«Прожорливость» процессоров в теории и на практике
Великий все-таки был философ Иммануил Кант: введенное им понятие «вещь в
себе» вполне применимо, например, к процессору. Конечно, последний можно
использовать по прямому назначению в вычислительных системах, но, с другой
стороны, центральные процессоры могли бы неплохо отапливать небольшие помещения,
выступать в роли декоративных брошек или, будучи положены ножками вверх на стул
школьной учительницы, заменить собою целую россыпь канцелярских кнопок.
А если серьезно, то и для обычных пользователей, и для продвинутых экспертов
центральный процессор таит в себе массу загадок и неожиданностей. Еще бы, даже
непосредственные разработчики микропроцессоров не знают точно, как поведет себя
их логическая схема узлов после воплощения в кусочке обычного кремния.
Мог ли кто предположить несколько лет назад, что ядра процессоров
Athlon/Athlon 64 и R3xx/R4xx позволят компаниям AMD и ATI на равных тягаться с
гигантами Intel и nVidia? А между тем лишь благодаря технической фортуне да
пытливости журналистов новинки AMD и ATI буквально ворвались в компьютерные
системы многих домашних пользователей.
Вот и сейчас, задумав серию материалов об энергосберегающих технологиях в
«настольных» процессорах, в ряде тестов мы получили очень неожиданные данные, от
которых глаза технических специалистов Intel и AMD становились круглыми, а
амбиции знатоков — скромными . Но давайте сначала познакомимся с теоретическими
выкладками технологий AMD Cool’n’Quiet (аналог AMD PowerNow!) и Intel
Geyserville 3 (аналог Enhanced Intel SpeedStep), а затем оценим их реальную
эффективность.
В теории
|
ПК DESTEN eStudio-832P и счетчик СО-505: тестовый
стенд готов к работе |
Если раньше интересные процессорные технологии сначала появлялись в дорогих
серверных системах, а затем медленно спускались в класс домашних и мобильных
компьютеров, то с энергосберегающими технологиями AMD и Intel все произошло
иначе. Зародившись несколько лет назад под именами AMD PowerNow! и Enhanced
Intel SpeedStep в мобильных платформах, они постепенно перекочевывают в сегменты
настольных и серверных компьютеров.
Действительно, зачем круглые сутки гонять на 100% корпоративный почтовый
сервер, если известно, что основная нагрузка ложится на него лишь с девяти до 18
часов? И зачем нужна энергозатратная производительность ЦП в офисных приложениях
или во время простоя домашнего ПК? Согласитесь, потребителю есть где сэкономить
на электроэнергии...
Отметим сразу, энергосберегающие технологии от компаний AMD и Intel, за
исключением небольших технических нюансов, очень сходны между собой. А вот
настольные процессоры Pentium 4, в отличие от микропроцессоров Athlon 64, пока
поддерживают технологию Intel Geyserville 3 лишь в умах маркетологов да в
некоторых инженерных образцах, коих мы так и не смогли раздобыть. Однако уже в
первой половине 2005 г. ситуация должна кардинально поменяться.
Разумеется, все новейшие процессоры AMD и Intel поддерживают стандарт
управления питанием ACPI версии 2.0, который включает характерные уровни
управления системой (S-State), подсистемой, устройством (D-State), шиной,
процессором (C-State и P-State). Самым интересным здесь представляется
подмножество состояний процессора C-States: C1(Halt), C2(Stop Grand), C3(Sleep)
и C0(интересующий нас набор режимов управления ЦП — P-States). Все современные
центральные процессоры можно условно разделить на устройства с поддержкой С0(или
P-States) и без нее (более подробную информацию о стандартах управления питанием
и используемой терминологии можно найти на сайте www.acpi.info).
Режимы P-States (Processor Performance States, рабочее состояние процессора)
— это правильные комбинации напряжений и частот работы ядра процессора для
разных нагрузок. Идеально подобранная пара «напряжение—частота» позволяет
адекватно выставить необходимую производительность для выполнения текущих задач,
что в свою очередь позволит снизить энергопотребление и тепловыделение ЦП в
большинстве рабочих ситуаций.
Различные процессоры могут иметь разное число возможных режимов P-States,
например, в процессорах Pentium 4 количество запрограммированных комбинаций
«напряжение — частота» может колебаться от двух (в дешевых образцах) до 16 (в
самых продвинутых ЦП). Аналогичный маркетинговый подход мы видим и в процессорах
AMD Athlon 64, а полную раскладку по типам существующих процессоров AMD и
возможным режимам P-States мы привели в таблице к статье «Процессоры AMD разорят
РАО «ЕЭС России»?» (см. «Мир ПК»,
№ 1/05).
Важная роль в энергосберегающих технологиях процессоров отводится
соответствующей поддержке в системных платах, поскольку используемая BIOS
должна:
- уметь определять наличие поддержки режимов P-States в установленном ЦП
(т.е. анализировать поля CPUID и возвращаемое значение функции 8000_0007h);
- иметь полную таблицу комбинаций «напряжение—частота»;
- иметь набор микросхем и системных ограничений для работы с/без поддержки
объектов P-States, описанных стандартом ACPI версии 2.0.
С учетом поддержки современными операционными системами объектов ACPI,
вырисовывается следующий алгоритм выполнения переходов между состояниями
P-States:
- ОС, проанализировав накопленную статистику простоев, решает, что требуется
сделать переход от одного P-State к другому, и вызывает драйвер процессора
(допустим, для повышения производительности).
- Драйвер процессора (см. «МирПК»,
№1/05, с.32) сообщает ОС, что необходимый переход допустим, и начинает
его осуществление.
- Драйвер процессора поэтапно повышает напряжение ядра до необходимого
максимума с одинаковыми шагами MVS (Maximum Voltage Step) за одинаковые
промежутки времени VST (Voltage Stabilization Time).
- Драйвер процессора, достигнув необходимого напряжения, меняет частоту
работы ядра на новое значение, которое запросила система (и в этот короткий
промежуток времени ЦП недоступен, так что чем этот промежуток меньше, тем
лучше).
Когда системе требуется пониженный P-State, то выполняется точно такой же
алгоритм действий, но с учетом необходимого понижения напряжения на ядре.
Наглядно представить весь процесс смены состояний P-States помогут две схемы
восходящих переходов в процессорах AMD и Intel (см. график 1 и график 2). Налицо
некоторая разница: технология AMD Cool’n’Quiet на третьей ступеньке нашего
алгоритма к необходимому новому напряжению добавляет небольшой задел RVO (Ramp
Voltage Offset — превышение напряжения), который убирается сразу после смены
частот ядра (шаг 4) и частотно-вольтажные показатели нового состояния P-State
возвращаются к стандартным. Такое поведение придает надежности работе процессора
Athlon 64, но отнимает лишние 100 мкс для полного выполнения всего перехода. А
все эти мгновения складываются в доли секунды, уже ощутимые для человека.
Шаги изменения напряжения ядра (MVS) в процессорах Athlon 64 в 2 раза больше,
чем у процессоров Pentium 4, а значит, нужные значения напряжения выставляются
за меньшее количество стабилизационных периодов. Но вот стабилизационное время у
процессоров AMD в 20 раз больше, чем у конкурентных решений, и поэтому
процессоры Pentium 4 выигрывают у семейства Athlon 64 по необходимому времени
стабилизации для итогового изменения состояния P-State. Более того, в момент,
когда процессор недоступен (на этапе смены частоты), провал ЦП Athlon 64 должен
быть заметней, но напомним, это лишь в теории. На практике мы уже более года
плотно работаем с технологией AMD Cool’n’Quiet, а вот процессоров Pentium 4 с
поддержкой технологии Intel Geyserville 3 пока не видели вообще.
На практике
|
ПК DESTEN eStudio-832P
|
Надеемся, с теорией мы разобрались, теперь можно перейти к реальным тестам
энергопотребления современных процессоров в различных рабочих ситуациях.
Поскольку начало нашему тестированию было положено в вышеупомянутой статье
«Процессоры AMD разорят РАО «ЕЭС России»?» при работе с ПК Formoza S320+ на базе
процессора AMD Athlon 64 3200+, то на этот раз мы подобрали серийный ПК Desten
eStudio-832P на базе 3,2-ГГц процессора Intel Pentium 4 (Northwood).
На техническом уровне компьютеры Formoza S320+ и DESTEN eStudio-832P
отличались друг от друга лишь процессором, системной платой и корпусом. Так что
сравнение «прожорливости» процессоров прошло максимально корректно (тем более,
что в системный блок ПК DESTEN мы установили БП Thermaltake XP480, используемый
в ПК Formoza S320+). Пользуясь таким случаем, мы еще сняли показания с
компьютера DESTEN eStudio-832P, заменив в нем штатный процессор на 3,2-ГГц Intel
Pentium 4E (Prescott).
Для уверенности в полученных результатах и наших выводах мы замеряли
энергопотребление по ГОСТ 6570—96 счетчиком СО-505, а потребляемую мощность —
сертифицированным прибором SATURN LF-202 SE (http://www.saturn.com.ru/). И полученные с разных
измерительных устройств данные оказались взаимосвязанными.
Общий анализ результатов тестов показывает гипотетическую выгоду в затратах
на электроэнергию при эксплуатации системы на базе процессора AMD Athlon 64
3200+. Но необходимо помнить, что системная плата компьютера должна поддерживать
технологию AMD Cool’n’Quiet, иначе более привлекательным становится ПК на базе
3,2-ГГц Intel Pentium 4 (Northwood).
Пока процессор Pentium 4 не поддерживает энергосберегающие технологии GV3, но
тем не менее управление питанием системной платы Gigabyte GA-8IK1100,
использующейся в ПК DESTEN, позволяет аккуратно работать с энергоресурсами в
ситуациях частого простоя и при решении офисных задач.
Как и предполагалось, самым «прожорливым» в тестах оказался ЦП Prescott, но в
среднем его результаты лишь чуть хуже показателей Athlon 64 с отключенной
функцией Cool’n’Quiet. А поскольку свое будущее компания Intel связывает именно
с ядром Prescott, то вывод один: нужно скорее внедрять технологию Geyserville 3
в настольные системы. Иначе в руках конкурентов останутся важные козыри.
Но самое интересное содержится в первом столбце таблицы результатов. Из него
видно, что даже «выключенный» ПК использует немало электроэнергии по дежурной
шине +5Vsb. Потребляемая мощность по ней составляет 25 Вт у процессора Northwood
и 16—17 Вт у альтернативных ЦП. И если сделать элементарный подсчет, то видно,
что простой сетевой фильтр типа «пилот» с кнопкой выключения позволит хорошо
сэкономить и без технологии AMD Cool’n’Quiet (главное — как можно реже включать
компьютер ). Кстати, это первый неожиданный результат тестирования, но возможно,
он обусловлен влиянием 400-Вт блока питания Thermaltake XP480.
А вот то, что в выключенном состоянии системная плата на базе Northwood
потребляла больше электроэнергии, чем аналогичная платформа с процессором
Prescott, стало для нас откровением. Что это, скрытые сюрпризы электропитания
процессора нового поколения или все дело в плате? По возможности мы обязательно
проверим разные гипотезы и вскоре сообщим результаты.
Если заглянуть в близкое будущее, то не за горами появление в наших ПК
двухъядерных процессоров, и пока можно лишь предсказать их завидную
производительность при использовании специального программного обеспечения и
прогнозируемый проигрыш в устаревших тестах. Но сразу очевидно одно: в целях
энергосбережения и последующего снижения тепловыделения разработчики новейших ЦП
(с двумя ядрами) заложат в них возможность отключения одного вычислительного
центра в случаях простоя компьютера (или его низкой загрузки). А как иначе? На
рынок пришло время бережного отношения к финансам пользователя.
Редакция выражает благодарность компаниям Desten (http://www.desten.ru/) и
Formoza (http://www.formoza.ru/) за предоставленные для
тестирования серийные ПК.
Таблица
Потребление электроэнергии по электрическому счетчику СО-505, кВт.ч
Модель |
Cутки в выключенном состоянии |
Сутки работы в MS Office XP (минимальная
загрузка) |
Сутки цикличного выполнения теста 3DMark05 |
Сутки при максимальной нагрузке |
Среднеарифметические сутки работы ПК при среднестатис
тической нагрузке1 |
Расчетное потребление электроэнергии за год постоянной
работы (365 дней) при среднеста тистической нагрузке |
ПК Formoza S320+ на базе Athlon 64 3200+ с включенной
технологией AMD Cool’n’Quiet |
0,4 |
1,8 |
3,5 |
3,8 |
2 |
730 |
ПК Formoza S320+ на базе Athlon 64 3200+ с отключенной техноло
гией AMD Cool’n’Quiet |
0,4 |
2,6 |
3,6 |
3,8 |
2,8 |
1022 |
ПК DESTEN eStudio-832P на базе 3,2-ГГц процессора Intel Pentium
4 (Northwood) |
0,6 |
2,2 |
3,9 |
4,6 |
2,5 |
912,5 |
ПК DESTEN eStudio-832P на базе 3,2-ГГц процессора Intel Pentium
4 (Prescott) |
0,4 |
2,5 |
4,2 |
4,7 |
2,8 |
1022 |
График 1.
Восходящий переход между состояниями (P-States) в процессоре AMD Athlon 64.
Ф1: фаза увеличения напряжения; Ф2: фаза увеличения частоты (процессор
недоступен); Ф3: фаза VID-перехода и нивелирования RVO
График 2.
Восходящий переход между состояниями (P-States) в гипотетическом процессоре
Intel Pentium 4 с технологией GV3. Ф1: фаза увеличения напряжения; Ф2: фаза
увеличения частоты (процессор недоступен)
Перекресток технологий Geyserville 3 (GV3) и Hyper-Threading (HT)
Операционная система рассматривает ЦП с поддержкой Hyper-Threading как два
логических процессора, но сам физический процессор может находиться лишь в одном
состоянии P-State. При этом оба логических устройства используют одну и ту же
пару значений «напряжение—частота».
Важно отметить, что каждый логический ЦП может запрашивать свое состояние
P-State, и BIOS координирует эти требования. По умолчанию выставляется самый
высокий P-State из требуемых процессорами режимов.
Пока в обычных процессорах Intel Pentium 4 при загрузке одной ли нитки
Hyper-Threading или двух разницы в энергопотреблении нет. Впрочем, если
технологию HT просто отключить в BIOS, различия в «прожорливости» тоже не
будет.
Автор: Алексей Набережный
Источник: www.morepc.ru
|