Процессор Celeron 1.80 ( Willamette-128 )
Автор: Антон Гаврилов
Celeron - это название так
называемого "бюджетного" семейства процессоров
Intel. Процессоры Celeron построены на базе одного
из семейств Pentium, но имеют некоторые упрощения,
призванные снизить их стоимость. Конечно, при этом
страдает и производительность, однако Celeron
предназначен для базовых офисных задач, в которых
быстродействие процессора не является определяющим
фактором, в отличие от инженерных, научных,
математических задач и т.п. Процессоры Celeron
развиваются почти одновременно со своими старшими
"братьями", Pentium. Меняются процессорные ядра,
корпусы, частоты. Но вот никаких цифр к их
названию от этого не прибавляется. И если
последнее поколение Pentium в названии содержит
цифру "4", то Celeron так и остался Celeron'ом.
Отличать один от другого приходится по тактовым
частотам. Так, в мае 2002 года появились два новых
Celeron - 1.70 и 1.80, которые принадлежат к
следующему, пятому по счету поколению,
построенному на базе ядра Willamette и
совместимому с Pentium 4.
Новые Celeron - шаг вперед или назад?
Как известно, до появления
новых моделей Celeron самым быстродействующим в
семействе был процессор с частотой 1.3 ГГц. Он и
объявленный чуть позже Celeron 1.40 имеют ядро
Tualatin c 100 МГц шиной и 256 Кб кэша второго
уровня, совместимы с архитектурой Socket370. Эти
процессоры отлично справляются с поставленными
перед ними задачами; более того, в большинстве
тестов они оказываются даже быстрее своих более
частотных собратьев. Зачем же тогда потребовалось
переводить Celeron на новые рельсы вместо того,
чтобы и дальше наращивать частоты прежних
процессоров?
Тому есть несколько причин.
Во-первых, архитектура P6, по которой построено
ядро Tualatin, уже исчерпала себя. Поскольку
производительность подсистемы памяти за последние
пару лет резко возросла, процессор стал
сдерживающим фактором на пути к дальнейшему
наращиванию производительности. Конечно, можно
попробовать увеличить частоту процессорной шины в
несколько раз. Но ведь процессор проектируется с
расчетом на определенное быстродействие его
составных блоков. Нельзя просто повысить частоту
шинного интерфейса, оставив без изменений объемы
буферов, разрядности шин, регистров, длину и
состав исполнительных конвейеров и т.п. Да, у
Intel были планы по введению новой шины для
процессоров Pentium III, однако вместо доработки
старого процессора было принято решение
форсировать выпуск нового, Pentium 4.
Во-вторых, развитие платформы
Socket370 остановилось. Да, во многом это было
сделано искусственно. Однако тесты первых систем с
поддержкой памяти DDR показали, что
производительность платформы Socket370 во многих
случаях остается на месте. Приложения,
предназначенные для обработки больших массивов
данных, нуждаются в увеличении пропускной
способности памяти, а старая платформа не может
этого обеспечить. Поэтому сначала Intel, а потом и
другие разработчики чипсетов прекратили работу в
этом направлении.
В-третьих, интенсивно
использующие память задачи из разряда
специфических перешли в разряд обыденных. Сжатие и
воспроизведение звука и видео, компьютерные игры,
мультимедиа-презентации... Кроме того, вскоре
должны появиться интерфейсы, использующие не
только графический, но и голосовой ввод,
распознавание движений и т.п., которые начнут
внедряться только в том случае, если
среднестатистическая аппаратная база будет
достаточно мощной, чтобы их поддерживать.
И наконец, потребовалось
просто привести все компоненты системы к общему
знаменателю. Зачем продолжать выпускать два
семейства чипсетов, разъемов, кулеров, блоков
питания, если можно отбросить одно из них? И
конечно, лучше отбросить старое.
Что такое новый Celeron
По большому счету, это просто
Pentium 4 с меньшим объемом кэш-памяти второго
уровня. Celeron 1.70 и 1.80 имеют в своей основе
ядро Pentium 4 первого поколения - Willamette. Это
32-разрядное суперскалярное CISC-ядро архитектуры
IA32, которое выпускается по технологическим
нормам 0.18 мкм, имеет кэш первого уровня объемом
8 Кб для данных и трассировочный кэш на 12 тыс.
микроопераций, длинный конвейер на 20 стадий;
внешняя шина имеет разрядность 64 бита, частоту
100 МГц, учетверенный поток данных (эквивалентно
частоте 400 МГц). Кэш второго уровня, встроенный в
ядро, у оригинального Willamette имел объем 256
Кб, но у Celeron был урезан до 128 Кб. При этом
специалисты Intel утверждают, что латентность
(длительность задержек) и ассоциативность
(количество блоков, в которых хранятся не
связанные между собой данные) кэша не изменились,
то есть быстродействие осталось тем же. Можно
предположить, что для процессора с архитектурой
Pentium 4 объем кэша не так важен, поскольку у
него данные из памяти поступают и так достаточно
быстро. Тем не менее, частота процессорной шины
все еще составляет 100 МГц, поэтому задержки,
возникающие при кэш-промахе и необходимые для
реакции контроллера памяти, остаются достаточно
высокими. В общем, Celeron был неплохо
"приторможен" по сравнению с Pentium 4.
Есть также неофициальные
данные, что переход Celeron на более совершенное
ядро Northwood не приведет к увеличению объема
кэша или частоты шины. Возможно, корпоративные
потребители не особенно расстроятся, а вот наши
отечественные пользователи, вынужденные покупать
бюджетные процессоры из-за недостатка средств,
потеряют возможность заполучить достаточно быстрый
процессор по низкой цене.
Впрочем, сейчас не известно,
какое решение примет руководство Intel. В данный
момент нас интересует, насколько ниже получилась
производительность нового Celeron по сравнению с
Pentium 4.
Тестирование
Чтобы точно выяснить,
насколько пострадал Celeron от сокращения размера
кэша, я решил протестировать три процессора с
одинаковой тактовой частотой, но различными
кэшами. Для этого я взял три процессора - Celeron
1.80, Pentium 4 1.80 и Pentium 4 1.80A.
У первого объем кэш-памяти
второго уровня составляет 128 Кб, у второго - 256
Кб (он основан на том же ядре), а у третьего - 512
Кб, так как это уже процессор на ядре Northwood.
Внешне все три процессора почти не отличаются,
корпус у них один и тот же, работают они на одних
и тех же материнских платах. А вот быстродействие
у них различное, и единственная тому причина -
кэш.
Процессоры устанавливались в
материнскую плату Intel D845GBV (чипсет i845G) с
256 Мб памяти PC2700, графика использовалась
встроенная. Так эмулировалась наиболее как
наиболее вероятная среда существования процессора
Celeron. Понятно, что для Pentium 4 1.80A
пользователь предпочтет внешнюю графику, больший
объем памяти, и если он не дурак, разгонит
процессор до 2.4-2.5 ГГц.
Начнем с измерения пропускной
способности кэш-памяти процессора с помощью теста
Cachemem. По его результатам получается, что кэш
первого уровня у всех трех процессоров
обеспечивает пропускную способность 13,5 Гб/c. Что
касается кэша второго уровня, то он, похоже, у них
тоже имеет одинаковые параметры и обеспечивает 7,3
Гб/с. Это - при выполнении выборки данных. При
записи результат для обоих кэшей оказывается
одинаковым - 6 Гб/с, что свидетельствует о режиме
сквозной записи в кэш второго уровня.
Графики чтения всех трех
процессоров идеально совпадают во всем, кроме
одного - вторая ступень, обозначающая работу в
пределах кэша второго уровня, заканчивается у них
по-разному.
Тест Linpack, измеряющий
скорость решения систем линейных уравнений, более
реалистично показывает влияние объема кэш-памяти
на быстродействие в математических задачах.
Мы видим, что у всех
процессоров графики идут вверх с одинаковой
скоростью, а потом начинают резко спадать. У
Celeron 1.80 спад начинается намного раньше. Если
взять объем матрицы 330 Кб, Celeron покажет
быстродействие в полтора раза хуже, чем Pentium 4
1.80, а Pentium 4 1.80A окажется втрое быстрее
последнего.
Рассмотрим другие
синтетические тесты. Начнем с Sandra CPU Bench.
Этот тест измеряет количество целочисленных и
FP-операций, выполняемых процессором в секунду.
Само собой, у всех трех
результаты одинаковы, так как они построены по
одной архитектуре и имеют равные тактовые частоты.
Тест CPUMark'99 содержит набор
инструкций (instruction mix) различных приложений,
список которых не приводится. Он использовался
раньше для измерения производительности
процессоров. Результаты свидетельствуют, что
Celeron с нагрузкой справился на 33% хуже, чем
Pentium 4, а процессор с ядром Northwood оказался
еще на 5% быстрее.
Тест CPU Rightmark моделирует
в реальном времени поведение системы многих тел в
среде, обладающей вязкостью. Он состоит из трех
вычислительных блоков.
Блок решения системы
дифференциальных уравнений (поддержка SSE2) не
заметил разницы между процессорами. Блок
отображения результатов, оптимизированный под
инструкции SSE, тоже отработал с одинаковой
скоростью. А вот блок предварительного расчета
координат, использующий только набор команд x87 и
написанный на языке высокого уровня, оказался
чувствительным к объему кэша. Celeron возился с
ним на 40% дольше, чем P4 1.80, а P4 1.80A
оказался лишь на 6% быстрее предшественника.
Еще одна математическая задача
- вычисление знаков числа "пи". Я измерял, сколько
тысяч знаков рассчитывает процессор за секунду.
Celeron оказался на 30% медленнее Pentium 4 1.80,
а тот, в свою очередь, на 10% медленнее Pentium 4
1.80A.
Тест PCMark2002 содержит
несколько различных алгоритмов обработки данных.
Раскодирование JPEG-файлов с
помощью стандартной библиотеки версии 6b все три
процессора выполняют одинаково, то есть Celeron
наравне с Pentium 4 может использоваться для
просмотра изображений. Распаковка ZIP-архивов,
созданных стандартным методом LZ77, тоже
выполняется одинаково (1% не считается). А вот
сжатие тем же методом Celeron выполняет медленнее
на 40%. Поиск строки текста распространенным
методом Бойера-Мура все три процессора опять-таки
выполняют одинаково. Нет между ними разницы и при
выполнении 3D-моделировании объектов с
использованием оптимизированных алгоритмов движка
MAX-FX (игра Max Payne). Немного отстает (3%)
Celeron при сжатии звука кодером Ogg Vobis.
Похожие цифры (4-8%) мы видим и при сжатии видео в
формат MPEG4 с использованием кодера Windows Media
Encoder 7.1.
Идем дальше. Офисные
приложения, для которых и предназначены процессоры
Celeron.
Согласно SYSmark2002,
бюджетный процессор уступает 10% P4 1.80 и 20% -
P4 1.80A. Прилично. В Winstone2001 на похожем
наборе приложений оказался на 20% медленнее, а
соотношение между P4 не изменилось. Как ни
странно, в задачах, связанных с подготовкой
материалов для Web, в том же Winstone2001 Celeron
приблизился к P4 1.80 (-8%). А в аналогичном тесте
SYSmark2002 вперед вырвался P4 1.80A (17%);
соотношение между P4 1.80 и Celeron не изменилось
(10%). Видимо, более новые версии приложений,
использованные в SYSmark2002, стали более
требовательными к быстродействию подсистемы
памяти.
Возьмем тест SPECviewperf. Он
содержит фрагменты профессиональных приложений для
дизайнеров.
В большинстве случаев разницы
между процессорами не заметно из-за того, что не
справилась встроенная видеокарта. Но в двух тестах
мы видим, что Celeron и P4 с кэшем 256 Кб показали
близкие результаты, а P4 c кэшем 512 Кб вырвался
вперед (10% в одном и 20% в другом тесте).
Возьмем некоторые 3D-игры в
низком разрешении (640х480х16 бит), когда влияние
видеокарты минимально.
Отставание Celeron от
процессора с 256 Кб кэша составило в среднем
15-20%, и только Comanche4 оказался ему не по
зубам. Pentium 4 1.80A от своих лишних 256 Кб
получил 15% преимущества.
Итог
Мы рассмотрели результаты
тестов. Очевидно, что сложные математические
задачи даются новому Celeron c большим трудом - в
них он отстает чуть ли не в полтора раза даже от
Pentium 4 c кэшем 256 Кб. Более-менее удается ему
справиться со сжатием мультимедиа-данных. В играх
Celeron, к сожалению, не блещет, зато нормально
справляется с офисными задачами, отставая на 10%
от Pentium 4 на том же ядре. Pentium 4 с кэшем 512
Кб практически во всех реальных приложениях имеет
не менее 5% преимущества над предшественником с
той же частотой. Поэтому если вас не интересуют ни
игры, ни сложная математика, то Celeron будет
оправданным выбором. В противном случае имеет
смысл ориентироваться на Pentium 4 на ядре
Northwood, особенно если учесть его отличный
разгонный потенциал.
|