Эволюция + революция, или Пути развития современных процессоров
Недавнее появление двухъядерных процессоров революционно уже хотя бы потому, что кардинально новые модели процессоров оказались дешевле сравнимых с ними по производительности предшественников.
Оба основных производителя процессоров в последнее время регулярно радуют нас новинками. При этом фактически происходит развитие технологии в двух напрявлениях: в эволюционном (улучшение
характеристик классических одноядерных процессоров) и революционном (выпуск новых многоядерных процессоров). При сегодняешнем уровне развития рынка оба направления оправданы и востребованы
пользователями — прежде всего, в силу того что типично пользовательское программное обеспечение, такое как игры и офисные программы, слабо оптимизировано под многопоточное выполнение. Поэтому в
ближайшее время две рыночные ниши для новых процессоров будут существовать паралельно — и достаточно четко разделятся по критерию создания/просмотра цифрового контента. На ПК, на которых контент
(видео, аудио, моделирование, конструирование) создается, более оправданными будут многоядерные процессоры, а на клиентских и игровых ПК целесообразным будет использование обычных процессоров.
В сегменте одноядерных процессоров компанией Intel не так давно были выведены на рынок новые модели с тактовыми частотами 3,8 ГГц. Речь идет о топовом Pentium 4 670 и более демократичной модели —
Pentium 4 570. В сегменте же двухъядерных процессоров корпорация представила новый Pentium D 820 по очень привлекательной цене (около $250). Данная модель, по всей видимости, должна стать
катализатором интереса к таким процессорам со стороны профессиональных пользователей. Каждое ядро Pentium D 820 работает на частоте 2,8 ГГц. Впрочем, в этой линейке есть и более быстрые процессоры
(3,0 и 3,3 ГГц), но и стоят они уже от $550.
Цель данного тестирования — оценить привлекательность Pentium D 820 для профессионального пользователя. Естественно, что в данный момент этот процессор не сможет проявить свой потенциал в играх и
в ряде других чисто клиентских приложений — однако нас интересует выгоды использования Pentium D 820 для расчетов или создания цифрового контента. Собственно, этим и определялся выбор используемых
тестов.
Pentium 4 для сокета LGA775
Серия процессоров Intel 6хх для сокета LGA775 состоит из моделей 630, 640, 650, 660 и 670, тактовые частоты которых лежат между 3,00 и 3,80 ГГц. Все они имеют 2-мегабайтный кэш L2, используют
FSB с частотой 800 МГц и поддерживают технологию Hyper-Threading. Кроме того, в серии 6хх реализована поддержка 64-битных- расширений команд EM64T, а также технологий SpeedStep (энергосбережение) и
XD (защита от атак типа "переполнение буфера").
Представленные еще в июне 2004 г. Pentium-4 500-й серии имеют такие же тактовые частоты, однако кэш L2 для них составляет 1 Мб. Нет также поддержки технологий EM64T и SpeedStep. С конца
прошлого года 500-е модели со степингом E0 поддерживают технологию XD. На это указывает индекс "J" в конце номера процессора.
С июня 2005-го линейка процессоров 5х0 была модернизирована до линейки 5х1. Новые модели 521, 531, 541, 551, 561 и 571 по-прежнему имеют частоты от 2,8 до 3,8 ГГц, однако теперь дополнительно
поддерживают технологию EM64T.
Pentium D
Двухъядерные процессоры Pentium D — это два независимых ядра, объединенных на одной кремниевой пластине. Каждое ядро имеет собственный кэш L2 объемом 1 Мб. Ядра процессоров базируются на
архитектуре NetBurst процессоров Pentium 4. Ядра объединены общей процессорной шиной, работающей на частоте 800 МГц. Рассчитаны эти процессоры только на сокет LGA775.
Ядра процессоров Pentium D не поддерживают технологию Hyper-Threading. Для двухъядерных процессоров она присутствует только в Pentium Extreme Edition, который благодаря этому виден в системе
как восьмиядерный.
Все процессоры Pentium D поддерживают 64-битные расширения команд EM64T и технологию XD — защита от атак типа "переполнение буфера". Кроме того, модели 830 и 840 дополнительно поддерживают
технологию SpeedStep, при которой возможно динамическое регулирование частоты и напряжения питания ядер процессора.
Все Pentium D выпускаются по 90-нанометровому техпроцессу, при этом на кристалле площадью 206 мм2 размещается 230 млн. транзисторов.
AMD Athlon 64 4000+ San Diego и Athlon 64 FX-57
Помимо уже знакомого читателям Athlon 64 4000+ в нашем тесте участвует также Athlon 64 4000+ — новый процессор, выполненный по 90-нанометровому техпроцессу. По сравнению с предшественником эта
модель отличается сниженным до 85 Вт максимальным энергопотреблением и, самое главное, поддержкой набора команд SSE3.
Остальные параметры процессора остались без изменений. Это сокет 939, частота ядра 2,4 ГГц, частота шины HyperTransport 250 МГЦ (1000 МГц эффективная), поддержка двухканальной памяти DDR400 и
кэш L2 размером 1 Мб. Сейчас в продаже как старый, так и новый процессоры — и, судя по нашим тестам, их производительность разнится незначительно.
Athlon 64 FX-57, также участвующий в нашем тесте, построен на 90-нанометрвом ядре San Diego и от AMD Athlon 64 4000+ отличается только увеличенной до 2,8 ГГц частотой процессора.
Что касается других технологических параметров обоих процессоров, то тут можно упомянуть об использовании технологии "кремний на изоляторе" и площади кристалла, которая составляет 155 мм2 (на
ней размещается 114 млн. транзисторов).
SYSmark2004
Новый тестовый пакет SYSmark2004 от компании BAPCo является наследником индустриально признанного предшественника SYSmark2002. Тестовый пакет использует 17 обновленных приложений и содержит
исправления некоторых спорных моментов предшественника.
SYSmark2004 не только открывает несколько программ одновременно, но и позволяет приложениям работать в фоновом режиме. Следовательно, многоядерные процессоры в этом тесте могут показать свой
потенциал (как и процессоры, поддерживающие Hyper-Threading).
В общей оценке Pentium D 820 эффект от его второго ядра примерно эквивалентен прибавке частоты в 400 МГц для одноядерного процессора. То есть по производительности он примерно равен 3,2 ГГц
процессору Pentium 4 540J.
Не очень убедительно в общем зачете выглядит Pentium 4 670, работающей на новой 955X материнке с памятью DDR2-667. Его производительность практически равна таковой у Pentium 4 560 (925X чипсет с
памятью DDR2-533).
SYSmark2004: Internet Content Creation
В этой дисциплине лидируют, прежде всего, процессоры с быстрыми блоками FPU. Кроме того, участвующие в этом подтесте приложения активно используют набор команд SSE2 и многопоточную обработку.
В состав теста входят Macromedia Dreamweaver и Flash MX, Discreet 3ds max 5.1, Adobe AfterEffects 5.5, Photoshop 7.0.1 и Premiere 6.5, Microsofts Windows Media Encoder 9, WinZip 8.1 а также McAfee
VirusScan 7.0.
В этой дисциплине процессор Pentium D 820 наглядно демонстрирует преимущества двухъядерной архитектуры. Здесь он практически равен моделям с частотой в 3,6 ГГц. Особенно большой прирост в
производительности показали 3ds max и Photoshop.
Весьма неплохо показал себя и Pentium 4 670.
Наряду с общей суммой баллов в подтесте, SYSmark2004 вычисляет еще и производительность для подкатегорий 2D Creation, 3D Creation и Web Publication.
2D Creation
Видео из различных несжатых источников монтируется в Premiere 6.5 и экспортируется. Одновременно Photoshop импортирует и модифицирует фотоизображения. После экспортирования видео к нему с помощью
After Effects добавляются некоторые спецэффекты.
И снова Pentium D 820 показывает производительность, сравнимую с 3,6 ГГц процессорами. Для одноядерных процессоров в этом подтесте, наряду с частотой, очень важным показателем оказалась величина
кэш-памяти.
3D Creation
Производится рендеринг 3D-моделей в 3ds max 5. Одновременно с помощью Dreamweaver подготавливаются веб-страницы. В заключение происходит прокрутка трехмерной анимации.
Эффект от второго ядра Pentium D 820 в этом подтесте немного меньше, но все равно уровень процессора 3,2 ГГц примерно сохраняется.
Web Publication
В этом тесте сценарии SYSmark2004 распаковывают архив с WinZip. Параллельно с помощью Flash MX открывается, модифицируется и экспортируется трехмерная векторная графика. Видео из подсценария 2D
Creation архивируется с помощью Windows Media Encoder 9. Dreamweaver с помощью своих сценариев обрабатывает веб-страницы и в конце VirusScan проверяет систему на вирусы.
Благодаря параллельной работе приложений второе ядро Pentium D 820 дает в этом тесте прибавку производительности, примерно эквивалентную 1 ГГц. Все одноядерные процессоры остались позади.
SYSmark2004: Office Productivity
В категории Office Productivity тестовый пакет SYSmark2004 использует 10 различных приложений: Microsofts Word, Excel, PowerPoint, Access и Outlook (все версий 2002), McAfee VirusScan 7.0,
ScanSoft Dragon Naturally Speaking 6, WinZip 8.1, Adobe Acrobat 5.0.5 и Internet Explorer 6.0.
В категории Office Productivity двухъядерность не сыграла никакой роли. Обычные процессоры здесь лидируют — и среди них наилучшие результаты показывают модели, использующие память DD2-533.
Наряду с общей суммой для офисной производительности SYSmark2004 дополнительно делает оценки в категориях Communications, Document Creation и Data Analysis.
Communications
Пользователь получает в Outlook 2002 e-mail с файлом zip, в котором содержится несколько документов. Во время чтения e-mail и актуализации календаря VirusScan 7.0 сканирует систему.
Теоретически в этом сценарии двухъядерный процессор должен был показать неплохие результаты, однако этого не произошло. Кроме того, на примере с Pentium 4 670 заметно, что чипсет 955X с памятью
DDR2-667 вообще "не любят" этот подтест.
Document Creation
Производится редактирование документа в Word версии 2002. Кроме этого с помощью NaturallySpeaking аудиофайл переводится в документ и конвертируется затем в формат PDF. Затем сценарий SYSmark2004
прокручивает презентацию.
Уж кому многоядерность не нужна, так это тем, кто использует ПК в качестве продвинутой пишущей машинки. Результаты зависят, в основном, только от частот процессоров.
Data Analysis
В данном подтесте сначала производится выборка данных из Access. Затем WinZip 8.1 архивирует большое количество документов. Результаты выборки SYSmark2004 выгружает в Excel и строит там
графики.
То, что в этой дисциплине двухъядерность не сыграла никакой роли, скорее всего, объясняется странностью самого подтеста. Не понятно, причем тут архиватор. И если с построением графиков в Excell
еще можно согласиться, то выбор СУБД, мягко говоря, неадекватен.
SPECint_base2000
Как Intel, так и AMD используют Base-рейтинг теста SPEC при рекламе своих продуктов. Мы также воспользовались этими тестами, скомпилировав их с помощью Intel C++ 8.1 и MS Visual Studio.
Подтест SPECint_base2000 работает как однопоточное приложение, поэтому, естественно, не использует ни Hyper-Threading, ни двухъядерность. Соответственно, результаты позволяют оценить чистую
целочисленную производительность ядра процессора.
В таблице приведены развернутые результаты по каждой тестовой подзадаче:
В итоге в тесте SPEC CPU2000 Integer, SPECint_base2000 имеем следующие результаты:
Pentium D 820 уверенно занял последнее место — и так же уверенно первое место досталось Pentium 4 670. Результат закономерный, так как при однопоточном выполнении целочисленных вычислений важны, в
первую очередь, тактовая частота и объем кэша L2.
SPECint_rate_base2000
Этот тест позволяет определить пропускную способность системы при выполнении целочисленных вычислений. При этом в системе запускается несколько копий теста параллельно. Обычно число копий является
равным числу видимых операционной системой реальных или виртуальных ядер процессоров. То есть для процессоров от AMD запускалась одна копия (хотя при запуске двух результат остается тем же), а для
всех процессоров Intel — две (двухъядерность или Hyper-Threading).
Pentium D 820 ни оставил одноядерным собратьям никаких шансов. Этот процессор работает при 2,80 ГГц тактовой частоты на 22% быстрее, чем Pentium 4 670 с 3,80 ГГц. Прибавка же производительности от
второго ядра составила около 80%.
SPECfp_base2000
Для определения Base-рейтинга вычислений с плавающей запятой мы скомпилировали тест с помощью Intel C++ 8.1 и MS Visual Studio а также Intel Fortran 8.1.
SPECfp_base2000 также выполняется как однопоточное приложение, выдавая в качестве результата чистую производительность FPU процессора.
Процессоры AMD64 тестировались с ключами компиляции -QxW для включения поддержки SSE2.
Результаты этого теста пропорциональны тактовым частотам, поэтому лидирующий результат Pentium 4 670 вполне закономерен.
SPECfp_rate_base2000
При определении максимальной пропускной способности вычислений с плавающей запятой в системе параллельно запускается несколько копий теста. Обычно число копий является равным числу видимых
операционной системой реальных или виртуальных ядер процессоров.
И опять при определении максимальной пропускной способности вычислений Pentium D 820 значительно опережает все классические процессоры.
Lightwave 3D 8.2
Один из популярнейших инструментов для работы с 3D-графикой, программа Lightwave версии 8.2 хорошо оптимизирована под Pentium 4. Она может работать как используя набор команд SSE2, так и разбивая
работу на оптимальное число параллельных потоков. Тестирование в этой программе мы провели как в однопоточном, так и в многопоточном (8 потоков) варианте.
При однопоточном рендеринге Pentium D 820 закономерно не получил никакой прибавки за счет второго ядра. Для одноядерных процессоров при прочих равных условиях здесь наиболее важна скорость
кэш-памяти. При восьмипоточном рендеринге Pentium D 820 заметно лидирует и на 26% опережает Pentium 4 670, который, в свою очередь, заметно опережает Pentium 4 560.
CineBench 2003
CineBench 2003 базируется на Cinema 4D восьмого релиза и является популярным Shading и Raytracing тестом. Актуальная версия поддерживает SSE2, а также технологию Hyper-Threading.
В тесте Raytracing с помощью Cinema-4D-Raytracers производится рендеринг сцены Daylight. Она содержит 35 источников света и благодаря 16 картам освещенности формируют мягкие тени. Здесь в основном
работает GPU процессора, а мощность графической карты играет второстепенную роль.
Тест работает, в основном, в кэш-памяти, пропускная способность процессорной шины здесь не очень важна. Pentium D 820 уверенно опережает более дорогие Pentium 4 670 и 3,73 ГГц Extreme Edition.
В дисциплине OpenGL-HW тест CineBench 2003 выводит две анимации с помощью OpenGL ускорителя графической карты. Таким образом процессор передает лишь позицию источников света, а также геометрию
графической карте. Самое важное здесь — объем кэш-памяти и производительность памяти. Анимация Pump Action состоит из 37000 треугольников в 1046 объектах, во второй сцене Citygen два объекта в целом
состоят из 70000 треугольников.
В дисциплине OpenGL-SW Cinema 4D дополнительно принимает расчет освещения — то есть процессор выполняет дополнительную арифметическую работу.
В обоих дисциплинах заметно серьезное преимущество процессоров от AMD — точнее, преимущество архитектуры со встроенным в процессор контроллером памяти. Результаты процессоров от Intel
пропорциональны тактовой частоте — и у Pentium D 820 закономерно последнее место.
SPECapc: 3ds max 6
Компания Discreet/Autodesk известна своим софтом для 3D-моделирования, анимации и рендеринга 3ds max. Актуальная версия — 6. С июня 2004 г. для этой программы существует тест SPECapc. С его
помощью можно определить производительность 3ds max 6 на различных аппаратных платформах.
SPECapc для 3ds max 6 представляет собой реальный проект с использованием функций wireframe modeling, shading, texturing, lighting, blending, inverse kinematics, object creation, scene creation,
particle tracing, animation и rendering.
При рендеринге 3ds max 6 полностью использует до шести процессоров, поэтому многоядерность Hyper-Threading должна значительно ускорять работу.
Как и представлялось изначально, в 3ds max процессор Pentium D 820 значительно опережает все одноядерные модели. Объем кэш-памяти особой роли в этом тесте не сыграл.
Революция для профи
Может ли быть сразу два правильных пути развития процессоров? На сегодня, наверное, да. Во многих тестах одноядерный Pentium 4 670 благодаря высокой частоте ядра и 2 Мб кэша L2 оказывается на
первом месте. Так что для обычного клиентского ПК или, другими словами, для "потребителя" цифрового контента это довольно неплохой выбор. Обычно человек работает с одной программой, а для работающих
на заднем плане брандмауэров/антивирусов/меседжеров/качалок вполне достаточно и возможностей Hyper-Threading.
Совсем другое дело те пользователи, для которых ПК является инструментом для создания 3D/видео/аудио или интенсивных расчетов. При вполне достаточной для "single-threaded"-приложений
производительности и в разы меньшей, по сравнению с Pentium 4 3,73 EE и Pentium 4 670, стоимости двухъядерный процессор Pentium D 820 обеспечивает значительно большую производительность на
профессиональных задачах и, кроме того, "нафарширован" всеми модными технологиями типа EM64T и XD.
Так что на сегодня наличие двух "правильных" путей развития процессоров выглядит вполне логично. Профессиональные пользователи пойдут по революционному (и более дешевому!) пути многоядерности, а
обычные пользователи будут довольствоваться плодами эволюции одноядерных процессоров.
Несколько разочаровывает пока связка чипсета 955X с памятью DDR2-667. Можно считать, что скоростной потенциал новой памяти оценить на данном этапе не удалось.
Тестовые платформы
Pentium 4 670 и двухъядерный Pentium D 820 и тестировались нами в комплекте с материнской платой Intel Desktop Boards D955XBK (чипсет 955X) и памятью DDR2-667 SDRAM CL4.
Остальные процессоры Pentium 4 тестировались на материнке Intel Desktop Board D925XECV2 с памятью DDR2-533 SDRAM CL4. Одноядерные процессоры от AMD тестировались на MSI K8N Diamond (чипсет
NVIDIA nForce4 SLI) с памятью DDR 400 CL2.
Чтобы гарантировать одинаковые тестовые условия, все системы оснащались видеокартой MSI GeForce 6800 GT в PCI-Express (драйвер ForceWare 67.66, DirectX 9.0c) с 256 Мб памяти GDDR3 и
SerialATA-винчестером Maxtor MaxLine III 250 Гб.
Автор: Андрей Бондаренко
Источник: www.cpp.com.ua
|