Оригинал материала: https://3dnews.ru./172073

AMD Athlon 64-939 на ядре Winchester

Стр.1 - Процессоры Athlon 64-939


Процессоры Athlon 64 на ядре Winchester

Выпуск процессоров Athlon 64 Socket939 стал однозначным успехом компании AMD. Высокая производительность в сочетании с хорошим балансом прочих характеристик (прежде всего энергопотребления) привлекло внимание пользователей. Однако интерес потенциальных покупателей был "платонический" - первые модели (3500+ и 3800+) имели очень высокую цену, которая закрывала путь этим процессорам на массовый рынок.

Причиной этого были ограниченные производственные мощности компании AMD. Все процессоры выпускались по 0.13мкм техпроцессу, в результате чего количество ядер с одной пластины было относительно невелико. Следствием этого было ограниченное количество и высокая себестоимость процессоров, и, соответственно, их дефицит в магазинах (даже по запредельным ценам).

Ситуация изменилась после перевода части линий на новый 0.09мкм техпроцесс. Причем, в отличие от Intel, компания AMD сделала этого очень тихо и скромно. Первые процессоры на ядре Winchester (а именно так называли 0.09мкм ядро) появились в продаже 15 сентября (а в России они появились только в конце года: таможня долго не отдавала "добро".

Интересно отметить, что во многом новое ядро не оправдало ожиданий пользователей. Во-первых, тепловыделение: наученные горьким опытом Prescott покупатели ожидали повышенного тепловыделения 0.09мкм процессоров AMD. Однако на практике ядро Winchester потребляет на 25% меньше энергии, чем ядро NewCastle, которое изготавливается по 0.13мкм техпроцессу. Однако не стоит делать вывод, что 0.09 техпроцесс компании AMD превосходит соответствующую технологию Intel. Дело в том, что архитектура процессорных ядер Prescott и Winchester настолько разная, что прямое их сравнение просто неуместно. Соответственно, разработка технологии изготовления процессоров велась с учетом особенностей ядер. Например, перед Intel стояла жесткая задача по обязательному повышению тактовой частоты. И, по большому счету, она провалилась: максимальная частота ядра Northwood = 3.4Ггерц, а Prescott всего навсего 3.8Ггерц; модель 4.0Ггерц - вообще отменили.

Что касается AMD, то задачи повышения тактовой частоты при переходе на новый техпроцесс не было. Основной целью перехода было увеличение производства процессоров. Судите сами: площадь ядра процессора на ядре NewCastle = 144 кв.мм., а площадь ядра Winchester = 84 кв.мм. В результате на одной 200мм-пластине (именно такие используются на заводе Fab30) количество ядер увеличилось на 77%! Соответственно, нетрудно оценить и последствия: больше ядер - ниже себестоимость. А более низкая себестоимость позволяет установить более низкую розничную цену. Кроме того, большее количество процессоров позволяет AMD выпустить процессоры для массового рынка, с розничной ценой 200-250$. Именно такие цены установлены на две модели: 3000+ и 3200+, которые мы сегодня протестируем.


Внешний вид процессоров на ядре Winchester ничем не отличается от вида процессоров на ядре NewCastle (крайний справа).


Скажем пару слов о самом ядре Winchester. Фактически это то же самое ядро NewCastle, с небольшими изменениями контроллера памяти (который, как мы знаем, интегрирован в процессорное ядро). В результате чуть-чуть изменилась производительность. Но это изменение настолько невелико, что AMD не придает этому большого значения. Да и вообще представители AMD не акцентируют внимание на новом техпроцессе, предпочитая называть процессоры Winchester просто процессорами Athlon 64 степпинга D0. Поэтому с точки зрения обычного пользователя разницы между процессорами на ядрах Winchester и NewCastle нет ни по производительности, ни по другим характеристикам. Даже температура процессора под нагрузкой одинакова для обоих ядер. Это объясняется тем, что у ядра Winchester хоть и снизилось потребление энергии, но также значительно сократилась площадь ядра. Поэтому удельное (относительно площади ядра) тепловыделение изменилось незначительно.

С точки зрения оверклокера, новое ядро Winchester более предпочтительно, нежели NewCastle. Большинство процессоров сохраняют стабильность работы до частот 2550-2600Мгерц, а процессоры некоторых партий стабильно работают на частоте 2700Мгерц! Поэтому при покупке процессора A64 3500+, более предпочтительным является ядро Winchester, которое можно определить по маркировке: буквы BI в конце первой строки. Что касается моделей 3000+ и 3200+ то их можно покупать с закрытыми глазами, поскольку все они принадлежат степпингу D0 (т.е. основаны на ядре Winchester).


Процессоры 3000+ и 3200+, соответственно.


Теперь более внимательно посмотрим на упаковку процессоров. Во-первых, отметим, что AMD отказалась от tray-поставок для розничной торговли. Отныне процессоры продаются в BOX-варианте.


Обратите внимание на наклейку "Enhanced Virus Protection", которая обещает надежную защиту от компьютерных вирусов. Данная наклейка послужила причиной скандала в Бельгии, где она была признана недобросовестной рекламой, поскольку для работы защиты от вирусов требуется наличие Windows XP SP2.

Также особенностью нового бокса является прозрачное окно, через которое мы видим процессор (а главное, его маркировку!), а также масса голографических наклеек, которые гарантируют подлинность процессора.

К большому сожалению, боксовая поставка означает, что в "нагрузку" к процессу мы получаем кулер. Впрочем, невысокий уровень тепловыделения позволяет разгонять Athlon64 даже с боксовым кулером (о процессорах Intel этого сказать нельзя - в бюджетных корпусах без дополнительного охлаждения, боксового кулера бывает недостаточно даже на штатных частотах).


На основание кулера нанесен слой термоинтерфейса:


Вот собственно и все про тепловыделение - фактически все то время когда AMD будет выпускать процессоры на ядре Winchester, проблем в этой области у нее не предвидится.

Стр.2 - Производительность на штатных частотах

Производительность на штатных частотах

Для тестирования производительности были собраны следующие системы:

Процессор AMD Athlon 64 3500+ (Socket939; ядро Winchester 11x200)
AMD Athlon 64 3200+ (Socket939; ядро Winchester 10x200)
AMD Athlon 64 3000+ (Socket939; ядро Winchester 9x200)
Intel Pentium4 3.2E (ядро Prescott)
Intel Pentium4 3.46 EE (ядро Gallatin)
Материнская плата Asus P5AD2-E Premium на чипсете i925XE
Asus A8N-SLI на чипсете nForce4 SLI
Видеокарта Abit Radeon X600XT
Звуковая карта -
HDD IBM DTLA 307030 30Gb
Память 2x256 Мбайт PC3200 DDR SDRAM, производства OCZ
2x256 Мбайт DDR2-533 SDRAM, производства Kingmax
Корпус Inwin506 с блоком питания PowerMan 300W
OS Windows XP SP1

Мы использовали процессор Intel Pentium4 Extreme Edition исключительно для оценки производительности. Во-первых, он стоит порядка 1000$, а во-вторых, у него есть свой конкурент AMD Athlon-FX.

Итак, в тестах использовался уже привычный набор приложений. Сперва посмотрим на результаты синтетических тестов.



Перед нами исключительно синтетические приложения, которые демонстрируют теоретическую производительность. Особо показателен результат теста Sandra 2002: старая версия программы "не узнает" систему Athlon64, и вычисляет пропускную способность памяти совершенно непонятным образом. Тест MadonionFuturemark PCMark 2002 более серьезный, и его результаты лучше отражают реальное соотношение сил.

Теперь тесты игровых приложений.


При рассмотрении результатов в игре ID Quake3 нужно помнить, что производительность этого приложения очень сильно зависит от пропускной способности подсистемы памяти. Появление встроенного контроллера памяти в процессоре Athlon64 позволило последнему серьезно увеличить производительность в этом тесте (напомню, что на движке Quake3 выпущено большое количество игр начиная от Return to Castle Wolfenstein и заканчивая Call of Duty). Правда, в низком разрешении процессор Intel Prescott все равно обгоняет процессоры AMD.


В игре Serious Sam процессоры AMD всегда показывали отличные результаты, обгоняя многие процессоры Intel. С выходом Athlon64 преимущество продуктов AMD только увеличилось. Дело в том, что производительность в этой игре довольно сильно зависит от длины конвейера. Как следствие, процессоры Pentium4, даже с частотой 3.2Ггерц, выглядят очень слабо.


В UT2004 ситуация с производительностью такая же, как и в игре Comanche 4.










кбс. больше - лучше









Выводы: в среднем рейтинг производительности процессоров Athlon64 Socket939 совпадает с частотами процессоров Intel Pentium4.

Теперь посмотрим на масштабируемость процессоров Athlon64, т.е. рост производительности при разгоне.

Стр.3 - Производительность при разгоне

Производительность при разгоне

Итак, процессор Athlon 64 3000+ был успешно разогнан до частоты 2.57 Ггерц при напряжении питания 1.6V. Довольно неплохой прирост частоты, особенно если учесть, что штатная частота равна 1.8Ггерц (9х200).


Версия CPU-Z 1.23 не определяет ядро Winchester, но у версии 1.25 этой проблемы нет:


Второй процессор (это модель 3200+, штатная частота 2Ггерц = 10х200) мы разогнали до частоты 2.6Ггерц, при Vcore=1.6V.

Сперва посмотрим на результаты синтетических тестов.



Перед нами исключительно синтетические приложения, которые демонстрируют теоретическую производительность.

Теперь тесты игровых приложений.








Единственный тест, который не смог пройти разогнанный P4 Prescott, это Aquamark (хотя мы использовали дополнительный 120мм вентилятор для обдува кулера Gigabyte 3D Cooler!).





кбс. больше - лучше









Вывод: разогнанный до частоты 2.4Ггерц процессор Athlon64 показывает тот же уровень производительности, что и процессор Pentium4 4.0Ггерц. При этом, в распоряжении оверклокера есть еще запас в 200-300Мгерц, что для архитектуры AMD очень большие цифры. А при разгоне Prescott выше потолка прыгнуть нельзя. И, хотя последние степпинги процессоров Intel повышают этот потолок до 4.1-4.2Ггерц, этого явно недостаточно для обгона Athlon64.

Стр.4 - Оптимизация настроек памяти для системы Socket939

Оптимизация настроек памяти для системы Socket939

Одним из важнейших вопросов при сборке компьютера является тип и режим работы оперативной памяти. Для AMD-систем эта задача упрощается за счет того, что тип поддерживаемой памяти только один - DDR-I. А вот с режимом работы не все так просто: необходимо определить влияние на производительность как частоты памяти, так и используемых таймингов.

Для этого мы сейчас протестируем четыре комплекта модулей памяти. Это Geil PC4400, OCZ PC3200 400512ELDCPER2-K(серия "Platinum") revision 2.0, стандартные модули OCZ PC3200 400512PDC-K(серия "Premier") и Patriot PC3200 XBL.


Во-первых, определим влияние таймингов на уровень производительности. Наилучшими тестами в этой области являются полу-синтетический тест PCMark и игра Quake3.


Результаты оказались полностью предсказуемыми: чем ниже тайминги - тем выше скорость прокачки памяти, и, соответственно, общая производительность.


Точно такая же картина и в Quake3. Причем разница в скорости между минимальными и максимальными таймингами может достигать 10%! В результате тем пользователям, которые используют только штатные режимы, совет один - приобретать те модули памяти, которые гарантированно работают на минимальных таймингах (или близких к ним).

Второй вопрос, который нас интересует, следующий: насколько снижается уровень производительности при переходе от синхронного режима к асинхронному.


И опять мы получили вполне ожидаемые результаты: наиболее производительный режим - синхронный.


А падение производительности при переходе к асинхронному режиму довольно существенно. Особенно это касается режимов DDR200 и DDR266.

Здесь будет уместно отметить, что частота работы памяти на системах с процессором Athlon64 устанавливается весьма хитрым способом, в зависимости от делителя процессора. Приведем пример (на основе тестовой платы Asus A8N-SLI). Данная плата предоставляет следующие режимы(частоты) работы памяти:


Однако при выборе значения DDR333 память работает на частоте = частота процессора 11. То есть частота памяти = 180011 = 163Мгерц (DDR327). Соответственно частоты памяти при установке DDR266 = 128Мгерц (DDR257; делитель памяти = 14), а при установке DDR200 = 100Мгерц (DDR200; делитель памяти = 18). Все это справедливо для процессора A64 3000+ с штатной частотой 1800Мгерц. А при установке процессора 3200+ (с множителем = 10) набор делителей частоты памяти будет иным.

В любом случае, обычного пользователя это, опять же, мало интересует - для его потребностей хватит и обычной памяти DDR400 (т.е. работающей в синхронном режиме). А если память еще и будет работать на минимальных таймингах, то пользователь получает максимальную производительность.

А вот для оверклокеров ситуация запутывается довольно сильно. Дело в том, что компания AMD заблокировала изменение множителя процессоров Athlon 64 в сторону увеличения. Поэтому разгон процессора мы можем осуществлять только при помощи увеличения опорной частоты (для упрощения назовем ее частотой FSB). Кроме того, ситуацию усугубляет то, что множители процессоров относительно невелики.

Для лучшего восприятия приведем пример. Берем процессор 3000+ с штатной частотой 1800Мгерц, которая формируется 200Мгерц (FSB) * 9 (множитель процессора). Подавляющее большинство таких процессоров гарантированно работают на частоте 2.4Ггерц. А чтобы ее получить, мы обязаны увеличить частоту FSB до значения 266Мгерц! Именно тут и возникает вопрос - какую частоту памяти нужно установить.

Наилучший вариант (синхронный с минимальными таймингами) отпадает моментально - в природе пока не существует модулей памяти, способных работать на частоте 266Мгерц (что соответствует DDR533) с таймингами 2-2-5-2. Для справки - наивысший результат, который мне известен ~240Мгерц на таймингах 2-2-5-2.

Поэтому необходимо найти компромиссный вариант. Первый - сохраняем синхронный режим памяти, с повышением таймингов. А раз повышаем тайминги - значит теряем часть производительности. Вариант номер два - сохраняем минимальные тайминги, но переходим в асинхронный режим (т.е. снижаем частоту памяти). И, опять же, теряем часть производительности.

Опять усложняем задачу - для достижения технологического предела степпинга D0 (текущий степпинг ядра Winchester) = 2.7Ггерц, частота FSB (для модели 3000+) должна быть равна 300Мгерц (соответственно, память, работающая в синхронном режиме, обязана функционировать в режиме DDR600!). Есть такая память ? Есть - но она очень редкая и соответственно дорогая.

С более старшими моделями процессоров ситуация лучше - у них множитель выше. Если взять модель 3200+, то для разгона до 2.7Ггерц нам потребуется увеличить FSB до значения 270Мгерц (тоже довольно высокая частота).

Теперь начинаем обрабатывать вышеизложенное, и пытаться найти решение проблемы - какую память, и какие тайминги установить при разгоне процессора Athlon64. Для этого я поставил себя на место обычного покупателя самого дешевого процессора (пока это A64 3000+), и протестировал производительность следующих режимов:

  • Штатный (частота = 1.8Ггерц; 200200)- без комментариев.
  • Разгон до 2.4Ггерц, частота FSB = 266, частота памяти = 266Мгерц(параметр в биосе - DDR400), тайминги 3-4-8-4

    Подавляющее большинство оверклокерских модулей имеют именно такие тайминги.

  • Разгон до 2.4Ггерц, частота FSB = 266, частота памяти = 218Мгерц (параметр в биосе - DDR333), тайминги 2-2-5-2

    Найти память, способную работать в таком режиме, вполне реально. Но если нельзя - то обратите внимание на следующий режим:

  • Разгон до 2.4Ггерц, частота FSB = 266, частота памяти = 218Мгерц(параметр в биосе - DDR333), тайминги 2-3-6-3

    В таком режиме может работать подавляющее большинство модулей памяти.

  • Разгон до 2.4Ггерц, частота FSB = 266, частота памяти = 171Мгерц(параметр в биосе - DDR266), тайминги 2-2-5-2

Сперва посмотрим на результаты синтетических тестов.



Перед нами исключительно синтетические приложения, которые демонстрируют теоретическую производительность.

Теперь тесты игровых приложений.












кбс. больше - лучше


сек. меньше - лучше









И каков вывод? Очень простой - не нужно бояться асинхронного режима, если тайминги работы памяти = 2-2-5-2, или 2-3-6-3! Это прежде всего касается режима DDR333. А вот при установке режима DDR266 падение производительности будет уже заметно. Но только в тех приложениях, которые сильно зависят от пропускной способности памяти. Но в большинстве популярных игрушек, в высоких разрешениях, падение производительности на глаз будет абсолютно незаметно.

Теперь переходим непосредственно к выбору модулей памяти. Если ограничиться максимальной частотой разгона процессора = 2.7Ггерц, то нам необходима память, работающая в одном из следующих режимов:

  • 300Мгерц (DDR600) на таймингах 3-4-8-4 (или меньших);
  • 245Мгерц (DDR490) на таймингах 2-2-5-2 или 2-3-6-3;

Параметры ясны - смотрим на результаты тестирования модулей памяти (в последний момент мы добавили комплект модулей Kingston HyperX PC2700).


Общий вывод: в последнее время на рынке появились оверклокерские модули памяти нового поколения. Это, прежде всего, OCZ Platinum и Patriot XBL. Их отличает полная работоспособность на частотах 200-220Мгерц при минимальных таймингах, а также колоссальный потенциал роста частоты при увеличении таймингов. На их фоне оверклокерские модули предыдущего поколения (их представитель - Geil PC4400) выглядят довольно слабо. Их главной чертой является невысокий рабочий диапазон частот при максимальных таймингах. И, наконец, обычная память - это обычная память, с весьма и весьма посредственными характеристиками.

Также следует помнить, что на способность модулей памяти работать на тех или иных частотах влияет материнская плата, версия биоса, а также рабочее напряжение на модулях (мы использовали относительно небольшое Vmem = 2.75V).

Например, в сети есть достоверная информация, что модули OCZ Platinum rev2.0 работали на частоте 350Мгерц (DDR700!), а модули Patriot XBL работали на частоте 240Мгерц (DDR480) при минимальных таймингах!

Более того, часто бывает, что модули памяти, слабо выглядящие на системе с Athlon 64, показывают высокие результаты на системе с Pentium4 (и наоборот). Пример - OCZ Premier на плате Abit IC7-G (чипсет i875P) работала на частотах 233-240Мгерц, а модули Kingston HyperX PC2700 на этой же плате работали на частоте 210Мгерц при минимальных таймингах.

И, в заключение, пара комментариев насчет модулей участвовавших в тестировании.

  • Kignston HyperX PC2700 - это очень старая память, и для системы A64 подходит слабо.
  • OCZ PC3200 Premier - несмотря на громкое название, память очень и очень посредственная. Штатные тайминги высокие - 2.5-3-7-3. Также отметим медные зеркальные радиаторы на чипах, которые выглядят просто великолепно, но быстро пачкаются и царапаются (я лично потерял кучу денег при возврате этой памяти :). Вывод - не покупать.
  • Geil PC4400 ; штатные тайминги 3-4-8-4. Модули также имеют красивые зеркальные радиаторы, но беда этой памяти в другом - высокие тайминги при малом потенциале рабочей частоты. Также модули не завелись на гарантированной производителем частоте = 275Мгерц. Вывод - брать только в случае гарантированного манибека.
  • OCZ PC3200 400512ELDCPER2-K Platinum rev2.0 и Patriot PC3200 XBL. И тот и другой комплект - просто прекрасная память. При этом комплект из двух модулей по 256Мбайт OCZ стоит ~180$, а комплект модулей Patriot можно найти в магазинах за ~140$. И последнее - при покупке именно этих модулей следует очень строго проверять маркировку, так как под серией OCZ Platinum продается масса различных моделей памяти с иными характеристиками (понятно, что более худшими ;). Тоже самое справедливо и для Patriot: в магазине просто глаза разбегаются от обилия различных моделей EL и LL.

Стр.5 - Выводы; выбор платформы

Выводы; выбор платформы

Первое - по чистой производительности процессоры AMD Athlon64 ничуть не уступают процессорам Intel Pentium4 LGA775. По остальным характеристикам они либо равны (по цене), либо превосходят конкурентов (по уровню тепловыделения). Кстати, с переходом на 0.09мкм техпроцесс тепловыделение Athlon64 значительно уменьшилось. И, в сочетании с технологией Cool'n'Quiet, в данной области они вне какой-либо конкуренции. Тоже самое можно сказать про потенциал для оверклокинга - разогнанный процессор Athlon64 в большинстве приложений обгоняет разогнанный Pentium4 (модель Expreme Edition мы не рассматриваем: для процессоров стоимостью в 1000$ у AMD есть свой флагман - модель Athlon FX).


Но чистая скорость - это еще не все. Очень важное значение имеет платформа (читай - возможности материнской платы). И тут системы AMD в лидерах: если сделать приблизительное сравнение чипсета nForce4 с последними чипсетами Intel, то соотношение сил будет следующим. За платформой nVidia nForce4 + AMD Socket939 есть преимущество в поддержке жестких дисков: 4 канала SerialATA II, расширенная функциональность RAID и 2 канала ParallelATA (у ICH6 - 4 канала SerialATA, MatrixRAID и один канал ParallelATA). За nForce4 преимущество и в количестве портов USB 2.0: 10 против 8. По коммуникационным возможностям чипсеты приблизительно равны: и тот и другой позволяют подключать гигабитный сетевой контроллер к шине PCI Express, а версия ICH6 с поддержкой WiFi так и не появилась. Единственное, в чем ICH6 выигрывает - это поддержка 8 канального звука High Defenition Audio.

Впрочем, в запасе у nVidia есть неслабый козырь: полностью готовое и отлаженное ядро SoundStorm, а также поддержка шины Firewire (и то и другое было внедрено в MCP-T). Но к, сожалению, эти две функции не реализованы в чипсете nForce4.

Также отметим, что nForce4 поддерживает перспективную шину PCI Express (текущие цены на соответствующие видеокарты очень и очень привлекательные). Ну а если у пользователя уже есть дорогая AGP-видеокарта, он также может воспользоваться преимуществами процессоров Athlon64 Socket939, установив материнскую плату на чипсете nForce3 250(GB).

Заключение; ядро Winchester

Плюсы:
  • Высокий уровень производительности (благодаря встроенному контроллеру памяти);
  • Очень низкий уровень тепловыделения (технология Cool'n'Quiet);
  • Долгий срок жизни Socket939;
  • Высокий потенциал для разгона.
Минусы:
  • Нет
Особенности
  • Технологический предел степпинга D0 = 2.6-2.7Ггерц.

Все вопросы, замечания и пожелания можно и нужно задавать в конференции.

Дополнительные материалы:



Оригинал материала: https://3dnews.ru./172073