Оригинал материала: https://3dnews.ru./636955

Тюнинг для бульдозера. Обзор процессора AMD FX-8350

Архитектура. Разгон

С момента появления на рынке процессоров AMD FX с микроархитектурой Bulldozer прошёл уже почти год. И теперь со всей уверенностью можно говорить о том, что они пришлись не по душе не только нам, но и большинству потребителей. Покупатели предпочитают предложения конкурента, так как в подавляющем большинстве случаев процессоры семейств Core i5 и Core i7 не только заметно быстрее, но и существенно экономичнее. Конечно, примеры приложений, где применение Bulldozer может быть оправданно, существуют, но это по большей части сугубо узкоспециализированные задачи. В общеупотребительных же средах — и в первую очередь в играх — AMD FX выглядят весьма бледно.

Причина такого положения дел кроется в особенностях микроархитектуры Bulldozer. Основная идея, заложенная в дизайне этих процессоров, не так уж и плоха. Упрощение отдельных вычислительных ядер в пользу наращивания их количества и увеличения тактовой частоты вполне имеет право на жизнь, ведь с каждым годом всё больше разработчиков программного обеспечения увереннее переходят на многопоточные алгоритмы. Однако первейший недостаток Bulldozer состоит в том, что его ядра оказались уж слишком простыми и низкопроизводительными, а создание большого количества равноправных вычислительных потоков возможно при решении далеко не каждой реальной задачи. Есть и другая проблема. Ядра в процессорах с микроархитектурой Bulldozer попарно скомпонованы в модули-сборки, разделяющие некоторые ключевые блоки. В результате загрузка работой более половины вычислительных ядер приводит к падению удельной производительности в пересчёте на одно ядро. По идее, все эти слабые места могли бы быть скомпенсированы высокой тактовой частотой, однако на пути такого естественного решения встали используемый AMD технологический процесс с 32-нм нормами и недостаточно отработанный дизайн полупроводникового кристалла. Поэтому-то и вышло, что блеснуть производительностью Bulldozer может исключительно за счёт своего превосходства в количестве ядер, то есть в тех немногих случаях, когда приложение способно создать восемь полностью равноправных вычислительных потоков. Однако даже в такой идеальной для микроархитектуры AMD ситуации скорость восьмиядерных Bulldozer не дотягивает до уровня быстродействия четырёхъядерных процессоров Core i7, которые тоже способны исполнять восемь потоков одновременно за счёт технологии Hyper-Threading.

Слабые места собственной процессорной микроархитектуры осознают и в AMD. Поэтому в течение ближайших нескольких лет мы станем свидетелями выхода усовершенствованных модификаций Bulldozer, которые будут последовательно исправлять описанные недостатки. В данный момент наибольший оптимизм вызывает запланированная на 2013 год итерация с кодовым именем Steamroller. В ней AMD собирается пересмотреть свой подход к попарному объединению ядер в модули и вернуть каждому ядру собственный декодер, переделать объединённый блок операций с плавающей точкой, а также ввести в употребление динамическое распределение ресурсов разделяемой кеш-памяти. Однако микроархитектура Steamroller – это тема наших будущих исследований, целью же данного материала является изучение дизайна Piledriver, ведь именно эта версия микроархитектуры будет использоваться в процессорах AMD FX с сегодняшнего дня.

Можно подумать, что AMDпроизводит строительную технику, но бульдозер, копёр, каток и экскаватор – это всего лишь названия поколений процессорных микроархитектур

#Микроархитектура Piledriver и процессоры Vishera

Итак, Piledriver. С этой микроархитектурой мы уже знакомы. Именно она нашла своё место в гибридных процессорах Trinity, подробное рассмотрение которых мы проводили двумя неделями ранее. Несмотря на то, что тогда речь шла об APU, а сегодня мы рассматриваем CPU – процессоры без встроенной графики, строение вычислительных ядер у них одинаковое. Различия есть только в их количестве, а также в том, что в нацеленных на производительные системы CPU без встроенных графических ядер есть кеш-память третьего уровня.

Улучшений в новой микроархитектуре много, но все они имеют лишь косметический характер

Это позволяет нам, не вдаваясь в подробности, просто повторить список усовершенствований микроархитектуры Piledriver, отличающих её от дизайна прошлого поколения – Bulldozer:

  • За счёт внедрения гибридного двухуровневого предсказателя улучшена точность предсказания переходов;
  • Набор инструкций расширен трёхоперандными 128- и 256-битными инструкциями FMA3 (fused multiply–add) и инструкциями из подмножества SSE5 – преобразованием вещественных данных с половинной точностью F16C;
  • Оптимизирована работа планировщиков;
  • За счет переделки соответствующего исполнительного устройства ускорено выполнение операций деления;
  • Увеличена L1 TLB;
  • Алгоритмы предварительной выборки данных в L1- и L2-кеши улучшены, теперь они позволяют работать с паттернами переменной длины, в том числе и находящимися на границах страниц;
  • Увеличена эффективность L2-кеша за счёт более агрессивного его освобождения от неиспользуемых данных, ошибочно загруженных вследствие работы алгоритмов предварительной выборки.

Для более подробного знакомства с микроархитектурой Piledriver вы можете обратиться к нашим материалам о процессорах Trinity. Здесь же просто отметим, что все перечисленные улучшения в глобальном масштабе не столь существенны. Как мы уже имели возможность убедиться, новая микроархитектура повышает количество исполняемых за такт инструкций не более чем на 5 процентов. Ставит на второе место перечисленные оптимизации и сама AMD. Самое же главное, что, по мнению инженеров компании, им удалось сделать в Piledriver, это улучшить компоновку полупроводникового кристалла и снизить его энергопотребление и тепловыделение. Результаты проведённого редизайна хорошо видны на снимке: полупроводниковый кристалл Piledriver имеет существенные отличия от кристалла Bulldozer.

Поменялось не только взаимное расположение модулей и кеш-памяти, но и размещение функциональных блоков внутри вычислительных ядер

При этом площадь и транзисторный бюджет по сравнению с Bulldozer совершенно не изменились: 32-нм полупроводниковый кристалл, включающий восемь ядер с микроархитектурой Piledriver и 8-мегабайтный кеш третьего уровня, состоит из 1,2 млрд транзисторов и имеет площадь 315 мм2.

Благодаря проведённому редизайну полупроводникового кристалла, новые процессоры получили возможность работы на более высоких тактовых частотах без усовершенствования производственной технологии и без расширения рамок привычного теплового пакета. Именно это в первую очередь и дало жизнь второму поколению флагманских процессоров для настольных компьютеров AMD FX с кодовым именем Vishera, которые приходят на смену первопроходцам Zambezi.

Сразу же хочется отметить, что Vishera не считают революционным продуктом ни в AMD, ни в 3DNews. Микроархитектура Piledriver совершила прорыв в области интегрированных систем: в APU она сменила старый дизайн Stars, но в настольных производительных платформах внедрение Piledriver представляет собой лишь эволюционное обновление Bulldozer. Поэтому по сравнению со старыми процессорами FX ждать какого-то существенного прогресса явно не следует.

Отсутствие кардинальных технологических прорывов производитель подчёркивает и тем, что у новых представителей серии FX четырёхзначные модельные номера увеличились не столь значительно – лишь на пару сотен. Микроархитектуру Piledriver в номенклатуре CPU выдаёт цифра три на втором месте в номере. Всего же линейка обновлённых FX состоит из четырёх моделей, различающихся в первую очередь количеством ядер.

Процессоры AMD FX Piledriver
FX-8350 FX-8320 FX-6300 FX-4300
Число ядер 8 (4 модуля) 8 (4 модуля) 6 (3 модуля) 4 (2 модуля)
Тактовая частота 4,0 ГГц 3,5 ГГц 3,5 ГГц 3,8 ГГц
Частота в турборежиме До 4,2 ГГц До 4,0 ГГц До 4,1 ГГц До 4,0 ГГц
L2-кеш 4x2 Мбайт 4x2 Мбайт 3x2 Мбайт 2x2 Мбайт
L3-кеш 8 Мбайт 8 Мбайт 8 Мбайт 4 Мбайт
Частота северного моста 2,2 ГГц 2,2 ГГц 2,0 ГГц 2,0 ГГц
Память До DDR3-1866 До DDR3-1866 До DDR3-1866 До DDR3-1866
TDP 125 Вт 125 Вт 95 Вт 95 Вт
Процессорное гнездо Socket AM3+ Socket AM3+ Socket AM3+ Socket AM3+
Цена $195 $169 $132 $122

Преемники старых Bulldozer совместимы с той же самой платформой Socket AM3+ и имеют аналогичные характеристики расчётного тепловыделения, то есть способны превосходно работать в старых материнских платах, основанных на наборах системной логики девятисотой серии. К тому же компания AMD не стала сопровождать выход процессоров Vishera запуском какого-либо нового чипсета. Таким образом, внедрение микроархитектуры Piledriver в процессоры семейства FX – это фактически не модернизация платформы, а ординарное расширение линейки, выполненное в первую очередь за счёт увеличения тактовых частот. Они, к слову, по сравнению с показателями старых FX (Zambezi) подросли в среднем на 10-15 процентов. В сумме с небольшими микроархитектурными улучшениями это должно обеспечить Vishera преимущество в производительности на уровне 15-20 процентов.

И всё-таки кое в чём AMD смогла удивить. Год назад, в момент анонса первых процессоров серии FX, старшие модели этой линейки позиционировались как конкуренты самым скоростным процессорам Intel Core i5 или даже Core i7. Теперь же производитель серьёзно поумерил свои амбиции: стоимость старшей модификации Vishera, модели FX-8350, оказалась даже ниже, чем у Core i5-3570K и Core i5-2500K. То есть мало того что AMD готова предложить потребителям самые дешёвые оверклокерские процессоры – все CPU серии FX обладают незафиксированными множителями и допускают простой разгон. К тому же, с учетом произошедших улучшений и роста частот, новинки имеют хорошие шансы стать привлекательными предложениями с точки зрения соотношения производительности и цены. Впрочем, это нам ещё предстоит проверить.

#Описание тестовой системы

Для проведения тестирования процессоров Vishera с микроархитектурой Piledriver AMD предоставила нам образец FX-8350 – старшего представителя в обновлённой линейке предложений компании для своей высокопроизводительной платформы Socket AM3+.

Это восьмиядерный процессор Vishera, собранный из четырёх условно двухъядерных модулей. Объём кеш-памяти третьего уровня остался таким же, как и у процессоров Zambezi, зато выросла тактовая частота. Номинально AMD FX-8350 работает на 4,0 ГГц, однако при любом удобном случае, когда это позволяет его температурный режим и энергопотребление, частота увеличивается до 4,2 ГГц. Технология Turbo Core 3.0 работает в новой версии AMD FX очень агрессивно. Прирост частоты до максимального значения возможен даже в тех ситуациях, когда работой загружены все ядра CPU.

Учтя ту цену, которую выставил на свой AMD FX-8350 производитель, в качестве его основного соперника мы выбрали процессор Intel Core i5-3570K. Он немного дороже, но в своих материалах, разосланных прессе, в качестве конкурента для старшего Vishera AMD рекомендует использовать именно его. Более же низкая цена альтернативы AMD в этом ключе выступает ещё одним преимуществом новинки. Впрочем, сравнением FX-8350 с одним лишь только Core i5-3570K мы не ограничились. В тестах также приняли участие старший процессор предыдущего поколения Zambezi для Socket AM3+ – AMD FX-8150 — и старший четырёхъядерник Intel в LGA1155-исполнении, Core i7-3770K.

В результате нами были задействованы следующие аппаратные и программные компоненты:

  • Процессоры:
    • AMD FX-8350 (Vishera, 8 ядер, 4,0-4,2 ГГц, 4 x 2 Мбайт L2, 8 Мбайт L3);
    • AMD FX-8150 (Zambezi, 8 ядер, 3,6-4,2 ГГц, 4 x 2 Мбайт L2, 8 Мбайт L3);
    • Intel Core i7-3770K (Ivy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 4 x 256 Кбайт L2, 8 Мбайт L3);
    • Intel Core i5-3570K (Ivy Bridge, 4 ядра, 3,4-3,8 ГГц, 4 x 256 Кбайт L2, 6 Мбайт L3).
  • Процессорный кулер: NZXT Havik 140.
  • Материнские платы:
    • ASUS Crosshair V Formula (Socket AM3+, AMD 990FX + SB950);
    • ASUS P8Z77-V Deluxe (LGA1155, Intel Z77 Express).
  • Видеокарта: NVIDIA GeForce GTX 680 (2 Гбайт/256-бит GDDR5, 1006/6008 МГц).
  • Память: 2 x 4 Гбайт, DDR3-1866 SDRAM, 9-11-9-27 (Kingston KHX1866C9D3K2/8GX).
  • Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
  • Блок питания: Corsair AX1200i (80 Plus Platinum, 1200 Вт).
  • Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
  • Драйверы:
    • AMD Chipset Driver 12.8;
    • Intel Chipset Driver 9.3.0.1019;
    • Intel Graphics Media Accelerator Driver 15.26.12.2761;
    • Intel Management Engine Driver 8.1.0.1248;
    • Intel Rapid Storage Technology 11.2.0.1006;
    • NVIDIA GeForce 306.97 Driver.

При тестировании процессоров для платформы Socket AM3+ патчи операционной системы KB2645594 и KB2646060, адаптирующие поведение планировщика под микроархитектуры Bulldozer и Piledriver, были установлены.

#Разгон

Прежде чем начать знакомиться с результатами бенчмарков, следует уделить внимание и ещё одному аспекту. Процессоры, подобные AMD FX-8350 или Intel Core i5-3570K, зачастую приобретаются не совсем обычными пользователями, а той категорией людей, которых мы называем энтузиастами. Они редко оставляют все настройки по умолчанию, а вместо этого эксплуатируют свои системы в разогнанном состоянии. Поэтому тестирование производительности мы проводили в том числе и с процессорами, частота которых увеличена до предела, достижимого при использовании воздушного охлаждения и без неоправданного завышения напряжений.

Разгон процессоров Vishera по сути мало отличается от разгона их предшественников для Socket AM3+. Как и в Zambezi, их коэффициент умножения не заблокирован, так что для увеличения рабочей частоты достаточно просто изменить множитель в BIOS.

Типичным уровнем разгона процессоров Zambezi при использовании воздушного охлаждения можно назвать частоту 4,6 ГГц. Новые Vishera имеют примерно такое же строение и выпускаются по той же самой 32-нм производственной технологии с SOI. Да и предельные рабочие частоты Trinity, согласно нашим опытам, не превышают те же самые 4,6 ГГц. Вроде бы прироста оверклокерского потенциала ждать особо неоткуда? Однако некоторый оптимизм всё же внушают увеличенные у Vishera по сравнению с предшественниками номинальные частоты, которые достигают 4-гигагерцевой отметки или даже превышают её с учётом турборежима.

Выступает ли это симптомом оверклокерской привлекательности процессоров FX-8350? Наверное, ответить на этот вопрос следует положительно. Например, наш экземпляр FX-8350 оказался способен на стабильную работу на частоте 4,7 ГГц. Правда, для достижения стабильности его напряжение питания пришлось повысить до 1,5 В, но это, как уверяет AMD, совсем не опасно. Инженеры компании берутся утверждать, что при разгоне с воздушным охлаждением напряжение на процессоре вполне допустимо увеличивать до 1,4-1,55 В.

В таком состоянии система оставалась совершенно стабильной, а температура процессора под нагрузкой не превышала 70-75 градусов.

Разогнали мы и главного конкурента FX-8350 – процессор Intel Core i5-3570K. Достигнутая частота составила 4,6 ГГц – это вполне типичный результат для представителей семейства Ivy Bridge.

Таким образом, на диаграммах производительности, помимо результатов процессоров в номинальном режиме, будут указаны и показатели производительности AMD FX-8350 и Intel Core i5-3570K при описанном выше разгоне.

Тестирование. Выводы

#Результаты вычислительных тестов

На всех диаграммах большее значение соответствует лучшему результату.

На фоне своего предшественника с микроархитектурой Bulldozer процессор FX-8350 смотрится очень неплохо. С анонсом первых CPU семейства FX AMD обещала 10-15-процентный прирост производительности собственных процессоров ежегодно, и, как видим, плана она чётко придерживается. По факту, средний прирост скорости составил 13 процентов, и складывается он, напомним, из двух составляющих: небольших микроархитектурных улучшений и увеличенной тактовой частоты. Конечно, это совсем не выглядит принципиальным рывком, но справедливости ради заметим, что переход конкурента от дизайна Sandy Bridge к Ivy Bridge дал ещё меньший эффект.

А если к этому прибавить тот факт, что поддержка многопоточности современными приложениями за последний год только улучшилась, то очень достойное выступление FX-8350 на фоне Core i5-3570K совсем неудивительно. Иными словами, во всяких ресурсоёмких приложениях, которые способны распараллеливать свою нагрузку на большое число ядер, FX-8350 будет явно лучше своего прямого интеловского конкурента. При этом до уровня производительности Core i7-3770K, который усилен технологией Hyper-Threading, он не дотягивает, но не забывайте про цену: AMD FX-8350 стоит даже дешевле Core i5-3570K.

Не меняет расстановку сил и разгон. Хотя рабочую частоту AMD FX-8350 нам удалось повысить всего на 18 процентов, а частота Core i5-3570K при разгоне может быть увеличена примерно вдвое сильнее, восемь вычислительных ядер процессора с микроархитектурой Piledriver всё равно позволяют ему доминировать в большинстве бенчмарков, создающих серьёзную многопоточную нагрузку.

Впрочем, то, что при тяжёлой многопоточной нагрузке Vishera смотрится молодцом, совсем неудивительно. Примерно такую же ситуацию мы наблюдали и с первым поколением процессоров Bulldozer. Беда же микроархитектуры в том, что нагрузка с небольшой степенью параллелизма ставит их в не самое выгодное положение. И такая нагрузка – это не экзотика. Самый распространённый вариант приложений, не способных равномерно нагрузить все восемь ядер FX-8350, – это игры.

#Результаты игровых тестов

Если учесть, что игровая производительность компьютеров верхнего и среднего ценового диапазона зависит в первую очередь от мощности графической подсистемы, а также то, что в недалёком будущем нас ждёт встреча с новыми поколениями видеоускорителей, мы провели тестирование лишь в разрешении 1280х800 с максимальными настройками качества. Такой подход позволяет оценить именно процессорную игровую производительность, не ограниченную возможностями текущего поколения графических карт.

И вот тут-то и обнажаются все слабые места текущей микроархитектуры AMD. Игры не могут эффективно распределять нагрузку по большому количеству вычислительных ядер, поэтому в данном случае процессор FX-8350 выглядит на фоне конкурентов совсем уныло. Хотя Vishera использует усовершенствованную версию микроархитектуры с увеличенным числом исполняемых за такт инструкций (в этом нас пытается убедить производитель), по сравнению с оригинальными Bulldozer никаких принципиальных улучшений не заметно. Vishera, как и Zambezi, остаётся совершенно негеймерским процессором, появляться в игровых системах ему противопоказано. Разгон ситуацию не исправляет, а даже усугубляет. Так что для игровых компьютеров оптимальным выбором продолжают оставаться процессоры семейства Core i5/i7, и их гегемонии на данном поприще, похоже, конец придёт совсем не скоро.

В то же время если провести тестирование процессоров при выборе Full HD-разрешения с максимальным уровнем полноэкранного сглаживания, то расхождения в игровой производительности оказываются не столь заметными.

Впрочем, несущественными назвать их тоже нельзя. Оборудованная современной видеокартой игровая система на базе AMD FX-8350 неспособна предложить такое же, как и система на базе интеловского процессора, количество кадров в секунду даже при установке Full HD-разрешений и самых высоких настроек качества. Конечно, различия эти не столь принципиальны, и можно даже говорить, что для современных видеокарт и современных игр мощностей процессора FX-8350 вроде бы всё-таки хватает. Но мы не можем гарантировать, что так будет всегда и везде. Пройдёт совсем немного времени, и на рынке появятся следующие поколения графических чипов с гораздо более высокой производительностью, а также более требовательные к центральному процессору игры. И тогда может получиться так, что геймерам, чьи системы базируются на процессорах AMD, придётся кусать локти.

#Выводы

Подведение итогов проведённого исследования мы начнём неожиданно – с результатов ещё одного бенчмарка, по которым вся ситуация с плюсами и минусами микроархитектуры, которой на данный момент располагает AMD, становится совершенно прозрачной. На приведённом ниже графике показана производительность, выдаваемая процессорами AMD и Intel в известном шахматном бенчмарке Fritz Chess Benchmark при создании им различного количества вычислительных потоков.

Здесь отлично видно обе слабые стороны процессорного дизайна Vishera. Во-первых, производительность отдельных ядер у FX-8350 существенно меньше, чем у современного поколения интеловских процессоров. Во-вторых, при загрузке более четырёх ядер у FX-8350 величина прироста производительности, обусловленная подключением к работе последующих ядер, становится ниже из-за их «сдвоенного» строения. В результате восьмиядерный процессор AMD FX-8350 может соперничать с четырёхъядерным Core i5-3570K лишь в том случае, когда нагрузка носит более чем шестипоточный характер. Достичь же уровня производительности Core i7-3770K топовому чипу AMD не удаётся вообще – скорость флагмана для младшей интеловской платформы при числе потоков более четырёх продолжает расти благодаря технологии Hyper-Threading.

Это отлично описывает всё то, что наблюдается в многочисленных реальных приложениях. AMD FX-8350 выглядит привлекательно в тяжёлых счётных задачах, допускающих распараллеливание вычислений. В таких случаях он однозначно превосходит Core i5 и порой даже приближается к уровню быстродействия процессоров Core i7. Типичные примеры таких задач – это обработка и перекодирование видео, финальный рендеринг или какая-то подобная деятельность, направленная на создание «тяжёлого» контента. Значит, для разного рода компьютеров, играющих роль профессиональных инструментов, новые процессоры AMD подходят очень неплохо. А если принять во внимание их демократичную стоимость, то придумать какую-то более подходящую основу для недорогой рабочей станции вообще вряд ли возможно.

Но в тех ситуациях, когда речь идёт о выборе процессора для типичной домашней системы, которая обычно нужна не столько для создания контента, сколько для его потребления, рекомендовать процессор AMD FX-8350 очень тяжело. Общеупотребительные программы и игры редко способны создавать равномерную многопоточную нагрузку, и в таких условиях процессоры с микроархитектурой Piledriver проигрывают своим конкурентам, причем порой весьма серьёзно. Ни привлекательная цена, ни разгонные возможности Vishera компенсировать этот проигрыш, по нашему мнению, не могут.

Таким образом, первая итерация усовершенствования микроархитектуры Bulldozer, превратившая её в Piledriver, хотя и позволила увеличить быстродействие процессоров AMD FX на обещанные 10-15 процентов, по сути ничего не изменила. Новые CPU с дизайном Vishera остались такими же нишевыми продуктами, какими были их предшественники. Однако у новинок, предложенных AMD на этот раз, всё-таки есть несколько свежеприобретённых плюсов. В частности, число преданных сторонников продукции AMD наверняка увеличит выбранная компанией соблазнительная ценовая политика, а полная совместимость с уже существующей платформой Socket AM3+ сделает Vishera интересным вариантом модернизации уже имеющихся у пользователей систем. Иными словами, внедрение в процессоры AMD FX микроархитектуры Piledriver скажется на их популярности только положительно, и, хочется надеяться, позволит платформе Socket AM3+ продержаться на плаву ещё годик, спустя который на выручку Bulldozer и Piledriver придут процессоры с многообещающей микроархитектурой Steamroller.



Оригинал материала: https://3dnews.ru./636955