Оригинал материала: https://3dnews.ru./635804

AMD Trinity для десктопа. Часть 1. Графическое ядро

Дизайн Trinity. Графическое ядро. Модельный ряд

Ни у кого не возникает сомнений в том, что наиболее быстродействующие процессоры для персональных компьютеров поставляет на сегодняшний день отнюдь не компания AMD. И такая ситуация сложилась далеко не вчера. С тех пор как Intel перешла от Pentuim 4 к выпуску различных процессоров рода Core, предложения AMD скатились на вторые позиции. Фактически вся сегодняшняя процессорная продукция этой компании представляет собой либо бюджетные, либо какие-то узкоспециализированные решения, малоинтересные для широкого круга пользователей, ставящих высокую производительность во главу угла. Однако невысокие показатели быстродействия выпускаемых процессоров, так же как и сокращение рыночной доли, – это совсем не повод поставить крест на результатах работы процессорного подразделения AMD.

Инженеры этой фирмы славятся тем, что способны время от времени выдавать какие-то оригинальные идеи, позволяющие AMD не просто поддержать своё рыночное положение, но и оказать немалое влияние на всю индустрию в целом. За примерами таких идей далеко ходить не надо: 64-битные расширения микроархитектуры x86, многоядерный дизайн CPU, интеграция в процессор контроллера памяти и северного моста чипсета – все эти решения первой разработала и внедрила именно AMD, а не текущий лидер процессоростроения.

Именно поэтому мы продолжаем пристально следить за тем, какие нововведения вызревают в недрах AMD. И похоже, к настоящему моменту компания вновь нащупала плодотворный вектор развития, который способен придать положительный импульс не только ей самой, но и всему процессорному рынку в целом. Вектор этот – APU (Accelerated Processing Unit, «ускоренное процессорное устройство») – идеология, предусматривающая объединение на одном полупроводниковом кристалле традиционных вычислительных ядер с производительным графическим ядром. Причём не простое соседство, а симбиоз – возможность объединения их ресурсов для решения общих задач.

К классу APU можно отнести несколько разнообразных предложений AMD, выпущенных ещё в 2011 году. Наибольший интерес среди них представляют гибридные процессоры A-серии с кодовым именем Llano, служащие базисом платформ Lynx и Sabine и ориентированные на применение в широком спектре настольных и мобильных систем. Несмотря на то, что эти процессоры и платформы служат лишь «пробным шаром», так как на них происходит только обкатка принципов APU, они были достаточно тепло приняты рынком. Особенно востребованными Llano оказались в мобильном сегменте, что тут же отразилось в увеличении присутствия продукции AMD в современных ноутбуках. И это действительно видно невооружённым глазом. Если ещё пару лет назад мобильные платформы AMD встречались в составе очень немногочисленных предложений, то сегодня купить ноутбук, основанный на процессоре этого производителя, не составляет никакого труда. В любом компьютерном магазине вы с лёгкостью найдёте огромное число предложений, оснащённых APU разработки AMD.

Впрочем, повышенный интерес к процессорам AMD, наблюдаемый на рынке мобильных компьютеров, возник вовсе не из-за их гибридности. Его, скорее, следует понимать как побочный эффект. В реальности же дело в том, что достаточно мощное графическое ядро, скомпонованное с приемлемыми по меркам мобильных решений вычислительными ядрами, – это как раз то, чего не хватает в ассортименте Intel. А если принять во внимание очень демократичные цены, установленные компанией AMD на свои APU, то совершенно неудивительно, что в недорогие ноутбуки они вписались идеально, дав тем самым производителям оных возможность собирать компьютеры современного уровня без установки в них дискретных видеоускорителей и сопряженных с этим дополнительных затрат.

В результате в народ пошла и сама концепция APU. Её проповедники от AMD, общаясь с разработчиками программного обеспечения, получили возможность опираться на актуальность и распространённость, и в конце концов в распоряжении пользователей появились и реальные программы, рассчитанные на полноценное использование ресурсов гибридных процессоров. Майское же обновление A-серии мобильных процессоров AMD дизайном Trinity, в рамках которого была увеличена производительность как вычислительной, так и графической частей APU, стало дополнительным аргументом в пользу жизнеспособности и привлекательности концепции. Так что в дальнейшем доля ноутбуков с логотипом AMD Vision будет только увеличиваться.

С десктопными же процессорами AMD класса APU случилась совсем иная история. Требования пользователей настольных систем существенно отличаются от запросов владельцев ноутбуков, и тема APU их особо не заинтересовала с самого начала. Движущей силой проникновения первых поколений гибридных процессоров в ноутбуки выступала достаточно мощная графика, однако при её использовании в настольных компьютерах от этого эпитета нужно отказаться. Дело в том, что для десктопов характерны гораздо более высокие разрешения экрана, в которых процессоры AMD A-серии приемлемого уровня 3D-производительности не развивают. Иными словами, с точки зрения пользователей десктопов графическое ядро процессоров Llano качественно мало отличается от встроенной графики интеловских предложений: оба варианта для геймерской системы начального уровня подходят почти одинаково плохо. Мощность же вычислительных ядер, которыми располагают гибридные процессоры AMD, существенно ниже, чем у процессоров Intel, и это закрывает Llano путь в целый ряд домашних или офисных систем. Даже в роли сердца медиацентров у APU компании AMD не слишком много шансов перед конкурирующими предложениями. В этом случае их подводит слишком высокое тепловыделение и отсутствие средств, позволяющих ускорять кодирование видеоконтента высокого разрешения.

Однако самым грандиозным препятствием на пути Llano в настольные компьютеры стала специально разработанная для них платформа Socket FM1 с совершенно неясными перспективами. Никакие иные процессоры, кроме Llano, установить в неё невозможно, и это делает её «вещью в себе», с одной стороны, не склонной к последующему апгрейду, а с другой – с очень ограниченным сроком жизни. Вполне закономерно, что заинтересовать решением с таким сочетанием характеристик пользователей настольных систем практически невозможно, ведь рынок наводнён конкурирующими LGA1155-предложениями на любой вкус и кошелёк с куда более продолжительным жизненным циклом.

Но отдавать рынок интегрированных настольных процессоров во власть конкурента, который, видя перспективность концепции APU, в спешном порядке наращивает мощности собственных графических ядер, в планы AMD явно не входит. Поэтому, спустя примерно год с появления Llano, компания готова предложить второе поколение десктопных процессоров A-серии, исправленное и переработанное. Дизайн новых десктопных APU не является специализированным и утилитарным. Это – Trinity, и он уже обкатан на мобильных системах, где успешно применяется с начала лета. Однако для настольных систем серьёзно увеличены частоты вычислительной и графической составляющих, что позволяет производителю уверять общественность в том, что свежие APU, в отличие от их предшественников, должны понравиться многим пользователям десктопов, в том числе и энтузиастам.

В целом мы почти готовы поверить в слова AMD: по крайней мере, по дизайну Trinity однозначно лучше Llano. Как мы уже видели на примере мобильных APU, используемые в Trinity вычислительные ядра, которые основаны на микроархитектуре Piledriver, работают побыстрее ядер Husky из Llano, корни микроархитектуры которых уходят в далёкое прошлое. Существенно поднялась и производительность графического ядра, строение которого коренным образом переработано. И самое главное, для десктопных процессоров Trinity теперь предлагается новая платформа Socket FM2, которая должна быть лишена всех старых недостатков. AMD готова гарантировать её устойчивость в течение нескольких последующих лет, а модельный рад процессоров в совместимом с ней исполнении будет включать широкий диапазон предложений разного уровня.

Иными словами, если сравнивать Trinity и Llano, то новые процессоры очевидно лучше. Однако достаточно ли они хороши для того, чтобы результативно продвинуть концепцию APU в настольные системы, пользователи которых пока что относятся к подобным решениям очень скептически? В нашем материале мы попробуем частично дать ответ на этот вопрос, для чего подробно протестируем графическую составляющую настольных гибридных процессоров нового поколения и попробуем понять, хватает ли её мощности для применения в игровых системах начального уровня.

К сожалению, подробное рассмотрение второй части Trinity – вычислительных ядер – мы вынуждены отложить на некоторое время. Однако в этом нет нашей вины. Дело в том, что компания AMD пока официально не анонсировала свои новые процессоры A-серии для настольных систем. Поэтому наши руки частично связаны обязательствами о неразглашении, так что за этой статьей последует и вторая, включающая тесты другого плана. Впрочем, никто не запрещает нам оперировать имеющейся информацией о микроархитектуре Trinity, поэтому для начала давайте проанализируем, какую работу проделали инженеры AMD для того, чтобы новоиспечённые APU стали реальностью.

#Дизайн Trinity

В соответствии с оригинальной концепцией любой APU состоит из трёх основных частей. В этом плане Trinity не привносит никаких изменений: гибридные процессоры нового поколения включают процессорные ядра, интегрированный графический ускоритель и небольшой, но очень важный компонент – объединённый северный мост. Именно он превращает сумму разнородных ядер в единую систему и, включая контроллер DDR3 SDRAM, отвечает за взаимодействие вычислительных и графических ядер между собой и с системной памятью, обеспечивая возможность их совместной работы с одними и теми же данными.

В целом общая структура Trinity осталась точно такой же, как и у Llano, но вот на более низком уровне все составляющие переработаны. При этом все изменения сделаны таким образом, чтобы не раздувать полупроводниковый кристалл: производственная технология у AMD не обновилась, компания продолжает использовать 32-нм процесс Globalfoundries с SOI, а поднимать себестоимость APU, позиционируемых в качестве достаточно доступных предложений, производитель не собирается. В результате площадь кристалла Trinity по сравнению с Llano возросла лишь на 8 процентов – до 246 мм2. Количество транзисторов изменилось также весьма незначительно и достигло 1,303 млрд штук (было – 1,178 млрд). Более того, не сильно трансформировалось даже деление транзисторного бюджета между вычислительными и графическими ресурсами: они занимают на кристалле примерно одинаковую площадь и в том и в другом случае.

Тем не менее на этом разговоры о похожести Llano и Trinity можно и закончить. Вычислительные ядра, например, с выходом нового поколения APU изменены кардинально. Теперь в основе гибридных процессоров используется (и будет использоваться в дальнейшем) микроархитектура Bulldozer, а конкретнее, её второе поколение – Piledriver. Двухъядерники и четырёхъядерники Trinity включают в себя один или два условно называемых двухъядерными модуля, которые, напомним, содержат по два набора исполнительных устройств и могут обрабатывать по два потока одновременно, но при этом имеют общие на модуль кеш-память, блок выборки инструкций, их декодер и блок операций с плавающей точкой. При этом в Trinity по сравнению с основанными на микроархитектуре Bulldozer процессорами класса FX без встроенной графики не только уменьшено количество ядер, но и отсутствует кеш третьего уровня.

Зато используемое в новых APU второе поколение микроархитектуры Bulldozer, пока что не представленное ни в одном другом семействе процессоров, предлагает целый ряд небольших усовершенствований, направленных на увеличение производительности, уменьшение токов утечки и обеспечение стабильности на высоких тактовых частотах. Фронтальная часть конвейера получила более точный предсказатель ветвлений, а также окно инструкций увеличенного размера. Исполнительные устройства обрели улучшенный планировщик, а сами они научились немного быстрее выполнять отдельные инструкции, например целочисленное и вещественночисленное деление. Кроме того, разработчики говорят об увеличении ёмкости L1 TLB и о совершенствовании алгоритмов арбитража и предварительной выборки данных L2-кеша. Всё это оценено в примерно 25-процентное превосходство (по расчётам AMD) процессоров Trinity над Llano в вычислительной производительности.

Кардинальные изменения затронули и объединённый северный мост. В первую очередь инженеры пересмотрели систему приоритетов доступа к разделяемой памяти, отдав первенство вычислительным ядрам, которые, как показывает практика, генерируют относительно небольшую часть запросов. Помимо этого, AMD позаботилась и о поддержке новых типов памяти, включая DDR3-1866 в штатном режиме или DDR3-2400 при разгоне. Внутренние шины данных были расширены, в частности, графическое ядро получило возможность работать с контроллером памяти по 256-битной специализированной шине Radeon Memory Bus, а вне чипа все соединения теперь используют протокол PCI Express, пришедший на смену Hyper-Transport.

Однако наибольший интерес вызывают изменения, произошедшие с графическим ядром. Дело в том, что без существенного увеличения транзисторного бюджета и без коренной переработки архитектуры у AMD получилось заметно поднять его быстродействие, то есть фактически нарастить плотность полезных блоков в GPU за счёт упразднения каких-то излишков. Эта находка, пожалуй, заслуживает отдельного разговора, тем более что именно интегрированная в Trinity графика сегодня находится в фокусе нашего внимания.

#Графическое ядро Devastator

Самый интригующий факт, касающийся дизайна Devastator, – а именно такое кодовое имя получил GPU, встроенный в процессоры Trinity, – это то, что он основывается на архитектуре VLIW4. Если учесть, что графическое ядро Llano базировалось на архитектуре VLIW5, такой ход AMD кажется несколько странным, и мы бы скорее ожидали увидеть в Trinity архитектуру CGN, характерную для последних версий дискретных ускорителей. Однако на самом деле именно VLIW4 позволяет увеличить удельную эффективность графического ядра, искусственно ограниченного числом транзисторов. Такой трюк AMD уже проворачивала с собственными видеокартами серии Radeon HD 6900, и тогда его результаты были более чем удовлетворительными.

Суть в том, что предусмотренная VLIW5 группировка ALU по пять штук на потоковый VLIW-процессор оказывается не очень эффективной, и один из ALU в большом числе случаев просто простаивает. Поэтому VLIW4-компоновка Devastator, предполагающая наличие четырёх ALU в потоковом VLIW-процессоре, влечёт за собой более рациональное задействование имеющихся ресурсов. Конечно, обратной стороной выступает уменьшение суммарного числа исполнительных устройств и снижение теоретической пиковой производительности ядра, однако практическая удельная производительность в пересчёте на квадратный миллиметр растёт. А для кристалла гибридного процессора, на котором, помимо графического ядра, находятся вычислительные ядра, это – наиболее правильный путь оптимизации.

В общей сложности в графическом ядре Trinity предусмотрено шесть SIMD-движков, каждый из которых состоит из четырёх текстурных блоков и шестнадцати потоковых VLIW-процессоров. В сумме это даёт наличие в ядре 384 ALU, и это – на 16 штук меньше, чем имелось в распоряжении графического ядра Sumo процессоров Llano. Однако простая арифметика здесь не вполне уместна, ALU-блоки Devastator обычно загружены работой сильнее, чем их предшественники, а, кроме того, относительная простота потоковых VLIW-процессоров позволяет выставлять графическому ядру более высокие тактовые частоты. Например, в то время как в старшей версии Llano графика работала на частоте 600 МГц, у Trinity скорость видеоядра может достигать 800 МГц.

Если учесть, что в распоряжении Devastator есть 24 блока текстурирования (по 4 TMU на каждый SIMD-движок) и 8 блоков растровых операций (ROP), то можно заключить, что это графическое ядро фактически представляет собой примерно одну четверть GPU класса Radeon HD 6970. Что даже с учетом поправки на немного более низкую рабочую частоту и на отсутствие выделенной шины памяти с высокой пропускной способностью – очень неплохо. Иными словами, говоря, что процессоры Trinity оснащены интегрированной графикой «дискретного» класса, AMD совсем не лукавит. От гибридных процессоров нового поколения действительно можно ожидать очень неплохой 3D-производительности.

Вряд ли кого-то удивит то, что графическое ядро Trinity совместимо с современными программными интерфейсами DirectX 11, OpenCL 11 и DirectCompute 11. Эти возможности были и у видеокарт Radeon HD 6900, основанных на той же архитектуре, и у предшественников Trinity – процессоров Llano. Но при этом в новой встроенной графике унаследованы и некоторые черты совсем современных решений, в которых нашла своё место архитектура CGN. В частности, в Devastator имеется усовершенствованный блок тесселяции, а также поддержка всех актуальных типов полноэкранного сглаживания: SSAA, EQAA и MLAA.

Отдельное внимание в графике Trinity уделено актуальным для гибридных процессоров медийным возможностям. Графическое ядро располагает позаимствованным из свежих версий GPU специализированным блоком AMD HD Media Accelerator, который включает в себя движки для аппаратного декодирования видео (UVD3) и аппаратного кодирования видеоконтента в формат H.264 (VCE). Последняя возможность очень важна для успешной конкуренции Trinity с интеловскими гибридными процессорами, давно получившими технологию Quick Sync для высокоскоростного транскодирования видео высокого разрешения. Теперь нечто подобное есть и в процессорах AMD, однако на данный момент мы так и не смогли убедиться в работоспособности движка VCE по причине проблем с его поддержкой в драйверах и в существующем программном обеспечении.

Выводя на рынок настольных систем свой новый гибридный процессор, в AMD задумались и над тем, чтобы его пользователи не чувствовали себя обделёнными по сравнению с владельцами дискретных видеокарт в части возможностей подключения мониторов. Выражается это в том, что к интегрированной системе с процессором Trinity можно подключить до четырёх независимых дисплеев одновременно, при этом поддерживаются все типы соединений: аналоговый — VGA — и цифровые — DVI, HDMI и Display Port 1.2, а также четыре независимых аудиопотока. Правда, при этом количество физических выводов ограничено тремя, а для подключения четырёх дисплеев потребуется соединение пары мониторов «цепочкой» через Display Port.

Что впечатляет ещё сильнее, графика Trinity поддерживает и технологию Eyefinity. Конечно, для того чтобы найти какую-нибудь игру, способную работать с приемлемым уровнем FPS на подключенных к Devastator трёх-четырёх мониторах, придётся потрудиться, но само наличие такой возможности говорит о том внимании, с которым разработчики AMD подошли к оснащению APU второго поколения перед его выводом на массовый рынок.

#Модельный ряд Trinity

Говоря о графическом ядре десктопных процессоров Trinity, необходимо коснуться и состава их модельного ряда. Дело в том, что различные представители A-серии с дизайном Trinity могут быть снабжены различающимися вариантами ядра Devastator. Их различия образуются стандартно: пытаясь ввести сегментирование своих продуктов по различным ценовым категориям, производитель в младших модификациях отключает один или несколько SIMD-движков. В результате подробно описанным в предыдущем разделе набором ресурсов, включающим 384 исполнительных устройства, обладают лишь старшие модификации APU.

Номенклатура моделей Trinity при этом выглядит следующим образом. Наиболее скоростные модели с полноценным ядром Devastator, которое имеет маркетинговое название Radeon HD 7660D, относятся исключительно к новой флагманской серии A10. Все же остальные модификации с графическими ядрами с урезанным количеством потоковых процессоров и с пониженными частотами принадлежат к более «простым» сериям A8, A6 и A4, заменяя в них процессоры со старым дизайном Llano.

Полный состав линейки APU, основанной на дизайне Trinity, приводится в таблице:

Спецификации APU Trinity
Модельный номер A10-5800K A10-5700 A8-5600K A8-5500 A6-5400K A4-5300
Встроенная графика HD 7660D HD 7660D HD 7560D HD 7560D HD 7540D HD 7480D
TDP, Вт 100 65 100 65 65 65
Число унифицированных шейдерных процессоров 384 384 256 256 192 128
Частота GPU, МГц 800 800 760 760 760 723
Количество ядер 4 4 4 4 2 2
Частота CPU, ГГц (базовая/турбо) 3,8 / 4,2 3,4 / 4,0 3,6 / 3,9 3,2 / 3,7 3,6 / 3,8 3,4 / 3,6
L2-кеш, Мбайт 4 4 4 4 1 1
Максимальная частота памяти DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1600

Даже версия графического ядра, устанавливаемая в процессоры класса A8, чисто теоретически медленнее полноценного Devastator более чем на 35 процентов. Что уж говорить о ещё более медлительных A6 и A4. А это значит, что для использования в качестве игрового решения интерес представляют в первую очередь процессоры A10-5800K и A10-5700. Именно их можно пытаться представить себе в геймерских системах начального уровня, лишённых дискретной видеокарты. Процессоры же младших серий, пожалуй, для универсальных игровых компьютеров подходят совсем плохо, поэтому их рекомендуется применять в мультимедийных центрах или в домашних развлекательных системах, не нацеленных на запуск ресурсоёмких игровых 3D-приложений.

Именно поэтому в данном материале мы сосредоточились на тестировании самого старшего гибридного процессора — A10-5800K, со встроенным в него графическим ядром Radeon HD 7660D. Этот процессор имеет в своём распоряжении два модуля Piledriver, благодаря чему распознаётся диагностическими утилитами и операционной системой как четырёхъядерный. Однако отметим и существование альтернативного мнения, согласно которому этот процессор – двухъядерный, но с возможностью выполнения четырёх потоков. Собственно, это мнение, хотя и противоречит заявлениям самой AMD, как раз более точно отражает позиционирование A10-5800K. По своей стоимости этот APU попадает в ту же ценовую категорию, что и интеловские Core i3, которые, как известно, двухъядерники, но с поддержкой технологии Hyper-Threading.

Рабочая частота рассматриваемого процессора, с учетом поддержки им технологии Turbo Core 3.0, должна колебаться в пределах от 3,8 до 4,2 ГГц. Однако на практике мы видели, что под нагрузкой большую часть времени A10-5800K проводит в промежуточном состоянии – при частоте 4,0 ГГц.

Встроенное в A10-5800K графическое ядро Radeon HD 7660D работает на частоте 800 МГц, причём в моменты отсутствия 3D-нагрузки она снижается до 300 МГц. Несмотря на то, что AMD обещала функционирование турборежима и для графического ядра, в реальности выше заложенных в спецификациях 800 МГц его частота не поднимается.

Тестирование. Выводы

#Как мы тестировали

В рамках этого материала мы поставили перед собой цель исследовать производительность графического ядра новых гибридных процессоров AMD и, опираясь на полученные результаты, ответить на вопрос: могут ли самые современные процессоры с интегрированной графикой использоваться в составе игровых систем начального уровня без добавления дискретных видеокарт.

В тестировании процессору AMD A10-5800K c графическим ядром Radeon HD 7660D противопоставлялись другие присутствующие на рынке интегрированные чипы, обладающие 3D-графикой с приемлемым уровнем производительности. Во-первых, это – хоть и устаревающие с появлением Trinity, но всё ещё актуальные AMD Llano, представленные в наших тестах старшим процессором этого семейства, AMD A8-3870K с видеоядром Radeon HD 6550D. Во-вторых – представители семейства Intel Ivy Bridge, максимальная версия графического ядра которых, HD Graphics 4000, обладает многообещающей (по мнению его разработчиков) 3D-производительностью. Честь интеловской графики отстаивал двухъядерный процессор Core i3-3225. Мы выбрали именно его, а не четырёхъядерник семейства Core i5, так как APU компании AMD позиционируются в качестве альтернативы интеловским двухъядерным процессорам самим производителем. В частности, по предварительным данным, стоимость AMD A10-5800K будет примерно такой же, как и у младших представителей семейства Core i3.

Кроме того, не следует забывать и о выводах наших прошлых исследований, показывающих более высокую удельную эффективность ядер процессоров Intel. Четырёхъядерники с микроархитектурой Sandy Bridge вполне успешно противостояли восьмиядерным процессорам Bulldozer, и маловероятно, что с выходом новых поколений микроархитектур Ivy Bridge и Piledriver эта ситуация как-то поменялась. Это можно подтвердить и относительными результатами теста SYSmark 2012, показывающими общеупотребительную производительность процессоров.

Хотя AMD A10-5800K и получил заметно более высокое, нежели AMD A8-3870K, быстродействие, от процессоров Core i3-3225 и Core i3-2125 он отстаёт, не говоря уже об его солидном проигрыше в вычислительной производительности четырёхъядернику Core i5-3330. Так что противопоставление четырёхъядерных APU компании AMD в графических тестах двухъядерному Core i3 вполне оправданно. К тому же различия в графической производительности самого мощного Intel Core i7 и выбранного нами Core i3 сводятся к 100-МГц разнице в частоте встроенного видеоядра: 1,05 ГГц у нашего подопытного против 1,15 ГГц у флагманского процессора под Socket LGA1155. Так что принципиально лучший результат, чем Core i3-3225, никакой другой интеловский процессор в графических тестах показать не сможет.

Чтобы мы имели возможность судить об уровне быстродействия интегрированных графических ядер современных процессоров относительно дискретных видеокарт, в число протестированных конфигураций был добавлен и вариант, снабжённый внешней графикой. Ориентиром была выбрана видеокарта Radeon HD 6570, стоимость которой на сегодняшний день в используемой нами версии с GDDR5-памятью составляет порядка $70. Её тестирование проводилось в системе с процессором A10-5800.

В результате в тестах были задействованы следующие аппаратные и программные компоненты:

  • Процессоры:
    • AMD A10-5800K (Trinity, 4 ядра, 3,8-4,2 ГГц, 4 Мбайт L2, Radeon HD 7660D);
    • AMD A8-3870K (Llano, 4 ядра, 3,0 ГГц, 4 Мбайт L2, Radeon HD 6550D);
    • Intel Core i3-3225 (Ivy Bridge, 2 ядра + HT, 3,3 ГГц, 3 Мбайт L3, HD Graphics 4000).
  • Материнские платы:
    • ASUS P8Z77-V Deluxe (LGA1155, Intel Z77 Express);
    • ASUS F2A85-V Pro (Socket FM2, AMD A85);
    • Gigabyte GA-A75-UD4H (Socket FM1, AMD A75).
  • Видеокарта: AMD Radeon HD 6570 1 Гбайт GDDR5 128-бит.
  • Память: 2 x 4 Гбайт, DDR3-1866 SDRAM, 9-11-9-27 (Kingston KHX1866C9D3K2/8GX).
  • Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
  • Блок питания: Corsair AX1200i (80 Plus Platinum, 1200 Вт).
  • Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
  • Драйверы:
    • AMD Catalyst 12.8 Driver;
    • AMD Chipset Driver 12.8;
    • Intel Chipset Driver 9.3.0.1019;
    • Intel Graphics Media Accelerator Driver 15.26.12.2761;
    • Intel Management Engine Driver 8.1.0.1248;
    • Intel Rapid Storage Technology 11.2.0.1006.

При тестировании платформы, основанной на процессоре AMD A10-5800K, были установлены патчи операционной системы KB2645594 и KB2646060, адаптирующие поведение планировщика под микроархитектуру Bulldozer.

Основной акцент в настоящем тестировании был вполне закономерно сделан на игровые применения встроенной процессорной графики. Поэтому основная масса использованных нами бенчмарков – это игры или специализированные геймерские тесты. Причём, если учесть поставленные цели, нас в первую очередь интересовала производительность различных графических решений в ставшем де-факто стандартом для настольных систем Full HD-разрешении 1980x1080. Поэтому большинство тестов проводилось именно в нём при установке низкого или среднего уровня качества изображения.

#3D-производительность

3DMark Vantage

Результаты тестов семейства 3DMark очень популярны для оценки средневзвешенной игровой производительности видеокарт. Поэтому к 3DMark мы обратились в первую очередь. Для начала давайте посмотрим на производительность в версии Vantage, которая использует DirectX десятой версии.

В глаза сразу же бросается тот немалый прогресс, который произошёл с APU компании AMD при переходе от графического ядра Sumo к новому дизайну Devastator. Преимущество процессора Trinity перед флагманом семейства Llano составляет порядка 40 процентов. В результате система, построенная на базе A10-5800K, приближается по графическому быстродействию к платформе с дискретной видеокартой AMD Radeon HD 6570.

3DMark 11

Более свежая версия 3DMark ориентирована на измерение DirectX 11-производительности. Ранее в подобных тестах не могли принимать участие процессоры Intel, оставляя APU компании AMD в одиночестве, однако реализованное в Ivy Bridge графическое ядро Intel HD Graphics 4000 наконец-то получило поддержку всех современных программных интерфейсов, так что процессор Core i3-3225 присутствует и на этой диаграмме.

3DMark 11 выдал чрезвычайно интересный результат. По данным этого бенчмарка, графическое ядро, встроенное в A10-5800K, смогло обойти дискретную видеокарту Radeon HD 6570. Это выступает прекрасной иллюстрацией высокой эффективности использованной в Devastator архитектуры VLIW4. Напомним, видеокарта Radeon HD 6570 основывается на 800-мегагерцевом графическом процессоре Turks c VLIW5-архитектурой и при этом обладает 480 потоковыми процессорами против 384 в Devastator. Однако большее количество исполнительных устройств, как мы видим, не всегда выливается в лучшие практические показатели, из чего можно сделать вывод о том, что выбор для Trinity VLIW4-дизайна – это очень правильное решение.

Aliens vs. Predator (2010)

Несмотря на то, что в синтетическом бенчмарке 3DMark 11 графическое ядро процессора A10-5800K смогло обогнать дискретную видеокарту Radeon HD 6570, в реальном игровом приложении — Aliens vs. Predator – ситуация складывается совершенно иным образом. Тут дискретный видеоускоритель серьёзно опережает любой вариант интегрированной графики, включая и Radeon HD 7660D. Очевидно, что слабым местом любых процессорных видеоускорителей остаётся шина памяти, которая обладает явно недостаточной пропускной способностью. При этом следует отметить, что мы здесь сравниваем Radeon HD 7660D с видеокартой Radeon HD 6570, оборудованной GDDR5-памятью с высокой пропускной способностью. Но если бы в тестах использовалась более «простая» дискретная видеокарта с DDR3 SDRAM, то она наверняка бы оказалась поверженной ядром Devastator.

Batman: Arkham City

Разница в производительности старого и нового графического ядра, используемых в составе APU компании AMD, в Batman: Arkham City составляет около 30 процентов. Так что с точки зрения быстродействия графики переход от дизайна Llano к дизайну Trinity – вполне оправданное решение, приносящее ощутимые дивиденды. При этом сделан такой шаг отнюдь не из-за обострения конкуренции с Intel: даже самый новый и самый быстрый GPU микропроцессорного гиганта выглядит на фоне предложений AMD очень блекло. Очевидно, AMD прицеливается на подписание смертного приговора бюджетным видеокартам с DDR3-памятью, например Radeon HD 6570 или GeForce GT 630.

Battlefield 3

Конечно, Radeon HD 7660D – это совсем не то же самое, что дискретная видеокарта верхнего или среднего уровня. Производительность этого решения существенно ниже. Однако, как мы видим, новое интегрированное графическое ядро компании AMD позволяет вполне пристойно играть в самые современные игры в Full HD-разрешении, в том числе и в Battlefield 3. Порой для этого требуется выставлять низкие настройки качества, но зато среднее количество кадров в секунду находится на приемлемом уровне. Не демонстрирует Radeon HD 7660D и явных «просадок». Например, при тестировании в Battlefield 3 минимальная мгновенная производительность с низкими настройками качества составила вполне приличные, пусть и не совсем играбельные 18 кадров в секунду.

Borderlands 2

Без особых проблем идёт на A10-5800K даже новейший шутер от первого лица Borderlands 2. О «красивостях», конечно, придётся забыть, но зато свежий APU компании AMD, в отличие от интеловских процессоров с интегрированной графикой, даёт возможность поиграть в Borderlands 2 в разрешении 1920x1080 без установки дискретного видеоускорителя.

F1 2012

Игры в жанре симуляторов автогонок обычно не слишком требовательны к графическим ресурсам. Типично в этом плане и поведение F1 2012 — эта игра идёт на интегрированных системах с хорошей производительностью даже при выборе Full HD-разрешения и высокого качества изображения. При этом, хотя преимущество Radeon HD 7660D над графикой из процессора Llano приближается к 35 процентам, дискретная видеокарта Radeon HD 6570 всё же показывает слегка более высокий результат. Впрочем, по сравнению с графическим ядром конкурирующих процессоров, Intel HD Graphics 4000, любые интегрированные предложения AMD выглядят превосходно. В F1 2012 процессор A10-5800K обгоняет Core i3-3225 примерно на 60 процентов.

Far Cry 2

Мы совершенно осознанно не выкидываем Far Cry 2 из тестового набора. Присутствие этого шутера четырёхлетней давности позволяет воочию увидеть то, что в играх прошлого поколения современный APU класса Trinity работает с просто-таки выдающейся производительностью. Например, в том же Far Cry 2 мы смогли выставить разрешение 1920x1080 с максимально доступным качеством изображения и при этом получили в среднем более 30 кадров в секунду. При этом зафиксированный в тестировании минимальный FPS составил вполне приемлемые 23 кадра в секунду.

Sleeping Dogs

К сожалению, в самой современной из выбранных нами игр графическое ядро процессора A10-5800K вновь демонстрирует свою неспособность противостоять полноценной видеокарте Radeon HD 6570, отставая от неё примерно на 10-15 процентов. Источник проблемы APU понятен – ему бы не помешала память с более высокой пропускной способностью. Именно поэтому распространение решений, подобных Trinity, может сильно оживить рынок DDR3 SDRAM. В общеупотребительных приложениях скорость работы зависит от частоты памяти совсем малозаметно, но вот для систем с интегрированной графикой быстрая подсистема памяти может оказаться принципиально важной. Впрочем, этому вопросу мы ещё уделим подробное внимание.

Sniper Elite V2

Среди всех имеющихся на рынке встроенных GPU ядро Devastator в версии Radeon HD 7660D – это самое быстрое решение. Результаты, полученные в бенчмарке Sniper Elite V2, подтверждают это ещё раз. Новая версия интегрированного графического ядра, разработанная компанией AMD, обгоняет прошлую модификацию Sumo на 26 и 43 процента в зависимости от установок качества изображения. В результате превосходство Radeon HD 7660D над Intel HD Graphics 4000 достигает двукратной величины. Иными словами, в части встроенных в процессор GPU компания AMD продолжает значительно обгонять своего конкурента. Причём на произошедший у Intel с выходом микроархитектуры Ivy Bridge прогресс у AMD нашёлся не менее впечатляющий ответ – Trinity. Так что актуальные APU обеих компаний вновь попадают в совершенно различные весовые категории.

Cinebench R11.5

Все игры, в которых мы провели тестирование, относятся к приложениям, использующим программный интерфейс DirectX. Однако нам хотелось посмотреть и на то, как справятся ускорители с работой в OpenGL. Поэтому к чисто игровым тестам мы добавили и небольшое исследование производительности при работе в профессиональном графическом пакете Cinema 4D.

Расклад сил совершенно типичен. Уровень производительности Trinity в OpenGL-приложении качественно не отличается от его скорости в игровых DirectX-задачах. Встроенный в процессор AMD A10-5800K ускоритель Radeon HD 7660D опережает своего предшественника и интеловского конкурента, но отстаёт от дискретной видеокарты Radeon HD 6570. При этом, если принять во внимание достигнутый уровень OpenGL-быстродействия, идея использования встроенной графики в профессиональных приложениях начинает казаться не такой уж и абсурдной. Более того, в ассортименте компании AMD даже имеются и соответствующие предложения – «профессиональные» процессоры Trinity, продаваемые под торговой маркой FirePro.

Производительность GPGPU

Компания AMD неустанно акцентирует внимание на том, что её процессоры Llano, а теперь и Trinity, относятся к классу APU. Это означает, что их архитектура оптимизирована под решение задач различного класса силами не только традиционных x86-ядер, но и потоковых процессоров графического ядра — они должны трудиться совместно. Для успешного функционирования такого содружества принципиально различных вычислительных ресурсов, естественно, требуется специализированное программное обеспечение. И если ещё год назад это звучало как приговор концепции APU, то теперь ситуация начала активно меняться. Разработчики целого ряда популярных программных продуктов стали предпринимать конкретные попытки использования преимуществ гибридных решений. На сегодня существует информация о том, что вычислительные возможности графического ядра могут вовлекать в работу текущие или перспективные версии таких программ, как Adobe Flash 11.2, Adobe Photoshop CS6, GIMP, ArcSoft MediaConverter 7.5, CyberLink MediaEspresso 6.5, Handbrake и WinZip 16.5.

В рамках данного материала мы пока не имеем права прибегать к тестированию процессора Trinity в подобном программном обеспечении, тем не менее мы можем оценить практическое быстродействие графического ядра Devastator на GPGPU-нагрузке, создаваемой через программные интерфейсы OpenCL и Microsoft DirectCompute. Для этого мы использовали тестовый пакет SiSoftware Sandra 2012.10.18.74.

Вычислительная производительность графического ядра Devastator выглядит очень неплохо. Применение в его основе VLIW4-архитектуры позволяет достичь высокой эффективности вычислений общего назначения, в результате чего Radeon HD 7660D заметно обгоняет не только предшествующую версию графического ускорителя из Llano и интеловское графическое ядро Intel HD Graphics 4000, но и дискретную видеокарту Radeon HD 6570. В итоге в приложениях, поддерживающих OpenCL, от Trinity можно ожидать высокого уровня производительности.

Похожим образом складывается ситуация и в криптографическом тесте. Иными словами, поместив в новые гибридные процессоры производительную графику с VLIW4-архитектурой, AMD стремилась решить вполне конкретную задачу – наглядно показать полезность и перспективность совмещения x86-ядер общего назначения и потоковых графических ядер. Если учесть, что производители программного обеспечения начинают пробовать использование гибридных процессоров в деле, это очень своевременный ход. На данном этапе AMD должна не просто продемонстрировать потенциальную возможность новых подходов, но и на деле доказать их преимущество.

#Выводы

Времена, когда к интегрированной графике нужно было подходить с позиции «лишь бы работало», давно прошли. С тех пор как графические ядра обосновались в центральных процессорах, AMD и Intel стали активно наращивать их мощность, вытесняя с рынка бюджетные видеокарты и придавая своим процессорам новые модели использования. В этой гонке встроенных GPU лидером выступает компания AMD: самые быстрые графические ядра из процессоров Ivy Bridge пока что не превзошли даже графику Llano, не говоря уже о новом Trinity. Однако такое положение дел не стало для AMD поводом, чтобы замедлить темпы введения инноваций. Эта компания борется не с конкретным продуктом конкурента, а за то, чтобы отношение к гибридным процессорам изменилось в принципе. Для этого нужно не простое превосходство над альтернативными продуктами в бенчмарках, а иное его качество.

Очень похоже, что новые десктопные процессоры Trinity, с которыми мы познакомились сегодня, это и есть тот самый необходимый качественный скачок. AMD A10-5800K не просто оказался гибридным процессором с самым быстродействующим на данный момент графическим ядром. Важно то, что скорости этого ядра уже хватает на обеспечение приемлемой производительности практически в любых современных 3D-играх в Full HD-разрешении. Конечно, при этом приходится выставлять не самые максимальные настройки качества, однако факт остаётся фактом: Trinity вполне достойно смотрится в одном ряду с дискретными 3D-акселераторами нижнего уровня, стоимостью порядка $60-70, которые новый гибридный процессор может с лёгкостью заменить. Фактически сегодня можно говорить о том, что ускорители типа Radeon HD 6570 и GeForce GT 630 с распространением Trinity могут отправляться на свалку, по крайней мере это относится к их DDR3-модификациям.

Сегодня мы познакомились лишь с графической составляющей нового многообещающего проекта AMD. И эта составляющая – его сильная сторона. С точки же зрения общеупотребительной производительности Trinity, скорее всего, не сможет стать таким же впечатляющим предложением. Даже обещанного самой AMD 25-процентного роста скорости будят явно недостаточно для того, чтобы A10-5800K, как и другие продукты семейства, смог бы выступать на равных с интеловскими процессорами поколения Ivy Bridge. Конечно, можно рассчитывать на то, что AMD сможет продавить концепцию APU, и гибридные предложения этого производителя получат заметный прирост быстродействия за счёт вычислительных ресурсов графического ядра. Однако если это и произойдет, то явно не очень скоро. Поэтому пока в виду придётся иметь то, что у Trinity есть и слабая сторона.

Что же в итоге? Задумайтесь, большинству покупателей десктопных процессоров Intel, по большому счёту, на их графическую производительность наплевать. Они готовы мириться с любым её уровнем, так как их привлекает высокая скорость x86-ядер. Trinity же вполне может добиться расположения потребителей, зайдя с другой стороны. Если этот APU предлагает заманчивый уровень 3D-производительности, стоит ли так сильно переживать из-за более низкой, чем у конкурента, скорости x86-ядер? Ответ на этот вопрос, судя по имеющимся данным, вполне может быть отрицательным: для большинства типичных задач имеющегося быстродействия Trinity наверняка вполне хватает.

Впрочем, давайте не будем торопиться с окончательными выводами и дождёмся-таки снятия эмбарго на публикацию полных результатов тестов. В то время как вы читаете эти строки, работа над продолжением материала уже ведётся.



Оригинал материала: https://3dnews.ru./635804