Оригинал материала: https://3dnews.ru./794878

Первое знакомство с AMD Kaveri. Обзор процессора AMD A8-7600

Микроархитектура Steamroller. Графическое ядро GCN. Технологии HSA: hUMA и hQ

В том, что AMD собирается свернуть разработку своих высокопроизводительных многоядерных процессоров, сомнений остаётся всё меньше и меньше. На смену чипам, располагающим одними лишь вычислительными x86-ядрами и предназначающимся для использования в игровых системах совместно с дискретным видеоускорителем, окончательно приходят гибридные процессоры — APU (Accelerated Processing Units), совмещающие на одном полупроводниковом кристалле как вычислительные, так и графические ядра. В течение многих лет AMD успешно торговала процессорами серии FX, которые не обладали встроенными графическими ядрами и представляли собой быстрейшие предложения компании. Такие чипы, идеологически похожие на Intel Core Extreme Edition, пользовались достаточно высокой популярностью среди геймеров и оверклокеров, применяющих при построении своих систем продвинутые внешние видеокарты. Их успех опирался на проводимую AMD разумную ценовую политику и неплохую многопоточную производительность. Однако теперь AMD собирается перенести фокус с проверенных временем процессоров серии FX на новомодные APU, и это — принципиальное решение, отражающее произошедшую смену приоритетов.

Как официально заявляют представители компании, серия процессоров FX пока не умрёт, но AMD сосредоточится на развитии и продвижении APU, которые более актуальны в свете возникшего бума мобильных решений. Всё это означает, что принципиально новых моделей в линейке FX больше не будет, и в них продолжит использоваться 32-нм процессорный дизайн Piledriver образца 2012 года. В то же время основным предложением из ассортимента AMD для настольных, мобильных и прочих ПК станут гибридные процессоры, которые, напротив, будут активно развиваться.

И сегодня мы познакомимся с абсолютно новым APU компании AMD, Kaveri, в котором такое развитие проявляется почти во всём: в микроархитектуре x86-ядер, в строении интегрированного видеоядра и в том, как эти компоненты взаимодействуют между собой. По замыслу маркетологов AMD, данный гибридный процессорный дизайн должен совершить с серией FX своеобразную рокировку. Отныне главным и флагманским продуктом становится именно Kaveri, а серии FX отводится роль свадебного генерала, обладающего обширным набором регалий, но при этом не воспринимаемого серьёзно. Хотя Kaveri пока не претендуют на достижение такой же, как у FX, многопоточной x86-производительности из-за вдвое меньшего количества вычислительных ядер, они предлагают более прогрессивную архитектуру. В частности, в их основе лежит самая современная микроархитектура Steamroller, выступающая дальнейшим развитием Piledriver, а для производства используется наиболее совершенный из имеющихся в распоряжении AMD техпроцесс с 28-нм нормами.

AMD обещает, что Kaveri и их последователи постепенно доберутся и до высокопроизводительных игровых ПК, в том числе и до таких, где используются дискретные видеокарты. Правда, как у компании получится выполнить такой маркетинговый манёвр, откровенно говоря, не совсем понятно. Сама же AMD делает акцент на уникальном свойстве новых гибридных процессоров — поддержке спецификации HSA (Heterogeneous System Architecture), предполагающей возможность параллельной обработки одних и тех же данных вычислительными и графическими (а в общем случае и любыми иными) ядрами. Вариант реализации HSA в Kaveri, названный hUMA, позволяет всем гетерогенным ядрам процессора пользоваться общей памятью и единым адресным пространством, что избавляет от необходимости копирования данных при их обработке разнородными ресурсами и увеличивает производительность. Однако всё это требует программной поддержки, которая, как это обычно и бывает с революционными начинаниями, пока находится в зачаточном состоянии.

Так что фактически на данный момент Kaveri — это просто новый процессор с интегрированным графическим ядром, в котором AMD усилила микроархитектуру и увеличила производительность всех составляющих — скалярной (x86) и параллельной (GPU). Но достаточно ли этих изменений для того, чтобы получившийся продукт стал действительно привлекательным вариантом для производительных настольных компьютеров? Сама AMD, говоря, что это вполне возможно с теоретических позиций, на практике, похоже, серьёзно опасается, как бы её бодрая риторика не разбилась о суровую реальность. Поэтому к первому появлению Kaveri на публике она постаралась напустить максимальное количество тумана и построить всё таким образом, чтобы затруднить объективное тестирование нового продукта. Например, в преддверии анонса наша редакция получила образец лишь младшей десктопной модели нового APU, A8-7600, а графический драйвер для Kaveri нам достался и вовсе только позавчера. Однако, невзирая на все выстроенные AMD препоны, мы всё же попробуем разобраться, имеет ли Kaveri шанс стать флагманским решением компании на рынке настольных компьютеров.

#Микроархитектура Steamroller

Новая микроархитектура вычислительных ядер Kaveri — это, пожалуй, одно из важнейших обновлений, привносимых этим процессором. После того как предыдущие версии производительной микроархитектуры AMD, Bulldozer и Piledriver, не смогли сравниться по быстродействию с интеловскими Core, улучшение эффективности старших процессоров AMD стали связывать с новой микроархитектурой Steamroller. Тем более что разработчики обещали в Steamroller постараться ликвидировать главный недостаток больших ядер AMD — низкую однопоточную производительность.

Теперь мы уже знаем, что Steamroller в производительные многоядерные процессоры не попадёт, а будет существовать лишь в APU с двумя и четырьмя ядрами. Однако интерес к данной микроархитектуре от этого только увеличился. В свете смены приоритетов в пользу APU, AMD необходимо добиться, чтобы её четырёхъядерные процессоры смогли бы конкурировать по производительности с четырёхъядерниками Intel. И Steamroller может предложить для этого целый набор улучшений. Сама AMD говорит о том, что количество исполняемых за такт инструкций у новой микроархитектуры выросло примерно на 20-25 процентов по сравнению с Piledriver. А если учесть, что для производства процессоров с микроархитектурой Steamroller используется более прогрессивный техпроцесс с 28-нм нормами, который при удачном стечении обстоятельств способен улучшить и частотный потенциал, от них можно ожидать заметного рывка в производительности.

В целом Steamroller представляет собой эволюционное развитие предыдущих микроархитектур Bulldozer и Piledriver. AMD идёт по пути пошаговой оптимизации, не затрагивая заложенный c появлением процессоров класса K15 базис. Поэтому по большинству формальных характеристик разницы между Piledriver и Steamroller не заметно. В обоих случаях используется одна и та же структура с двухъядерными модулями и 2-мегабайтным кешем второго уровня на каждый модуль, а в поддерживаемой системы команд не вводится никаких дополнений.

Основная проблема предыдущих микроархитектур Bulldozer и Piledriver состояла в объединении пар вычислительных ядер в модули, существенная часть ресурсов в которых присутствует в единичном на оба ядра экземпляре. К числу разделяемых узлов относились блоки выборки и декодирования инструкций, блок операций с плавающей запятой и кеш-память. Такой подход позволял AMD добиться уменьшения сложности полупроводниковых кристаллов и снижения их тепловыделения, но при многопоточной нагрузке разделяемые ресурсы становились ограничивающим производительность узким местом, приводящим к простоям исполнительных устройств. Как показала практика, наибольшие «заторы» возникали на этапе декодирования инструкций, и в Steamroller разработчики AMD решили исправить этот недостаток.

В результате главным улучшением в Steamroller стало удвоение числа декодеров. Теперь каждое из ядер, входящих в двухъядерный модуль, обладает собственным независимым декодером, способным обрабатывать до четырёх x86-инструкций за такт. Но выборка инструкций при этом осталась в сфере ответственности общего на два ядра функционального узла, эффективность и результативность работы которого попытались улучшить другими мерами. В частности, совершенствованием алгоритмов предсказания переходов (за счёт роста ёмкости буферов) и увеличением размера общего на модуль кеша инструкций первого уровня с 64 до 96 Кбайт.

Следует понимать, что удвоение числа декодеров — это лишь ликвидация основного бутылочного горлышка микроархитектуры, поэтому ожидать от Steamroller близкого к двукратному роста темпа исполнения инструкций явно не следует. Узкие места в микроархитектуре остались на этапах выборки и исполнения инструкций, и прирост скорости, обеспечиваемый Steamroller по сравнению с прошлыми версиями микроархитектуры, оказывается не столь значительным.

К изменениям во фронтальной части исполнительного конвейера добавились и некоторые другие мелкие переделки микроархитектуры, которые, впрочем, не имеют столь же основополагающего влияния на производительность. Так, в Steamroller проведена балансировка ролей исполнительных устройств в блоке FPU с целью оптимизации их загрузки, а также оптимизирован интерфейс между кеш-памятью первого и второго уровня, что позволило увеличить скорость перемещения данных. Часть же нововведений в Steamroller вообще направлена исключительно на улучшение экономичности. Так, L2-кеш получил деление на четыре области, имеющие независимое питание, что позволяет по возможности отключать его по частям, а в декодерах добавилась очередь микроопераций, при наполнении которой основная логика этих блоков также может обесточиваться.

К сожалению, вместе с увеличением производительности микроархитектура Steamroller существенно нарастила и свою сложность. Число транзисторов, задействованных в одном двухъядерном модуле, с переходом от Piledriver к Steamroller возросло более чем на 60 процентов. Связано это не только с внутренними изменениями в микроархитектуре, но и с вводом новых автоматизированных методов компоновки полупроводникового кристалла. Впрочем, тут важна не столько причина, сколько следствие: внедрение располневшего Steamroller в многоядерные процессоры серий Opteron и FX стало для AMD невозможным, по крайней мере при использовании имеющихся в распоряжении производителя техпроцессов. Но для APU с двумя или четырьмя x86-ядрами новая микроархитектура вполне подошла.

Получается, что Steamroller, в которой AMD попыталась простыми методами увеличить эффективность, заставляет компанию отказываться от своей изначальной идеи — компоновки процессоров из большого числа высокочастотных, но простых ядер. Иными словами, внедрение новой микроархитектуры отчасти можно расценивать и как некоторое изменение основополагающей парадигмы, что в дальнейших планах AMD находит самое непосредственное отражение.

#Графическое ядро GCN

Но на самом деле AMD не говорит о своём гибридном процессоре Kaveri как о четырёхъядерном наследнике Bulldozer и отводит совершенствованию x86-части не так уж и много внимания. Более того, несмотря на то, что новинка располагает двумя модулями Steamroller и четырьмя x86-ядрами, AMD считает, что её новый процессор имеет (в максимальной конфигурации) ни много ни мало двенадцать ядер. Компания просто вводит в употребление новое определение вычислительного ядра, считая за него программируемый аппаратный блок, способный выполнять в своём собственном контексте независимо от других ядер по крайней мере один процесс в виртуальной памяти. И с точки зрения этого определения в качестве ядер проходят в том числе и вычислительные блоки графического ядра.

Графическое ядро в Kaveri относится к классу Radeon R7 и базируется на новой для интегрированных процессоров архитектуре GCN 1.1, внедрённой AMD в видеоускорителях класса Hawaii. Никаких изменений при переносе этой архитектуры из видеокарт в гибридные процессоры сделано не было, поэтому основным структурным элементом графики остались вычислительные кластеры (Compute Unit), имеющие по 64 совместимых со стандартом IEEE 2008 шейдерных процессора, которые разделены между четырьмя векторными и 16 текстурными блоками.

В максимальной конфигурации графическое ядро Kaveri может содержать до восьми таких вычислительных кластеров, плюс геометрический сопроцессор и до восьми блоков растровых операций. С учетом нацеленности графического ядра в том числе и на параллельные вычисления в видеоядре в полном объёме присутствует пул из восьми независимых движков асинхронных вычислений, которые могут работать параллельно с графическим командным процессором и обслуживать до восьми очередей команд каждый. Важно, что эти движки имеют прямой доступ к кеш-памяти и контроллеру памяти процессора, за счёт чего и реализуется набор технологий, упрощающий организацию гетерогенных вычислений HSA.

Таким образом, суммарно графическое ядро Kaveri может иметь до 512 шейдерных процессоров, то есть по этой характеристике новый APU дотягивает до показателя очень неплохой видеокарты среднего уровня Radeon HD 7750. Всё это позволяет AMD говорить о теоретической суммарной производительности Kaveri на уровне 856 Гфлопс (где на вычислительные ресурсы видеоядра приходится 737 Гфлопс). Однако надо иметь в виду, что игровое быстродействие встроенной в процессоры графики во многом ограничивается пропускной способностью памяти, а не мощностью шейдерных процессоров видеоядра.

Если учесть, что в Kaveri нашла применение самая современная на данный момент графическая архитектура AMD, этими APU поддерживается не только DirectX 11.2, но и фирменный программный интерфейс Mantle. Пока его не использует ни одна публично доступная игра, но AMD ожидает, что в течение ближайшего месяца этот недостаток будет исправлен. При этом компания обещает гигантский прирост графической производительности, который, например, в Battlefiled 4 составит до 45 процентов.

Присутствует в графическом ядре Kaveri и звуковой сопроцессор TrueAudio, предназначенный для создания аппаратно ускоряемых сложных динамических пространственных звуковых эффектов. Так же, как и раньше, в процессоре остались выделенные движки VCE и UVD для кодирования и декодирования видеоконтента высокого разрешения. Номер версии VCE за счёт улучшения качества кодирования путём внедрения B-кадров и поддержки цветовой модели YUV увеличился до второго, а номер версии UVD возрос до четвёртого: улучшилась устойчивость при обработке видеопотока с ошибками.

#Технологии HSA: hUMA и hQ

Но самым важным нововведением в Kaveri с точки зрения AMD является не обновление микроархитектуры x86-ядер и не внедрение нового графического ядра с архитектурой GCN, а то, как они могут взаимодействовать друг с другом в рамках концепции HSA.

AMD сделала ставку на гетерогенную системную архитектуру уже достаточно давно. Основная идея заключается в том, что многие задачи могут выполняться на параллельных потоковых процессорах графических ядер быстрее и с меньшими затратами энергии, нежели на скалярных x86-ядрах. Комбинируя и те и другие вычислительные ресурсы, можно получить универсальную аппаратную базу для эффективного выполнения широкого спектра задач. Однако на ранних стадиях процессоры с гетерогенным дизайном не могли завоевать широкую популярность. Проблема заключалась в том, что для их использования нужны были специальные программы, создание которых вызывало у разработчиков большие трудности. В Kaveri же заложены технологии семейства HSA, которые должны существенно упростить программирование алгоритмов, работающих в гетерогенной среде.

Первая из них — hUMA (Heterogeneous Uniform Memory Access). В рамках этой технологии новые гибридные процессоры предлагают простой путь доступа ко всей системной памяти вне зависимости от того, какой частью APU сгенерирован соответствующий запрос. Иными словами, любое из 12 ядер Kaveri (вне зависимости от того, ядро ли это с x86-архитектурой или вычислительный кластер графического ядра) имеет равноценный и простой доступ непосредственно в системную память.

Аппаратная реализация hUMA в Kaveri обеспечивает когерентность кеш-памяти различных по назначению ядер; даёт графическому ядру возможность работать не только с физической, но и с виртуальной памятью в рамках 32-гигабайтного адресного пространства; а также убирает любые ограничения и любое разделение памяти на системную и видеопамять.

Вторая важная технология, базирующаяся на HSA и делающая Kaveri по-настоящему гетерогенным процессором, это hQ (Heterogeneous Queuing). В старой традиционной архитектуре вся вычислительная нагрузка проходила через процессорные ядра, в том числе и та, которая предназначена для решения на графическом ядре. За отправку задач для решения на GPU и контроль их исполнения всё равно отвечал CPU, что вносило дополнительные задержки. Новый же подход к организации вычислений, hQ, разрешает графическому ядру взаимодействовать с приложением и другими ядрами не под управлением CPU, а напрямую, уравнивая ядра с различной природой в своих правах. Иными словами, hQ стирает грани между ролями CPU и GPU, уменьшает задержки и упрощает параллельную обработку данных разнородными ядрами. GPU, как и CPU, получает право создавать и отправлять вычислительные потоки на исполнение.

Если принять к рассмотрению hUMA и hQ, желание AMD представить свои процессоры Kaveri как 12-ядерные уже не выглядит таким нелепым. Ядра эти разнородны и предназначены для различных целей, но при условии должной оптимизации программного обеспечения они действительно способны существенно улучшить производительность и энергоэффективность систем. Поддержка же новыми гибридными процессорами HSA-возможностей делает Kaveri чипами, полностью аппаратно совместимыми с OpenCL 2.0. А это значит, что оптимизировать алгоритмы под гибридные процессоры Kaveri будет значительно проще, и, вполне возможно, концепция APU будет находить реальное применение гораздо активнее.

Впрочем, на данный момент все HSA-возможности остаются лишь простой декларацией, так как для их задействования нужна поддержка не только со стороны программного обеспечения, но и со стороны операционной системы и драйвера. А эти условия пока не выполнены. На данный момент совместимость с HSA есть лишь в 64-битных версиях Windows 8.1 и Windows 7 (в Windows 8 почему-то поддержки HSA нет), а необходимый драйвер, разрабатываемый AMD, пока далёк от финального состояния. Закономерно, что программного обеспечения, созданного с использованием технологий hUMA и hQ, в природе (пока?) не наблюдается, а все оптимизированные под гибридные возможности APU программы работают старым путём, используя библиотеки OpenCL 1.2.

#Всё вместе: Kaveri

Рассмотрев составные части (CPU и GPU) гибридного процессора Kaveri, логично перейти к знакомству c этим дизайном в сборе. И вот на этом уровне, к сожалению, AMD может порадовать своих поклонников не слишком многим. Kaveri, как и их предшественники Trinity и Richland, собраны на базе двух двухъядерных процессорных модулей Steamroller. Иными словами, гибридные процессоры нового поколения сохраняют в максимальной конфигурации четырёхъядерный (в терминах x86) дизайн и принципиально превосходят предшественников лишь по оснащённости интегрированного графического ядра Radeon R7. Оно не только несёт новую архитектуру GCN 1.1, сменившую использовавшуюся в Richland VLIW4, но и может располагать набором из 512 шейдерных процессоров, которых стало на треть больше, чем было в максимальных версиях APU прошлого поколения.

В результате, процессоры Kaveri стали ещё более графически-ориентированными. Если в Richland на долю x86-части приходилось 58 процентов транзисторного бюджета, то в новом Kaveri эта доля снизилась до 53 процентов. При этом в целом новый APU стал гораздо сложнее своего предшественника. Прошлые версии гибридных процессоров AMD состояли из примерно 1,3 млрд транзисторов, полупроводниковый же кристалл Kaveri включает 2,41 млрд транзисторов. И это даже больше количества транзисторов в процессорах Intel Haswell с графикой GT3, которое ограничивается величиной 1,8 млрд штук. Однако высокая сложность полупроводникового кристалла не обязательно конвертируется в высокую производительность, а вот проблемы при производстве создаёт заметные.

Для массового выпуска Kaveri компания AMD прибегла к более современной производственной технологии с 28-нм нормами и монолитной подложкой. Производственным партнёром выбрана GlobalFoundries, сумевшая настроить своё оборудование для выпуска APU. Надо заметить, что техпроцесс прошёл определённую адаптацию именно под конкретные нужды AMD, так как стандартная технология GlobalFoundries предполагает использование слишком тонких для высоких частот APU межсоединений. Но в результате полупроводниковый кристалл Kaveri удалось заметно уплотнить и разместить на площади 245 мм2, то есть по физическому размеру он почти эквивалентен 32-нм кристаллу процессоров Richland.

Полупроводниковый кристалл AMD Kaveri

Однако, несмотря на все старания GlobalFoundries, AMD всё же пришлось несколько сбавить частоты своих процессоров при переходе на новую технологию. И на данный момент максимальная частота CPU-части Kaveri не превышает 3,7 ГГц, а GPU работает на частоте не выше 720 МГц. Частоты же их предшественников, производимых по 32-нм технологии с SOI гибридных процессоров Richland, доходили до 4,1 ГГц в части CPU и до 844 МГц в части GPU. То есть были выше примерно на 10-15 процентов. В качестве компенсации в Kaveri AMD обещает некоторое снижение тепловыделения, и для настольных модификаций этих гибридных процессоров установлены тепловые пакеты 95/65/45 Вт. Richland же имели максимальное расчётное тепловыделение на уровне 100/65/45 Вт, причём с 45-ваттным тепловым пакетом существовала лишь единственная модель A8-6500T, которая в широкую продажу никогда не поступала.

Модельный ряд процессоров Kaveri для десктопов в его первоначальном виде состоит всего из трёх моделей.

AMD A10-7850KAMD A10-7700KAMD A8-7600
Ядра 4 ядра (2 модуля) 4 ядра (2 модуля) 4 ядра (2 модуля)
Разблокированный множитель Есть Есть Нет
Тактовая частота 3,7 ГГц 3,4 ГГц 3,3/3,1 ГГц
Частота в турборежиме До 4,0 ГГц До 3,8 ГГц До 3,8/3,3 ГГц
L2-кеш 2x2 Мбайт 2x2 Мбайт 2x2 Мбайт
Графическое ядро Radeon R7 Radeon R7 Radeon R7
Вычислительные кластеры 8 6 6
Шейдерные процессоры 512 384 384
Частота GPU 720 МГц 720 МГц 720 МГц
TDP 95 Вт 95 Вт 65/45 Вт
Цена $173 $152 $119

Две старшие модели, имеющие оверклокерские возможности, должны быть доступны с сегодняшнего дня. Младшая же энергоэффективная модель A8-7600 появится на рынке — в течение первого квартала.

Следует отметить, что нумерация моделей Kaveri не столь прозрачна, как ранее. Максимальное количество вычислительных блоков заложено лишь в модели A10-7850K, которая обладает и четырьмя x86-ядрами, и восемью графическими вычислительными кластерами (512 шейдерными процессорами). Во второй же модели из ряда A10, A10-7700K, возможности GPU урезаны: число вычислительных кластеров сокращено до шести. Логично было бы, чтобы эта модель, располагающая, как и старшие Richland, 384 шейдерными процессорами, относилась к классу A8. Но нет, теперь в класс A8 входит лишь энергоэффективный и неоверклокерский A8-7600, который по своей внутренней структуре подобен A10-7700K.

Кстати, младший A8-7600 интересен не только пониженными тепловыми спецификациями. Он, кроме этого, имеет конфигурируемый уровень TDP. Приведенные в таблице тепловые пакеты 65 и 45 Вт относятся не к двум различным вариантам A8-7600, а указывают на то, что этот процессор может работать и так и этак — в зависимости от конкретной ситуации. Пользователь может выбрать желаемый для себя уровень TDP через BIOS материнской платы. В зависимости от этой настройки процессор будет использовать ту или иную схему формирования тактовых частот и работы турборежима.

#Новая платформа: Socket FM2+

Ещё одной новостью, сопряжённой с выходом процессоров Kaveri, стало появление специально предназначенной для них платформы Socket FM2+, вводящей в употребление новый процессорный разъём. Изначально вся эпопея с его обновлением была затеяна с целью добавления в платформу поддержки DDR4 SDRAM, но в процессе разработки что-то пошло не так, и контроллер памяти Kaveri такую возможность не получил, ограничившись двумя стандартными каналами DDR3 SDRAM. Впоследствии AMD отказалась и от поддержки DDR4 в следующем поколении APU компании, Carrizo, которое должно быть совместимо с Socket FM2+. Поэтому на деле вышло так, что новый процессорный разъём введён в употребление лишь с целью искусственного обновления парка материнских плат.

Слева — Socket FM2, справа — Socket FM2+

Вполне закономерно, что Socket FM2+ очень похож на Socket FM2 по внешнему виду и отличается от него лишь расположением контактов-ключей, физически не дающих установить новые процессоры Kaveri в старые материнские платы Socket FM2. При этом новые платы Socket FM2+ имеют обратную совместимость со старыми процессорами, и в них вполне допускается устанавливать представителей семейств Trinity и Richand. Нет никаких проблем и с использованием с платами Socket FM2+ старых процессорных систем охлаждения — здесь также сохранена полная совместимость.

Материнские платы с разъёмом Socket FM2+ доступны на рынке уже достаточно давно, и с поиском подходящей платформы для Kaveri у первых покупателей этих процессоров проблем явно не возникнет. Все такие платы основываются на наборах логики семейства Bolton (A88X и A78), которые по спецификациям практически не отличаются от своих предшественников Hudson (A85X и A75).

Новые возможности, предлагаемые материнскими платами с Socket FM2+, ограничиваются поддержкой графической шины PCI Express x16 3.0 и более скоростных вариантов DDR3-памяти — вплоть до DDR3-2400. Но и то и другое, на самом деле, обеспечивается самими процессорами Kaveri, в которых AMD обновила контроллер шины PCI Express и подтянула параметры контроллера памяти. Иными словами, ожидать каких-то серьёзных изменений с вводом в употребление плат Socket FM2+ и новых наборов логики явно не следует.

#Тестовый процессор: A8-7600

Во вводной части этой статьи мы уже сказали о том, что компания AMD, руководствуясь какими-то своими соображениями, предоставила нам на тестирование не старшую модель Kaveri, а младшую — A8-7600. Это странно вдвойне, так как данный процессор, в отличие от своих старших собратьев, в продажу с сегодняшнего дня не поступит — его распространение начнётся в течение первого квартала. Втройне же обескураживает то, что предоставленный AMD образец — это не серийный процессор, а инженерный семпл, о чём честно и написано на его крышке.

Причём одной маркировкой дело тут не ограничивается. То, что процессор этот отличается от тех APU, которые получат в свои руки покупатели, следует и из того, что определяется он не как A8-7600, а как «AMD Eng Sample: ZD317095I4468_38/31/16/07_1313».

Обычно подобные инженерные процессоры компания AMD распространяет до анонса среди производителей материнских плат и готовых систем для валидации их продуктов. Почему же на этот раз инженерные образцы достались прессе, доподлинно не известно. Но скорее всего, связано это с тем, что серийные продукты у производителя в необходимых количествах на данный момент попросту отсутствуют. И мы в этой связи ожидаем некоторой задержки начала поставок реальных Kaveri продавцам. Нам же сегодня придётся делать выводы о новом гибридном процессоре, базируясь на результатах тестирования его предварительной версии, которая, возможно, в каких-то аспектах будет отличаться от тех APU, которые получат на руки покупатели. Это надо иметь в виду.

Впрочем, характеристики образца полностью сошлись с заявленными в спецификациях. Процессор базируется на двух модулях Steamroller, имеет четыре ядра и располагает кеш-памятью второго уровня суммарным объёмом 4 Мбайт. Частота этого процессора была установлена на уровне положенных 3,3 ГГц, а турборежим увеличивал её до 3,8 ГГц. Отметим, что столь существенная «вилка» в частотах связана с энергоэффективностью модели, ведь её тепловой пакет ограничен величиной 65 Вт. В реальном же использовании до штатных 3,3 ГГц она почти никогда не падает. Большию часть времени A8-7600 функционирует на частоте 3,7 ГГц, причём даже под многопоточной нагрузкой.

Достаточно любопытно работает функция конфигурируемого TDP. При установке в BIOS материнской платы предельного уровня тепловыделения 45 Вт процессор кардинально меняет своё поведение и тактовые частоты. Максимальной частотой в турборежиме становится 3,3 ГГц, а при высокой нагрузке она снижается до 3,1 ГГц. Такая мера действительно заметно снижает тепловыделение и потребление, но заметно падает и производительность.

Графическое ядро класса Radeon R7, имеющее кодовое имя Spectre, у A8-7600 собрано на базе шести вычислительных кластеров, что означает наличие 384 потоковых шейдерных процессоров. Они дополнены 96 текстурными блоками и 8 блоками растровых операций. Таким образом, по своей конфигурации встроенное в A8-7600 графическое ядро несколько превосходит видеоядра, имеющиеся в процессорах A10, которые относятся к семейству Richland. И дело тут не только в более прогрессивной архитектуре GCN, но и в увеличенном количестве текстурников. Правда, частота работы графики у A8-7600 несколько ниже — всего 720 МГц. Причём частота эта снижается до 350 МГц в том случае, когда на графическом ядре не лежит никакая 3D- или вычислительная нагрузка.

К сожалению, в отличие от представителей серии A10, A8-7600 к числу оверклокерских моделей не относится. Его коэффициент умножения изменять невозможно, так что разгон можно осуществить только через изменение частоты базового тактового генератора. Правда, на изменение частоты графического ядра и памяти эти ограничения не распространяются. Тем не менее сегодня мы воздержимся от тестов разгона и подождём появления в нашем распоряжении серийных вариантов старших моделей Kaveri. Основной же темой данного материала станет производительность, насколько её можно оценить, располагая младшим вариантом APU с новым дизайном.

Тестирование. Выводы

#Описание тестовых систем

Знакомство с A8-7600, построенным на новом гетерогенном дизайне Kaveri, мы проводили, сравнивая его в первую очередь с процессорами A8 прошлого поколения Richland: A8-6600K и A8-6500. Участие в тестировании этих двух моделей одновременно обусловлено тем, что одна из них относится к 100-ваттному классу, а вторая — аналогично A8-7600 — энергоэффективна: её максимальное тепловыделение ограничено 65-ваттной величиной. Ещё одним конкурентом для A8-7600 стал Core i3-4130 — младший интеловский двухъядерник из семейства Core i3, который ближе всех к рассматриваемой модели Kaveri по своей стоимости.

При сравнении скорости работы графических ядер в число объектов для тестирования добавлялось ещё два процессора. Во-первых, A10-6700 — Richland с максимальной версией графического ядра, также как и A8-7600, располагающий 384 шейдерными процессорами. И во-вторых, Core i3-4340 — двухъядерный процессор Intel с полноценным графическим ядром класса GT2.

В результате набор тестового оборудования приобрёл следующий вид:

  • Процессоры:
    • AMD A10-6700 (Richland, 4 ядра, 3,9-4,2 ГГц, 2x2 Мбайт L2, Radeon HD 8670D);
    • AMD A8-7600 (Kaveri, 4 ядра, 3,3-3,8 ГГц, 2x2 Мбайт L2, Radeon R7 Series);
    • AMD A8-6600K (Richland, 4 ядра, 3,7-4,3 ГГц, 2x2 Мбайт L2, Radeon HD 8570D);
    • AMD A8-6500 (Richland, 4 ядра, 3,5-4,1 ГГц, 2x2 Мбайт L2, Radeon HD 8570D);
    • Intel Core i3-4340 (Haswell, 2 ядра + HT, 3,6 ГГц, 2x256 Кбайт L2, 4 Мбайта L3, HD Graphics 4600);
    • Intel Core i3-4130 (Haswell, 2 ядра + HT, 3,4 ГГц, 2x256 Кбайт L2, 3 Мбайта L3, HD Graphics 4400).
    • Процессорный кулер: Noctua NH-U14S.
  • Материнские платы:
    • ASRock FM2A88X Extreme6+ (Socket FM2+, AMD A88X);
    • Gigabyte Z87X-UD3H (LGA1150, Intel Z87 Express).
  • Память: 2x8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill [TridentX] F3-2133C9D-16GTX).
  • Видеокарта: NVIDIA GeForce GTX 780 Ti (3 Гбайт/384-бит GDDR5, 876-928/7000 МГц).
  • Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
  • Блок питания: Corsair AX760i (80 Plus Platinum, 760 Вт).

Тестирование выполнялось в операционной системе Microsoft Windows 8.1 Enterprise x64 с использованием следующего комплекта драйверов:

  • AMD Chipset Drivers 13.12;
  • AMD Catalyst Graphics Driver 13.30 RC2;
  • Intel Chipset Driver 9.4.0.1027;
  • Intel Iris and HD Graphics Driver 15.33.8.64.3345;
  • Intel Management Engine Driver 9.5.0.1345;
  • Intel Rapid Storage Technology 12.9.0.1001;
  • NVIDIA GeForce 332.21 Driver.

#Методика тестирования производительности

Тестирование проводилось в два этапа. На первом этапе мы исследовали производительность Kaveri в роли обычного x86-процессора при его работе в системе с внешней графической картой. Соответственно, графические ресурсы APU в этом случае никакого значения не имеют, а оценивается вычислительное быстродействие микроархитектуры Steamroller.

Для измерения производительности использовались следующие инструменты:

Бенчмарки:

  • Futuremark PCMark 8 Professional Edition 2.0.162.0 — тестирование в сценариях Home (обычное домашнее использование PC), Creative (использование PC для развлечений и для работы с мультимедийным контентом) и Work (использование PC для типичной офисной работы).
  • Futuremark 3DMark Professional Edition 1.2.250.0 — тестирование в сценах Cloud Gate и Fire Strike.

Приложения:

  • Adobe Photoshop CC — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
  • Autodesk 3ds max 2014 — тестирование скорости финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920x1080 с применением рендерера mental ray одного кадра стандартной сцены Space_Flyby из тестового пакета SPEC.
  • Maxon Cinebench R15 — измерение быстродействия фотореалистичного трёхмерного рендеринга в анимационном пакете CINEMA 4D. Применяемая в бенчмарке сцена содержит порядка 2 тысяч объектов и состоит из 300 тысяч полигонов.
  • dBpoweramp Music Converter R14.4 — тестирование скорости перекодирования звуковых файлов. Измеряется скорость выполнения преобразования FLAC-файлов в MP3-формат с максимальным качеством сжатия.
  • Internet Explorer 11 — тестирование производительности при работе интернет-приложений, построенных с использованием современных технологий. Применяется специализированный тест Google Octane 2.0 Benchmark, реализующий на JavaScript реально использующиеся в интернет-приложениях алгоритмы.
  • WinRAR 5.0 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. Используется максимальная степень компрессии.
  • x264 r2358 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 1080p@50fps AVC-видеофайл из теста x246 FHD Benchmark 1.0.1, имеющий битрейт около 30 Мбит/с.
  • Freemake 4.1.1 — тестирование скорости транскодирования видео в формат H.264/AVC. Данная популярная утилита использует библиотеку FFmpeg, то есть опирается на широко распространённый кодер x264. Для оценки производительности используется исходный 1080p@50FPS AVC-видеофайл из теста x246 FHD Benchmark 1.0.1, имеющий битрейт около 30 Мбит/с. Технология CUDA при перекодировании отключается, но используется DXVA-ускорение.

Игры:

  • Batman — Arkham Origins. Настройки для разрешения 1280х800: Anti-Aliasing = Off, Geometry Details = DX11 Enhanced, Dynamic Shadows = DX11 Enhanced, Motion Blur = On, Depth of Field = DX11 Enhanced, Distortion = On, Lens Flares = On, Light Shafts = On, Reflections = On, Ambient Occlusion = DX11 Enhanced, Hardware Accelerated Physx = High. Настройки для разрешения 1920х1080: Anti-Aliasing = MSAA 4x, Geometry Details = DX11 Enhanced, Dynamic Shadows = DX11 Enhanced, Motion Blur = On, Depth of Field = DX11 Enhanced, Distortion = On, Lens Flares = On, Light Shafts = On, Reflections = On, Ambient Occlusion = DX11 Enhanced, Hardware Accelerated Physx = High.
  • Civilization V: Brave New World. Настройки для разрешения 1280х800: Antialiasing = Off, High-Detail Strategic Vie = On, GPU Texture Decode = On, Overlay Detail = High, Shadow Quality = High, Fog of War Quality = High, Terrain Detail Level = High, Terrain Tesselation Level = High, Terrain Shadow Quality = High, Water Quality = High, Texture Quality = High. Настройки для разрешения 1920х1080: Antialiasing = 4xMSAA, High-Detail Strategic Vie = On, GPU Texture Decode = On, Overlay Detail = High, Shadow Quality = High, Fog of War Quality = High, Terrain Detail Level = High, Terrain Tesselation Level = High, Terrain Shadow Quality = High, Water Quality = High, Texture Quality = High. Используется DirectX 11-версия игры.
  • Company of Heroes 2. Настройки для разрешения 1280х800: Maximum Image Quality, Anti-Aliasing = Off, Higher Texture Detail, High Snow Detail, Physics = Off. Настройки для разрешения 1920x1080: Maximum Image Quality, Medium Anti-Aliasing, Higher Texture Detail, High Snow Detail, Physics = High.
  • F1 2013. Настройки для разрешения 1280х800: Ultra Quality, 0xAA, DirectX 11. Настройки для разрешения 1920x1080: Ultra Quality, 4xAA, DirectX 11. Используется трасса Texas и версия игры с поддержкой AVX-инструкций.
  • Metro: Last Light. Настройки для разрешения 1280х800: DirectX 11, High Quality, Texture Filtering = AF 16X, Motion Blur = Normal, SSAA = Off, Tesselation = Off, Advanced PhysX = Off. Настройки для разрешения 1920x1080: DirectX 11, High Quality, Texture Filtering = AF 16X, Motion Blur = Normal, SSAA = On, Tesselation = On, Advanced PhysX = On. При тестировании используется сцена D6.

Второй этап тестирования производительности был целиком посвящён работе процессоров при использовании встроенного в них графического ядра. Здесь набор тестовых инструментов был следующим:

  • Futuremark 3DMark Professional Edition 1.2 — тестирование в сценах Cloud Gate и Fire Strike.
  • Battlefield 4. Настройки качества для разрешения 1280x800: Medium Quality. Настройки качества для разрешения 1920x1080: Low Quality. Тестирование проводится в кампании Tashgar.
  • F1 2013. Настройки для разрешения 1280х720: Ultra Quality, 0xAA, DirectX 11. Настройки для разрешения 1920x1080: Medium Quality, 4xAA, DirectX 11. Используется трасса Texas и версия игры с поддержкой AVX-инструкций.
  • Metro: Last Light. Настройки для разрешения 1280х720: DirectX 11, Medium Quality, Texture Filtering = AF 16X, Motion Blur = Normal, SSAA = Off, Tesselation = Off, Advanced PhysX = Off. Настройки для разрешения 1920x1080: DirectX 11, Low Quality, Texture Filtering = AF 16X, Motion Blur = Low, SSAA = Off, Tesselation = Off, Advanced PhysX = Off. При тестировании используется сцена D6.
  • Tomb Raider (2013). Настройки для разрешения 1280х720: High Quality. Настройки качества для разрешения 1920x1080: Medium Quality. Технология TressFX отключена.
  • War Thunder. Настройки для разрешения 1280х720: Max Quality. Настройки качества для разрешения 1920x1080: Medium Quality. Используется встроенный тест Eastern Front.

#Вычислительная x86-производительность

Futuremark PCMark 8 2.0

По традиции в первую очередь для измерения производительности мы пользуемся интегральным тестом PCMark 8 2.0, который моделирует различные варианты типовой нагрузки на систему.

Думается, многим после вышеприведённых графиков захочется закрыть эту статью. В целом с процессорной частью Kaveri всё уже понятно. Микроархитектура x86-ядер была улучшена и увеличила свою удельную производительность, однако её частотный потенциал оказался не столь хорошим, как у Piledriver. Не помог и новый техпроцесс с 28-нм нормами. В результате AMD пришлось понизить тактовые частоты, что привело к наблюдаемой на диаграмме ситуации: быстродействие Kaveri по сравнению с показателями Richland того же класса не выросло. A8-7600 оказался очень похожим по скорости работы на старый A8-6500.

То есть можно не надеяться на то, что Kaveri смогут сместить с роли флагманских процессоров устаревшие FX. Более того, рассматриваемый A8-7600 оказался заметно медленнее младшего интеловского двухъядерного процессора Core i3 семейства Haswell. Стало быть, с традиционной (x86) точки зрения Kaveri, как и их предшественники, остаются бюджетными предложениями без каких-либо шансов в верхнем рыночном сегменте.

Тесты в приложениях

Положительное влияние нововведений, реализованных в микроархитектуре Steamroller, видно в первую очередь в тех задачах, которые создают тяжёлую многопоточную нагрузку. Это вполне закономерно, так как главное улучшение — «раздвоение» декодеров — как раз и направлено на более эффективную загрузку исполнительных устройств при одновременном задействовании обоих ядер в каждом модуле. Поэтому в задачах рендеринга и перекодирования видео A8-7600 удаётся выступить немного лучше своих предшественников поколения Richland, A8-6500 и A8-6600K. Однако подобная ситуация наблюдается далеко не всегда, и в целом можно вновь с полной уверенностью говорить о том, что по вычислительной скорости процессорных ядер новый A8 очень похож на старых представителей этой серии.

Отсутствие явного прогресса в x86-производительности ставит A8-7600 в достаточно незавидное положение на фоне двухъядерного Haswell. Откровенно говоря, существует лишь очень небольшое число задач, где A8-7600 способен соперничать с младшим, 120-долларовым Core i3. К сожалению, для этого тестирования компания AMD не предоставила нам старший процессор семейства Kaveri, но что-то подсказывает, что с четырёхъядерными Haswell не сможет полноценно конкурировать и он.

Игровые тесты

Заметьте, в данном разделе мы уделяем внимание игровой производительности процессоров в том случае, когда в системе установлен дискретный графический ускоритель. Тестирование в играх предваряют результаты синтетического бенчмарка 3DMark, который выдаёт некую усреднённую метрику игровой 3D-производительности систем.

Знакомая картина. Новый A8-7600 чуть медленнее A8-6500, процессора, имеющего такой же 65-ваттный тепловой пакет и на 20 процентов более низкую цену. Интеловский же Core i3-4130 оказывается быстрее, чем новинка AMD, примерно на 20 процентов. Печально.

Тестирование в реальных играх редко когда позволяет выявить принципиальные различия между современными процессорами. Однако сегодня мы тестируем достаточно медленные и недорогие модели, которые — в случае использования в игровых системах — вполне способны стать узким местом. Поэтому мы могли бы ограничиться лишь тестами в Full HD-разрешении с высокими настройками качества. Но по сложившейся традиции и для лучшей иллюстративности мы также сделали замеры и в разрешении 1280х800. Результаты в первом случае показывают тот уровень FPS, который можно получить в реальных условиях прямо сейчас, второй же вариант тестирования позволяет оценить теоретическую игровую производительность процессоров, которая, возможно, будет раскрыта в перспективе, если в нашем распоряжении появятся более быстрые варианты графической подсистемы.

Игровая производительность является слабым местом процессоров AMD уже достаточно давно. С вводом в строй микроархитектуры Steamroller и выходом процессоров Kaveri ситуация не изменилась. A8-7600 почти не отличается по производительности от A8-6500, и все процессоры класса A8, как Kaveri, так и Richland, безапелляционно проигрывают Core i3-4130. Причём преимущество интеловского двухъядерника серьёзно настолько, что ему удаётся обеспечить очень заметное превосходство даже при разрешении 1920x1080 с максимальным качеством изображения и включённым полноэкранным сглаживанием.

Всё это означает лишь одно: использовать процессоры Kaveri в системах с установленной дискретной видеокартой абсолютно нерационально. Как в этих условиях AMD собирается выставлять свою новинку в качестве флагмана вместо серии FX, совершенно непостижимо. Остаётся, впрочем, небольшая надежда, что такое мнение о Kaveri изменится, когда в наше распоряжение попадёт представитель серии A10, однако это — что-то из серии фантастики. A8-7600 — ровно такой же четырёхъядерник, как и A10-7850K, просто имеющий на 10-15 процентов более низкие частоты. Отставание же A8-7600 от младшего Core i3 в играх достигает порой полуторакратной величины, этого небольшой прибавкой в частоте явно не исправить.

#3D-производительность видеоядра

Но довольно о грустном. Давайте обратимся к тем тестам, где процессоры AMD показывают себя с лучшей стороны, а именно — к тестам игровой производительности встроенного в них графического ядра. Здесь c графикой Radeon R7 процессора A8-7600 сравниваются интегрированные видеоускорители Radeon HD 8670D из A10-6700, Radeon HD 8570D из A8-6500 и Intel HD Graphics 4600 из Core i3-4340.

В тестах 3D-графики всё складывается для Kaveri намного лучше. Несмотря на то, что в тестировании принял участие лишь процессор класса A8, его графике удаётся показать наилучший результат среди всех интегрированных видеоускорителей. Преимущество A8-7600 перед A8-6500 составляет от 20 до 60 процентов — и это закономерно: в процессорах A8 прошлого поколения графическое ядро располагало лишь 256 шейдерными процессорами. Но при этом A8-7600 заметно обгоняет и A10-6700, хотя и там и там количество шейдеров одинаковое — 384 штуки. Тем не менее, как мы видим, графическое ядро Kaveri быстрее, даже несмотря на свою более низкую тактовую частоту — 720 против 844 МГц. Объясняется это двумя факторами: прогрессивностью графической архитектуры GCN и тем, что в интегрированном видеоускорителе серии Radeon R7 реализовано вдвое больше текстурных блоков.

Совершенно неудивительно, что интеловское графическое ядро GT2, являющееся максимальным вариантом интегрированной графики для десктопных LGA1150-процессоров, конкурировать со встроенным Radeon R7 не может даже близко. К сожалению, сравнить с предложениями AMD более прогрессивное видеоядро Intel GT3 и уж тем более GT3e мы не можем в силу их направленности исключительно на мобильные системы.

И ещё один вопрос, который пока остаётся за кадром: как показывает себя графика процессоров Kaveri по сравнению с недорогими графическими картами? К такому исследованию мы обратимся, когда AMD пришлёт нам свой процессор A10, в котором число шейдеров доведено до 512, то есть до того количества, которое предлагается вполне полноценными видеокартами вроде Radeon HD 7750.

Не оставляют сомнений в высокой производительности графического ядра процессоров Kaveri и игровые тесты. Если даже тот урезанный интегрированный видеоускоритель, который реализован в A8-7600, оказывается быстрее, чем старшая графика поколения Richland, то от A10-7850K можно ожидать действительно феноменальных результатов, которые могут вывести интегрированные системы Socket FM2+ на принципиально другой уровень.

Как видно из результатов, A8-7600 позволяет свободно играть почти в любые современные игры в Full HD-разрешении при низком качестве изображения. Не слишком высокое число кадров в секунду наблюдается разве только в экстремально тяжёлом Metro Last Light. Зато существует масса примеров, когда качество изображения можно даже увеличить до среднего уровня. А это значит, что старший Kaveri может стать вполне достаточным решением для недорогих игровых систем. Очевидно, что Full HD-разрешение с приемлемым числом кадров будет доступно вообще везде, причём в большинстве ситуаций можно будет не ограничиваться минимальными настройками.

Пока же мы не располагаем A10-7850K в нашей лаборатории, в подтверждение этого тезиса можем предъявить пару слайдов из презентации Kaveri — в ней перечисляются популярные игры, в которых старший процессор этого семейства выдаёт более 30 кадров в секунду в разрешении 1080p.

К сказанному нужно добавить, что у графического ядра Kaveri остаётся ещё один неразыгранный козырь — поддержка программного интерфейса Mantle, который потенциально может дополнительно поднять игровую производительность. Таким образом, не исключено, что старшие модификации этих гибридных процессоров смогут предложить даже лучший игровой опыт, чем то, на что мы рассчитываем сейчас.

#Энергопотребление

Согласно заявлениям AMD, целью разработки процессорного дизайна Kaveri являлось повышение производительности APU при уменьшении их тепловыделения и энергопотребления. Как мы видели, с производительностью вышло двояко — она подросла лишь у графического ядра. Но улучшение в тепловых и энергетических характеристиках обещается везде: расчётное тепловыделение старших модификаций Kaveri снизилось по сравнению с Richland не просто так. Конечно 5-процентное изменение TDP — это не слишком большой повод для гордости, но для процессоров AMD, не отличающихся энергоэффективностью, важен каждый ватт.

Впрочем, эти теоретические обещания неплохо бы проверить на практике, чем мы и занялись. На следующих ниже графиках приводится полное потребление систем (без монитора), измеренное на выходе из розетки, в которую подключен блок питания тестовой платформы. Все имеющиеся в процессорах энергосберегающие технологии активированы. Нагрузка на процессорные ядра создаётся 64-битной версией утилиты LinX 0.6.4 с поддержкой набора инструкций FMA, а графическое ядро нагружается утилитой Furmark 1.12. Показатели энергопотребления A8-7600 с TDP, установленным в 65 Вт, мы сравнивали с потреблением 65-ваттных Richland, A10-6700 и A8-6500 и с потреблением Core i3-4340 с 54-ваттным тепловым пакетом.

В состоянии простоя потребление Kaveri находится примерно на том же уровне, что и у Richland. Любопытно, что Haswell в простое требует энергии больше. Однако если учесть, что современные энергосберегающие технологии приводят потребление процессоров в состоянии простоя к практически нулевому состоянию, этот результат следует воспринимать как характеристику платформ, а не самих процессоров.

При нагрузке на x86-ядра всё возвращается к привычной картине. Интеловские процессоры на протяжении последних лет остаются более экономичными решениями и уступать никому совершенно не намерены. Причём несмотря на то, что с обычным Core i3-4340 здесь соревнуются исключительно энергоэффективные гибридные процессоры AMD с тепловым пакетом 65 Вт, стандартное положение дел это ничуть не меняет.

Что же действительно удивляет, так это то, что энергопотребление A8-7600 оказалось выше, чем у его предшественников. Видимо, что-то не так либо с используемым AMD 28-нм техпроцессом, либо с микроархитектурой Steamroller. Технологические нормы уменьшились, частоты снизились, но Kaveri всё равно потребляет больше Richland.

Картина повторяется и при нагрузке на графическое ядро. A8-7600 потребляет больше 65-ваттных процессоров A8 и A10 поколения Richland и существенно больше, чем Core i3-4340.

При полной нагрузке на все ресурсы гибридных процессоров одновременно Richland сравниваются по потреблению с Core i3-4340, однако новый A8-7600 неприятно выбивается из этой благостной картины. Конечно, те, кому важен невысокий уровень потребления Kaveri, могут воспользоваться функцией конфигурирования TDP и ограничить его тепловой пакет 45-ваттной величиной, что снизит потребление примерно на 20 Вт. Но это неминуемо приведёт к серьёзному понижению вычислительной производительности и так не слишком быстрого нового процессора AMD.

#Выводы

Первое знакомство с процессором семейства Kaveri оставляет после себя очень неоднозначное впечатление. Отчасти это связано с тем, что AMD не смогла или не захотела предоставить нам на тесты старшую оверклокерскую модель A10-7850K. Но и из тестирования младшего A8-7600 становится понятно, что новое поколение гибридных процессоров Kaveri стало заметно лучше старых Richland. Однако всё это «заметно» лежит в одной плоскости: у новых APU серьёзно улучшилось графическое ядро, чего нельзя сказать о традиционной процессорной части.

В результате даже у младшего Kaveri, A8-7600, графика работает заметно быстрее, чем старший вариант встроенного видеоядра процессоров поколения Richland, не говоря уже о продуктах конкурента. А более производительные модели нового поколения APU, как мы надеемся, по своей 3D-производительности смогут дотянуть до видеокарт стоимостью порядка $100. Располагая встроенным видеоускорителем с архитектурой GCN с 384 или даже 512 шейдерными процессорами, Kaveri могут предложить приемлемую играбельность в современных играх в Full HD-разрешении без использования дискретного видеоускорителя. Причём порой речь можно вести и о том, что достаточный уровень FPS достижим не только при низком качестве изображения.

Что же касается x86-составляющей Kaveri, то с ней всё, напротив, оказалось очень грустно. Как и обещала AMD, новая микроархитектура Steamroller позволила нарастить количество исполняемых за такт инструкций, однако это совсем не помогло итоговому быстродействию. Усложнение микроархитектуры, даже несмотря на внедрение более прогрессивного 28-нм технологического процесса, потребовало снижения тактовых частот, и в результате x86-производительность Kaveri оказалась не лучше, чем у Richland, то есть осталась на достаточно низком по современным меркам уровне. Как в этих обстоятельствах AMD собирается позиционировать свои APU в качестве флагманских процессоров, понятно плохо. Располагая в максимальной версии лишь четырьмя x86-ядрами без перспектив увеличения их количества в ближайшем будущем, с точки зрения традиционной производительности Kaveri не только медленнее четырёхъядерников конкурента, но и, очевидно, уступают старым процессорам серии AMD FX с шестью и восемью ядрами.

Сама AMD апеллирует к тому, что процессоры Kaveri обладают существенной потенциальной производительностью за счёт их гетерогенности, и даже выдаёт кластеры графического ядра за полноценные вычислительные ядра, однако усмотреть в этом реальное решение проблемы невысокого быстродействия в обычных программах не так-то просто. Да, в Kaveri нашла своё место поддержка HSA, позволяющая ресурсам графического ядра легко вовлекаться в вычислительную работу, но пока речь идёт лишь лишь о принципиальной возможности. В реальности же AMD ещё только предстоит большая работа с разработчиками программных продуктов, которые должны принять и одобрить новую концепцию. На данный же момент даже незатейливое OpenCL-ускорение вычислений применяется в достаточно ограниченном числе программных продуктов, не говоря уже о том, что задействование графических ядер для вычислений имеет практический смысл лишь в небольшой части общеупотребительных алгоритмов.

Однако признание к Kaveri вполне может прийти с другой стороны. Этот процессор имеет шанс оказаться востребованным игровым решением, но не для систем высокого класса, оснащаемых дискретными быстродействующими видеоускорителями, а для геймерских компьютеров более низкого уровня. Уже сейчас Kaveri могут полноценно заменить собой комбинацию из недорогих процессора и видеокарты, а в дальнейшем позиции APU могут дополнительно улучшиться за счёт внедрения в современных играх программного интерфейса Mantle. На руку новинке может сыграть и выход игровых приставок класса Steam Machines, где новые гибридные процессоры имеют шанс неплохо обосноваться. Впрочем, даже без этого Kaveri наверняка оценят экономные геймеры, предпочитающие популярные и не самые требовательные в графическом плане сетевые проекты, число которых в последнее время сильно возросло. Армию довольных пользователей Kaveri наверняка можно наполнить одними только поклонниками World of Tanks, а ведь подобных популярных онлайн-игр несчётное множество: War Thunder, Final Fantasy XIV: A Realm Reborn, World of Warcraft и так далее.

На этом наше знакомство с новым гибридным процессором компании AMD не заканчивается. Как только наша лаборатория получит в своё распоряжение полноценную серийную модификацию новинки, к тестам Kaveri мы ещё вернёмся. Сегодня за кадром остались вопросы разгона, гетерогенной производительности и скорости его графического ядра в сравнении с современными дискретными видеокартами — и все эти аспекты мы планируем изучить. Дело за малым: AMD должна несколько серьёзнее отнестись к продвижению своей новинки и обеспечить нашу тестовую лабораторию нормальными, а не абы какими образцами Kaveri.

Дополнение: Компания AMD оперативно отреагировала на наше желание протестировать старшую модель Kaveri и пообещала в ближайшее время предоставить образец A10-7850K. Поэтому скоро на нашем сайте выйдет и вторая часть обзора нового APU, в которой мы подробно остановимся на аспектах, обойдённых вниманием в этот раз.



Оригинал материала: https://3dnews.ru./794878