Оригинал материала: https://3dnews.ru./956930

Обзор видеокарты AMD Radeon RX Vega 64

Архитектура AMD Vega. Графический процессор Vega 10. Технические характеристики

С тех пор как производство по нормам ниже 28 нм стало доступным и коммерчески оправданным для таких крупных микросхем, как дискретные графические процессоры, и AMD, и NVIDIA заменили свою прошлую продукцию чипами нового поколения, предлагающими совершенно иное соотношение быстродействия и мощности. Однако если NVIDIA не потребовалось много времени, чтобы заполнить все эшелоны производительности ускорителями на базе архитектуры Pascal и превзойти рекорды производительности, установленные в эпоху Maxwell, то AMD сосредоточила усилия на продуктах средней и начальной ценовой категории, фактически устранившись от конкуренции в сегменте высокопроизводительной графики.

Видеокарты на основе GPU семейства Polaris хорошо проявили себя как доступный массовый продукт и помогли графическому подразделению AMD вернуть рыночные позиции, упущенные картами Radeon 300-й серии. Тем не менее, AMD изначально дала понять, что Polaris, в отличие от предшествующих архитектур, не будет развиваться в сторону больших чипов, какими были ядра Hawaii и затем Fiji в эпоху 28 нм.

Действительно, хотя Polaris выиграла в энергоэффективности от перехода на норму 14 нм FinFET, она все еще имеет много общих черт со старыми продуктами AMD (Tonga и Fiji), которые помешали столь же эффективно распорядиться преимуществами прогрессивного техпроцесса. И хотя AMD исправила положение путем оптимизации производства и схемотехники GPU во втором поколении Polaris, карты Radeon RX 500-й серии по-прежнему ограничены в потенциале тактовых частот и лишены архитектурных преимуществ, которые могли бы нарастить быстродействие в инструкциях за такт. Как микроархитектура GCN, лежащая в основе чипов AMD, так и организация блоков внутри графического процессора требовали пересмотра, и эта задача легла на грядущее семейство Vega.

Чтобы не было сомнений в том, что AMD еще вернется на рынок GPU для энтузиастов, компания заранее рассказала довольно много о том, что представляет собой Vega, а в июле выпустила ускоритель Radeon RX Vega Frontier Edition. Сегодня же мы, наконец, можем изучить массовый геймерский продукт AMD на основе кремния нового поколения — Radeon RX Vega 64.

#Архитектура AMD Vega

NCU — Next-generation Compute Unit

Основным строительным блоком в архитектуре Graphics Core Next является Compute Unit, который в данном случае обозначается аббревиатурой NCU (Next-generation Compute Unit). Со времен первой реализации GCN более пяти лет тому назад AMD не вносила кардинальных изменений в структуру CU. Как и в предыдущих итерациях, NCU в составе Vega по-прежнему содержит 64 шейдерных ALU, которые способны выполнить 128 операций одинарной точности (FP32) за такт. Объем кэша первого уровня и разделяемой памяти внутри NCU также остался неизменным со времен GCN 1.0. Тем не менее, если в GCN версии 1.3, к которой относятся чипы Polaris, CU лишь претерпел оптимизации, способствующие увеличению удельной производительности по сравнению с CU в GCN 1.2 (Tonga и Fiji), и две версии архитектуры даже остались совместимы на уровне ISA, разработчики Vega внедрили массу новых инструкций и форматов данных, за счет которых GCN пятого поколения можно расценивать как наиболее глубокое преобразование шейдерной микроархитектуры Graphics Core Next на сегодняшний день.

Как и Polaris, Vega может выполнять операции над вещественными и целыми числами с половинной точностью (FP16), но в Vega дополнительно появилась поддержка целочисленных операций с точностью 8, 16 и 32 бит. Что касается целочисленных форматов данных со сниженной разрядностью, то у них уже сейчас есть масса применений. К примеру, формат INT8 используется для обработки данных с помощью предварительно натренированных сетей машинного обучения (inference), а INT32 — для расчета хэшей в криптографических алгоритмах (включая майнинг криптовалют). С другой стороны, востребованность операций над вещественными числами с половинной точностью не столь очевидна. Формат FP16 широко используется для обработки шейдеров в мобильной графике, но уницифированная шейдерная модель десктопных API изначально сделала выбор в пользу FP32. Тем не менее, FP16 может со временем найти применение и в десктопной графике для тех задач, которые не требуют полной точности для сохранения качества изображения — таких как векторы нормали, значения освещенности и HDR.

Но самое главное — это то, что NCU в составе Vega способен комбинировать операции сниженной разрядности, таким образом кратно увеличивая пропускную способность. К примеру, вместо 128 операций за такт над числами FP32, которые выполняет отдельно взятый NCU, может быть выполнено 256 операций FP16 или 512 операций FP8. Единственным из прочих GPU, который наделен такой функций, на сегодняшний день является GP100 от NVIDIA. Таким образом, Vega, помимо высокопроизводительной игровой архитектуры, представляет собой универсальное решение для расчетов широкого назначения — во всем, кроме двойной точности, т.к. пропускная способность FP64 ограничена значением 1/16 от FP32.

Тайловый рендеринг и поддержка Direct3D feature level 12_1

Следующая область, в которой Vega сделала большой шаг вперед, — это пропускная способность в пикселах. Вслед за NVIDIA, AMD использует в Vega тайловый рендеринг — технологию, которая широко используется в мобильной графике и позволяет сократить количество обращений к данным, находящимся за пределами кеш-памяти GPU. Аналогично работает и механизм Draw-Stream Binning Rasterizer (DSBR) в составе Vega.

Классический тайловый рендеринг, широко распространенный в мобильных GPU, подразумевает обработку кадра в два прохода. Сначала драйвер разделяет экранное пространство на тайлы (участки с типичным размером 16 × 16 или 32 × 32 пиксела) и составляет индекс полигонов, находящихся в проекции каждого тайла. Затем последовательно в пределах каждого тайла целиком выполняется процедура рендеринга — от трансформации и пересечения полигонов до заполнения текстур и исполнения шейдеров — и конечный результат всех тайлов сшивается в единую картинку. Преимущество такого метода состоит в том, что любые промежуточные операции в пределах тайла оперируют единым массивом данных, который целиком помещается в кеш GPU, а следовательно, сокращается частота обращений к оперативной памяти.

Тем не менее, необходимость в двух проходах обработки геометрии сцены сама по себе расходует пропускную способность RAM, поскольку GPU необходимо сначала записать во внешнюю память информацию о полигонах, попадающих в тот или иной тайл, а затем, выполняя рендеринг от тайла к тайлу, извлекать ее обратно. Как следствие, эффективность тайлового рендеринга в конечном счете зависит от того, перевешивает ли экономия ПСП на скорости заполнения пикселов ее потери на двухпроходную проекцию геометрии. В мобильных приложениях, отличающихся простой геометрией, тайловый рендеринг оправдывает себя, но для современных десктопных игр лучше подходит стандартный метод мгновенного (immediate) рендеринга, при котором в едином экранном пространстве происходит последовательная растеризация одного полигона за другим.

Реализация тайлового рендеринга в чипах Maxwell/Pascal и Vega отличается. У NVIDIA отсутствует этап сортировки полигонов, т. к. трансформация геометрии происходит единым проходом. AMD, напротив, производит сортировку, но расход тактов на эту операцию снижается путем динамического выбора размера тайла и партии (batch) примитивов в зависимости от сложности конкретной сцены.

Кроме того, сортировка и группировка примитивов в партии позволяет наиболее эффективно предотвращать наложение пиксельных шейдеров на невидимые пикселы, перекрытые полигонами, ближайшими к плоскости экрана. Отдельные выборки пикселов Vega помещает в очередь, которая показывает, на какой глубине от экрана они находятся, а т.к. эта очередь имеет конечный размер, целесообразно использовать тайловый рендеринг, чтобы в пределах отдельно взятого тайла уложиться в ее пределы.

Тайловый рендеринг в чипах Vega не требует специальной поддержки со стороны приложений и активируется на уровне драйвера видеокарты. По данным внутреннего тестирования AMD, DSBR увеличивает среднюю частоту кадров в современных играх вплоть до 10%, снижает расход пропускной способности шины памяти вплоть до 33% и при этом никак не отражается на энергопотреблении GPU. В профессиональных CAD-приложениях прирост частоты смены кадров за счет DSBR может быть и двукратным.

Vega может похвастаться поддержкой возможностей, предусмотренных Direct3D уровня 12_1. Фактически, среди современных GPU Vega имеет наиболее полный набор функций, включая ряд опциональных.

Оптимизированный front-end

Чипы Polaris не испытывают острой нехватки быстродействия на ранних этапах рендеринга, однако по сравнению с конкурирующей архитектурой AMD было над чем поработать и в этой области. Vega по-прежнему содержит по одному блоку обработки геометрии на каждый Shader Engine (наиболее крупную структуру в схеме GPU, которая объединяет все стадии конвейера рендеринга), но разработчики нашли возможность увеличить предельную пропускную способность front-end’а с четырех до 17 примитивов за такт.

Для этого AMD представила альтернативный режим работы геометрического движка, в котором некоторые из стадий фиксированной функциональности были замещены программируемыми «шейдерами примитивов» — точно так же, как в чипах NVIDIA Pascal конвейер геометрии является частично программируемым. Помимо того, что шейдеры примитивов сами по себе исполняются более экономно по сравнению с аналогичными стадиями фиксированного конвейера, они позволяют отсекать невидимые примитивы на более ранних стадиях. Шейдеры примитивов в будущем можно будет задействовать для тесселяции и многих других функций, включая одновременную проекцию сцены с различных точек обзора и в различном разрешении. Пока, однако, непонятно, нужно ли для того, чтобы активировать программируемый конвейер геометрии Vega какое-либо участие со стороны движка приложений или эту функцию берет на себя драйвер.

В дополнение к непосредственной оптимизации геометрического конвейера AMD приняла меры для того, чтобы гарантировать полную загрузку движков в пределах GPU. Допонительный блок под названием Intelligent Workload Distributor (IWD) обеспечивает балансировку нагрузки между несколькими геометрическими движками, планировку операций с целью минимизировать смену контекста и группировку нескольких инстанций мелкого примитива в единой SIMD-инструкции.

High-Bandwidth Cache Controller

В составе Vega AMD представила инновационную организацию памяти, в рамках которой GPU оперирует примерно таким образом, как центральный процессор ПК. В стандартной архитектуре GPU рассматривает содержимое локальной оперативной памяти как совокупность структур, отвечающих данным различного типа, будь то текстуры, массивы вершин и т.д. Как следствие, поскольку эти структуры могут иметь большой размер, их перемещение из системой памяти в локальную память существенно снижает скорость рендеринга. Как правило, разработчики приложений стремятся зарезервировать как можно больший объем локальной памяти и держать все необходимые данные поближе к GPU, хотя есть и такие методы, как Tiled Resources, с помощью которых данные можно подгружать из системной памяти небольшими порциями (наподобие того, как работает технология Mega Texture в движках id Software).

AMD предлагает универсальный механизм работы с адресным пространством, который издавна применяется в центральных процессорах. В нем содержимое локальной и удаленной памяти вне зависимости от типа ресурса делится на «страницы» небольшого размера, которые могут быть по отдельности затребованы конвейером рендринга, перемещены или скопированы поближе или подальше от GPU. В таком случае локальная оперативная память работает как новый уровень кеша в дополнение к кешу L2.

Помимо экономии RAM, технология HBCC позволит более эффективно распоряжаться объемом Flash-памяти в ускорителях Radeon Pro и адресовать вплоть до 512 Тбайт виртуального пространства. Для потребительских устройств эта функциональность избыточна, но будет востребована в виртуализированной среде. Остается открытым и такой вопрос, может ли страничный доступ к памяти работать на уровне драйвера (сама функция активируется в Radeon Settings) или, напротив, приложение должно самостоятельно управлять движением ресурсов.

Кстати, AMD ввела дополнительные функции виртуализации, обеспечив доступ гостевых ОС (вплоть до 16 сессий) к аппаратным блокам кодирования и декодирования видеопотока. Планировкой нагрузки между тремя движками (графика/вычисления, кодирование и декодирование видео) занимается отдельный аппаратный блок.

#GPU Vega 10

Единственный GPU семейства Vega, который на данный момент выпустила AMD, по конфигурации вычислительных блоков соответствует процессору Fiji: 4096 шейдерных ALU, 256 блоков наложения текстур и 64 ROP. Тем не менее, число транзисторов в чипе увеличилось с 8,9 до 12,5 млрд. В тоже время благодаря техпроцессу 14 нм FinFET площадь кристалла удалось сократить с 596 до 486 мм2. Таким образом, Vega 10 — на 72% более плотный чип, нежели Fiji, и даже по сравнению с Polaris площадь используется на 5% более эффективно.

Часть транзисторного бюджета, которым Vega 10 отличается от Fiji, израсходована на удвоенный объем кеш-памяти второго уровня (4 против 2 Мбайт в Fiji) на новые функции рендеринга, описанные выше, но львиная доля элементов, распределенных в схеме GPU, служит основой для дополнительных стадий конвейера, которые AMD пришлось внедрить, чтобы обеспечить стабильную работу на повышенных тактовых частотах. Однако разработчики заверили, что дополнительные стадии появились только на тех участках, где польза от высокой частоты перевешивает возросшую латентность. В противном случае использовались более изощренные методы, включая уменьшение длины внутренних соединений или полную переработку тех или иных функциональных блоков.

Регистры внутренней памяти Vega построены с применением статической памяти, изначально созданной для процессоров Ryzen, которая, согласно данным AMD, обеспечивает экономию площади в объеме 18%, снижение мощности на 43% и латентности на 8% по сравнению со стандартными решениями.

Кстати, ROP внутри Vega теперь являются клиентами кеша второго уровня, а не контроллера памяти. Это увеличит производительность движков отложенного рендеринга, поскольку результат отдельного прохода будет записан непосредственно в L2 вместо оперативной памяти и будет немедленно доступен текстурным модулям для следующих операций.

Для коммуникаций внутри чипа между собственно GPU и uncore-компонентами (контроллером RAM, шины PCI Express, мультимедийным блоком и т. д.) Vega использует интерфейс Infinity Fabric, который также является частью процессоров архитектуры Zen. Благодаря ей AMD в будущем сможет с легкостью интегрировать ядро Vega в APU нового поколения.

Блок декодирования видеопотока в составе Vega не приобрел новых функций по сравнению с Polaris. Он по-прежнему выполняет расшифровку форматов H.264 и H.265 при разрешении вплоть до 3840 × 2160 с кадровой частотой 120 Гц, однако AMD внесла ясность в вопрос аппаратной поддержки кодека VP9, которая впервые была заявлена для Polaris, но не реализована в драйвере вплоть до сегодняшнего дня. Оказывается, Vega использует гибридный метод, комбинируя ресурсы выделенного блока, шейдерных ALU и центрального процессора.

А вот блок кодирования в Vega приобрел возможность записывать видео в формате H.264 в 4К-разрешении с частотой 60 Гц, в то время как Polaris был ограничен частотой 30 Гц.

В Vega вновь используется память типа HBM, но поскольку вторая версия технологии позволяет выпускать сборки объемом вплоть до 8 Гбайт, AMD одновременно получила возможность увеличить объем локальной памяти GPU и упростить конструкцию за счет меньшего числа микросхем и упрощенной разводки соединений. Кремниевая подложка Vega 10 объединяет кристалл GPU с двумя сборками HBM2 по 4 Гбайт 2048-битной шиной, но за счет практически удвоенной частоты HBM2 процессор сохранил «сырую» пропускную способность памяти, сопоставимую с характеристиками Fiji.

#Технические характеристики, комплект поставки, цена

AMD представила три ускорителя на основе Vega 10, не считая Radeon RX Vega Frontier Edition. Топовой моделью в семействе является Radeon RX Vega 64, доступная в вариантах с воздушным кулером и системой жидкостного охлаждения. Число в названии указывает на 64 активных NCU в составе полностью разблокированного чипа. Поскольку Radeon R9 Fury X обладает такой же конфигурацией, дополнительную производительность RX Vega, помимо оптимизации конвейера, извлекает из более высоких тактовых частот.

Базовая частота GPU в Radeon RX Vega 64 с воздушным охлаждением составляет 1247 МГц, и это не очень воодушевляет, если сравнивать с базовой частотой GeForce GTX 1080 Ti (который основан на GPU сопоставимого размера и даже на 500 млн транзисторов меньше). Тем не менее, boost-частоты у двух видеокарт вполне сопоставимы — 1546 и 1582 МГц соответственно. К тому же, в случае Vega AMD вкладывает иной смысл в понятие boost clock. Вместо максимальной частоты, которая разрешена для GPU число означает максимальную частоту, которой ядро может гарантированно достигнуть в играх, но истинный предел лежит еще выше. Таким образом, AMD и NVIDIA теперь оперируют похожими показателями, что облегчает сравнение видеокарт по их спецификациям, хотя NVIDIA все-таки подразумевает под boost clock некое среднее, а не пиковое значение, которое наблюдается в играх.

Radeon RX Vega 64 Liquid Cooled Edition по заявленным частотам уже вполне соответствует GeForce GTX 1080 Ti, но давайте посмотрим на энергопотребление новинок: если даже «воздушная» версия Radeon RX Vega 64 превышает по мощности типичные для топовых потребительских видеокарт 250 Вт, то мощности Liquid Cooled Edition достигает совершенно безумных с позиции одночипового ускорителя 345 Вт.

Принимая во внимание масштаб оптимизаций, которые содержит Vega 10, размеры чипа и его мощность, было бы логично ожидать от Radeon RX Vega 64 производительности на уровне GeForce GTX 1080 Ti или выше. По крайней мере, по теоретической пропускной способности операций FP32 Radeon RX Vega 64 опережает топовый ускоритель конкурента. Но судя по ценам, AMD не столь уверена в потенциале своего флагмана. Действительно, версия с воздушным охлаждением поступит в продажу по рекомендованной цене $499 — аналогично GeForce GTX 1080. Рекомендованная цена Radeon RX Vega 64 Liquid Cooled Edition — $699, что соответствует текущей цене GeForce GTX 1080 Ti.

Производитель AMD
Модель Radeon R9 Fury X Radeon RX 580 Radeon RX Vega 64 Frontier Edition Radeon RX Vega 56 Radeon RX Vega 64 Radeon RX Vega 64 Liquid Cooled Edition
Графический процессор
Название Fiji XT Polaris 20 XTX Vega 10 XT Vega 10 XL Vega 10 XT Vega 10 XT
Микроархитектура GCN 1.2 GCN 1.3 GCN 1.4 GCN 1.4 GCN 1.4 GCN 1.4
Техпроцесс, нм 28 нм 14 нм FinFET 14 нм FinFET 14 нм FinFET 14 нм FinFET 14 нм FinFET
Число транзисторов, млн 8900 5700 12 500 12 500 12 500 12 500
Тактовая частота, МГц: Base Clock / Boost Clock —/1050 1257/1340 1382/1600 1156/1471 1247/1546 1406/1677
Число шейдерных ALU 4096 2304 4096 3584 4096 4096
Число блоков наложения текстур 256 144 256 256 256 256
Число ROP 64 32 64 64 64 64
Оперативная память
Разрядность шины, бит 4096 256 2048 2048 2048 2048
Тип микросхем HBM GDDR5 SDRAM HBM2 HBM2 HBM2 HBM2
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 500 (1000) 2000 (8000) 945 (1890) 800 (1600) 945 (1890) 945 (1890)
Объем, Мбайт 4096 4096/8192 8096 8096 8096 8096
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 8602 6175 13107 10544 12665 13738
Производительность FP32/FP64 1/16 1/16 1/16 1/16 1/16 1/16
Пропускная способность оперативной памяти, Гбайт/с 512 256 484 410 484 484
Вывод изображения
Интерфейсы вывода изображения HDMI 1.4a, DisplayPort 1.2 HDMI 2.0, DisplayPort 1.3/1.4 HDMI 2.0, DisplayPort 1.4 HDMI 2.0, DisplayPort 1.4 HDMI 2.0, DisplayPort 1.4 HDMI 2.0, DisplayPort 1.4
TDP, Вт 275 185 <300 210 295 345
Розничная цена (США, без налога), $ 649 (рекомендованная на момент выхода) 199/229 (рекомендованная на момент выхода) 999/1499 (рекомендованная на момент выхода) 399 (рекомендованная на момент выхода) 499 (рекомендованная на момент выхода) 699 (рекомендованная на момент выхода)
Розничная цена (Россия), руб. НД 13 449 / 15 299 (рекомендованная на момент выхода) НД НД НД НД

#AMD Radeon RX Vega 64: конструкция

Производительность: 3DMark. Производительность: игры (1920 × 1080, 2560 × 1440)

#Тестовый стенд, методика тестирования

Конфигурация тестовых стендов
CPU Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота
Материнская плата ASUS RAMPAGE V EXTREME
Оперативная память Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт
ПЗУ Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты

Radeon R9 Fury X, Radeon R9 580: Radeon Software Crimson ReLive Edition 17.6.2

Radeon RX Vega 64: 17.30.1051-Beta6a

(Tesselation: Use application settings)

ПО для GPU NVIDIA
Все видеокарты GeForce Game Ready Driver 384.94
Бенчмарки: синтетические
Тест API Разрешение Полноэкранное сглаживание
3DMark Fire Strike DirectX 11 (feature level 11_0) 1920 × 1080 Выкл.
3DMark Fire Strike Extreme 2560 × 1440
3DMark Fire Strike Ultra 3840 × 2160
3DMark Time Spy DirectX 12 (feature level 11_0) 2560 × 1440
Бенчмарки: игры
Игра (в порядке даты выхода) API Настройки Полноэкранное сглаживание
1920 × 1080 / 2560 × 1440 3840 × 2160
Crysis 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Swamp MSAA 4x Выкл.
Metro: Last Light Redux, встроенный бенчмарк Макс. качество SSAA 4x
GTA V, встроенный бенчмарк Макс. качество MSAA 4x + FXAA + Reflection MSAA 4x
DiRT Rally, встроенный бенчмарк Макс. качество MSAA 4x
Rise of the Tomb Raider, встроенный бенчмарк DirectX 12 Макс. качество, VXAO выкл. SSAA 4x
Tom Clancy's The Division, встроенный бенчмарк Макс. Качество, HFTS выкл. SMAA 1x Ultra + TAA: Supersampling TAA: Stabilization
Ashes of the Singularity, встроенный бенчмарк Макс. качество MSAA 4x + TAA 4x Выкл.
DOOM Vulkan Макс. качество. Миссия Foundry TSSAA 8TX
Total War: WARHAMMER встроенный бенчмарк DirectX 12 Макс. качество MSAA 4x
Deus Ex: Mankind Divided, встроенный бенчмарк Макс. качество MSAA 4x
Battlefield 1 + OCAT Макс. качество. Начало миссии Over the Top TAA
Бенчмарки: декодирование видео, вычисления
Программа Настройки
DXVA Checker, Decode Benchmark, H.264 Файлы 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 Video Decoder
DXVA Checker, Decode Benchmark, H.265 Файлы 1920 × 1080p (Main Profile, L4.0), 3840 × 2160p (Main Profile, L5.0). Microsoft H265 Video Decoder
LuxMark 3.1 x64 Сцена Hotel Lobby (Complex Benchmark)
Sony Vegas Pro 13 Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080p 24 Гц
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis Open CL, FP32/FP64
CompuBench CL Desktop Edition X64, Ocean Surface Simulation
CompuBench CL Desktop Edition X64, Particle Simulation— 64K

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт);
  • AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт);
  • AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт);
  • NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт);
  • NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт);
  • NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт).

#Производительность: 3DMark

3DMark (Graphics Score)
Разрешение AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Fire Strike 1920 × 1080 22 503 13 631 16 105 17 115 21 694 27 877
Fire Strike Extreme 2560 × 1440 10 711 6 090 7 559 7 928 10 264 13 681
Fire Strike Ultra 3840 × 2160 5 400 3 051 3 821 4 042 5 001 6 728
Time Spy 2560 × 1440 7 079 4 238 5 192 5 106 7 111 9 525
Макс. −39% −27% −24% +0% +35%
Средн. −42% −28% −26% −4% +28%
Мин. −44% −29% −28% −7% +24%

#Производительность: игры (1920 × 1080, 2560 × 1440)

1920 × 1080
Полноэкранное сглаживание AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Ashes of the Singularity MSAA 4x + TAA 4x 37 24 32 31 45 58
Battlefield 1 TAA 131 82 91 85 115 141
Crysis 3 MSAA 4x 65 44 61 66 79 115
Deus Ex: Mankind Divided MSAA 4x 38 25 33 30 38 54
DiRT Rally MSAA 4x 85 57 65 84 101 129
DOOM TSSAA 8TX 200 138 166 151 200 200
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 64 45 55 67 84 93
Metro: Last Light Redux SSAA 4x 87 51 69 74 92 124
Rise of the Tomb Raider SSAA 4x 57 35 42 47 63 86
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 81 51 61 54 82 113
Total War: WARHAMMER MSAA 4x 71 39 54 59 71 85
Макс. −30% −6% +4% +30% +77%
Средн. −36% −19% −16% +9% +39%
Мин. −45% −31% −35% −12% +0%
2560 × 1440
Полноэкранное сглаживание AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Ashes of the Singularity MSAA 4x + TAA 4x 28 19 26 25 34 47
Battlefield 1 TAA 97 59 62 62 82 102
Crysis 3 MSAA 4x 41 27 39 41 53 73
Deus Ex: Mankind Divided MSAA 4x 24 16 19 19 25 35
DiRT Rally MSAA 4x 64 41 49 61 73 96
DOOM TSSAA 8TX 147 89 110 100 136 178
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 48 31 39 48 63 81
Metro: Last Light Redux SSAA 4x 50 28 41 44 52 73
Rise of the Tomb Raider SSAA 4x 36 22 27 29 38 53
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 59 36 44 39 56 80
Total War: WARHAMMER MSAA 4x 47 26 38 40 49 64
Макс. −32% −5% +1% +32% +78%
Средн. −38% −20% −17% +8% +46%
Мин. −45% −36% −36% −15% +5%

Производительность: игры (3840 × 2160)

#Производительность: игры (3840 × 2160)

3840 × 2160
Полноэкранное сглаживание AMD Radeon RX Vega 64 (1546/1890 МГц, 8 Гбайт) AMD Radeon RX 580 (1340/8000 МГц, 8 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Ashes of the Singularity Выкл. 45 28 37 31 44 59
Battlefield 1 55 34 41 37 50 67
Crysis 3 32 20 28 31 36 50
Deus Ex: Mankind Divided 28 17 15 21 28 38
DiRT Rally 43 27 33 41 50 66
DOOM 75 45 59 54 75 97
GTA V 47 29 37 41 52 71
Metro: Last Light Redux 43 26 37 39 47 65
Rise of the Tomb Raider 42 26 30 35 44 62
Tom Clancy's The Division TAA: Stabilization 34 21 2 23 32 46
Total War: WARHAMMER Выкл. 39 24 32 31 39 52
Макс. −37% −13% −3% +16% +56%
Средн. −38% −29% −20% +3% +41%
Мин. −40% −94% −33% −9% +22%

Производительность: декодирование видео, вычисления. Тактовые частоты, энергопотребление, температура. Выводы

#Производительность: декодирование видео

#Производительность: вычисления

#Тактовые частоты, энергопотребление, температура

Обновленная версия утилиты WattMan для Radeon RX Vega содержит три предустановленных профиля мощности, с помощью которых можно либо сократить энергопотребление, либо увеличить его относительно номинальных 100%. Все тесты быстродействия Radeon RX Vega 64 мы провели в режиме Turbo, который расширяет энергетический пакет GPU на 15%. В таких условиях максимальная частота Vega 10, которую мы наблюдали в играх, составила 1662 МГц, что даже выше заявленного в спецификациях уровня boost clock — 1546 МГц. Тем не менее, в большинстве приложений стабильные частоты оказываются намного ниже. К примеру, в игре Crysis 3, которую мы используем для измерения мощности, частота GPU колеблется вокруг отметки 1478 МГц.

#Выводы

Благодаря колоссальной работе инженеров над архитектурой Vega, AMD смогла вернуться на рынок высокопроизводительной дискретной графики. По многим параметрам — размеру кристалла, тактовым частотам и энергопотреблению — графический процессор Vega 10 выглядит как полноправный конкурент GP102 от NVIDIA, и эти ожидания вполне оправдались в тестах вычислений общего назначения. Тем не менее, в игровых приложениях новый флагман AMD может потягаться лишь с GeForce GTX 1080. Более того, несмотря на все отличия архитектуры Vega от Polaris, Radeon RX Vega 64 занял такую же позицию по отношению к GTX 1080, как Radeon RX 480 когда-то — по отношению к GeForce GTX 1060. А именно, в ультравысоком разрешении (4К) можно признать паритет между двумя видеокартами, но в менее требовательных режимах позиции Vega не столь устойчивы, и хотя соперники обменялись ударами в тестах, благосклонных к той или иной графической архитектуре, в нашей подборке игр класса ААА есть несколько проектов, в которых Vega работает столь неэффективно, что чаша весов склоняется в пользу GeForce GTX 1080.

P.S. В связи с чрезвычайно сжатыми сроками подготовки обзора (Radeon RX Vega 64 досталась нам за 24 часа до момента публикации) мы вынуждены были провести сокращенное тестирование и, в частности, не коснулись такой темы, как разгон, но обещаем в ближайшем будущем наверстать упущенное.



Оригинал материала: https://3dnews.ru./956930