Оригинал материала: https://3dnews.ru./914971

Обзор видеокарты NVIDIA GeForce GTX 980 Ti: большой Maxwell пошел в массы

Архитектура. Спецификации. Дизайн

В контексте существующего тренда на развитие GPU в сторону универсальных вычислительных устройств, который активно поддерживает сама NVIDIA, архитектура процессора GM200 стала вынужденным компромиссом. Так как производство крупных дискретных GPU еще не вырвалось из тисков техпроцесса 28 нм, ограничивающего всесторонний рост производительности за счет простого увеличения транзисторных бюджетов, для архитектуры Maxwell пришлось расставить четкие приоритеты: графика – в первую очередь, вычисления двойной точности (FP64) – по остаточному принципу (более подробно об этой архитектуре вы можете прочитать в обзорах GeForce GTX 750 Ti и GeForce GTX 980).

В качестве ускорителя для игр и вычислительных задач, не включающих операции FP64, TITAN X сделал большой шаг вперед относительно как GTX 980, так и группы плат, построенных на старшем чипе архитектуры Kepler – GK110: GTX 780/780 Ti, TITAN/TITAN Black. Но GeForce GTX 980 Ti неизбежно должен быть ограничен в конфигурации вычислительных блоков по сравнению с TITAN X, ведь производительность FP64, и так чрезвычайно низкая у GM200, не может служить фактором, отличающим плату серии TITAN от лидера игровой линейки GeForce. Основная интрига связана с тем, где в промежутке между GTX 980 и TITAN X производитель решит поместить новинку.

Как выяснилось, в GPU нового флагмана были отключены лишь 2 из 24 потоковых мультипроцессоров (SMM). Соответственно, GTX 980 Ti обладает 2816 активными ядрами CUDA и 176 текстурными блоками вместо 3072 и 192 в GPU TITAN X. Число ROP (96) не изменилось, равно как широта шины памяти (384 бит). Тактовые частоты GPU и памяти также остались в неприкосновенности, однако объем RAM был уполовинен до 6 Гбайт. Вот, собственно, и вся разница между GTX 980 Ti и TITAN X.

Модель Графический процессор Видеопамять TDP, Вт Рекомендованная розничная цена для рынка США (без налогов), $
Кодовое название Число транзис-торов, млн Тактовая частота, МГц: Base Clock / Boost Clock Число ядер CUDA Число текстур-ных блоков Число ROP Разряд-ность шины, бит Тип микро-схем Тактовая частота: реальная (эффектив-ная), МГц Объем, Мбайт
GeForce GTX TITAN X GM200 8 000 1000/1076 3072 192 96 384 GDDR5 SDRAM 1753 (7012) 12 280 250 999
GeForce GTX 980 Ti GM200 8 000 1000/1076 2816 176 96 384 GDDR5 SDRAM 1753 (7012) 6 144 250 649
GeForce GTX 980 GM204 5 200 1126/1216 2048 128 64 256 GDDR5 SDRAM 1750 (7000) 4 096 165 499
GeForce GTX 780 Ti GK110 7 100 875/928 2880 240 48 384 GDDR5 SDRAM 1750 (7000) 3 072 250 699 (до снятия с продажи)

За эту скромную жертву полагается существенная скидка: GeForce GTX 980 Ti имеет рекомендованную цену $649 (США, без налогов) – куда дешевле, чем TITAN X ($999). Рублевый эквивалент составляет 39 990 р. Новый флагман основной геймерской линейки NVIDIA GTX 980 Ti получился дешевле, чем 780 Ti, до снятия с производства продававшийся за $699, и в то же время дороже, чем GTX 980 ($549 на момент релиза). Кстати, последний в связи с выходом 980 Ti получил уценку до $499.

Топовый однопроцессорный адаптер AMD – Radeon R9 290X – по прежнему остается наиболее выгодным предложением в верхнем сегменте игровых видеоадаптеров ($369), хотя равным соперником для него может быть в лучшем случае GTX 980, но никак не GTX 980 Ti. Более интересно столкнуть новоприбывшего с Radeon R9 295X2 (цена – от $789). И хотя последний – это уже устройство классом выше как по цене, так и по производительности, интересно проверить, что новый продукт NVIDIA сможет противопоставить такому монстру.

#Поддержка новых аппаратных функций в DirectX 12 и GameWorks VR

Осталось немного времени до выхода в свет Windows 10, поэтому DirectX 12 уже обрел окончательный вид. В частности, представлены два «уровня» аппаратных функций (feature level). Напомним, что новая версия DirectX – это, с одной стороны, другой API, поддержка которого может быть внедрена в драйверы GPU, выпущенных до его появления. Соответственно, относительно старое «железо» также сможет воспользоваться преимуществами DX12 – в первую очередь более эффективным расходованием ресурсов CPU. С другой стороны, DirectX 12 представляет новые функции рендеринга, которые опционально могут быть реализованы в графических процессорах, но не требуются для работы новой runtime-библиотеки API. GPU, принадлежащие ко второй итерации архитектуры Maxwell, включая GM200, обладают полной поддержкой данных функций (feature level 12_0 и 12_1), среди которых можно выделить Volume Tiled Resources и Conservative Raster.

Первая дает возможность по требованию загружать в память видеоадаптера необходимые части большой трехмерной текстуры (необходимой для рендеринга жидкости или дыма), не расходуя ресурс RAM на текстуру целиком. Вторая обеспечивает точную локализацию пересекающихся границ полигонов, что в ряде ситуаций помогает избежать артефактов с прозрачными текстурами или, к примеру, наложением теней методом Ray Tracing, как показано на следующем слайде.

Одновременно с GTX 980 Ti NVIDIA представила набор библиотек GameWorks VR, предназначенных для адаптации игр к шлемам виртуальной реальности. Одна из ключевых функций GameWorks VR, которая опирается на аппаратные алгоритмы в GPU архитектуры Maxwell, – Multi-Res Shading – должна увеличить производительность при рендеринге сцены для стереоскопического шлема.

В окулярах шлема установлены линзы, позволяющие глазам сфокусироваться на близко расположенных LCD-экранах, потому картинка, отрисованная GPU, должна быть модифицирована, чтобы компенсировать искажение геометрии: края изображения сжимаются, как в фотоснимке, сделанном на объектив-«рыбий глаз». В результате часть работы, которую выполнил GPU, потратив ресурсы на рендеринг пикселов по краям изображения, обесценивается компрессией.

NVIDIA предлагает разделить кадр на несколько зон (viewports), рендеринг в которых выполняется одновременно, но с различным разрешением: больше в центре, меньше – по краям. Специальные алгоритмы задействуются, чтобы сопоставить края пикселей разного размера на границе зон, а затем формируется финальный кадр с искаженной геометрией. По утверждению разработчиков, Multi-Res Shading увеличивает производительность пиксельных шейдеров в 1,3-2 раза по сравнению с такой ситуацией, когда изображение изначально строится в высоком разрешении.

#Конструкция

С виду GeForce GTX 980 Ti отличает от TITAN X только маркировка, цвет кожуха системы охлаждения (светлый в данном случае и черный у TITAN X), да еще количество микросхем памяти: поскольку объем RAM вдвое меньше, все чипы разместились на лицевой стороне платы, под общим радиатором.

Видеокарта оснащается закрытым кулером, уже неоднократно использованным NVIDIA в других топовых решениях, начиная с самого первого TITAN.

Не будем в очередной раз описывать устройство этой системы охлаждения. Достаточно отметить, что в радиатор GPU вмонтирована испарительная камера, которая также применялась в адаптерах на базе GK110, но отсутствовала в GTX 980.

Видеокарта обладает тремя разъемами DisplayPort и по одной штуке – HDMI и Dual-Link DVI-I.

#Плата

Печатные платы GTX 980 Ti и TITAN X различаются лишь количеством распаянных чипов RAM. Память набрана 12 микросхемами SK hynix H5GQ4H24MFR-R2C со штатной частотой 7 ГГц.

Преобразователь напряжения построен по схеме 6+2 (число фаз для питания GPU и микросхем памяти соответственно) и содержит контроллер ON Semiconductor NCP81174. Дополнительное питание подается через один восьмиконтактный и один шестиконтактный разъемы.

Тестирование. Выводы

#Тестовый стенд, методика тестирования

Конфигурация тестовых стендов
CPU Intel Core i7-5960X @ 4 ГГц (100x40)
Материнская плата ASUS RAMPAGE V EXTREME
Оперативная память Corsair Vengeance LPX, 2133 МГц, 4x4 Гбайт
ПЗУ Intel SSD 520 240 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Охлаждение CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Операционная система Windows 8.1 Pro X64
ПО для GPU AMD AMD Catalyst Omega 15.4 Beta
ПО для GPU NVIDIA 350.90

Энергосберегающие технологии CPU во всех тестах отключены. В настройках драйвера NVIDIA в качестве процессора для вычисления PhysX выбирается CPU. В настройках AMD настройка Tesselation переводится из состояния AMD Optimized в Use application settings.

Бенчмарки: синтетические
Программа Настройки Анизотропная фильтрация, полноэкранное сглаживание Разрешение
3DMark 2011 Тест Extreme
3DMark Тест Fire Strike (не Extreme)
Unigine Heaven 4 DirectX 11, макс. качество, тесселяция в режиме Extreme AF 16x, MSAA 4x 1920 × 1080 / 2560 × 1440
Бенчмарки: игры
Программа Настройки Полноэкранное сглаживание Разрешение
Tomb Raider, встроенный бенчмарк Макс. качество SSAA 4x 1920 × 1080 / 2560 × 1440
Crysis 3 + FRAPS Макс. качество. Начало миссии Post Human MSAA 4x 1920 × 1080 / 2560 × 1440
Metro: Last Light, встроенный бенчмарк Макс. качество SSAA 4x 1920 × 1080 / 2560 × 1440
Company of Heroes 2, встроенный бенчмарк Макс. качество SSAA 4x 1920 × 1080 / 2560 × 1440
Battlefield 4 + FRAPS Макс. качество. Начало миссии Tashgar MSAA 4x + FXAA 1920 × 1080 / 2560 × 1440
Alien: Isolation Макс. качество SMAA T2X 1920 × 1080 / 2560 × 1440
Far Cry 4 + FRAPS Макс. качество. Banapur (первая деревня) MSAA 4x 1920 × 1080 / 2560 × 1440
GTA V, встроенный бенчмарк Макс. качество MSAA 4x 1920 × 1080 / 2560 × 1440
Witcher 3 + FRAPS Макс. качество. Локация Kaer Morhen FXAA 1920 × 1080 / 2560 × 1440
Бенчмарки: вычисления
Программа Настройки
DXVA Checker Decode benchmark. H.264, H.265. Файлы 1920х1080p (битрейт видео ~3000 Кбит/с), 3840x2160p (битрейт видео ~7500 Кбит/с). Microsoft H264 Video Decoder (H.264), LAV Video Decoder (H.265), ускорение на аппаратном кодеке GPU (DXVA2)
LuxMark 2.0 X64 Сцена Room (Complex Benchmark)
Sony Vegas Pro 13 Бенчмарк Sony для Vegas Pro 11, продолжительность – 65 с, рендеринг в XDCAM EX, 1920х1080@24p
CompuBench CL Desktop Edition X64, Ocean Surface Simulation
CompuBench CL Desktop Edition X64, Particle Simulation – 64K
SiSoftware Sandra 2015, Scientific Analysis Open CL, FP32/FP64

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

#Тактовые частоты, энергопотребление, температура, разгон

Хотя по спецификациям GPU в составе GeForce GTX 980 Ti работает на тех же частотах, что и в TITAN X, выяснилось, что частота ядра в новой видеокарте может достигать более высоких значений – вплоть до 1202 МГц (в отличие от 1177 МГц у TITAN X). При этом на GPU подается чуть более высокое напряжение, чем позволяет TITAN X (1,193 против 1,174 В).

В разгоне GTX 980 Ti также не подкачал. Увеличив максимальное напряжение на GPU до 1,237 В, нам удалось поднять базовую частоту до 1270 МГц, а в динамике процессор достигал планки 1497 МГц.

Base Clock, МГцМакс. Boost Clock, МГцBase Clock, МГц (разгон)Макс. зарегистрированная Boost Clock, МГц (разгон)
GeForce GTX TITAN X 1000 1177 (+177) 1252 1455 (+203)
GeForce GTX 980 Ti 1000 1202 (+202) 1270 1497 (+227)
GeForce GTX 980 1127 1253 (+126) 1387 1526 (+139)
GeForce GTX TITAN Black 889 1032 (+143) 1100 1262 (+162)
GeForce GTX TITAN 836 1006 (+145) 966 1150 (+184)
GeForce GTX 780 Ti 876 1020 (+144) 986 1130 (+144)
GeForce GTX 780 863 1006 (+143) 1053 1215 (+162)
GeForce GTX 770 1046 1176 (+130) 1190 1333 (+143)

Среднее энергопотребление GTX 980 Ti в Crysis 3 чуть ниже, чем у TITAN X, что объясняется частично заблокированными вычислительными блоками. Если сравнивать с лучшим однопроцессорным решением AMD, то на штатных частотах новинка потребляет на 26 Вт меньше энергии, чем Radeon R9 290X.

FurMark демонстрирует меньший разброс показателей между разными видеоадаптерами. В частности, здесь GTX 980 Ti и R9 290X отстоят лишь на 13 Вт по средней мощности.

Поскольку GPU Boost позволяет графическому процессору работать при максимальной заданной температуре, не повышая без нужды обороты охлаждающего вентилятора, в замерах температуры под нагрузкой нет большого смысла. Ядро GTX 980 Ti прогревается до 84 °C, как и в TITAN X, а также продуктах на базе GK110. Система охлаждения референсного образца имеет большой запас мощности, который позволяет сбить температуру GPU до 63-66 °C даже после разгона, запустив вентилятор на максимальные обороты.

#Производительность: синтетические тесты

3DMark 2011

  • В первом же тесте разница между GTX 980 Ti и TITAN X сведена к минимуму. Обе карты с большим отрывом лидируют среди решений на базе единственного GPU и уступают лишь Radeon R9 295X2, хотя преимущество последнего довольно скромное для двухпроцессорной карты.

3DMark

  • Таким же образом можно описать результаты в 3DMark версии 2013 года, с тем исключением, что потенциал Radeon R9 295X2 здесь раскрыт более полно.

Unigine Heaven 4

  • Лидерство адаптеров на базе GM200 по-прежнему вне сомнений. GTX 980 Ti успешно соревнуется даже с R9 295X2 в режиме WQHD. Только в 4К-разрешении «двухголовая» карта AMD заняла первое место.
  • Что интересно, хотя при разрешении WQHD TITAN X немного быстрее GTX 980 Ti, в 4К они абсолютно равны.

#Производительность: игры

Tomb Raider

  • Разница между GTX 980 Ti и TITAN X вновь пренебрежимо мала вне зависимости от разрешения.
  • GTX 980 Ti покоряется только Radeon R9 295X2, хотя карта AMD здесь недалеко ушла вперед.

Crysis 3

  • Результаты GTX 980 Ti и TITAN X вновь одинаковы. Оба доминируют среди однопроцессорных видеокарт, но R9 295X2 все же быстрее, и намного.

Metro: Last Light

  • Аналогичная картина: GTX 980 Ti и TITAN X идут ноздря в ноздрю, но не могут ничего противопоставить двухпроцессорному Radeon R9 295X2.

Company of Heroes 2

  • Поскольку CoH 2 так и не научилась использовать CrossFire или SLI, GTX 980 Ti и TITAN X здесь властвуют безраздельно. Последний выдает на 1-3 FPS больше в зависимости от разрешения.

Battlefield 4

  • Battlefield 4 возвращает нас к уже знакомой ситуации: GTX 980 Ti и TITAN X не знают равных среди видеокарт с единственным GPU, но уступают грубой силе Radeon R9 295X2. Разница между продуктами на GM200 опять-таки пренебрежимо мала.

Alien: Isolation

  • Alien: Isolation – самая нетребовательная игра в текущей тестовой обойме. При разрешении WQHD абсолютные значения частоты смены кадров на топовых GPU так велики, что производительность наверняка упирается в центральный процессор. Поэтому расстояние между GTX 980 Ti и TITAN X, с одной стороны, и Radeon R9 295X2 с другой сократилось до минимума.
  • В 4К-разрешении потенциал двухпроцессорного адаптера AMD наконец раскрывается. GTX 980 Ti больше не конкурент ему при таких настройках.
  • Различия между GTX 980 Ti и TITAN X вновь пренебрежимо малы.

Far Cry 4

  • Far Cry 4 никогда не мог использовать CrossFire, что автоматически исключает Radeon R9 295X2 из числа соперников GeForce GTX 980 Ti. Более того, Radeon R9 290X здесь работает быстрее, чем его двухпроцессорный родственник.
  • Кстати, R9 290X отлично справляется с Far Cry 4 и немногим уступает GTX 980 Ti в режиме WQHD. Другое дело – разрешение Ultra HD, в котором только GTX 980 Ti и TITAN X не скатились в слайд-шоу за счет своего объема RAM. Разницы между двумя картами вновь практически нет.

GTA V

  • GTX 980 Ti ненамного отстал от R9 295X2 в режиме WQHD и даже чуть превосходит его при разрешении Ultra HD.
  • Существенных отличий GTX 980 Ti от TITAN X не выявлено.

Witcher 3

  • И снова CrossFire отказывается работать, оставляя лидерство адаптерам NVIDIA. Разницы между TITAN X и GTX 980 Ti по-прежнему нет никакой.

#Производительность: разгон

Оверклокинг, как уже не раз бывало, отлично конвертируется в баллы 3DMark, но далеко не всегда заметен в реальных играх. В Metro: Last Light и Witcher 3 эффект налицо, а вот в других тестах пользы от разгона совсем немного.

3DMark 2011

3DMark

Игровые тесты + Unigine Heaven 4

#Производительность: вычисления

Luxmark: Room (Complex Benchmark)

  • Radeon R9 290X еще после выхода GTX 980 сложил претензии на лидерство в задаче трассировки лучей, но R9 295X2 все еще обеспечивает производительность, недостижимую для любых одиночных GPU.
  • GTX 980 Ti существенно опережает любых конкурентов в своей категории и нисколько не уступает TITAN X.

Sony Vegas Pro 13

  • Адаптеры AMD лучше всего подходят для этого приложения, хотя два GPU в R9 295X2 тут ничем не лучше одного.
  • Среди карточек NVIDIA наилучший результат принадлежит GTX 980 – видимо, за счет более высокой, чем у прочих, частоты. GTX 980 Ti немного уступает как ему, так и TITAN X. Впрочем, при столь небольших различиях (в пределах нескольких секунд работы теста) трудно судить о явном преимуществе одного адаптера перед другим.

CompuBench CL: Ocean Surface Simulation

  • Довольно неожиданно, но сокращение массива ядер CUDA в GTX 980 Ti обернулось существенным отставанием от TITAN X в данной задаче.
  • GTX 980 Ti держится на одном уровне с GTX 780 Ti и уступает Radeon R9 290X.

CompuBench CL: Particle Simulation

  • И вновь проявилась разница между GTX 980 Ti и TITAN X, которая сближает новинку с GTX 980 по результатам в этом тесте. Несмотря на это, у GTX 980 Ti (как и GTX 980) тут попросту нет равных соперников как в 700-й серии GeForce, так и среди продуктов AMD. Два GPU в составе R9 295X2 CompuBench CL одновременно задействовать не может.

SiSoftware Sandra 2015: Scientific Analysis

  • GTX 980 Ti демонстрирует столь же прискорбную производительность в расчeтах FP64, как и TITAN X. Даже Radeon R9 280X оставил их позади.
  • А вот с FP32 TITAN X справляется значительно лучше, чем GTX 980 Ti. Впрочем, Radeon R9 290X больше подходит для этой задачи, не говоря уже о R9 295X2.

#Выводы

NVIDIA удается двигать вперед производительность дискретных GPU, несмотря на ограничения техпроцесса 28 нм, который используется в этой категории микросхем с 2011-2012 года. GeForce GTX 980 Ti, оставшись в рамках TDP, которые заданы прошлыми флагманскими продуктами на базе GK110, предлагает совершенно новый уровень производительности в 3D-рендеринге и вычислениях FP32. Кроме того, GTX 980 Ti поступил в продажу по меньшей цене ($649), чем GTX 780 Ti в свое время ($699). В глазах перфекциониста впечатление от новинки немного портит тот факт, что в GTX 980 Ti отключена часть вычислительных блоков GPU, но на поверку это практически не влияет на игровую производительность и даже не всегда сказывается в расчетных задачах. В то же время небольшой компромисс в спецификациях GPU позволил NVIDIA нарастить объем поставок, пустив в дело частично дефектные чипы.

На текущий момент, пока AMD еще не разродилась адаптерами нового поколения, GTX 980 Ti просто не имеет конкурентов среди игровых однопроцессорных видеокарт. Выбирая аналог от AMD, вам придется либо удовлетвориться существенно менее производительным, но куда более дешевым Radeon R9 290X ($369), либо собрать систему из двух таких видеокарт (альтернатива – несколько более дорогой Radeon R9 295X2). В последнем случае, к сожалению, не гарантирована одинаковая производительность в любых играх в связи с подчас неэффективным использованием CrossFire либо отсутствием поддержки последнего, не говоря уже о повышенном энергопотреблении двухголовой системы.

Однако для того, чтобы нарастить производительность без перехода на более прогрессивный техпроцесс, NVIDIA пришлось кое-что принести в жертву. В отличие от GK110 (старшего GPU семейства Kepler), чип GM200, установленный в GTX 980 Ti и TITAN X, не претендует на универсальность и обладает весьма посредственными возможностями в расчетах двойной точности (FP64). Для этой задачи NVIDIA предлагает специализированные продукты – либо TITAN Z, либо ускорители Tesla на базе GK110/GK210. Видеоадаптеры AMD на GPU Hawaii (Radeon R9 290X, R9 295X2) также отлично подходят для этой цели.

Поскольку производительность в FP64 не позволяет провести черту между игровой (GTX 980 Ti) и полупрофессиональной (TITAN X) картами на базе GM200, разница проявляется лишь в избранных вычислительных задачах одинарной точности (FP32), когда количество активных ядер CUDA прямо связано с результатом. В отличие от ситуации с оригинальным TITAN и GTX 780, на этот раз существование отдельной разновидности ускорителя с полностью разблокированной конфигурацией GPU имеет под собой меньше оснований. Впрочем, TITAN X сослужил службу желающим получить самое лучшее, не дожидаясь по-настоящему массовых продуктов, и по-прежнему остается непревзойденным однопроцессорным ускорителем для FP32.



Оригинал материала: https://3dnews.ru./914971