Оригинал материала: https://3dnews.ru./975979

Обзор видеокарты NVIDIA GeForce RTX 2080 Founders Edition: качество против количества

Технические характеристики. Конструкция. Плата

Спецификации кремния архитектуры Turing и видеокарт серии GeForce RTX 20 мы подробно рассматривали в первой части обзора GeForce RTX 2080 Ti, но будет уместно выделить основные факты о GeForce RTX 2080 и сформулировать главную интригу сегодняшнего теста.

В отличие от флагманского ускорителя RTX 2080 Ti, который основан на беспрецедентно крупном по стандартам потребительских видеокарт чипе TU102, графический процессор TU104, лежащий в основе RTX 2080, имеет близкий аналог среди чипов Pascal, а именно GP102. Но если сравнить «в лоб» их технические характеристики, откроется на первый взгляд странная картина. Площадь кристалла TU104 на 16 % больше, чем у GP102, а число транзисторов выше на 13 %, но вот парадокс: TU104 уступает по количеству вычислительных блоков, связанных со стандартными функциями рендеринга. GP102 содержит 768 дополнительных CUDA-ядер, на 48 больше блоков наложения текстур и на 32 больше ROP. В потребительских видеокартах оба чипа немного «урезаны», но в итоге преимущество по конфигурации GPU и расчетной вычислительной мощности в операциях FP32 оказывается не на стороне GeForce RTX 2080. Даже пропускная способность оперативной памяти и ее объем выше именно у GeForce GTX 1080 Ti.

При всем при этом RTX 2080 получил такую же рекомендованную розничную цену, как и GTX 1080 Ti на старте продаж последнего ($699), а видеокарта марки Founders Edition стоит еще и на $100 больше. Казалось бы, вот идеальная мишень для критиков NVIDIA. Но не все так просто. Даже если не брать в расчет перспективы трассировки лучей и глубинного обучения в компьютерных играх, было бы ошибкой решить, будто львиную долю транзисторного бюджета TU104 съели специализированные ядра для этих задач, а в стандартном рендеринге методом растеризации GeForce RTX 2080 сделал шаг назад с той позиции, которую занимает GeForce GTX 1080 Ti. Как мы писали ранее, сама архитектура Turing устроена таким образом, что внутренняя логика графического процессора стала сложнее, а эффективность вычислений значительно увеличилась по сравнению с Pascal.

Но как бы то ни было, GeForce RTX 2080 Ti заведомо мощнее, чем любая другая современная видеокарта, и не имеет даже близких соперников на потребительском рынке, а вот для GeForce RTX 2080 остро стоит вопрос о том, удалось ли инженерам NVIDIA найти баланс между технологиями будущего и запросами текущего дня. Ответ на него будет найден в игровых бенчмарках, но сперва уделим внимание материальным аспектам видеокарты, которая представит нам графический процессор TU104.

ПроизводительNVIDIA
Модель GeForce GTX 1070 GeForce GTX 1080 GeForce GTX 1080 Ti GeForce RTX 2070 GeForce RTX 2080 GeForce RTX 2080 Ti
Графический процессор
Название GP104 GP104 GP102 TU106 TU104 TU102
Микроархитектура Pascal Pascal Pascal Turing Turing Turing
Техпроцесс, нм 16 нм FinFET 16 нм FinFET 16 нм FinFET 12 нм FFN 12 нм FFN 12 нм FFN
Число транзисторов, млн 7 200 7 200 12 000 10 800 13 600 18 600
Тактовая частота, МГц: Base Clock / Boost Clock 1 506 / 1 683 1 607 / 1 733 1 480 / 1 582 1 410 / 1 620 (Founders Edition: 1 410 / 1 710) 1 515 / 1 710 (Founders Edition: 1 515 / 1 800) 1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU 1 920 2 560 3 584 2304 2944 4352
Число блоков наложения текстур 120 160 224 144 184 272
Число ROP 64 64 88 64 64 88
Оперативная память
Разрядность шины, бит 256 256 352 256 256 352
Тип микросхем GDDR5 SDRAM GDDR5X SDRAM GDDR5X SDRAM GDDR6 SDRAM GDDR6 SDRAM GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 000 (8 000) 1 250 (10 000) 1 376,25 (11 010) 1 750 (14 000) 1 750 (14 000) 1 750 (14 000)
Объем, Мбайт 8 192 8 192 11 264 8 192 8 192 11 264
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 6 463 8 873 11 340 7 465 / 7 880 (Founders Edition) 10 069 / 10 598 (Founders Edition) 13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64 1/32 1/32 1/32 1/32 1/32 1/32
Пропускная способность оперативной памяти, Гбайт/с 256 320 484 448 448 616
Вывод изображения
Интерфейсы вывода изображения DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DisplayPort 1.3/1.4, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт 150 180 250 175/185 (Founders Edition) 215/225 (Founders Edition) 250/260 (Founders Edition)
Розничная цена (США, без налога), $ 349 (рекомендованная) / 399 (Founders Edition, nvidia.com) 499 (рекомендованная) / 549 (Founders Edition, nvidia.com) НД (рекомендованная) / 699 (Founders Edition, nvidia.com) 499 (рекомендованная) / 599 (Founders Edition, nvidia.com) 699 (рекомендованная) / 799 (Founders Edition, nvidia.com) 999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб. НД (рекомендованная) / 31 590 (Founders Edition, nvidia.ru) НД (рекомендованная) / 45 790 (Founders Edition, nvidia.ru) НД (рекомендованная) / 52 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru)

#Конструкция

Внешне GeForce RTX 2080 Founders Edition немногим отличается от аналогичной версии RTX 2080 Ti. Видеокарты имеют одинаковый дизайн и габариты — 267 мм в длину и 116 мм в ширину. NVIDIA сохранила компактный форм-фактор, присущий референсным моделям GeForce GTX 1080 и GTX 1080 Ti (266 × 111 мм), несмотря на то, что RTX 2080 характеризуется существенно большим тепловыделением по сравнению с GTX 1080 (225 против 180 Вт).

С повышенной мощностью связано ключевое отличие Founders Edition 20-й серии от ее предшественников, конструкция которых в общих чертах не менялась со времен GeForce GTX TITAN на чипе GK110 и вплоть до TITAN V на базе GV100. Референсные видеокарты традиционно оснащают закрытыми системами охлаждения с центробежным вентилятором, так как это наиболее универсальное решение, подходящее и для одиночной работы, и для установки нескольких видеокарт впритык друг к другу. На этот раз у NVIDIA нет такой необходимости, ведь ускорители 20-й серии в дизайне на любой вкус и цвет с первого дня продаж выпускаются сторонними производителями. К тому же RTX 2080 Ti Founders Edition стал первым одночиповым GeForce, который вышел за рамки теплового пакета 250 Вт (AMD, со своей стороны, уже давно пренебрегает этим ограничением), а для закрытой системы охлаждения такое тепловыделение можно считать разумным пределом в условиях домашнего ПК без усиленной вентиляции.

В итоге NVIDIA сделала выбор в пользу открытой конструкции с двумя осевыми вентиляторами диаметром 85 мм. Металлический кожух охватывает видеокарту как большая сплющенная труба и обеспечивает сквозной продув радиатора СО вдоль короткой стороны печатной платы. Сам радиатор, который прежде был разделен на металлическую раму и блок ребер с испарительной камерой, теперь представляет собой единую деталь, а испарительная камера покрывает всю площадь PCB, включая микросхемы памяти и элементы преобразователя напряжения. По всей видимости, именно за счет гигантской испарительной камеры видеокарта осталась такой компактной, в то время как сторонние производители решают задачу охлаждения за счет кулеров на теплотрубках толщиной в 2,5–3 слота расширения.

С эстетической точки зрения GeForce RTX 2080/2080 Ti также выгодно отличается от GTX 1080/1080 Ti — в первую очередь простыми симметричными формами и чистой массой алюминия, которую NVIDIA тратит на каждую видеокарту. Верхняя часть корпуса сформирована листом в 2 мм толщиной, а пластина, защищающая обратную сторону платы, еще вдвое толще. Даже разъем NVLink закрыт металлической заглушкой. Логотип GeForce RTX на боку видеокарты светится зеленым огнем, причем каждая буква вырезана в металле по отдельности. Все это сильно напоминает монументальный стиль компьютеров Apple периода Power Mac G5 и башенных Mac Pro.

#Плата

Преобразователь напряжения GeForce RTX 2080 Founders Edition включает восемь фаз для питания GPU и две для микросхем GDDR6. Налицо апгрейд по сравнению со схемой 7+2 фазы в GeForce GTX 1080 Ti — ближайшем по мощности представителе семейства Pascal. Но этим особенности силовой схемы RTX 2080/2080 Ti не исчерпываются. В то время как на плате GTX 1080 Ti в каждой фазе использовался драйвер с двумя дискретными ключами (dual-FET), в новых видеокартах NVIDIA перешла на интегрированные чипы типа DrMOS (Driver + FET) производства On Semiconductor под управлением ШИМ-контроллера uPI uP9512.

В отличие от старой схемы, DrMOS обеспечивает высокочастотный и точный мониторинг напряжения на стоке транзистора по сигналу IMON, а значит — более стабильное питание графического процессора. Кроме того, VRM новых видеокарт умеет динамически регулировать число активных фаз с целью поддержать высокий КПД во всем диапазоне потребляемой мощности.

Методика тестирования. Производительность: 3DMark. Производительность: игры (1920 × 1080, 2560 × 1440)

#Тестовый стенд, методика тестирования

Конфигурация тестового стенда
CPU Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота
Материнская плата ASUS RAMPAGE V EXTREME
Оперативная память Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт
ПЗУ Intel SSD 760p 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD / ASUS ROG Swift PG27UQ
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Crimson Adrenalin Edition 18.9.1 (Tesselation: Use application settings)
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 411.51
Бенчмарки: синтетические
Тест API Разрешение Полноэкранное сглаживание
3DMark Fire Strike DirectX 11 (feature level 11_0) 1920 × 1080 Выкл.
3DMark Fire Strike Extreme 2560 × 1440
3DMark Fire Strike Ultra 3840 × 2160
3DMark Time Spy DirectX 12 (feature level 11_0) 2560 × 1440
Бенчмарки: игры
Игра (в порядке даты выхода) API Настройки, метод тестирования Полноэкранное сглаживание
1920 × 1080 / 2560 × 1440 3840 × 2160
GTA V DirectX 11 Макс. качество. Встроенный бенчмарк MSAA 4x + FXAA + Reflection MSAA 4x Выкл.
The Witcher 3: Wild Hunt DirectX 11 Макс. качество. FRAPS, локация Caer Morhen TAA + HairWorks AA 4x
Tom Clancy's The Division DirectX 12 Макс. качество, HFTS выкл. Встроенный бенчмарк SMAA 1x Ultra + TAA: Supersampling TAA: Stabilization
DOOM Vulkan Макс. качество. Миссия Foundry TSSAA 8TX Выкл.
Deus Ex: Mankind Divided DirectX 12 Макс. качество. Встроенный бенчмарк MSAA 4x
Battlefield 1 DirectX 12 Макс. качество. OCAT, начало миссии Over the Top TAA
Ashes of the Singularity: Escalation Vulkan Макс. качество. Встроенный бенчмарк MSAA 4x + TAA 4x
Total War: WARHAMMER II, встроенный бенчмарк DirectX 12 Макс. качество. Встроенный бенчмарк (Battle Benchmark) MSAA 4x
Far Cry 5 DirectX 11 Макс. качество. Встроенный бенчмарк TAA
F1 2018 DirectX 11 Макс. качество. Встроенный бенчмарк TAA
Shadow of the Tomb Raider DirectX 12 Макс. качество. Встроенный бенчмарк SMAA 4x
Бенчмарки: кодирование/декодирование видео, вычисления общего назначения
Программа Настройки
AMD NVIDIA
Blender 2.78b + Blenchmark 1.0.7
DXVA Checker 4.1.2, Decode Benchmark H.264 1920 × 1080 (High Profile, L4.1), 3840 × 2160 (High Profile, L5.1). Microsoft H264 Video Decoder
H.265 1920 × 1080 (Main Profile, L4.0), 3840 × 2160 (Main Profile, L5.0), 7680 × 4320 (Main Profile, L6.0). Microsoft HEVC Video Extensions
VP9 1920 × 1080, 3840 × 2160, 7680 × 4320. Microsoft WebM MF VP8 Decoder
Ffmpeg 4.0.2, кодирование H.264 1920 × 1080 -c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M -c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M
3840 × 2160 -c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M -c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M
Ffmpeg 4.0.2, кодирование H.265 1920 × 1080 -c:v hevc_amf -quality speed -level 4 -b:v 3M -c:v hevc_nvenc -preset fast -level 4 -b:v 3M
3840 × 2160 -c:v hevc_amf -quality speed -level 5 -b:v 7.5M -c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M
7680 × 4320 -c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M
LuxMark 3.1 Сцена Hotel Lobby (Complex Benchmark)
SiSoftware Sandra Titanium (2018) 2018.8.28.26, GPGPU Scientific Analysis OpenCL, FP16/FP32
CompuBench 2.0 Ocean Surface Simulation
N-Body Simulation 1024K

Мощность видеокарт мы измеряем отдельно от CPU и прочих компонентов ПК. Для этого применяется жесткий райзер PCI Express x16, в котором линии +12 В и земли, идущие от материнской платы, разорваны и выведены на отдельный шестиконтактный разъем питания. Блок питания Corsair AX1200i с помощью утилиты Corsair LINK 4 позволяет регистрировать общий ток, проходящий по разъемам дополнительного питания видеокарты и райзеру, с периодом 1 с, а мощность вычисляется путем умножения величины тока на величину напряжения 12 В в каждый момент времени.

В качестве тестовой нагрузки используется FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x) и Crysis 3 (максимальное качество графики, разрешение 3840 × 2160, MSAA 4x). Замеры мощности выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются. Также во время теста мы регистрируем ряд других переменных с помощью ПО MSI Afterburner: тактовую частоту, напряжение питания и температуру графического процессора, скорость вращения вентиляторов системы охлаждения.

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

#Производительность: 3DMark

Если судить по ценам, NVIDIA рассматривает GeForce RTX 2080 как замену GeForce GTX 1080 Ti, и по результатам синтетических тестов видно, что именно эта видеокарта предопределила конфигурацию чипа TU104 и его тактовые частоты. По среднему баллу RTX 2080 лишь на 2 % опережает GTX 1080 Ti, но преимущество новой архитектуры достигает 16 % в Time Spy — единственном тесте набора 3DMark, где используется API Direct3D 12. В Time Spy также особенно велик отрыв RTX 2080 от Radeon RX Vega 64 (47 % очков). Вместе с тем GeForce RTX 2080 не посягает на лидерскую позицию RTX 2080 Ti, который имеет запас быстродействия в 25 %.

3DMark (Graphics Score)
Разрешение NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Fire Strike 1920 × 1080 27 497 21 801 27 492 34 515 23 228
Fire Strike Extreme 2560 × 1440 13 186 10 414 13 343 16 517 10 840
Fire Strike Ultra 3840 × 2160 6 408 5 130 6 710 7 965 5 481
Time Spy 2560 × 1440 10 762 7 193 9 258 13 392 7 285
Макс. −20% +5% +26% −14%
Средн. −24% −2% +25% −20%
Мин. −33% −14% +24% −32%

#Производительность: игры (1920 × 1080, 2560 × 1440)

В игровых бенчмарках производительность GeForce RTX 2080 велика лишь настолько, чтобы не отступить за черту, которую провел GeForce GTX 1080 Ti. По средней частоте смены кадров RTX 2080 на 2–6 % быстрее флагманской видеокарты прошлого поколения, но в редких случаях (F1 2018, Shadow of the Tomb Raider) перевес в пользу новинки достигает 11–14 %. При этом не нашлось ни одной игры, в которой GTX 1080 Ti получил бы преимущество, выходящее за пределы статистической погрешности.

Если сопоставить GeForce RTX 2080 с его аналогом по рангу в пределах 10-го семейства (GeForce GTX 1080), то средняя разница в быстродействии при условно низких разрешениях экрана составляет уже 22–32 %.

Заметьте, как похорошел Radeon RX Vega 64 за прошедшее время благодаря новым драйверам и переходу игр на Direct3D 12. Только GTA V, The Witcher 3 (единственные игры под Direct3D 11, оставшиеся в наборе бенчмарков), да еще Shadow of the Tomb Raider вытягивают GeForce GTX 1080 в столь актуальном год назад сравнении. И все же GeForce RTX 2080 на 25–33 % быстрее, чем топовая «Вега».

Режимы 1080p и 1440p — не лучшая среда для соревнования мощных GPU, и в особенности это касается GeForce RTX 2080 Ti. В среднем флагманский Turing лишь на 14–18 % опережает RTX 2080 по частоте смены кадров, хотя в играх с тяжелыми режимами полноэкранного сглаживания (Deus Ex: Mankind Divided и Total War: WARHAMMER II) разница достигает 23–36 %.

1920 × 1080
Полноэкранное сглаживание NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation MSAA 4x + TAA 4x 53 41 53 65 42
Battlefield 1 TAA 146 124 144 153 131
Deus Ex: Mankind Divided MSAA 4x 53 40 53 67 41
DOOM TSSAA 8TX 200 200 200 200 200
F1 2018 TAA 160 116 147 190 123
Far Cry 5 TAA 111 103 109 111 100
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 93 85 93 95 69
Shadow of the Tomb Raider SMAA 4x 83 63 75 99 55
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 107 83 107 130 86
Total War: WARHAMMER II MSAA 4x 46 36 47 58 39
The Witcher 3: Wild Hunt TAA + HairWorks AA 4x 128 93 120 149 80
Макс. +0% +2% +26% +0%
Средн. −18% −2% +14% −20%
Мин. −28% −10% +0% −38%
2560 × 1440
Полноэкранное сглаживание NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation MSAA 4x + TAA 4x 44 33 43 54 35
Battlefield 1 TAA 128 95 118 148 104
Deus Ex: Mankind Divided MSAA 4x 35 26 34 44 25
DOOM TSSAA 8TX 194 152 196 200 154
F1 2018 TAA 123 89 115 151 91
Far Cry 5 TAA 99 79 96 105 85
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 79 65 80 88 51
Shadow of the Tomb Raider SMAA 4x 56 41 49 67 36
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 77 58 76 94 61
Total War: WARHAMMER II MSAA 4x 33 25 33 42 26
The Witcher 3: Wild Hunt TAA + HairWorks AA 4x 96 69 91 117 62
Макс. −18% +1% +27% −14%
Средн. −24% −4% +18% −25%
Мин. −28% −13% +3% −36%

Производительность: игры (3840 × 2160). Производительность: HDR, DLSS, трассировка лучей

#Производительность: игры (3840 × 2160 SDR)

Переход к разрешению 2160p ничего не меняет в соотношении сил между GeForce RTX 2080 и GeForce GTX 1080 Ti. По среднему FPS они различаются на 3 %, но есть игры, в которых RTX 2080 явно сильнее, — Battlefield 1 и Shadow of the Tomb Raider (напомним, что в SoTR пока нет обещанной трассировки лучей), и лишь в Ashes of the Singularity GeForce GTX 1080 Ti удерживает лидерство.

Преимущество GeForce RTX 2080 перед Radeon RX Vega 64 и GeForce GTX 1080 составляет 33 и 37 % соответственно. Похожие цифры мы видели в режиме 1440p, а значит, для RTX 2080 еще не требуется монитор класса 4К, чего не скажешь о GeForce RTX 2080 Ti. В данном наборе тестов разница между RTX 2080 и старшей видеокартой 20-й серии наиболее велика и составляет 24 % по средней частоте смены кадров.

3840 × 2160 SDR
Полноэкранное сглаживание NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation Выкл. 54 43 57 67 47
Battlefield 1 82 56 75 101 63
Deus Ex: Mankind Divided 38 28 37 47 29
DOOM 111 83 109 137 81
F1 2018 79 53 75 99 57
Far Cry 5 59 44 56 73 48
GTA V 70 54 71 81 48
Shadow of the Tomb Raider 47 32 43 59 32
Tom Clancy's The Division TAA: Stabilization 46 34 44 57 35
Total War: WARHAMMER II Выкл. 28 21 28 36 23
The Witcher 3: Wild Hunt 64 46 61 79 40
Макс. −20% +4% +29% −13%
Средн. −27% −3% +24% −25%
Мин. −33% −9% +15% −38%

#Производительность: игры (3840 × 2160 HDR)

В мире компьютерных игр технология HDR применительно к выводу изображения является сравнительно новым явлением, хотя графические эффекты, основанные на широким динамическом диапазоне, известны как минимум со времен Direct3D 9.0. Благодаря тому, что игровой движок владеет всей полнотой информации о цвете пикселов в шейдерных операциях, стал возможным рендеринг изображения с переменной «экспозицией» — наподобие того, как делаются HDR-фотоснимки. Цель HDR-рендеринга состоит в том, чтобы сделать яркую зону изображения по-настоящему яркой, темную — темной, и сохранить при этом детализацию обеих, — и все это в рамках контрастности стандартного экрана. В свою очередь, экраны с широким динамическим диапазоном, которые появились на рынке в последние годы, позволяют, условно говоря, демонстрировать сцену такой, какой ее «видит» игровой движок. С формальной точки зрения все, что для этого нужно, — это достаточно высокая контрастность (20 000:1 при яркости 1000 кд/м2 либо 1 800 000:1 при яркости 540 кд/м2) и точное описание цвета с глубиной 10 бит на канал.

В теории для графического процессора не должно быть разницы между рендерингом в SDR и HDR, но на практике последний все-таки требует дополнительных вычислений — хотя бы из-за тоновой коррекции изображения в соответствии с характеристиками конкретного экрана. Кроме того, свои ограничения накладывает пропускная способность интерфейса DisplayPort. На игровых 4К-панелях частота обновления выше 98 Гц при включении HDR и работе с 10-битным цветом достигается за счет конвертации формата пикселов из полного RGB в YCbCr 4:2:2 — формат с цветовой субдискретизацией (Chroma Subsampling), который широко применяется в записи и передаче цифрового видео. Достаточно ресурсоемкие операции тоновой коррекции и конвертации формата пикселов чипы NVIDIA прошлых поколений выполняют на шейдерных ALU, но в Turing появилась специальная логика фиксированной функциональности, которая предотвращает потерю быстродействия при выводе HDR-видео.

Со стороны интерфейса эта проблема также частично решена стандартом DisplayPort версии 1.4a, который включает алгоритм компрессии данных VESA Display Stream Compression 1.2 (DSC). За счет DSC по одному кабелю возможна передача видеопотока с разрешением 7680 × 4320 и частотой 60 Гц в формате RGB. При этом DSC является алгоритмом сжатия с потерями, но, если верить разработчикам стандарта, визуально не влияет на качество изображения. Вот только пока дисплеев с поддержкой DSC еще нет на потребительском рынке.

Чтобы понять, насколько требовательным является HDR в современных условиях, мы воспользовались монитором ASUS ROG Swift PG27UQ. Это 27-дюймовый геймерский монитор формата 4K с IPS-матрицей и высокой частотой обновления экрана (до 144 Гц). Благодаря подсветке на основе квантовых точек он удовлетворяет критериям цветового пространства DCI-P3 и стандарта HDR. Для того, чтобы вывести на такой экран 4К-изображение с частотой 120 Гц и 10-битным цветом, необходимо преобразование пикселов в формат YCbCr 4:2:2 — именно такие настройки мы использовали для тестирования.

Оказалось, что тоновая коррекция и конвертация формата пикселов и вправду далеко не бесплатно даются GPU без аппаратного ускорения этих функций. В среднем быстродействие GeForce GTX 1080 и GTX 1080 Ti снизилось на 9 % в четырех играх нашей тестовой методики, которые поддерживают HDR (даже с учетом Shadow of the Tomb Raider — единственного теста, где HDR не оказывает заметного влияния на производительность). GeForce RTX 2080, напротив, ничего не теряет при активации HDR, как, впрочем, и Radeon RX Vega 64, которая также обладает аппаратным ускорением необходимых операций.

3840 × 2160 HDR
Полноэкранное сглаживание NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Battlefield 1 Выкл. 81 49 65 64
F1 2018 79 49 66 58
Far Cry 5 57 37 50 46
Shadow of the Tomb Raider 47 31 43 33
Макс. −34% −9% −19%
Средн. −37% −14% −24%
Мин. −40% −20% −30%

#Производительность: DLSS, трассировка лучей

Ключевые детали архитектуры Turing — специализированные ядра для трассировки лучей и машинного обучения — бездействуют в существующих играх. Но уже сейчас при помощи нескольких бенчмарков можно оценить, насколько успешно GeForce RTX 2080 справляется с обильной трассировкой лучей и какой прирост быстродействия дает масштабирование изображения методом DLSS, которое производит кадры 2160p из более низкого разрешения за счет нейросети.

В бенчмарке Final Fantasy XV, а также демке Infiltrator GeForce RTX 2080 и GTX 1080 Ti имеют практически равное быстродействие при рендеринге в «честном» 4К со сглаживанием TAA. Но с масштабированием DLSS новый GPU набрал еще 36–37 % кадровой частоты, практически ничего не теряя в качестве изображения. Если учесть, как много игровых проектов уже объявили о поддержке DLSS, видеокарты серии GeForce RTX 20 получат серьезный программный апгрейд, который полностью изменит соотношение сил между Turing и графическими процессорам предыдущих поколений.

Что касается трассировки лучей, то столь тяжелая нагрузка, как демка Reflections, нуждается в DLSS просто для того, чтобы поддерживать адекватную частоту смены кадров. Поскольку Reflections не допускает программную трассировку лучей на шейдерных ALU, GeForce RTX 2080 и RTX 2080 Ti — это единственные видеокарты, на которых ее можно запустить в данный момент. Здесь RTX 2080 Ti имеет преимущество в 27% тактовой частоты при разрешении 1440p с DLSS, а режим 2160p на RTX 2080 попросту не работает.

Производительность: кодирование/декодирование видео, вычисления. Тактовые частоты, энергопотребление, температура, разгон. Выводы

#Производительность: кодирование/декодирование видео

Баг в ранних драйверах не позволяла процессорам Turing работать на полной частоте выделенному блоку NVDEC, но ошибка уже частично устранена — по крайней мере для устройств Founders Edition, видеокарты сторонних производителей по-прежнему могут обрабатывать видео медленнее, чем должны были бы. Преимущество новой версии NVDEC перед аналогичным блоком в архитектуре Pascal заключается в чрезвычайно высокой скорости декодирования HEVC, особенно в разрешениях 4К и 8К. Ускорение H.264 и VP9, судя по всему, вызвано повышенными частотами GPU в картах 20-й серии.

В отличие от декодирования, запись видео в форматах H.264 и HEVC при помощи аппаратного кодера NVENC на RTX 20 работает без всяких проблем. Здесь мы видим, что быстродействие Turing в кодировании HEVC практически удвоилось по сравнению с тем, что показывают чипы Pascal, — вплоть до того, что RTX 2080 и RTX 2080 Ti способны в реальном времени записывать 8К-видеопоток с частотой 30 Гц. А пропускная способность в разрешениях 1080p и 2160p при «грязном» кодировании в один проход настолько велика, что в практических условиях не станут проблемой и более качественные режимы с высоким битрейтом.

#Производительность: вычисления

Не все программы вычислений общего назначения уже способны работать с GPU нового поколения: в частности, нам придется отложить тесты GeForce RTX в пакете Blender и бенчмарке CompuBench CL. Остались только Sandra и LuxMark, но по ним хорошо заметно, как много общего Turing, формально нацеленная на графику и потребительские устройства, имеет с архитектурой Volta, которая оптимизирована именно для GP-GPU. GeForce RTX 2080 оставил GeForce GTX 1080 Ti далеко позади в задаче трассировки лучей LuxMark (напомним, что последний не использует RT-ядра). Скорость вычислений FMA/FFT в SiSoftware Sandra также увеличилась по сравнению с предыдущим поколением, впрочем этот тест уже не дает адекватной оценки быстродействия в реальных задачах GP-GPU — хотя бы по той причине, что GeForce RTX 2080 Ti здесь уступает RTX 2080 в расчетах FP32 одинарной точности.

#Тактовые частоты, энергопотребление, температура, разгон

GeForce RTX 2080 основан на более компактном GPU, чем RTX 2080 Ti, и теплопакет старших видеокарт серии Founders Edition различается на 35 Вт. Вместе с тем эти два ускорителя снабжены практически одинаковыми системами охлаждения, так что графическое ядро RTX 2080 достигает существенно более высоких тактовых частот. Даже при длительной нагрузке чип TU104 от его предельной частоты 1995 МГц отделяет всего лишь 116 МГц.

Грех не попытать счастья в разгоне такой видеокарты, но алгоритм автоматического оверклокинга, который NVIDIA внедрила в ускорителях 20-й серии, подсказывает, что частотный ресурс GPU и без того практически исчерпан в рамках штатного TDP: все, что смогла сделать автоматика, — это подтянуть кривую тактовой частоты в бесполезном для любых задач диапазоне ниже 900 МГц. Тем не менее BIOS видеокарты позволяет увеличить резерв мощности на 23 %, и при поддержке вентиляторов СО, работающих на полной скорости, можно смело сдвинуть всю кривую на 100 МГц вверх. В таких условиях RTX 2080 поддерживает тактовую частоту GPU под нагрузкой на уровне 2017 МГц — близко к новому пределу в 2085 МГц. Стабильность на более высоких частотах требует повышенного напряжения питания, но с текущей версией драйвера регулятор вольтажа в оверклокерском ПО никак не влияет на чипы Turing. Зато эффективную частоту оперативной памяти удалось поднять с 14 до 16 ГГц, и это предел разгона RAM, который допускает прошивка Founders Edition.

НастройкиТактовая частота GPU, МГцНапряжение питания GPU, ВЧастота вращения вентиляторов, об/мин (% от макс.)
Средн. Макс. Предел Средн. Макс. Предел Средн.
NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) 1879 1890 1980 1,010 1,018 1,200 1977 (53%)
NVIDIA GeForce RTX 2080 FE (1615/16000 МГц, 8 Гбайт) +23% TDP, 100% RPM 2017 2025 2070 1,043 1,043 1,200 3700 (100%)
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) 1707 1740 1950 0,938 1,037 1,243 2087 (56%)
NVIDIA GeForce GTX 1080 FE (1607/10008 МГц, 8 Гбайт) 1697 1785 1911 0,920 0,993 1,243 2194 (55%)
NVIDIA GeForce GTX 1080 Ti FE (1480/11010 МГц, 11 Гбайт) 1624 1709 1911 0,886 0,931 1,193 2386 (50%)
AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт) WattMan: Balanced 1382 1492 1630 0,965 1,150 1,200 2392 (49%)

Прим.: измерение всех параметров проводится в игре Crysis 3 (максимальное качество графики, 3840 × 2160, MSAA 4x) после прогрева GPU.

Но пусть читателей не обманывают высокие частоты и сравнительная легкость разгона GeForce RTX 2080. По энергопотреблению под нагрузкой видеокарта не идет ни в какое сравнение с GeForce GTX 1080 и мало отличается от GeForce RTX 1080 Ti либо Radeon RX Vega 64. Впрочем, это не претензия, а комплимент инженерам NVIDIA, создавшим системы охлаждения и питания видеокарты, ведь TU104 содержит больше транзисторов, чем GP102, и работает на более высоких частотах с большим напряжением питания.

#Производительность: разгон

На первый взгляд, подъем частоты на 100 МГц ничего не решает для GPU, который изначально рассчитан на частоты немногим меньше 2 ГГц. Однако в комбинации с увеличенным TDP и разогнанной оперативной памятью разгон графического процессора TU104 принес прирост на величину от 5 до 9 % средней частоты смены кадров. При этом наилучшие результаты имеют место в разрешении 2160p.

1920 × 1080
Полноэкранное сглаживание NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce RTX 2080 FE (1615/16000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Ashes of the Singularity: Escalation MSAA 4x + TAA 4x 53 57 53
Battlefield 1 TAA 146 149 144
Deus Ex: Mankind Divided MSAA 4x 53 57 53
DOOM TSSAA 8TX 200 200 200
F1 2018 TAA 160 171 147
Far Cry 5 TAA 111 110 109
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 93 94 93
Shadow of the Tomb Raider SMAA 4x 83 90 75
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 107 117 107
Total War: WARHAMMER II MSAA 4x 46 49 47
The Witcher 3: Wild Hunt TAA + HairWorks AA 4x 128 133 120
Макс. +9% +2%
Средн. +5% −2%
Мин. −1% −10%
2560 × 1440
Полноэкранное сглаживание NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce RTX 2080 FE (1615/16000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Ashes of the Singularity: Escalation MSAA 4x + TAA 4x 44 46 43
Battlefield 1 TAA 128 138 118
Deus Ex: Mankind Divided MSAA 4x 35 38 34
DOOM TSSAA 8TX 194 200 196
F1 2018 TAA 123 133 115
Far Cry 5 TAA 99 103 96
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 79 83 80
Shadow of the Tomb Raider SMAA 4x 56 61 49
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 77 84 76
Total War: WARHAMMER II MSAA 4x 33 35 33
The Witcher 3: Wild Hunt TAA + HairWorks AA 4x 96 103 91
Макс. +9% +1%
Средн. +7% −4%
Мин. +3% −13%
3840 × 2160
Полноэкранное сглаживание NVIDIA GeForce RTX 2080 FE (1515/14000 МГц, 8 Гбайт) NVIDIA GeForce RTX 2080 FE (1615/16000 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Ashes of the Singularity: Escalation Выкл. 54 60 57
Battlefield 1 82 89 75
Deus Ex: Mankind Divided 38 41 37
DOOM 111 121 109
F1 2018 79 86 75
Far Cry 5 59 64 56
GTA V 70 74 71
Shadow of the Tomb Raider 47 52 43
Tom Clancy's The Division TAA: Stabilization 46 51 44
Total War: WARHAMMER II Выкл. 28 30 28
The Witcher 3: Wild Hunt 64 70 61
Макс. +11% +4%
Средн. +9% −3%
Мин. +6% −9%

Выводы

Глядя на результаты тестирования GeForce RTX 2080 и RTX 2080 Ti, гораздо проще рассуждать о второй видеокарте. С технической точки зрения NVIDIA добилась от флагманского ускорителя 20-й серии всего, на что можно было рассчитывать при условии, что переход с техпроцесса 16 нм на следующую технологическую норму еще не завершен, а узел 12 нм FFN является всего лишь промежуточной остановкой. Что касается небывалой стоимости RTX 2080 Ti, то, в отсутствие реальных аналогов даже для GeForce GTX 1080 Ti со стороны основного конкурента, у NVIDIA есть полное право требовать такие деньги за устройство с колоссальной вычислительной мощностью для современных игр и уникальными возможностями для грядущего поколения проектов.

Но к GeForce RTX 2080 нельзя подходить с той же линейкой. Пусть второй по рангу GPU семейства Turing обеспечил по сравнению с GeForce GTX 1080 примерно такой же рост быстродействия (25–37 %), как RTX 2080 Ti по сравнению с флагманом 10-й серии, эта видеокарта не лишена соперников в виде множества версий GeForce GTX 1080 Ti. RTX 2080 и GTX 1080 Ti практически равны по игровому быстродействию — с технической точки зрения это опять-таки триумф архитектуры Turing, которая способна выполнить ту же работу за счет меньшего набора вычислительных блоков и одновременно дает пропуск в будущее компьютерных игр, связанное с трассировкой лучей и машинным обучением.

С другой стороны, рекомендованная цена в $699 означает, что NVIDIA в этот раз не предлагает больше FPS за те же деньги, как происходило в предыдущие моменты смены поколений. Вместо этого даром прогресса стали только новые возможности — заманчивые, но пока далекие от реализации.



Оригинал материала: https://3dnews.ru./975979