Оригинал материала: https://3dnews.ru./926037

Итоги 2015 года: графические ускорители

Уходящий год мы встретили с надеждой на большие перемены в категории дискретных видеоадаптеров (см. итоги 2014 года). Прошедшие двенадцать месяцев, конечно, не идут ни в какое сравнение с уже далеким 2011-2012 годом, когда оба крупнейших производителя GPU перенесли основную часть своих продуктовых линеек на рельсы техпроцесса 28 нм, практически удвоив производительность, доступную топовым моделям видеоадаптеров по сравнению с предыдущим поколением эпохи 40 нм. Но в отличие от откровенно застойного 2014 года, когда единственным способом сдвинуть планку быстродействия для производителей был выпуск «двухголовых» видеоадаптеров Radeon R9 295X2 и GeForce GTX TITAN Z (в этот раз особенно неуклюжих и монструозных в связи с тепловыделением соответствующих GPU), AMD и NVIDIA все же породили две микросхемы, ныне по праву занимающих верхний ранг в иерархии дискретных GPU – AMD Fiji (семейство Radeon R9 Fury) и NVIDIA GM200 (GeForce GTX 980 Ti, GTX TITAN X).

И это по-своему уникальная ситуация, ведь дискретные GPU уже четыре года подряд выпускаются на базе одной и той же фотолитографической технологии TSMC с нормой 28 нм. Прорыв, который обеспечили Fiji и GM200, стал возможен в первую очередь благодаря тому факту, что оба чипа по площади практически достигли предела, заданного фотомаской, применяемой на конвейере TSMC (596 и 601 мм2 для Fiji и GM200 соответственно). Но, что не менее важно, в этих продуктах воплотились лучшие достижения в проектировании энергоэффективной процессорной архитектуры.

GPU нижних эшелонов в связи с появлением новых флагманов по большей части просто сдвинулись вниз и будут нести службу до тех пор, пока производители не представят им замену в лице чипов, произведенных по более прогрессивной норме (заветный час уже близок), однако у нас есть и третий новичок – NVIDIA GM206, который лег в основу видеоадаптеров GeForce GTX 950/960.

Таким образом, архитектура Maxwell, уже второго поколения, теперь заполнила всю линейку продуктов NVIDIA, начиная с карточек доступной геймерской категории. AMD, со своей стороны, перетасовала состав и конфигурацию уже существовавших GPU на базе архитектуры GCN различных версий и представила их под маркой Radeon R5/R7/R9 300.

Расскажем обо всем этом чуть более подробно, а в конце статьи по традиции будет синопсис слухов и публичных обещаний производителей относительно планов по выпуску новых GPU в следующие 12 месяцев. Можно с большой уверенностью утверждать, что в следующем году уж точно AMD и NVIDIA сменят изживший свое техпроцесс 28 нм на более прогрессивный – 14/16 нм, миновав промежуточную ступень 20 нм.

#Что было

#Большой Maxwell – NVIDIA GM200

NVIDIA внедрила новую архитектуру довольно быстрыми по меркам индустрии темпами, так что к моменту появления нового короля дискретных GPU уже существовали четыре чипа линейки Maxwell – GM107 (GeForce GTX 750, GTX 750 Ti), GM108 (GeForce GTX 730), GM204 (GeForce GTX 970, GTX 980) и GM206 (GeForce GTX 960).

 NVIDIA GM200

NVIDIA GM200

Появление в этом ряду чипа с индексом 200 было предопределено, только выбор конкретного техпроцесса оставался под вопросом. Вопреки наилучшему сценарию, NVIDIA по-прежнему использовала проверенный техпроцесс с нормой 28 нм, однако архитектура Maxwell сама по себе создавалась с расчетом на максимально эффективное использование теплового пакета и площади кристалла. Как следствие, ограничения производственной линии на TSMC вполне позволили создать чип, вмещающий в 1,5 раза больше ROP и ядер CUDA и вдвое больше текстурных блоков по сравнению с GM204.

Впрочем, количественным составом вычислительных блоков отличия GM200 от двух остальных GPU из второго поколения Maxwell – GM204 и GM206 – и ограничиваются (не считая того, что GM206 единственный из тройки обладает аппаратным декодером видео формата H.265).

Два продукта, построенных на основе GM200, – GeForce GTX TITAN X и GTX 980 Ti – на сегодняшний день удерживают лидерство в скорости игрового 3D-рендеринга среди дискретных GPU. Единственная проблема GM200 – весьма ограниченная производительность в расчетах двойной точности (FP64). В отличие от предыдущих «Титанов» на базе GK110, TITAN X не имеет никаких преимуществ перед геймерским флагманом (GTX 980 Ti) в этом отношении.

 NVIDIA GeForce GTX TITAN X

NVIDIA GeForce GTX TITAN X

#GeForce GTX 950 и GTX 960

Эти видеокарты, вышедшие в 2015 году, не предназначены поражать воображение. NVIDIA просто обновила середину своего модельного ряда (и убрала лишние позиции) за счет чипа GM206 на базе архитектуры Maxwell второго поколения. GTX 960 на своем месте заменил GTX 660 и GTX 760, принадлежащие к семейству Kepler, что принесло колоссальное снижение энергопотребления при сохранении прежнего уровня быстродействия. GTX 950 не так эффектно выглядит на фоне остающихся в продаже GTX 750 и GTX 750 Ti (так как это уже GM107 – Maxwell первого поколения), однако принес и рост производительности, и дополнительные функции рендеринга, свойственные второму поколению Maxwell.

 MSI GeForce GTX 960 GAMING 2G

MSI GeForce GTX 960 GAMING 2G

GeForce GTX 950 и GTX 960 обладают уникальной на данный момент особенностью среди дискретных видеоадаптеров – аппаратным блоком декодирования видео, сжатого в формате H.265.

#AMD Fiji

О новом флагманском GPU от AMD ходили самые разнообразные, во многом противоречивые слухи. Что-то из этого сбылось, что-то – нет, но в результате AMD представила действительно оригинальный и передовой продукт.

 AMD Fiji

AMD Fiji

Как и GM200 от NVIDIA, новое «большое ядро» от AMD – Fiji – по площади кристалла практически исчерпало возможности производственной линии 28 нм на TSMC. Архитектура вычислительных блоков Fiji включает в 1,45 раза больше шейдерных ALU («потоковых процессоров») и текстурных модулей, чем в предыдущем флагманском GPU – Hawaii, при неизменном количестве ROP.

Революционная особенность Fiji – новый тип памяти HBM (High-Bandwidth Memory), предусматривающий размещение микросхем на одной кремниевой подложке с графическим процессором. За счет этого стала возможной реализация чрезвычайно широкой, 4096-битной шины памяти, которая при относительно низкой частоте 1 ГГц обеспечивает лидирующую пропускную способность и втрое более низкое удельное энергопотребление сравнительно с GDDR5.

 AMD Radeon R9 Fury X

AMD Radeon R9 Fury X

Однако несмотря на свои достоинства и новаторство, дизайн Fiji содержит досадное ограничение в виде низкой пропускной способности front-end’а, выполняющего растеризацию треугольников. Как следствие, топовый продукт на базе Fiji – Radeon R9 Fuxy X, изначально оцененный производителем наравне с GeForce GTX 980 Ti, по совокупной производительности все же немного недотягивает до уровня конкурента. Первая итерация памяти HBM также наложила ограничение на объем RAM, доступный Fiji, – 4 Гбайт, чего в ряде случаев уже не вполне хватает для игр, наиболее требовательных к этому параметру. Впрочем, Fury X на равных соревнуется с GTX 980 Ti в 4К-разрешении и может похвастаться эффективной и тихой системой жидкостного охлаждения в референсной конфигурации.

 SAPPHIRE Tri-X R9 Fury

SAPPHIRE Tri-X R9 Fury

Помимо флагманского Radeon R9 Fury X, GPU Fiji лег в основу двух других видеокарт – Radeon R9 Fury и R9 Nano. Обе по игровому быстродействию занимают промежуточное положение между GeForce GTX 980 и Fury X. Но если Fury – это более дешевая карта на базе Fiji с частично ограниченной конфигурацией вычислительных блоков, в стандартном форм-факторе, с массивным воздушным кулером, то R9 Nano обладает уникальным сочетанием компактного форм-фактора и полнофункционального чипа Fiji с пониженными частотами (цена за такое удовольствие – как у Fury X).

 AMD Radeon R9 Nano

AMD Radeon R9 Nano

#AMD Radeon 300-й серии

Fiji – единственный GPU десктопного класса, который AMD представила в 2015 году. Остальную линейку в связи с появлением новых позиций вверху реорганизовали и выпустили под названиями Radeon R5/R7/R9 300-й серии.

Наибольший интерес в ней представляют Radeon R9 390 и R9 390X (де-факто разогнанные версии Radeon R9 290 и R9 290X на ядре Hawaii), которые AMD позиционирует как более дешевую и/или выгодную альтернативу GeForce GTX 970 и GTX 980 соответственно, которая к тому же обладает объемом RAM 8 Гбайт – вдвое большим, чем предлагает NVIDIA в этом сегменте.

SAPPHIRE NITRO R9 390

SAPPHIRE Tri-X R9 390X

В более низком эшелоне AMD полностью исключила продукты на базе заслуженного чипа Tahiti в пользу простых и дешевых в производстве карточек на процессоре Tonga, обладающем 256-битной шиной памяти (Antigua, согласно новой номенклатуре). Radeon R9 380 является близким соперником GeForce GTX 960 при более низкой цене. R9 380X, в свою очередь, не имеет прямых конкурентов по быстродействию в линейке NVIDIA и целит в промежуток между GeForce GTX 960 и GTX 970.

SAPPHIRE NITRO R9 380

XFX Radeon R9 380X BE DD OC

Что касается Radeon R9 360 и Radeon R9 370, то эти модели играют в одной категории с GeForce GTX 750 Ti и GTX 950 соответственно. И та и другая – медленнее и одновременно дешевле своих прямых соперников. К слову, чип под кодовым именем Pitcairn/Curacao/Trinidad в составе Radeon R9 360 – старейший из GPU, используемых AMD в десктопных видеокартах: он дебютировал еще в 2012 году в Radeon HD 7850/7870.

В целом в каждой позиции 300-й линейки AMD стремится дать покупателю более выгодное соотношение цены и производительности, чем у ближайшего «зеленого» соперника. Главная проблема, которая касается всех дискретных видеокарт AMD уровня ниже Fury (с технической точки зрения), – это несопоставимо низкая по сравнению с Maxwell энергоэффективность и, как следствие, более высокие требования к системе охлаждения (впрочем, конкретные производители здесь в силах многое исправить) и более низкий разгонный потенциал.

Кроме того, AMD проигрывает в плане модной сегодня поддержки DirectX 12. Как мы уже неоднократно отмечали, всем GPU архитектуры GCN доступна оптимизированная производительность новой runtime-библиотеки Direct3D. Однако в плане новых функций рендеринга AMD пока что отстает. Графические процессоры с архитектурой GCN 1.1-1.2, составляющие костяк действующей линейки Radeon, поддерживают feature level 12_0, в то время как Maxwell второго поколения совместим с feature level 12_1.

#Что будет

#NVIDIA Pascal

Продукты на базе следующей версии графической архитектуры от NVIDIA – Pascal – постепенно обретают все более реалистичный вид. Ранее производитель уже объявил две ключевые особенности флагманских продуктов на базе Pascal – проприетарная высокоскоростная шина NVLINK и «трехмерная» память, аналогичная той, которую впервые применила AMD в процессоре Fiji. Теперь нет сомнений, что последняя представляет собой не что иное, как чипы HBM второго поколения совокупным объемом 16 Гбайт, которые для NVIDIA выпустит SK Hynix. Сами GPU поступят в производство на мощностях TSMC с нормой 16 нм FinFET+.

О конкретных характеристиках чипов, формирующих линейку Pascal, пока можно судить лишь по слухам. Говорят, что GP100, флагман семейства, будет содержать 17 млрд транзисторов – почти двукратный рост по сравнению с GM200 (9 млрд). Предполагаемое увеличение производительности на 60-80% сделает GP100 первым GPU, способным в одиночку «вытянуть» современные игры на 4К-экране с частотой смены кадров 60 FPS.

Еще меньше известно о том, каким образом NVIDIA сумеет сделать на базе GPU высшего эшелона более доступный продукт в дополнение к флагманской видеокарте. Не исключено, что, помимо стандартного решения – срезать частоты и отключить часть вычислительных блоков, производитель сменит память HBM2 на GDDR5X – высокочастотную и энергоемкую версию преобладающего сегодня типа GDDR5.

И совсем трудно пока говорить о графических процессорах, которые обеспечат смену архитектуры Maxwell на Pascal на всем протяжении линейки продуктов NVIDIA. Ну а в 2017 году ожидается пришествие архитектуры Volta, которая, возможно, уже будет производиться по техпроцессу 10 нм.

#AMD Radeon R9 Fury X 2 и линейка Arctic Islands

Прежде чем погрузиться в планы компании на ближайшее будущее, напомним, что за AMD должок – двухпроцессорная графическая карта на базе GPU Fiji. Судя по тому, что известно на сегодняшний день, устройство давно могло бы поступить в продажу, но запуск все откладывается – теперь уже до второго квартала 2016 года. Вероятная причина в том, что AMD желает согласовать старт продаж Radeon R9 Fury X2 с массовой доступностью шлемов виртуальной реальности, которым как раз и требуется столь высокая вычислительная мощность. Но так как этот сегмент рынка развивается медленнее, чем хотелось бы AMD, Radeon R9 Fury X2 придется постоять на запасном пути.

Значит ли это, что будущие GPU от AMD под кодовым названием Arctic Islands увидят свет уже после намеченной для Fury X2 даты? Ответа на этот вопрос пока нет. Известно только, что в течение 2016 года AMD планирует полностью обновить свой ассортимент дискретных GPU. Подрядчиком по производству микросхем на этот раз выступит GlobalFoundries, а не TSMC и чипы будут выпускаться по техпроцессу 14 нм FinFET LPP (Low Power Plus).

Поколение Arctic Islands, согласно заявлениям AMD, принесет третье по счету крупное обновление архитектуры GCN и удвоит энергоэффективность микросхем. Как и в NVIDIA Pascal, здесь найдет применение оперативная память типа HBM2.

Дальнейшие подробности основываются исключительно на слухах. В частности, ожидается, что топовый графический процессор следующего поколения под названием Greenland будет состоять из 18 млрд транзисторов и получит 32 Гбайт памяти HBM2. Всплыли имена двух других чипов семейства Arctic Islands – Baffin и Ellesmere. Больше о них, однако, ничего не известно.

#Приложение. Актуальные линейки дискретных видеоадаптеров AMD и NVIDIA

Дискретные видеоадаптеры AMD

МодельГрафический процессорВидеопамятьШина ввода/выводаTDP, Вт
Кодовое название Число транзис-торов, млн Техпро-цесс, нм Тактовая частота, МГц: High State / Boost State Число пото-ковых проц-ров Число текстур-ных блоков Число ROP Ширина шины, бит Тип микросхем Тактовая частота, МГц (пропускная способность, Мбит/с на линию) Объем, Мбайт
Radeon R5 230 Caicos 370 40 625/– 160 8 4 64 GDDR3 SDRAM 533 (1066) 1024/2048 PCI Express 2.1 x16 19
Radeon R7 240 Oland PRO 1040 28 730/780 320 20 8 128 GDDR3/GDDR5 SDRAM 900 (1800) / 1125 (4500) 1024/2048 PCI Express 3.0 x16 30
Radeon R7 250 Oland XT 1040 28 1000/1050 320 20 8 128 GDDR3/GDDR5 SDRAM 900 (1800) / 1150 (4600) 1024/2048 PCI Express 3.0 x16 75
Radeon R7 250X Cape Verde XT 1500 28 1000/- 640 40 16 128 GDDR5 SDRAM 1125 (4500) 1024/2048 PCI Express 3.0 x16 95
Radeon R9 360 Tobago PRO 2080 28 1050/- 768 48 16 128 GDDR5 SDRAM 1625 (6500) 2048 PCI Express 3.0 x16 100
Radeon R9 370 Trinidad PRO 2800 28 975/- 1024 64 32 256 GDDR5 SDRAM 1400 (5600) 2048/4096 PCI Express 3.0 x16 110
Radeon R9 380 Antigua PRO 5000 28 970/- 1792 112 32 256 GDDR5 SDRAM 1425 (5700) 2048/4096 PCI Express 3.0 x16 190
Radeon R9 380X Antigua XT 6200 28 970/- 2048 128 32 256 GDDR5 SDRAM 1500 (6000) 4096 PCI Express 3.0 x16 190
Radeon R9 390X Grenada XT 6200 28 1000/- 2816 176 64 512 GDDR5 SDRAM 1500 (6000) 8192 PCI Express 3.0 x16 275
Radeon R9 Fury Fiji PRO 8900 28 1000/- 3584 224 64 4096 HBM 500 (1000) 4096 PCI Express 3.0 x16 275
Radeon R9 Nano Fiji XT 8900 28 1000/- 4096 256 64 4096 HBM 500 (1000) 4096 PCI Express 3.0 x16 175
Radeon R9 Fury X Fiji XT 8900 28 1050/- 4096 256 64 4096 HBM 500 (1000) 4096 PCI Express 3.0 x16 275

Дискретные видеоадаптеры NVIDIA

МодельГрафический процессорВидеопамятьШина ввода/выводаTDP, Вт
Кодовое название Число транзис-торов, млн Техпро-цесс, нм Тактовая частота, МГц: Base Clock / Boost Clock Число ядер CUDA Число текстур-ных блоков Число ROP Разряд-ность шины, бит Тип микросхем Тактовая частота, МГц (пропускная способность, Мбит/с на линию) Объем, Мбайт
GeForce GT 720 GK208 1300 28 797/- 192 16 8 64 GDDR3/GDDR5 SDRAM 900 (1800) / 1250 (5000) 1024/2048 PCI-Express 2.0 x16 19
GeForce GT 730 (128-bit) GF108 585 40 700/- 96 16 4 128 GDDR3 SDRAM 900 (1800) 1024 PCI-Express 2.0 x16 49
GeForce GT 730 (64-bit) GK208 1300 28 902/- 384 16 8 64 GDDR3/GDDR5 SDRAM 900 (1800) / 1250 (5000) 1024/2048 PCI-Express 2.0 x16 23/25
GeForce GT 740 GK107 1300 28 902/- 384 32 16 128 GDDR3/GDDR5 SDRAM 900 (1800) / 1250 (5000) 1024/2048 PCI-Express 3.0 x16 65
GeForce GTX 750 GM107 1870 28 1020/1085 512 32 16 128 GDDR5 SDRAM 1250 (5000) 1024 PCI-Express 3.0 x16 55
GeForce GTX 750 Ti GM107 1870 28 1020/1085 640 40 16 128 GDDR5 SDRAM 1350 (5000) 2048 PCI-Express 3.0 x16 60
GeForce GTX TITAN Z GK110 7 100 28 705/876 2880 240 48 2 x 384 GDDR5 SDRAM 1750 (7000) 2 x 6144 PCI-Express 3.0 x16 375
GeForce GTX 950 GM206 2 940 28 1024/1188 768 48 32 128 GDDR5 SDRAM 1653 (6612) 2048 PCI-Express 3.0 x16 90
GeForce GTX 960 GM206 2 940 28 1126/1178 1024 64 32 128 GDDR5 SDRAM 1753 (7010) 2048 PCI-Express 3.0 x16 120
GeForce GTX 970 GM204 5 200 28 1050/1178 1664 104 56 256 GDDR5 SDRAM 1750 (7000) 4096 PCI-Express 3.0 x16 145
GeForce GTX 980 GM204 5 200 28 1126/1216 2048 128 64 256 GDDR5 SDRAM 1750 (7000) 4096 PCI-Express 3.0 x16 165
GeForce GTX 980 Ti GM200 8 000 28 1000/1076 2816 176 96 384 GDDR5 SDRAM 1753 (7012) 6144 PCI-Express 3.0 x16 250
GeForce GTX TITAN X GM200 8 000 28 1000/1076 3072 256 96 384 GDDR5 SDRAM 1753 (7012) 12 280 PCI-Express 3.0 x16 250


Оригинал материала: https://3dnews.ru./926037