Итоги 2015 года: графические ускорители

С одной стороны, 2015 год не принес таких грандиозных изменений, как мы рассчитывали: освоение техпроцесса 14-16 нм и массовая смена GPU в линейках AMD и NVIDIA все еще впереди. С другой стороны, именно по этой причине столь впечатляют финальные успехи, которых индустрия достигла на этапе 28 нм

Уходящий год мы встретили с надеждой на большие перемены в категории дискретных видеоадаптеров (см. итоги 2014 года). Прошедшие двенадцать месяцев, конечно, не идут ни в какое сравнение с уже далеким 2011-2012 годом, когда оба крупнейших производителя GPU перенесли основную часть своих продуктовых линеек на рельсы техпроцесса 28 нм, практически удвоив производительность, доступную топовым моделям видеоадаптеров по сравнению с предыдущим поколением эпохи 40 нм. Но в отличие от откровенно застойного 2014 года, когда единственным способом сдвинуть планку быстродействия для производителей был выпуск «двухголовых» видеоадаптеров Radeon R9 295X2 и GeForce GTX TITAN Z (в этот раз особенно неуклюжих и монструозных в связи с тепловыделением соответствующих GPU), AMD и NVIDIA все же породили две микросхемы, ныне по праву занимающих верхний ранг в иерархии дискретных GPU – AMD Fiji (семейство Radeon R9 Fury) и NVIDIA GM200 (GeForce GTX 980 Ti, GTX TITAN X).

И это по-своему уникальная ситуация, ведь дискретные GPU уже четыре года подряд выпускаются на базе одной и той же фотолитографической технологии TSMC с нормой 28 нм. Прорыв, который обеспечили Fiji и GM200, стал возможен в первую очередь благодаря тому факту, что оба чипа по площади практически достигли предела, заданного фотомаской, применяемой на конвейере TSMC (596 и 601 мм² для Fiji и GM200 соответственно). Но, что не менее важно, в этих продуктах воплотились лучшие достижения в проектировании энергоэффективной процессорной архитектуры.

GPU нижних эшелонов в связи с появлением новых флагманов по большей части просто сдвинулись вниз и будут нести службу до тех пор, пока производители не представят им замену в лице чипов, произведенных по более прогрессивной норме (заветный час уже близок), однако у нас есть и третий новичок – NVIDIA GM206, который лег в основу видеоадаптеров GeForce GTX 950/960.

Таким образом, архитектура Maxwell, уже второго поколения, теперь заполнила всю линейку продуктов NVIDIA, начиная с карточек доступной геймерской категории. AMD, со своей стороны, перетасовала состав и конфигурацию уже существовавших GPU на базе архитектуры GCN различных версий и представила их под маркой Radeon R5/R7/R9 300.

Расскажем обо всем этом чуть более подробно, а в конце статьи по традиции будет синопсис слухов и публичных обещаний производителей относительно планов по выпуску новых GPU в следующие 12 месяцев. Можно с большой уверенностью утверждать, что в следующем году уж точно AMD и NVIDIA сменят изживший свое техпроцесс 28 нм на более прогрессивный – 14/16 нм, миновав промежуточную ступень 20 нм.

⇡#Что было

⇡#Большой Maxwell – NVIDIA GM200

NVIDIA внедрила новую архитектуру довольно быстрыми по меркам индустрии темпами, так что к моменту появления нового короля дискретных GPU уже существовали четыре чипа линейки Maxwell – GM107 (GeForce GTX 750, GTX 750 Ti), GM108 (GeForce GTX 730), GM204 (GeForce GTX 970, GTX 980) и GM206 (GeForce GTX 960).

NVIDIA GM200

Появление в этом ряду чипа с индексом 200 было предопределено, только выбор конкретного техпроцесса оставался под вопросом. Вопреки наилучшему сценарию, NVIDIA по-прежнему использовала проверенный техпроцесс с нормой 28 нм, однако архитектура Maxwell сама по себе создавалась с расчетом на максимально эффективное использование теплового пакета и площади кристалла. Как следствие, ограничения производственной линии на TSMC вполне позволили создать чип, вмещающий в 1,5 раза больше ROP и ядер CUDA и вдвое больше текстурных блоков по сравнению с GM204.

Впрочем, количественным составом вычислительных блоков отличия GM200 от двух остальных GPU из второго поколения Maxwell – GM204 и GM206 – и ограничиваются (не считая того, что GM206 единственный из тройки обладает аппаратным декодером видео формата H.265).

Два продукта, построенных на основе GM200, – GeForce GTX TITAN X и GTX 980 Ti – на сегодняшний день удерживают лидерство в скорости игрового 3D-рендеринга среди дискретных GPU. Единственная проблема GM200 – весьма ограниченная производительность в расчетах двойной точности (FP64). В отличие от предыдущих «Титанов» на базе GK110, TITAN X не имеет никаких преимуществ перед геймерским флагманом (GTX 980 Ti) в этом отношении.

NVIDIA GeForce GTX TITAN X

⇡#GeForce GTX 950 и GTX 960

Эти видеокарты, вышедшие в 2015 году, не предназначены поражать воображение. NVIDIA просто обновила середину своего модельного ряда (и убрала лишние позиции) за счет чипа GM206 на базе архитектуры Maxwell второго поколения. GTX 960 на своем месте заменил GTX 660 и GTX 760, принадлежащие к семейству Kepler, что принесло колоссальное снижение энергопотребления при сохранении прежнего уровня быстродействия. GTX 950 не так эффектно выглядит на фоне остающихся в продаже GTX 750 и GTX 750 Ti (так как это уже GM107 – Maxwell первого поколения), однако принес и рост производительности, и дополнительные функции рендеринга, свойственные второму поколению Maxwell.

MSI GeForce GTX 960 GAMING 2G

GeForce GTX 950 и GTX 960 обладают уникальной на данный момент особенностью среди дискретных видеоадаптеров – аппаратным блоком декодирования видео, сжатого в формате H.265.

⇡#AMD Fiji

О новом флагманском GPU от AMD ходили самые разнообразные, во многом противоречивые слухи. Что-то из этого сбылось, что-то – нет, но в результате AMD представила действительно оригинальный и передовой продукт.

AMD Fiji

Как и GM200 от NVIDIA, новое «большое ядро» от AMD – Fiji – по площади кристалла практически исчерпало возможности производственной линии 28 нм на TSMC. Архитектура вычислительных блоков Fiji включает в 1,45 раза больше шейдерных ALU («потоковых процессоров») и текстурных модулей, чем в предыдущем флагманском GPU – Hawaii, при неизменном количестве ROP.

Революционная особенность Fiji – новый тип памяти HBM (High-Bandwidth Memory), предусматривающий размещение микросхем на одной кремниевой подложке с графическим процессором. За счет этого стала возможной реализация чрезвычайно широкой, 4096-битной шины памяти, которая при относительно низкой частоте 1 ГГц обеспечивает лидирующую пропускную способность и втрое более низкое удельное энергопотребление сравнительно с GDDR5.

AMD Radeon R9 Fury X

Однако несмотря на свои достоинства и новаторство, дизайн Fiji содержит досадное ограничение в виде низкой пропускной способности front-end’а, выполняющего растеризацию треугольников. Как следствие, топовый продукт на базе Fiji – Radeon R9 Fuxy X, изначально оцененный производителем наравне с GeForce GTX 980 Ti, по совокупной производительности все же немного недотягивает до уровня конкурента. Первая итерация памяти HBM также наложила ограничение на объем RAM, доступный Fiji, – 4 Гбайт, чего в ряде случаев уже не вполне хватает для игр, наиболее требовательных к этому параметру. Впрочем, Fury X на равных соревнуется с GTX 980 Ti в 4К-разрешении и может похвастаться эффективной и тихой системой жидкостного охлаждения в референсной конфигурации.

SAPPHIRE Tri-X R9 Fury

Помимо флагманского Radeon R9 Fury X, GPU Fiji лег в основу двух других видеокарт – Radeon R9 Fury и R9 Nano. Обе по игровому быстродействию занимают промежуточное положение между GeForce GTX 980 и Fury X. Но если Fury – это более дешевая карта на базе Fiji с частично ограниченной конфигурацией вычислительных блоков, в стандартном форм-факторе, с массивным воздушным кулером, то R9 Nano обладает уникальным сочетанием компактного форм-фактора и полнофункционального чипа Fiji с пониженными частотами (цена за такое удовольствие – как у Fury X).

AMD Radeon R9 Nano

⇡#AMD Radeon 300-й серии

Fiji – единственный GPU десктопного класса, который AMD представила в 2015 году. Остальную линейку в связи с появлением новых позиций вверху реорганизовали и выпустили под названиями Radeon R5/R7/R9 300-й серии.

Наибольший интерес в ней представляют Radeon R9 390 и R9 390X (де-факто разогнанные версии Radeon R9 290 и R9 290X на ядре Hawaii), которые AMD позиционирует как более дешевую и/или выгодную альтернативу GeForce GTX 970 и GTX 980 соответственно, которая к тому же обладает объемом RAM 8 Гбайт – вдвое большим, чем предлагает NVIDIA в этом сегменте.


SAPPHIRE NITRO R9 390		SAPPHIRE Tri-X R9 390X

В более низком эшелоне AMD полностью исключила продукты на базе заслуженного чипа Tahiti в пользу простых и дешевых в производстве карточек на процессоре Tonga, обладающем 256-битной шиной памяти (Antigua, согласно новой номенклатуре). Radeon R9 380 является близким соперником GeForce GTX 960 при более низкой цене. R9 380X, в свою очередь, не имеет прямых конкурентов по быстродействию в линейке NVIDIA и целит в промежуток между GeForce GTX 960 и GTX 970.


SAPPHIRE NITRO R9 380		XFX Radeon R9 380X BE DD OC

Что касается Radeon R9 360 и Radeon R9 370, то эти модели играют в одной категории с GeForce GTX 750 Ti и GTX 950 соответственно. И та и другая – медленнее и одновременно дешевле своих прямых соперников. К слову, чип под кодовым именем Pitcairn/Curacao/Trinidad в составе Radeon R9 360 – старейший из GPU, используемых AMD в десктопных видеокартах: он дебютировал еще в 2012 году в Radeon HD 7850/7870.

В целом в каждой позиции 300-й линейки AMD стремится дать покупателю более выгодное соотношение цены и производительности, чем у ближайшего «зеленого» соперника. Главная проблема, которая касается всех дискретных видеокарт AMD уровня ниже Fury (с технической точки зрения), – это несопоставимо низкая по сравнению с Maxwell энергоэффективность и, как следствие, более высокие требования к системе охлаждения (впрочем, конкретные производители здесь в силах многое исправить) и более низкий разгонный потенциал.

Кроме того, AMD проигрывает в плане модной сегодня поддержки DirectX 12. Как мы уже неоднократно отмечали, всем GPU архитектуры GCN доступна оптимизированная производительность новой runtime-библиотеки Direct3D. Однако в плане новых функций рендеринга AMD пока что отстает. Графические процессоры с архитектурой GCN 1.1-1.2, составляющие костяк действующей линейки Radeon, поддерживают feature level 12_0, в то время как Maxwell второго поколения совместим с feature level 12_1.

⇡#Что будет

⇡#NVIDIA Pascal

Продукты на базе следующей версии графической архитектуры от NVIDIA – Pascal – постепенно обретают все более реалистичный вид. Ранее производитель уже объявил две ключевые особенности флагманских продуктов на базе Pascal – проприетарная высокоскоростная шина NVLINK и «трехмерная» память, аналогичная той, которую впервые применила AMD в процессоре Fiji. Теперь нет сомнений, что последняя представляет собой не что иное, как чипы HBM второго поколения совокупным объемом 16 Гбайт, которые для NVIDIA выпустит SK Hynix. Сами GPU поступят в производство на мощностях TSMC с нормой 16 нм FinFET+.

О конкретных характеристиках чипов, формирующих линейку Pascal, пока можно судить лишь по слухам. Говорят, что GP100, флагман семейства, будет содержать 17 млрд транзисторов – почти двукратный рост по сравнению с GM200 (9 млрд). Предполагаемое увеличение производительности на 60-80% сделает GP100 первым GPU, способным в одиночку «вытянуть» современные игры на 4К-экране с частотой смены кадров 60 FPS.

Еще меньше известно о том, каким образом NVIDIA сумеет сделать на базе GPU высшего эшелона более доступный продукт в дополнение к флагманской видеокарте. Не исключено, что, помимо стандартного решения – срезать частоты и отключить часть вычислительных блоков, производитель сменит память HBM2 на GDDR5X – высокочастотную и энергоемкую версию преобладающего сегодня типа GDDR5.

И совсем трудно пока говорить о графических процессорах, которые обеспечат смену архитектуры Maxwell на Pascal на всем протяжении линейки продуктов NVIDIA. Ну а в 2017 году ожидается пришествие архитектуры Volta, которая, возможно, уже будет производиться по техпроцессу 10 нм.

⇡#AMD Radeon R9 Fury X 2 и линейка Arctic Islands

Прежде чем погрузиться в планы компании на ближайшее будущее, напомним, что за AMD должок – двухпроцессорная графическая карта на базе GPU Fiji. Судя по тому, что известно на сегодняшний день, устройство давно могло бы поступить в продажу, но запуск все откладывается – теперь уже до второго квартала 2016 года. Вероятная причина в том, что AMD желает согласовать старт продаж Radeon R9 Fury X2 с массовой доступностью шлемов виртуальной реальности, которым как раз и требуется столь высокая вычислительная мощность. Но так как этот сегмент рынка развивается медленнее, чем хотелось бы AMD, Radeon R9 Fury X2 придется постоять на запасном пути.

Значит ли это, что будущие GPU от AMD под кодовым названием Arctic Islands увидят свет уже после намеченной для Fury X2 даты? Ответа на этот вопрос пока нет. Известно только, что в течение 2016 года AMD планирует полностью обновить свой ассортимент дискретных GPU. Подрядчиком по производству микросхем на этот раз выступит GlobalFoundries, а не TSMC и чипы будут выпускаться по техпроцессу 14 нм FinFET LPP (Low Power Plus).

Поколение Arctic Islands, согласно заявлениям AMD, принесет третье по счету крупное обновление архитектуры GCN и удвоит энергоэффективность микросхем. Как и в NVIDIA Pascal, здесь найдет применение оперативная память типа HBM2.

Дальнейшие подробности основываются исключительно на слухах. В частности, ожидается, что топовый графический процессор следующего поколения под названием Greenland будет состоять из 18 млрд транзисторов и получит 32 Гбайт памяти HBM2. Всплыли имена двух других чипов семейства Arctic Islands – Baffin и Ellesmere. Больше о них, однако, ничего не известно.

⇡#Приложение. Актуальные линейки дискретных видеоадаптеров AMD и NVIDIA

Дискретные видеоадаптеры AMD

Модель	Графический процессор							Видеопамять				Шина ввода/вывода	TDP, Вт
	Кодовое название	Число транзис-торов, млн	Техпро-цесс, нм	Тактовая частота, МГц: High State / Boost State	Число пото-ковых проц-ров	Число текстур-ных блоков	Число ROP	Ширина шины, бит	Тип микросхем	Тактовая частота, МГц (пропускная способность, Мбит/с на линию)	Объем, Мбайт
Radeon R5 230	Caicos	370	40	625/–	160	8	4	64	GDDR3 SDRAM	533 (1066)	1024/2048	PCI Express 2.1 x16	19
Radeon R7 240	Oland PRO	1040	28	730/780	320	20	8	128	GDDR3/GDDR5 SDRAM	900 (1800) / 1125 (4500)	1024/2048	PCI Express 3.0 x16	30
Radeon R7 250	Oland XT	1040	28	1000/1050	320	20	8	128	GDDR3/GDDR5 SDRAM	900 (1800) / 1150 (4600)	1024/2048	PCI Express 3.0 x16	75
Radeon R7 250X	Cape Verde XT	1500	28	1000/-	640	40	16	128	GDDR5 SDRAM	1125 (4500)	1024/2048	PCI Express 3.0 x16	95
Radeon R9 360	Tobago PRO	2080	28	1050/-	768	48	16	128	GDDR5 SDRAM	1625 (6500)	2048	PCI Express 3.0 x16	100
Radeon R9 370	Trinidad PRO	2800	28	975/-	1024	64	32	256	GDDR5 SDRAM	1400 (5600)	2048/4096	PCI Express 3.0 x16	110
Radeon R9 380	Antigua PRO	5000	28	970/-	1792	112	32	256	GDDR5 SDRAM	1425 (5700)	2048/4096	PCI Express 3.0 x16	190
Radeon R9 380X	Antigua XT	6200	28	970/-	2048	128	32	256	GDDR5 SDRAM	1500 (6000)	4096	PCI Express 3.0 x16	190
Radeon R9 390X	Grenada XT	6200	28	1000/-	2816	176	64	512	GDDR5 SDRAM	1500 (6000)	8192	PCI Express 3.0 x16	275
Radeon R9 Fury	Fiji PRO	8900	28	1000/-	3584	224	64	4096	HBM	500 (1000)	4096	PCI Express 3.0 x16	275
Radeon R9 Nano	Fiji XT	8900	28	1000/-	4096	256	64	4096	HBM	500 (1000)	4096	PCI Express 3.0 x16	175
Radeon R9 Fury X	Fiji XT	8900	28	1050/-	4096	256	64	4096	HBM	500 (1000)	4096	PCI Express 3.0 x16	275

Дискретные видеоадаптеры NVIDIA

Модель	Графический процессор							Видеопамять				Шина ввода/вывода	TDP, Вт
	Кодовое название	Число транзис-торов, млн	Техпро-цесс, нм	Тактовая частота, МГц: Base Clock / Boost Clock	Число ядер CUDA	Число текстур-ных блоков	Число ROP	Разряд-ность шины, бит	Тип микросхем	Тактовая частота, МГц (пропускная способность, Мбит/с на линию)	Объем, Мбайт
GeForce GT 720	GK208	1300	28	797/-	192	16	8	64	GDDR3/GDDR5 SDRAM	900 (1800) / 1250 (5000)	1024/2048	PCI-Express 2.0 x16	19
GeForce GT 730 (128-bit)	GF108	585	40	700/-	96	16	4	128	GDDR3 SDRAM	900 (1800)	1024	PCI-Express 2.0 x16	49
GeForce GT 730 (64-bit)	GK208	1300	28	902/-	384	16	8	64	GDDR3/GDDR5 SDRAM	900 (1800) / 1250 (5000)	1024/2048	PCI-Express 2.0 x16	23/25
GeForce GT 740	GK107	1300	28	902/-	384	32	16	128	GDDR3/GDDR5 SDRAM	900 (1800) / 1250 (5000)	1024/2048	PCI-Express 3.0 x16	65
GeForce GTX 750	GM107	1870	28	1020/1085	512	32	16	128	GDDR5 SDRAM	1250 (5000)	1024	PCI-Express 3.0 x16	55
GeForce GTX 750 Ti	GM107	1870	28	1020/1085	640	40	16	128	GDDR5 SDRAM	1350 (5000)	2048	PCI-Express 3.0 x16	60
GeForce GTX TITAN Z	GK110	7 100	28	705/876	2880	240	48	2 x 384	GDDR5 SDRAM	1750 (7000)	2 x 6144	PCI-Express 3.0 x16	375
GeForce GTX 950	GM206	2 940	28	1024/1188	768	48	32	128	GDDR5 SDRAM	1653 (6612)	2048	PCI-Express 3.0 x16	90
GeForce GTX 960	GM206	2 940	28	1126/1178	1024	64	32	128	GDDR5 SDRAM	1753 (7010)	2048	PCI-Express 3.0 x16	120
GeForce GTX 970	GM204	5 200	28	1050/1178	1664	104	56	256	GDDR5 SDRAM	1750 (7000)	4096	PCI-Express 3.0 x16	145
GeForce GTX 980	GM204	5 200	28	1126/1216	2048	128	64	256	GDDR5 SDRAM	1750 (7000)	4096	PCI-Express 3.0 x16	165
GeForce GTX 980 Ti	GM200	8 000	28	1000/1076	2816	176	96	384	GDDR5 SDRAM	1753 (7012)	6144	PCI-Express 3.0 x16	250
GeForce GTX TITAN X	GM200	8 000	28	1000/1076	3072	256	96	384	GDDR5 SDRAM	1753 (7012)	12 280	PCI-Express 3.0 x16	250