Оригинал материала: https://3dnews.ru./579183

Нужна ли Radeon RV870 шина памяти более 256-бит?

В этом материале на примере Radeon HD4890 мы попытаемся выяснить, достаточно ли пропускной способности видеопамяти для современных видеопроцессоров AMD. Затем, на основании полученных данных, мы попробуем оценить, хватит ли такой ПСП для GPU нового поколения и будет ли актуален переход на более широкую шину памяти. Попутно мы также выясним примерный уровень производительности RV870 с учетом тех "слухификаций", которые распространены в данное время.
Тестовый стенд 1
Центральный процессор Intel Core 2 Quad QX6850 @ 3600 МГц (400x9)
Материнская плата ASUS P5QC (Intel P45 + ICH10R)
Оперативная память DDR3 Kingston 2x1GB @ 1600 MHz, 7-7-7-20-2T
Видеокарта ASUS Radeon HD4890
OS Windows 7 RTM
Мы будем проводить наше исследование, используя в качестве 3D-приложения хорошо известную игру Crysis. Этот выбор продиктован тем, что, несмотря на возраст, Crysis до сих пор остается высокотехнологичной игрой, которая изрядно нагружает все компоненты системы. Благодаря этому будет гораздо проще увидеть характер поведения производительности видеосистемы при изменении ее параметров, а значит и сделать прогнозы, касающиеся будущих видеопроцессоров. Для того, чтобы избежать процессорозависимости видеосистемы, мы будем использовать в игре графический режим High, но без включения полноэкранного сглаживания и анизотропной фильтрации. Не удивляйтесь, но изучение вопроса о достаточности пропускной способности шины видеопамяти мы начнем с того, что выясним влияние частоты GPU на производительность видеосистемы. Для этого мы зафиксировали частоту видеопамяти на уровне 1000 Мгц (реальных), а затем с шагом 100 МГц изменяли частоту GPU. Что из этого получилось, показано на графике ниже.
 1-График 1 Зависимость.png
Как оказалось, в указанных условиях тестирования производительность видеосистемы зависит от частоты GPU практически линейно. Это значит, что в данном случае влияние других факторов, ограничивающих производительность видеосистемы, ничтожно, то есть пропускная способность видеопамяти - достаточна. Конечно, все это хорошо, но для того, чтобы строить какие-либо предположения о производительности будущих видеокарт - явно недостаточно. Нам потребуются дополнительные данные, а получим мы их... снижая частоту видеопамяти, как бы странно это ни звучало.
 2-График 2 Зависимость.png
На втором графике показаны еще три линии, построенные аналогично графику 1, только уже при частотах видеопамяти 750, 500 и 250 МГц (реальных). В итоге мы получили семейство кривых, которые при уменьшении частоты GPU "сливаются" в наклонную прямую (пунктирная линия). Эта прямая, из которой "вырастают" линии графиков, имеет очень важное значение, поэтому рассмотрим ее несколько подробнее. Здравый смысл подсказывает, что данная прямая должна проходить через начало координат графика, так как при нулевой частоте GPU мы получим ноль FPS. В то же время, значения FPS на графиках не должны выходить за пределы ограничивающей прямой и не могут находиться над ней. Физический смысл данной прямой состоит в том, что она является линией максимальных результатов при стремлении частоты видеопамяти к бесконечности. Разумеется, в реальности частота видеопамяти ограничена. Но если она значительно превышает частоту GPU, например в 10 раз, как получилось для самой левой точки графика в наших условиях тестирования (частота GPU равна 100 Мгц, а видеопамяти - 1000 МГц), то через данную точку и начало координат можно провести линию максимальных результатов. Собственно, именно так мы и поступили. Как видно из рисунка выше, точки графика, полученного при частоте видеопамяти 1000 МГц, фактически лежат на линии максимальных результатов вплоть до частоты GPU равной 500 МГц. Теперь посмотрим на правую часть графика 2. Очевидно, что при увеличении частоты видеопамяти производительность видеосистемы растет, но нелинейно. Наблюдается так называемый эффект "насыщения". Кривую насыщения можно описать, например, следующей функцией:
График данной кривой насыщения представлен на рисунке ниже.
 8-Кривая насыщения.png
В силу того, что экспонента не обращается в нуль при любых значениях Х, кривая насыщения никогда не достигнет значения 1, но будет приближаться к ней сколько угодно близко по мере возрастания X. Теперь давайте посмотрим, что происходит, когда кривая насыщения достигнет уровня 0.9. С одной стороны, мы еще не так "далеко" ушли от начала координат, с другой стороны - до достижения максимального уровня остается каких-то 10%. Причем для достижения этих недостающих 10% придется "пройти" по оси X теперь уже вдвое большее "расстояние" (правая граница графика). К чему все эти теоретические рассуждения? Давайте предположим, что зависимость значений FPS от частоты видеопамяти имеет характер кривой насыщения. Тогда, ограничившись пропускной способностью памяти, обеспечивающий результат 90% от теоретически возможного, мы "потеряем" лишь 10% от максимальной производительности, но значительно сэкономим силы и средства, поскольку нет необходимости излишне увеличивать ширину шины памяти и ее частоту. Оставшиеся 10% от максимума "достанутся" оверклокерам и бенчерам, а также любителям выпускать разогнанные решения. Конечно, в соревновании топовых видеокарт значение имеет каждый процент, но и "цена" этих процентов вырастает значительно быстрее реальной прибавки производительности видеокарты. Поэтому будем считать, что достижение 90% от теоретического максимума производительности является разумным ограничением для ПСП видеопамяти. Разумеется, эта величина является произвольной, поэтому каждый вправе выбрать себе уровень по вкусу, скажем, не 90%, а лишь 80%, или например 95%. Но теоретический максимум производительности, как правило, точно неизвестен. Поэтому для грубой оценки текущего "отставания" от максимума можно использовать касательную к графику производительности, для чего достаточно два-три измерения. Пример касательной приведен на графике выше. Чем меньше ее коэффициент наклона, тем ближе вы подобрались к максимуму. Кстати, эту же касательную можно использовать как приблизительную оценку потенциала разгона видеопамяти. Что интересно, если на Графике №2 взять FPS в какой-либо точке, соответствующей синхронной работе GPU и видеопамяти, а затем разделить его на значение FPS, соответствующее точке, лежащей на линии максимальных результатов, как раз и получим эти самые 90%. Идем дальше. За основу следующего построения мы опять возьмем График №2 и имеющуюся на нем линию, полученную при частоте видеопамяти 250 МГц. В правой части Графика №2 данная линия становится фактически горизонтальной, то есть ее положение определяется исключительно величиной частоты видеопамяти. Очевидно, что для любой другой частоты видеопамяти мы получим такую же горизонтальную "полочку" результатов, если значительно увеличим частоту GPU. Расстояние между этими горизонтальными "полочками" должно быть пропорционально частоте видеопамяти (сейчас мы рассматриваем предельный случай, когда частота GPU стремится к бесконечности). Давайте построим эти "полочки" указанным способом и посмотрим, что же в итоге получилось.
 3-График 3 Зависимость.png
Масштаб графика был несколько изменен для удобства представления. В левой части графика указаны экспериментальные данные, а в правой - расчетные "полочки", соответствующие производительности видеосистемы при фиксированной частоте видеопамяти и частоте GPU, стремящейся к бесконечности. Возникает вопрос - можно ли экстраполировать экспериментальные данные для получения примерных оценок производительности видеосистемы при более высоких частотах GPU, и зачем это вообще нужно? В общем, это нужно для того, чтобы оценить производительность будущего RV870, ведь он будет иметь более высокую производительность, чем HD4890. А для хорошей экстраполяции нам необходимо выполнить несколько требований, вытекающих из предыдущих построений. Во-первых, построенные горизонтальные "полочки" будут ограничивать рост FPS при фиксированной частоте видеопамяти и стремлении частоты GPU к бесконечности. Другими словами, вид кривой экстраполяции может напоминать кривую насыщения, где "полочки" являются асимптотами. Во-вторых, есть условие "гладкости" кривой в крайней правой точке экспериментальных данных, то есть значения FPS не должны "скакать" при переходе от экспериментальных данных к экстраполированным значениям. Используя вышеприведенные условия и подбирая параметры "кривой насыщения", рассмотренной ранее, мы получили следующий график.
 4-График 4 Зависимость.png
Разумеется, такое экстраполирование в значительной мере является произволом. То, что экстраполированные графики для частот видеопамяти 250 и 500 МГц ведут себя относительно "хорошо", объясняется близостью экспериментальных данных к "полочкам" насыщения. В то же время, графики, построенные для частот видеопамяти 750 и 1000 МГц оставляют куда больший простор для ошибок. Для чего нам понадобились такие построения? Предположим, что будущий RV870 будет иметь 1600 потоковых процессоров, а его рабочая частота будет равна, скажем, 900 МГц. Допустим, что увеличение числа потоковых процессоров вдвое приводит к двукратному увеличению производительности GPU, то есть соответствует производительности Radeon HD4890, работающему на частоте 1800 МГц. Конечно, в реальности все может оказаться совсем иначе из-за изменений в архитектуре GPU и многих других факторов. Впрочем, мы сейчас пытаемся лишь оценить примерную производительность будущего RV870, а вовсе не вычислить ее с точностью до второго знака после запятой, поэтому вышеуказанные допущения будем рассматривать как гипотезу. Разумеется, дальнейшие рассуждения будут справедливы только в рамках данной гипотезы. Итак, мы предположили, что GPU видеокарты HD4890, работающий на частоте 1800 МГц, обладает той же "мощностью", что и будущий RV870. Если теперь посмотреть на График №4, то выяснится, что частоты видеопамяти 1000 МГц ему будет явно недостаточно, чтобы полностью раскрыть свой потенциал (по крайней мере, в наших условиях тестирования). Но какой тогда должна быть частота видеопамяти или, если говорить обобщенно, пропускная способность видеопамяти? Предположим, что ширина шины видеопамяти RV870 будет те же 256-бит, а ее частота несколько выше. Более высокую частоту видеопамяти "нарисовать" достаточно просто - отложим еще две горизонтальные "полочки" соответствующие частотам 1250 и 1500 МГц, соответственно, на уровне 138,1 и 165.7 FPS. Затем, пользуясь методом, использованном при построении экстраполированных кривых на Графике №4, проведем аналогичные кривые, соответствующие частотам видеопамяти 1250 и 1500 МГц. В качестве дополнительного условия потребуем, чтобы при равенстве частот GPU и видеопамяти данные кривые проходили через точку, соответствующую 90% от FPS линии максимальных результатов, как это наблюдалось для экспериментальных данных ранее. Результат этих построений можно видеть на рисунке ниже.
 5-График 5 Зависимость.png
В итоге, получаем следующие результаты. В рамках наших построений производительность гипотетического RV870, оснащенного 1600-ми потоковыми конвейерами и работающего на частоте 900 Мгц, будет равна 112 FPS в случае использования видеопамяти GDDR5 с частотой 1250 МГц, и 124 FPS при частоте видеопамяти 1500 МГц. По сравнению с результатом HD4890, который при частоте GPU и видеопамяти 900 и 1000 МГц, соответственно, показывает в данном тесте 68.5 FPS, прибавка весьма солидная, хотя и не двукратная. При этом получается, что 112 FPS составляют 75% от величины в точке максимально возможного результата (148,7 FPS, синяя пунктирная линия), а 124 FPS - 90% от максимума. Если наши допущения, предположения и построения верны, то получается, что будущему RV870 достаточно иметь 256-битную шину памяти, а частота видеопамяти GDDR5 должна составлять примерно 1500 реальных мегагерц, то есть 6000 МГц QDR. Данные требования не являются особо критичными. Например, компания Hynix уже начала выпуск микросхем памяти GDDR5 с рабочей частотой 7000 МГц QDR, что при ширине шины 256-бит обеспечивает пропускную способность 224 Гбайт/с. Для сравнения, устанавливаемая в видеокартах HD4890 видеопамять с частотой 3900 МГц QDR способна прокачать лишь 124,8 Гбайт/с. Кстати, используя График №5 можно достаточно просто прикинуть производительность и остальных видеокарт в линейке Radeon HD5xxx (опять же, если вышеуказанные допущения и предположения верны). Для этого необходимо найти частоту GPU HD4890, эквивалентную мощности нового графического процессора и отложить ее по горизонтальной оси графика (например, вертикальной линией). Затем для гипотетической видеокарты надо рассчитать эквивалентную частоту видеопамяти HD4890, с учетом ширины шины видеопамяти, ее типа и рабочей частоты. А дальше остается только прочертить примерную кривую до пересечения с вертикальной линией, отмечающей эквивалентную частоту GPU.

Заключение

Даже весьма грубые прикидки позволяют предположить, что новые видеопроцессоры AMD Radeon вряд ли перейдут на использование более широкой шины памяти, и по-прежнему будут довольствоваться шиной 256-бит, наращивая ПСП за счет частоты видеопамяти. Для нас это, в принципе, хорошие новости. Это значит, что печатные платы будущих видеоадаптеров не будут чрезмерно сложными и дорогими в производстве, а значит и их цена не должна быть завышенной. А вот для компании NVIDIA данные новости могут оказаться не очень хорошими. Если верны слухи о том, что грядущий видеопроцессор GT300 будет иметь 512-битную шину и видеопамять GDDR5, то он получит изрядный запас по пропускной способности памяти. Это позволит иметь вдвое большую ПСП при равных с RV870 частотах памяти, либо при одинаковой ПСП устанавливать менее скоростную и более дешевую видеопамять. Но компенсирует ли более дешевая видеопамять стоимость производства более сложной печатной платы - большой вопрос. Впрочем, время покажет.
- Обсудить материал в конференции




Оригинал материала: https://3dnews.ru./579183