Сегодня 25 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Видеокарты

Процессорозависимость видеосистемы. Часть I - Анализ

⇣ Содержание

Как правильно оценивать производительность видеокарты

Вопрос может показаться надуманным, Казалось бы, чего сложного - взяли стенд покруче, установили видеокарту и давай гонять во всех режимах. Ну, в общем-то, так обычно и делается. Собственно, вопрос состоит в трактовке полученных результатов. Все не так просто, как кажется. Давайте еще раз посмотрим на наш график и поищем подводные камни. Чтобы излишне не загружать картинку, в этот раз мы оставили линии только для трех режимов.


График 3

Красная линия показывает результаты тестирования видеокарты в режиме 1024х768 NO AA/AF. Что в этом случае мы измеряем? Производительность видеокарты? Вряд ли. Посмотрите, как сильно меняются результаты при изменении частоты CPU, но ведь видеокарта у нас осталась та же самая, и производительность у нее не могла измениться! Вывод – в этом режиме мы, по сути, измеряем производительность центрального процессора в скорости генерации кадров, ведь результаты практически линейно зависят от частоты CPU.

Теперь посмотрим на коричневую линию, которая соответствует режиму 1600х1200 NO AA/AF. Нагрузка на видеокарту заметно возросла и о прямой линии речь уже не идет. Тем не менее, разброс результатов остается значительным. Какое именно значение отражает производительность видеокарты? Как мы видим, корректный ответ обязательно должен включать условия тестирования, и если не целиком, то производительность (частоту) CPU, при которой получен результат – обязательно.

И, наконец, третья линия зеленого цвета, соответствующая режиму 1600х1200 4AA/16AF. Смотрите, начиная с частоты CPU 1600 МГц результаты, показываемые видеокартой, перестали зависеть от мощности CPU. Поэтому мы можем с полной уверенностью утверждать, что тот уровень FPS, на котором находится горизонтальная «полочка», как раз и характеризует производительность видеокарты! Отсюда следует:

Критерий корректного сравнения производительности видеокарт (при прочих равных условиях) – допустимо сравнивать лишь те значения производительности (FPS), показываемые видеокартами, которые соответствуют горизонтальным уровням на графике процессорозависимости.

Для этого необходимо использовать тестовый стенд с достаточно мощным центральным процессором и выбирать режим тестирования так, чтобы получилась горизонтальная «полочка» результатов. Получившаяся «полочка» - и есть уровень производительности видеокарты в данном режиме.

Трактовка результатов, показываемых multi-GPU системами

Вы уже знакомы со способами объединения производительности видеокарт – SLI и CrossFire, и знаете, что смысл этих технологий состоит в увеличении производительности видеосистемы. Если говорить простыми словами (снова обращаясь к рисунку 1), то две видеокарты гораздо быстрее «раскрашивают» «каркас» кадра, чем одиночная видеокарта. Мы умышленно не говорим «вдвое быстрее», потому что обычная арифметика здесь не работает, и «два» не всегда вдвое быстрее, чем «один». Сказываются накладные расходы на распределение нагрузки между двумя видеокартами, время на синхронизацию и т.д. Поэтому двукратный прирост производительности от объединения двух видеокарт существует лишь в теории, а на практике максимальный прирост ограничен величиной примерно в 80-90%, то есть в 1,8-1,9 раз. Однако и 80% прироста от установки второй видеокарты удается увидеть далеко не всегда. Используя вышеприведенные графики, мы теперь можем объяснить, почему так происходит.
Возьмем график 3 и, добавив несколько линий, покажем как это можно сделать.


График 4

Как и прежде, зеленая, коричневая и красная линии соответствуют результатам, показываемым видеокартой, в разных графических режимах в зависимости от частоты центрального процессора. Прямая линия синего цвета обозначает «линию максимальных результатов», которая является следствием ограничения производительности со стороны центрального процессора. Серые двухсторонние стрелки показывают теоретически возможный прирост при наращивании производительности видеоподсистемы. Как легко заметить, для красной линии «запас прироста» минимален, поскольку она и так практически совпадает с синей прямой. Поэтому, при увеличении мощности видеоподсистемы с помощью технологий SLI или CrossFire, мы увидим минимальное увеличение производительности или не увидим его. Для коричневой линии, соответствующей более тяжелому графическому режиму, «запас прироста» несколько больше, но все равно меньше, чем теоретический предел 80-90% ( 120 fps + 80% ~ 220 fps, а мы получаем примерно лишь 150 fps). Наиболее благоприятная ситуация складывается для самого тяжелого графического режима – 4AA/16AF в разрешении 1600х1200. В этом случае «запас прироста» еще больше и связка из двух видеокарт может проявить себя в полную силу. Как видите, для полноценного раскрытия потенциала технологий SLI и CrossFire требуется мощный центральный процессор (при движении вправо по оси Х «запас прироста» увеличивается), а также тестирование в тяжелых графических режимах.

Конечно, все эти выводы были интуитивно понятны еще в момент анонса технологий объединения производительности видеокарт, мы лишь наглядно показали, где искать этот прирост.

Наверное, у вас возник вопрос – а что на графике делают оранжевые пунктирные линии? Предположим, что нижняя из двух пунктирных линий - это результаты, показанные в еще более тяжелом графическом режиме (скажем, 4AA/16AF в разрешении 2048x1536). Верхняя пунктирная линия проведена на уровне, который на 80% выше, то есть соответствует производительности двух видеокарт в SLI или CrossFire (нижняя пунктирная стрелка). А что же тогда показывает верхняя пунктирная стрелка? Разумеется, она показывает оставшийся «запас прироста», который может быть реализован, например, с помощью… Quad SLI. Как видите, поиски реального прироста производительности в этом случае требуют еще более тяжелого графического режима и, конечно же, мощного центрального процессора. (Замечание – приведенный для Quad SLI пример не отражает реальных значений производительности данной связки видеокарт и лишь иллюстрирует то, что подходы, рассматриваемые в статье, с успехом могут быть применены и к таким видеорешениям).

Проверка полученных выводов на других 3D-приложениях

До сих пор мы проводили все наши рассуждения на примере лишь одного 3D-приложения, а именно – игры Half-Life 2 с демо-сценой «d1_canals_09 3dnews02». Насколько выводы, полученные нами, справедливы в других приложениях? Давайте проверим. Ниже мы приведем еще два сводных графика, подобных графику 2, но для игр DOOM 3 и F.E.A.R., с использованием встроенных в эти игры демок.


График 5

Как видите, общая картина очень напоминает ту, что мы видели в Half-Life 2. Разумеется, абсолютные значения FPS другие, но общий характер поведения линий сохраняется.


График 6

Игра F.E.A.R. настолько «тяжела», что даже при использовании довольно мощной видеокарты 7800GTX, мы практически сразу получаем горизонтальные «полочки», причем в режимах NO AA/AF, то есть без включения полноэкранного сглаживания и анизотропной фильтрации. Поэтому, для поиска «линии максимально возможных результатов» пришлось использовать самое низкое из доступных разрешений – 640х480 (темно-зеленая линия на графике). Что касается более высоких разрешений, то некоторая «корявость» линий связана с тем, что встроенный в игру F.E.A.R. тест выдает целочисленные значения, что при небольших абсолютных значениях дает заметную относительную погрешность.

Ну и наконец – популярнейшие синтетические тесты семейства 3DMark. Для примера мы взяли 3DMark’05.


График 7

Как оказалось, с ростом частоты центрального процессора, результаты видеокарты GeForce 7800GTX (зеленая линия) при стандартных настройках 3DMark’05 превращаются в «полочку». Согласно полученному нами «критерию корректного сравнения производительности видеокарт» это означает, что производительность GeForce 7800GTX в этом тесте определена верно. А значит, корректно будет сравнивать и более «слабые» видеокарты с помощью 3DMark’05.

Думаю, теперь понятно, почему мы не стали приводить здесь результаты, полученные в 3DMark’06. Поскольку в этот бенчмарк включены тесты CPU, то мы не сможем получить горизонтальную «полочку» результатов на графике процессорозависимости, а значит корректное сравнение производительности видеокарт остается под вопросом.

Возвращаемся к графику 7. Для того, чтобы найти «линию максимальных результатов» в этом тесте мы использовали видеокарту Radeon X1900XTX (поскольку 3DMark’05 благоволит Radeon’ам), и тестировали в разрешении 320х240 (прочие настройки теста не менялись). Получившаяся красная линия хотя и не является геометрической прямой, тем не менее вполне подходит на роль «линии максимальных результатов». Как видите, с использованием процессора Athlon 64 4000+, работающего на частоте 2400 МГц, максимальное количество «марков» находится на уровне около 12000, или 12500, если следовать аппроксимирующей кривой. До сих пор ни одна протестированная нами система (7900GTX-SLI, CrossFire, Quad-SLI) не преодолела рубеж в 12000 «марков» в тесте 3DMark’05 на используемом нами стенде, что подтверждает сделаные нами выводы.

Следующая страница → ← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
За 2024 год в Steam вышло на 30 % больше игр, чем за прошлый — это новый рекорд 55 мин.
«Яндекс» закрыл почти все международные стартапы в сфере ИИ 2 ч.
Создатели Escape from Tarkov приступили к тестированию временного решения проблем с подключением у игроков из России — некоторым уже помогло 3 ч.
Веб-поиск ChatGPT оказался беззащитен перед манипуляциями и обманом 4 ч.
Инвесторы готовы потратить $60 млрд на развитие ИИ в Юго-Восточной Азии, но местным стартапам достанутся крохи от общего пирога 4 ч.
Selectel объявил о спецпредложении на бесплатный перенос IT-инфраструктуры в облачные сервисы 5 ч.
Мошенники придумали, как обманывать нечистых на руку пользователей YouTube 6 ч.
На Открытой конференции ИСП РАН 2024 обсудили безопасность российского ПО и технологий искусственного интеллекта 6 ч.
Российские торговые площадки назвали самые продаваемые игры в преддверии новогодних праздников 6 ч.
Linux Foundation сократила расходы на разработку ядра Linux до $6,8 млн, 7 ч.