Сегодня 08 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Microsoft добавила в «Блокнот» проверку орфографии и автокоррекцию — через 40 лет после релиза 11 мин.
Google придумала, как в 13 раз ускорить обучение ИИ и снизить потребление энергии в 10 раз 3 ч.
Replaced порадует фанатов «проработанных мрачных миров и крутых стильных боёв» — ретрофутуристический экшен-платформер впечатлил журналистов 4 ч.
Олдскульный файтинг Blazing Strike в духе Super Street Fighter 2 Turbo и Fatal Fury спустя девять лет разработки получил дату выхода — игру делает один человек 5 ч.
Слишком много затрат и слишком мало пользы: аналитики Goldman Sachs не уверены в будущем ИИ 5 ч.
Mundfish заинтриговала игроков первыми кадрами из третьего дополнения к Atomic Heart 7 ч.
Продвинутая интеграция Siri и Apple Intelligence будет реализована только в следующем году 13 ч.
Сюжетный трейлер Metaphor: ReFantazio — ролевой игры от разработчиков Persona 20 ч.
За два дня боевик Zenless Zone Zero от создателей Genshin Impact скачали 50 млн раз 21 ч.
Разработчики ИИ стали переходить на компактные ИИ-модели — они дешевле и экономичнее 07-07 12:35
«Лаборатория Касперского» представила единое решение для построения безопасных распределённых промышленных сетей 2 мин.
В России многократно выросли продажи отечественных мониторов, но доминирует на рынке Acer 2 ч.
Учёные создали 2D-кулер для квантовых компьютеров — он обеспечит температуру ниже, чем в открытом космосе 2 ч.
Всего за год «Сбер» захватил 5,2 % российского рынка телевизоров и обогнал «Яндекс» 3 ч.
Nothing представила беспроводные наушники CMF Buds Pro 2 за €59 — автономность до 43 ч, шумоподавление и необычный чехол 4 ч.
Nothing представила круглые смарт-часы CMF Watch Pro 2 со сменными безелями за $69 5 ч.
Маркетплейсы стали основным местом покупки смартфонов в России 6 ч.
Oracle запустила второй облачный регион в Сингапуре 6 ч.
Компактный компьютер ASUS ExpertCenter PN43 оснащён двумя портами 2.5GbE 7 ч.
Индустриальная плата Biostar Biast-Pat оснащена процессором Intel Amston Lake 7 ч.