Сегодня 10 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → cdna 4

AMD объединит RDNA для игр и CDNA для ИИ-ускорителей в единую графическую архитектуру UDNA

В разговоре с порталом Tom’s Hardware старший вице-президент и генеральный менеджер группы вычислительных и графических решений AMD Джек Гуинь (Jack Huynh) сообщил, что компания снова планирует объединить свои графические архитектуры для игровых видеокарт и ускорителей вычислений. Это необходимо для масштабирования и удовлетворения потребностей разработчиков.

 Источник изображений: AMD

Источник изображений: AMD

Ранее сообщилось, что AMD решила сместить акцент с ограниченного сегмента флагманских видеокарт для энтузиастов на расширение присутствия в сегменте массовых моделей GPU. Однако в том же разговоре Гуинь сообщил, что архитектуры RDNA и CDNA в перспективе будут объединены.

В 2020 году AMD сообщила о разделении своих графических архитектур после GCN на RDNA (для игр) и CDNA (для дата-центров). Графическая архитектура CDNA начала использоваться в качестве основы для специализированных ускорителей Radeon Instinct, позже переименованных просто в Instinct. Хотя на тот момент разделение и оптимизация графических архитектур под определённые сценарии казалась оправданной, разработчикам стало сложно ориентироваться в этих оптимизациях. В результате компания решила снова унифицировать архитектуру.

«Часть большого изменения в AMD связана с тем, что сегодня у нас есть архитектура CDNA для ускорителей Instinct для дата-центов и архитектура RDNA для потребительских видеокарт. Они разветвлены. Двигаясь вперёд, мы их объединим в одну с названием UDNA. Это будет унифицированная архитектура, предназначенная как для Instinct, так и для потребительских решений. Благодаря этому объединению мы значительно упростим задачи для разработчиков, которым сегодня приходится выбирать с какой архитектурой работать», — заяви Гуинь.

Благодаря упрощению архитектуры разработчикам необходимо будет сосредоточить своё внимание только на одной системе, независимо от того, работают ли они с большими кластерами графических процессоров или одним игровым GPU.

Компания теперь также будет планировать разработки графических архитектур на три поколения вперёд (RDNA5, UDNA6 и UDNA7) с целью поддержания оптимизаций без необходимости сбрасывать их каждый раз, когда AMD меняет свою иерархию памяти.

AMD официально пока не объявляла о стратегии перехода на унифицированную графическую архитектуру UDNA. Когда это случится — с выходом RDNA 5 или позже — неизвестно. На самом деле, компания пока мало что рассказала и о будущей графической архитектуре RDNA 4, которая, как ожидается, должна стать основной видеокарт Radeon 8000.

AMD представила мощнейший ИИ-ускоритель MI325X с 288 Гбайт HBM3e и рассказала про MI350X на архитектуре CDNA4

Компания AMD представила на выставке Computex 2024 обновлённые планы по выпуску ускорителей вычислений Instinct, а также анонсировала новый флагманский ИИ-ускоритель Instinct MI325X.

 Источник изображений: AMD

Источник изображений: AMD

Ранее компания выпустила ускорители MI300A и MI300X с памятью HBM3, а также несколько их вариаций для определённых регионов. Новый MI325X основан на той же архитектуре CDNA 3 и использует ту же комбинацию из 5- и 6-нм чипов, но тем не менее представляет собой существенное обновление для семейства Instinct. Дело в том, что в данном ускорителе применена более производительная память HBM3e.

Instinct MI325X предложит 288 Гбайт памяти, что на 96 Гбайт больше, чем у MI300X. Что ещё важнее, использование новой памяти HBM3e обеспечило повышение пропускной способности до 6,0 Тбайт/с — на 700 Гбайт/с больше, чем у MI300X с HBM3. AMD отмечает, что переход на новую память обеспечит MI325X в 1,3 раза более высокую производительность инференса (работа уже обученной нейросети) и генерации токенов по сравнению с Nvidia H200.

Компания AMD также предварительно анонсировала ускоритель Instinct MI350X, который будет построен на чипе с новой архитектурой CDNA 4. Переход на эту архитектуру обещает примерно 35-кратный прирост производительности в работе обученной нейросети по сравнению с актуальной CDNA 3.

Для производства ускорителей вычислений MI350X будет использоваться передовой 3-нм техпроцесс. Instinct MI350X тоже получат до 288 Гбайт памяти HBM3e. Для них также заявляется поддержка типов данных FP4/FP6, что принесёт пользу в работе с алгоритмами машинного обучения. Дополнительные детали об Instinct MI350X компания не сообщила, но отметила, что они будут выпускаться в формфакторе Open Accelerator Module (OAM).

 Источник изображения: AnandTech

Источник изображения: AnandTech

ИИ-ускорители Instinct MI325X начнут продаваться в четвёртом квартале этого года. Выход MI350X ожидается в 2025 году. Кроме того, AMD сообщила, что ускорители вычислений серии MI400 на архитектуре CDNA-Next будут представлены в 2026 году.

AMD продемонстрировала ускоритель вычислений MI300X, который превосходит решение NVIDIA по объёму поддерживаемой памяти

В этот вторник глава AMD Лиза Су (Lisa Su) на специальном мероприятии предсказуемо продемонстрировала образец ускорителя вычислений MI300X, который начнёт поставляться клиентам до конца текущего года. По сравнению с конкурирующим решением NVIDIA H100, он обеспечивает поддержку до 192 Гбайт памяти против 120 Гбайт соответственно.

 Источник изображения: Getty Images, David Becker

Источник изображения: Getty Images, David Becker

В ходе демонстрации способностей ускорителей на базе MI300X была показана их способность работать с языковой моделью для искусственного интеллекта, содержащей 40 млрд параметров. Для сравнения, известная GPT-3 стартапа OpenAI располагает 175 млрд параметров. Как пояснила Лиза Су, языковые модели становятся значительно больше по этому критерию, поэтому разработчикам потребуется сразу несколько GPU для работы с одной моделью. Правда, за счёт поддержки большего объёма памяти AMD MI300X способен сократить потребность собственно в дополнительных ускорителях.

Поддержка архитектуры Infinity Architecture позволяет клиентам AMD объединять в одной системе до восьми ускорителей MI300X. Конкурирующие решения NVIDIA опираются на программную экосистему CUDA для разработки приложений, формирующих систему искусственного интеллекта, а AMD опирается на платформу ROCm, которая работает с открытой экосистемой моделей. Архитектурно MI300X опирается на вычислительные ядра с архитектурой Zen 4 и CDNA 3, дополняя их стеками памяти типа HBM3 общим количеством до восьми штук. Общее количество транзисторов на одной подложке ускорителя MI300X достигает 153 млрд штук. Решение AMD превосходит продукт NVIDIA и по пропускной способности памяти, которая достигает 5,2 Тбайт/с, а интерфейс Infinity Fabric обеспечивает передачу до 896 Гбайт информации в секунду.

Лиза Су впервые продемонстрировала ускоритель AMD Instinct MI300 с 146 млрд транзисторов

Рассказав об ускорителе вычислений Instinct MI300 в общих чертах ещё летом прошлого года, компания AMD только в рамках презентации на январской CES 2023 уточнила некоторые особенности компоновки и характеристики этого долгожданного решения, которое найдёт применение в серверном сегменте в текущем году. Чиплетная компоновка позволяет новинке объединять несколько разнородных кристаллов с общим количеством транзисторов 146 млрд штук.

 Источник изображения: AMD, YouTube

Источник изображения: AMD, YouTube

Как пояснила на презентации Лиза Су (Lisa Su), сложная компоновка Instinct MI300 позволяет разместить чиплеты не только рядом друг с другом, но и в несколько ярусов. Ускоритель впервые объединяет на одном чипе процессорные и «графические» ядра, причём для системы они считаются одним целым, обеспечивая и равноправный доступ к памяти типа HBM3, которая расположилась на общей подложке по соседству. Глава AMD справедливо назвала Instinct MI300 самым сложным чипом из когда-либо созданных компанией.

Было заявлено, что Instinct MI300 сочетает ядра с архитектурой CDNA 3 и 24 процессорных ядра с архитектурой Zen 4. Объём памяти типа HBM3 достигает 128 Гбайт. Образец ускорителя был продемонстрирован на сцене Лизой Су, это было его первым появлением на публике. Как пояснила глава компании, в конструкции этого чипа девять 5-нм кристаллов располагаются на четырёх 6-нм кристаллах, а по бокам расположены стеки с микросхемами памяти типа HBM3.

 Источник изображения: AMD, YouTube

Источник изображения: AMD, YouTube

По сравнению с Instinct MI250X, новинка обеспечивает в восемь раз более высокую производительность в вычислениях, при этом обеспечивая в пять раз более высокую энергоэффективность в задачах искусственного интеллекта. Использование Instinct MI300 позволяет сократить время обучения соответствующих систем с нескольких месяцев до нескольких недель, как пояснила Лиза Су, при этом существенно сокращая сопутствующие затраты на оплату электроэнергии. В лабораториях AMD образцы Instinct MI300 уже успешно работают, на рынке ускорители этой модели появятся во втором полугодии.


window-new
Soft
Hard
Тренды 🔥
Архив интернета взломали — похищены данные 31 млн пользователей 58 мин.
«Зона вот-вот поместится у вас в руках»: сборник S.T.A.L.K.E.R. Legends of the Zone Trilogy выйдет на Nintendo Switch раньше обещанного 2 ч.
Модерация Instagram и Threads вышла из-под контроля — баны за пустяки и несправедливые удаления аккаунтов 3 ч.
IT-революция в теннисе: Уимблдон заменит линейных судей на искусственный интеллект с 2025 года 3 ч.
R-Vision разместит на Московской бирже облигации на 500 млн рублей 12 ч.
Paradox не потеряла надежду бросить вызов The Sims, несмотря на провал с Life by You 12 ч.
Российская смартфонная ОС «Аврора» станет «гибридной» — добавится поддержка внешнего монитора, клавиатуры и мыши 13 ч.
Авторы стратегии Songs of Conquest в духе «Героев» объявили сроки релиза на консолях, Android и iOS и показали тизер скандинавской фракции 14 ч.
«Ремастер, о котором никто не просил»: геймплейный трейлер раскрыл дату выхода Goat Simulator Remastered 15 ч.
Необычная метроидвания в мире японских мифов The Spirit of the Samurai не заставит себя долго ждать — новый геймплей и дата выхода в Steam 15 ч.
Samsung запустит производство 2-нм чипов небольшими партиями в начале 2025 года — 1,4-нм техпроцесс тоже не за горами 45 мин.
Google снова показала квантовое превосходство — квантовые компьютеры стали ближе к практическому применению 2 ч.
Новая статья: Рановато будет: обзор маршрутизатора Banana Pi BPI-R4 и тесты Wi-FI 7 10 ч.
Новая статья: Обзор смартфона TECNO CAMON 30s Pro: красота без проводов 12 ч.
Cerebras отложит IPO: США опасаются, что Китай получит доступ к ИИ-суперчипам при посредничестве ОАЭ 13 ч.
Дженсен Хуанг: будущее за рассуждающим ИИ, но для этого необходимо в разы удешевить вычисления 14 ч.
Лёгкий и тонкий планшет Honor Pad X8a с 11-дюймовым экраном уже в продаже в России 15 ч.
Вперёд в прошлое: инженеры создали программно-механических роботов без электроники 15 ч.
Электромобили Fisker останутся без облака и обновлений — их невозможно подключить к сторонним серверам 15 ч.
Nintendo неожиданно представила новое устройство — настойчивый умный будильник за $99 16 ч.