Сегодня 19 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Поумневшие ИИ-модели OpenAI o3 и o4-mini проявили повышенную склонность к галлюцинациям 2 ч.
EA показала суровую тактическую стратегию Star Wars Zero Company от ветеранов XCOM — первый трейлер и подробности 2 ч.
Новая статья: South of Midnight — соткана по лекалам. Рецензия 15 ч.
Спустя восемь лет «беты» Escape from Tarkov взяла курс на версию 1.0 — план обновлений игры на 2025 год 17 ч.
Создатели следующей Battlefield рассказали о новом «языке разрушения» и показали его в деле 19 ч.
Глава Microsoft Gaming Фил Спенсер намекнул на продолжение Indiana Jones and the Great Circle 19 ч.
Разработчики Everspace 2 решили снизить цену на дополнение Wrath of the Ancients, потому что «вокруг дорожает буквально всё» 21 ч.
Google обжалует «неблагоприятное» решение суда о признании её монополистом в интернет-рекламе 21 ч.
84 % россиян выходят в интернет каждый день, подсчитал Mediascope 21 ч.
Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference 23 ч.