Сегодня 26 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

IBM разработала энергоэффективный аналоговый процессор для ИИ

IBM создала процессор для ИИ на аналоговой основе с низким энергопотреблением. Этот прорыв может решить проблему высокого энергопотребления, характерную для больших языковых моделей, таких как ChatGPT.

 Источник изображения: ColiN00B / Pixabay

Источник изображения: ColiN00B / Pixabay

Большие языковые модели, стоящие за такими технологиями, как ChatGPT, невероятно сложны. Они содержат миллиарды вычислительных узлов и требуют множества соединений между ними. Это приводит к множественным обращениям к памяти и высокому энергопотреблению.

Один из способов решения этой проблемы — комбинирование памяти и блоков обработки данных. IBM и Intel уже разработали чипы, в которых каждому нейрону предоставляется необходимая память для выполнения своих функций. Альтернативой такому подходу является выполнение операций прямо в памяти, что было продемонстрировано с использованием фазово-изменяемой памяти (phase-change memory).

IBM продемонстрировала новый чип на основе фазово-изменяемой памяти, который ближе к функциональному процессору ИИ. В статье, опубликованной в Nature, компания показала, что её аппаратное обеспечение может выполнять распознавание речи с приемлемой точностью и значительно меньшим энергопотреблением.

Фазово-изменяемая память находится в разработке уже довольно долго. Она сочетает в себе долговечность флеш-памяти и производительность, сравнимую с существующей оперативной памятью. Эта память работает на основе нагрева небольшого участка материала и контроля скорости его охлаждения.

Такое поведение оказалось идеальным для нейронных сетей. В нейронных сетях каждый узел получает входной сигнал и, основываясь на своём состоянии, определяет, сколько этого сигнала передать дальше. Благодаря свойствам фазово-изменяемой памяти, эту силу можно представить в виде отдельного бита памяти, работающего в аналоговом режиме.

Когда мы сохраняем информацию, она использует два основных состояния — включено и выключено. Эти состояния созданы таким образом, чтобы минимизировать ошибки при сохранении данных. Однако интересно то, что мы можем настроить эту память так, чтобы она принимала любое промежуточное значение между «включено» и «выключено», создавая аналоговое поведение.

Это похоже на регулировку громкости музыки — от низкой до высокой, где каждый уровень громкости представляет собой плавный градиент потенциальных значений. Таким образом, мы можем использовать эти промежуточные значения для отображения разной «силы» или важности связей в нейронных сетях.

IBM уже демонстрировала эффективность этого подхода. Однако описанный чип гораздо ближе к функциональному процессору. Он содержит всю необходимую начинку для соединения отдельных узлов и работает на масштабе, приближенном к большим языковым моделям.

Основным компонентом нового чипа является так называемая плитка — это массив крестовин (представьте себе квадратную сетку) из отдельных битов фазово-изменяемой памяти размером 512 на 2 048 единиц. Каждый чип содержит 34 таких плитки, что равно примерно 35 млн бит фазово-изменяемой памяти.

Гибкость работы процессора позволяет контролировать силу любого соединения переменным числом битов. Кроме того, возможна коммуникация между чипами, что позволяет разделять большие задачи между несколькими чипами.

Для демонстрации работы исследователи использовали процессор для распознавания речи. В результате он смог выполнить 12,4 трлн операций на каждый ватт потребляемой мощности на пике своей производительности. Это во много раз меньше, чем потребляемая мощность традиционного процессора для выполнения эквивалентных операций.

Однако стоит отметить, что он оптимизирован для работы только с определённым типом нейронных сетей. Также он не очень подходит для обучения ИИ, и процесс обучения нейронной сети должен быть адаптирован под этот процессор. Несмотря на то, что этот процессор не является универсальным для ИИ, он предлагает значительное снижение энергопотребления.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Киберпанковый слешер Ghostrunner 2 стал новой бесплатной игрой в Epic Games Store — раздача доступна в России и продлится всего 24 часа 9 мин.
Activision сыграет в кальмара: новый трейлер раскрыл, когда в Call of Duty: Black Ops 6 стартует кроссовер со Squid Game 2 42 мин.
«К чёрту Embracer Group»: неизвестный устроил утечку исходного кода Saints Row IV 3 ч.
Отечественная платформа Tantor повысит производительность и удобство работы с СУБД на базе PostgreSQL 6 ч.
В Steam вышла новая демоверсия голливудской стратегии Hollywood Animal от авторов This is the Police 6 ч.
IT-холдинг Т1 подал иск к «Марвел-Дистрибуции» в связи с уходом Fortinet из России 7 ч.
Рождественское чудо: в открытый доступ выложили документы Rockstar начала 2000-х, включая планы на GTA Online от 2001 года 7 ч.
«Битрикс24» представил собственную ИИ-модель BitrixGPT 8 ч.
За 2024 год в Китае допустили к релизу более 1400 игр — это лучший результат за последние пять лет 8 ч.
Google применила конкурирующего ИИ-бота Anthropic Claude для улучшения своих нейросетей Gemini 9 ч.
Китайский автопроизводитель GAC представил гуманоидного робота GoMate с 38 степенями свободы 18 мин.
Главный конкурент Tesla запустил разработку человекоподобных роботов 33 мин.
Omdia: быстрый рост спроса на TPU Google ставит под вопрос доминирование NVIDIA на рынке ИИ-ускорителей 2 ч.
Российскую игровую приставку собрались построить на процессоре «Эльбрус», для которого не существует игр 3 ч.
Ubitium придумала универсальный процессор — он один выполняет работу CPU, GPU, FPGA и DSP 3 ч.
Equinix предложил ИИ-фабрики на базе систем Dell с ускорителями NVIDIA 4 ч.
NASA показало «рождественскую ель» галактического масштаба 4 ч.
Китайский оператор ЦОД Yovole может выйти на IPO в США — после неудавшейся попытки в Китае 4 ч.
Patriot представила SSD P400 V4 PCIe 4.0 — до 4 Тбайт и до 6200 Мбайт/с 5 ч.
OnePlus представила доступные флагманы Ace 5 и Ace 5 Pro со Snapdragon, большими экранами и до 16 Гбайт ОЗУ 5 ч.