Оригинал материала: https://3dnews.ru./1115288

IBM дотянула оптоволокно до процессора — это в 80 раз ускорит обучение искусственного интеллекта

Последние двадцать лет вычисления и связь переходят на оптические интерфейсы. Это уже произошло на магистральных линиях связи, но всё ещё буксует в пределах центров по обработке данных и на уровне межчиповых и межкомпонентных связей в компьютерах. В идеале сигнал должен сразу исходить из процессора в виде оптических импульсов и дальше направляться либо в чип по соседству, либо в соседние стойки, зал и даже за его пределы. IBM выбрала этот путь.

 Источник изображений: IBM

Слот CPO для установки на чип внешнего оптического «кабеля». Источник изображений: IBM

Оптика выгодно отличается от меди (токопроводящих соединений) малым весом, дешевизной, низкими помехами (наводками), высокой скоростью передачи, малым потреблением энергии и, в целом, позволяет повысить пропускную способность без увеличения энергопотребления. Возможность использования оптических линий связи уже заложена во все последние стандарты Ethernet, а также в стандарты PCIe. Ближе всех к интеграции оптических линий в процессоры (ускорители) в своё время подошла компания Intel с платформой Light Peak. И хотя Intel давно свернула разработку этой платформы, идея не умерла и сегодня находит продолжение в новом оптическом интерфейсе Intel OCI (Open Compute Project Interconnect Link).

Сегодня настала очередь IBM сообщить о прорыве на направлении интегрированных в процессоры оптических интерфейсов. Как и Intel, интегрированная оптика IBM берёт своё начало в разработках по кремниевой фотонике, которые обе компании начали более 20 лет назад. Новый интегрированный интерфейс IBM называется co-packaged optics (CPO). Дословно это переводится как «соупакованная» или «комбинированная» оптика — дополнительный канал передачи данных. Он не заменяет проводную разводку на материнской плате и кабели внутри компьютера и между стойками, а дополняет их высокоскоростным и энергоэффективным интерфейсом.

В качестве проводника света для интерфейса CPO выбрано недорогое полимерное оптоволокно PWG (polymer optical waveguide). Компания представила рабочий прототип интерфейса (платформы) с оптоволокном PWG толщиной 50 мкм и готова масштабировать его до оптоволокна менее 20 мкм толщиной. Спецификации интерфейса CPO позволяют организовать обмен данными между чипами, платами и стойками, или, проще говоря, работать на расстоянии от нескольких сантиметров до сотен метров.

Если предложенное IBM техническое решение найдёт применение и понимание в отрасли, это приведёт к снижению затрат на масштабирование платформ генеративного искусственного интеллекта благодаря более чем пятикратному снижению энергопотребления по сравнению с электрическими соединениями среднего класса, одновременно увеличив длину соединительных кабелей в центрах обработки данных с одного до сотен метров.

Также можно ожидать ускорения обучения моделей искусственного интеллекта, что позволит разработчикам обучать большие языковые модели (LLM) в пять раз быстрее, чем при использовании обычных проводных интерфейсов. Технология CPO может сократить время, необходимое для обучения стандартной LLM, с трёх месяцев до трёх недель. Это также обеспечит прирост производительности за счёт использования более крупных моделей и большего количества графических процессоров, что сократит простой оборудования.

Наконец, технология CPO значительно повысит энергоэффективность центров обработки данных, сэкономив энергию, эквивалентную годовому потреблению 5000 домов в США, на одно обучение модели искусственного интеллекта.

«Поскольку генеративный ИИ требует всё больше энергии и вычислительных ресурсов, центры обработки данных должны развиваться, а комбинированная оптика может сделать их более перспективными, — сказал Дарио Хиль (Dario Gil), старший вице-президент и директор по исследованиям IBM. — Благодаря этому прорыву чипы завтрашнего дня будут передавать данные так же, как волоконно-оптические кабели передают информацию в центры обработки данных и из них, открывая новую эру более быстрых и устойчивых коммуникаций, способных справляться с рабочими нагрузками искусственного интеллекта будущего».

Подробную информацию о новом интерфейсе исследователи IBM изложили в статье, опубликованной на сайте arXiv.org. Новые оптические структуры с высокой плотностью пропускной способности, в сочетании с передачей нескольких длин волн по одному оптическому каналу, потенциально увеличат пропускную способность между чипами в 80 раз по сравнению с электрическими соединениями.

 Тестирование оптических интерфейсов IBM

Тестирование оптических интерфейсов IBM

Экспериментальная платформа прошла все необходимые стресс-тесты для производства. Компоненты подвергались воздействию высокой влажности и температур в диапазоне от −40 °C до +125 °C, а также испытаниям на механическую прочность, чтобы подтвердить, что оптические соединения могут изгибаться без разрушения или потери данных. Кроме того, исследователи продемонстрировали технологию PWG с шагом 18 мкм. Объединение четырёх блоков PWG с таким шагом позволит подключать до 128 каналов. В конечном итоге это обеспечит плотность передачи до 10 Тбит/мм².



Оригинал материала: https://3dnews.ru./1115288