Оригинал материала: https://3dnews.ru./1085552

«Сбер» представил нейросеть GigaChat, но мемы тут ни при чём

«Сбер» сообщил о разработке собственной мультимодальной нейросети GigaChat (не путать с «Гигачадом» — популярным мемом), которая способна отвечать на вопросы пользователей, поддерживать диалог, писать программный код, создавать тексты и изображения на основе описаний в рамках единого контекста и, в отличие от иностранных сетей, более грамотно общается на русском языке. На первом этапе GigaChat доступна в режиме тестирования по приглашениям.

 Источник изображения: Сбер

Источник изображения: Сбер

Архитектура GigaChat основана на ИИ-платформе NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающей различные нейросетевые модели и метод supervised fine-tuning, reinforcement learning with human feedback. Такая комбинация обеспечивает способность GigaChat поддерживать беседу, писать тексты, отвечать на фактологические вопросы, а имеющаяся в ансамбле модель Kandinsky 2.1 делает возможным создание изображений по их текстовому описанию.

«Сбер» сообщил, что входящая в состав NeONKA модель ru-GPT 3.5 с 13 млрд параметров будет выложена в открытый доступ в целях ускорения развития сообщества Open Source и технологий в области искусственного интеллекта, что позволит студентам, учёным и разработчикам использовать её в своей работе.

Возможности новой ИИ-модели будут задействованы в виртуальном ассистенте «Салют» и прочих продуктах «Сбера». Сообщается, что первую версию платформы NeONKA оптимизировали по размеру и скорости для применения в высоконагруженных сервисах.

В разработке модели принимают участие команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов. Обучение нейросети выполнялось на суперкомпьютере Christofari Neo. В настоящее время модель работает в режиме закрытой бета-версии. Для участия в её бесплатном тестировании необходимо вступить в закрытое сообщество в Telegram-канале. В дальнейшем GigaChat будет доступна через облачное API для разработчиков и бизнеса.



Оригинал материала: https://3dnews.ru./1085552