Сегодня 26 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила большую языковую модель, которая отчасти превзошла GPT-4

Компания Alibaba Cloud анонсировала выпуск улучшенной версии своей большой языковой модели Qwen2.5. Новая нейросеть продемонстрировала превосходство над GPT-4 от OpenAI по некоторым параметрам, таким как логические рассуждения и понимание текста.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

По словам технического директора Alibaba Cloud Цзинжэня Чжоу (Jingren Zhou), новая модель демонстрирует значительные улучшения в области рассуждений, понимания кода и естественного языка по сравнению с предыдущей версией Qwen2.0. Согласно анализу платформы OpenCompass, проведённому в марте, модель Qwen2.5 превосходит GPT-4 от OpenAI по языковым и творческим возможностям. Однако она уступает в таких аспектах, как знания, логические рассуждения и математические способности.

Напомним, большие языковые модели (LLM), к которым относится и Qwen, используются в приложениях искусственного интеллекта. Они обучаются на огромных объёмах данных, чтобы затем генерировать ответы на запросы пользователей на естественном языке. После выхода ChatGPT в 2022 году, вызвавшего ажиотаж во всём мире, компания Alibaba представила Tongyi Qianwen в апреле 2023 года. А в октябре последовал выпуск обновлённой версии с расширенными возможностями понимания сложных инструкций, написания текстов, логических рассуждений и запоминания информации.

По сообщению Alibaba Cloud, сервисами ИИ на базе Qwen, такими как DingTalk (аналог Slack от Alibaba), уже воспользовались более 2,2 млн корпоративных пользователей. Кроме того, компания представила сообществу разработчиков ряд открытых моделей Qwen и модернизировала свою генеративную платформу Model Studio, добавив дополнительные средства для создания ИИ.

В Китае, как и во всем мире, наблюдается бум интереса к чат-ботам и моделям генеративного ИИ. Наряду с Alibaba свои решения выпустили Baidu и Tencent. Например, чат-бот Baidu Ernie к апрелю 2023 года привлёк более 200 млн пользователей после получения разрешения на публичное использование в августе 2022 года.

Компания Alibaba Cloud заявила, что её обновлённая языковая модель Qwen2.5 была развёрнута более чем в 90 000 компаниях разных отраслей, и она намерена дальше сотрудничать с клиентами и разработчиками для использования возможностей генеративного ИИ и внедрение этой технологии в разработку роботов-гуманоидов в Китае, где эти роботы смогут помогать на заводах и заменить ручной труд человека там, где это возможно.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Не думаю, что Nintendo это стерпит, но я очень рад»: разработчик Star Fox 64 одобрил фанатский порт культовой игры на ПК 9 ч.
Корейцы натравят ИИ на пиратские кинотеатры по всему миру 10 ч.
В Epic Games Store стартовала новая раздача Control — для тех, кто дважды не успел забрать в 2021 году 13 ч.
За 2024 год в Steam вышло на 30 % больше игр, чем за прошлый — это новый рекорд 14 ч.
«Яндекс» закрыл почти все международные стартапы в сфере ИИ 14 ч.
Создатели Escape from Tarkov приступили к тестированию временного решения проблем с подключением у игроков из России — некоторым уже помогло 15 ч.
Веб-поиск ChatGPT оказался беззащитен перед манипуляциями и обманом 16 ч.
Инвесторы готовы потратить $60 млрд на развитие ИИ в Юго-Восточной Азии, но местным стартапам достанутся крохи от общего пирога 17 ч.
Selectel объявил о спецпредложении на бесплатный перенос IT-инфраструктуры в облачные сервисы 18 ч.
Мошенники придумали, как обманывать нечистых на руку пользователей YouTube 18 ч.
Чтобы решить проблемы с выпуском HBM, компания Samsung занялась перестройкой цепочек поставок материалов и оборудования 2 ч.
Новая статья: Обзор и тест материнской платы Colorful iGame Z790D5 Ultra V20 7 ч.
Новая статья: NGFW по-русски: знакомство с межсетевым экраном UserGate C150 9 ч.
Криптоиндустрия замерла в ожидании от Трампа выполнения предвыборных обещаний 9 ч.
Открыт метастабильный материал для будущих систем хранения данных — он меняет магнитные свойства под действием света 11 ч.
Новый год россияне встретят под «чёрной» Луной — эзотерика ни при чём 14 ч.
ASRock выпустит 14 моделей Socket AM5-материнских плат на чипсете AMD B850 14 ч.
Опубликованы снимки печатной платы Nvidia GeForce RTX 5090 с большим чипом GB202 16 ч.
От дна океана до космоса: проект НАТО HEIST занялся созданием резервного космического интернета 16 ч.
OpenAI рассматривает возможность выпуска человекоподобных роботов 18 ч.