Сегодня 18 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → qwen-vl

Alibaba выпустила ИИ-модели, которые могут распознавать изображения и вести диалог

Китайский технологический гигант Alibaba представил две языковые модели — Qwen Large Vision Language Model (Qwen-VL) и Qwen-VL-Chat — демонстрирующие расширенные возможности интерпретации изображений и ведения диалогов на естественном языке. Учитывая растущий спрос на доступ к продвинутым ИИ-алгоритмам, появление языковых моделей Alibaba может оказаться весьма своевременным.

 Источник изображения: maginative.com

Источник изображения: maginative.com

Представленные языковые модели не ограничиваются понимаем текстовых сообщений. Qwen-VL способен воспринимать и понимать изображения, текст и соблюдать ограничения. Алгоритм может обрабатывать запросы, связанные с разными изображениями, и генерировать ответы на них. Qwen-VL-Chat предназначен для более сложного взаимодействия. Например, он может сравнивать несколько изображений, отвечать на серии вопросов, писать истории на основе предоставленных пользователем картинок. К примеру, пользователь может спросить ИИ о местоположении больницы по фото её вывески и получить точный ответ на этот вопрос.

Одно из преимуществ представленных языковых моделей состоит в том, что они работают с высокой точностью. По данным Alibaba, Qwen-VL значительно превосходит существующие схожие языковые модели с открытым исходным кодом по нескольким критериям оценки английского языка. Алгоритм также поддерживает новую функцию «общение с чередованием нескольких изображений», которая предполагает, что пользователь предоставит ИИ несколько изображений, после чего будет задавать связанные с ними вопросы.

Используя стандартные эталоны, специалисты Alibaba оценили возможности новых алгоритмов при выполнении разных задач, начиная от генерации комментариев к изображениям и заканчивая ответами на вопросы по загруженным снимкам. Обе модели также тестировались по разработанному в Alibaba эталону, который основан на оценке GPT-4 для определения диалоговых возможностей и соответствия человеческому восприятию. Отмечается, что Qwen-VL и Qwen-VL-Chat достигли наилучших результатов в разных категориях.

Alibaba стала одной из первых китайских компаний, представивших конкурентоспособную систему генеративного ИИ, что свидетельствует о быстром прогресс исследований в сфере нейросетей в Поднебесной. Выпуская модели с открытым исходным кодом, Alibaba гарантирует, что исследователи, учёные и компании по всему миру смогут использовать их для создания собственных приложений, не прибегая к трудоёмкому и дорогостоящему процессу обучения нейросетей с нуля.


window-new
Soft
Hard
Тренды 🔥
В Android вернётся переключатель «Не беспокоить» для тех, кому не понравились «Режимы» 36 мин.
Автор Loretta раскрыл дату выхода новой игры — хоррор-стратегии Anoxia Station про погоню за нефтью в недрах умирающей Земли 2 ч.
Создатели кинематографичного боевика Spine в духе «Джона Уика» заинтриговали игроков тизером хардкорного режима — новый геймплейный трейлер 2 ч.
Цифровой белорусский рубль «полноценно» заработает во второй половине 2026 года 3 ч.
Google вживую продемонстрировала возможности Android XR 3 ч.
Премьера аддона A Pirate’s Fortune, дата выхода на Switch 2 и бесплатное демо: Ubisoft разразилась новостями о Star Wars Outlaws 4 ч.
Взрывной геймплейный трейлер Painkiller порадовал фанатов демонстрацией нового и классического адского оружия 5 ч.
WhatsApp перенял ещё одну «фишку» Telegram — пользовательские наборы стикеров 5 ч.
Повышение цен сработало: квартальная выручка Netflix подскочила до $10,5 млрд 5 ч.
AWS: облако Azure лишится половины нагрузок, как только Microsoft ослабит политику лицензирования своего ПО 6 ч.
Китайская EHang пообещала запустить сервис летающих такси по разумной цене до конца года 4 мин.
$278 млрд налогов недоплатила «Кремниевая шестёрка» IT-гигантов благодаря лазейкам в законе 5 мин.
Tesla урезала производство пикапов Cybertruck, потому что их почти никто не покупает 34 мин.
Curiosity нашёл свидетельства того, что в древности на Марсе могла быть жизнь 57 мин.
В Индии представили ароматизированный смартфон Infinix Note 50s 5G+ 2 ч.
Трамповские тарифы могут стоить США лидерства в ИИ и возрождения производства чипов 2 ч.
ИИ-мегапроект Stargate может прийти в Великобританию и Евросоюз, но только в случае успеха в США 2 ч.
AMD выпустила DPU Pensando Pollara 400 для ИИ-инфраструктур с поддержкой Ultra Ethernet 3 ч.
Массовый выпуск серверных процессоров на предприятиях в России начнётся не раньше 2030 года 3 ч.
Apple продолжает терять китайский рынок — компания скатилась на пятое место с долей в 13,7 % 3 ч.