Сегодня 10 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Почти 30 % детей в России играют в игры, которые не подходят им по возрасту 2 ч.
Роскомнадзор не собирается блокировать Steam и не видит оснований для снятия ограничений с Discord 2 ч.
Изометрический ролевой экшен «Былина» отправит игроков в эпическое приключение по миру славянских мифов — трейлер и детали 3 ч.
Гендиректора Gotbit Алексея Андрюнина задержали в Португалии по запросу США 3 ч.
В Windows 11 станет удобнее работать с ключами доступа — ОС получит облачную синхронизацию и интеграцию с 1Password 4 ч.
Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях 5 ч.
Оригинальную версию стратегии Age of Empires III сняли с продажи в Steam, доступ к мультиплееру закроется 30 октября 6 ч.
Данные более 5 млн клиентов Burger King слили в открытый доступ 7 ч.
Selectel запустил бета-тестирование собственной инференс-платформы для ускорения запуска ИИ-моделей 7 ч.
«Яндекс» выпустил самостоятельное приложение для «Алисы», научил её рисовать и пообещал много новых функций с ИИ 7 ч.
AMD представила серверные процессоры EPYC 9005: до 128 ядер Zen 5 у Turin Classic и до 192 ядер Zen 5c у Turin Dense 16 мин.
«Гравитон» представила огромный моноблок 31,5-дюймовым экраном и чипами Intel Core 42 мин.
Все кулеры Noctua, выпущенные с 2005 года, получат поддержку Intel LGA 1851 60 мин.
Selectel представила первые российские серверы на базе Intel Xeon Sierra Forrest и Granite Rapids 2 ч.
Владелец TikTok представил свои первые беспроводные наушники Ola Friend — у них есть ИИ-помощник 2 ч.
Corsair и Activision представили геймерские ПК и периферию по мотивам Call of Duty 2 ч.
TensorWave привлёк $43 млн на закупу ускорителей AMD Instinct MI300X для своего ИИ-облака, в том числе от самой AMD 3 ч.
Intel мельком показала чипы Core Ultra 200H и 200HX для мощных игровых ноутбуков нового поколения — они выйдут только в 2025 году 3 ч.
Intel представила настольные процессоры Core Ultra 200S — они медленнее предшественников в играх 3 ч.
Microsoft представила золотую Xbox Series X в стиле Индианы Джонса к выходу игры Indiana Jones and the Great Circle 3 ч.