Сегодня 03 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → генератор изображений

«Сбер» научил нейросеть Kandinsky генерировать стикеры и фотореалистичные изображения и портреты

«Сбер» представил новую версию своей нейросети для генерации изображений по текстовому описанию — Kandinsky 2.2, которая позволит создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации, а также обеспечит значительный прирост качества при создании портретов.

 Генерация Kandinsky 2.2           Источник изображений: «Сбер»

Генерация Kandinsky 2.2. Источник изображений: «Сбер»

Для дообучения Kandinsky 2.2 использовался набор данных из 1,5 млрд пар «текст — изображение», что на 300 млн больше, чем для предыдущей версии — Kandinsky 2.1, вышедшей в апреле этого года и набравшей всего за 6 дней 2 млн пользователей.

Новую версию модели научили создавать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также благодаря внедрению специального структурного блока управляемых изменений ControlNetона она получила способность изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя при этом композицию исходной иллюстрации.

 Генерация Kandinsky 2.2

Генерация Kandinsky 2.2

Согласно пресс-релизу, Kandinsky 2.2 понимает запросы на русском и английском языках, обладает способностью рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, а также дорисовывать недостающие части картинки (inpainting) и создавать картины в режиме бесконечного полотна (outpainting).

 Стикерпак от Kandinsky 2.2

Стикерпак от Kandinsky 2.2

«Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации», — сообщил первый зампред правления Сбербанка Александр Ведяхин, добавив, что, как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе, и протестировать её можно совершенно бесплатно.

Сообщается, что ознакомиться с возможностями Kandinsky 2.2 можно на промостранице модели, на платформе FusionBrain.AI, в Telegram-боте и боте соцсети «ВКонтакте», а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют. Модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.

Разработкой и обучением нейросети занимались исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

ИИ-генератор изображений Microsoft Designer вышел в открытый доступ

Основанный на алгоритмах искусственного интеллекта генератор изображений Microsoft Designer стал общедоступной платформой, испробовать которую может любой желающий — достаточно войти в свой аккаунт системы Microsoft.

 Источник изображения: designer.microsoft.com

Источник изображения: designer.microsoft.com

Работа с Microsoft Designer начинается либо с загрузки собственного изображения, либо с генерации картинки по описанию. Есть также возможность создать слайд с заданным текстом в соответствии с набором шаблонов. Поддерживаются функции редактирования: перед получением окончательного результата можно внести в макет некоторые правки, например, изменить размер или начертание текста. При изменении размера картинки макет подстраивается под новый формат.

Microsoft Designer создан с расчётом на экспорт в социальные сети: шаблоны оптимизированы для выгрузки в Instagram и Facebook — всего около 20 платформ. Нейросеть может помочь в создании описания загруженного пользователем изображения, подобрать хештеги для него или произвести публикацию прямо из Designer.

Генерируемые ИИ изображения сегодня являются своеобразным «Диким Западом» с позиции авторского права — оно признается только в той части работы, которую совершает человек. Любопытно, что Microsoft разделяет эту позицию, заявляя, что не претендует ни на авторство контента, загружаемого пользователями, ни на авторство генерируемых изображений. Корпорация не ограничивает пользователей в коммерциализации этих изображений и, вместе с тем, возлагает на них всю ответственность за принимаемые ими решения по продаже таких картинок.

Microsoft планирует добавить Designer в браузер Edge наряду с инструментом Image Creator. При просмотре лент Twitter или Facebook в Edge и создании публикаций Designer может предложить дополнить их своими изображениями, чтобы оживить её. Кроме того, в планах Microsoft — новые функции редактирования изображений с ИИ. К примеру, можно будет убрать с головы человека корону или заменить её бейсболкой. Появится также функция смены фона, аналогичная той, что уже есть в Adobe Photoshop. Наконец, Microsoft Designer будет работать по freemium-модели: некоторые возможности станут доступными только для подписчиков Microsoft 365.

2 млн пользователей за 6 дней: нейросеть «Сбера» Kandinsky 2.1 оказалась среди самых быстрорастущих сервисов мира

Стало известно, что бесплатная генеративная модель Kandinsky 2.1, презентация которой состоялась ранее в этом месяце, стала одним из самых быстрорастущих сервисов искусственного интеллекта в мире. Она способна генерировать красочные картинки по текстовому описанию пользователя, а также поддерживает возможность создания работ в разных стилях.

Результат работы алгоритма Kandinsky 2.1 по запросу

Результат работы алгоритма Kandinsky 2.1 по запросу «современный художник за работой»

Разработчики сообщили, что алгоритму Kandinsky 2.1 потребовалось всего четыре дня, чтобы достичь отметки в 1 млн уникальных пользователей. Любопытно, что это на один день быстрее результата чат-бота ChatGPT компании Open AI. Согласно имеющимся данным, с момента запуска алгоритма было сгенерировано свыше 10 млн изображений, а число уникальных пользователей достигло 2 млн человек. Также отмечается, что на прошлой неделе алгоритм Kandinsky 2.1 попал в топ-5 трендов мировых репозиториев по версии сервиса GitHub.

Напомним, алгоритм Kandinsky 2.1 может генерировать изображения по их текстовому описанию на естественном языке. Модель поддерживает обработку запросов на 101 языке и готова открыть для пользователей новые творческие возможности, включая смешивание нескольких рисунков, дорисовку изображений, создание картин в режиме бесконечного полотна и др. Разработкой и обучением алгоритма занимались специалисты Sber AI совместно с учёными из Института искусственного интеллекта AIRI на объединённом дата-сете Sber AI и компании SberDevices. Kandinsky 2.1 содержит 3,3 млрд параметров вместо 2 млрд параметров в предыдущей версии алгоритма.


window-new
Soft
Hard
Тренды 🔥
GTA V вернётся в Game Pass, причём совсем скоро — впервые игра будет доступна в PC Game Pass 4 мин.
ZA/UM отреагировала на утечку «одиночной кооперативной игры» Locust City во вселенной Disco Elysium 5 мин.
Amazon включилась в борьбу за американский бизнес TikTok 26 мин.
«Яндекс» представил «Нейроэксперта» — ИИ, который соберёт базу знаний по ссылкам и файлам пользователя 2 ч.
«Хуже моего самого страшного кошмара»: утечка геймплея с тестирования новой The Sims ужаснула фанатов 2 ч.
Самые полные издания Borderlands 3 и Diablo III добавят в Game Pass, а лучшая игра 2024 года по версии 3DNews подписку скоро покинет 13 ч.
«Эпический» сериал Netflix по Assassin’s Creed впервые за несколько лет подал признаки жизни 14 ч.
Спустя 10 лет после релиза Enter the Gungeon получит «крупнокалиберный сиквел» — первый трейлер и подробности Enter the Gungeon 2 16 ч.
«Наш контент бесплатный, а инфраструктура — нет»: ИИ-боты разоряют «Википедию» 17 ч.
Nintendo поднимет цены на игры раньше Take-Two с GTA VI — Mario Kart World для Switch 2 будет стоить $80 в «цифре» и $90 в рознице 17 ч.
Hyundai обновила водородомобиль Nexo: запас хода вырос до 700 км, а мощность — до 255 л.с. 7 мин.
Sony представила преемника «короля телевизоров» и обновила всю серию Bravia 21 мин.
Российского инженеры начали судить за кражу секретных технологий ASML для запуска производства чипов в России 27 мин.
Самый опасный в истории наблюдений астероид теперь угрожает Луне, а не Земле 47 мин.
Apple, Nvidia и Amazon под ударом: трампоские пошлины полностью перекроят технологическую отрасль 51 мин.
Российская WildTeam выступила генеральным проектировщиком ЦОД общей ёмкостью 350 МВт 59 мин.
Смартфон Poco M7 Pro 5G с чипом Dimensity 7025-Ultra поступил в глобальную продажу 2 ч.
Названа дата запуска первой партии интернет-спутников Amazon Project Kuiper — они полетят на ракете с российскими двигателями 3 ч.
Samsung резко нарастила поставки чипов в Китай, пока этому не мешают санкции 3 ч.
Western Digital выпустила HDD серии Purple Pro ёмкостью 26 Тбайт для систем видеонаблюдения 3 ч.