Сегодня 08 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

NVIDIA представила свою ИИ-модель для превращения текста в видео под названием VideoLDM, разработанную в сотрудничестве с исследователями из Корнельского университета. Модель способна генерировать видео в разрешении до 2048 × 1280 пикселей с частотой 24 кадра и длительностью до 4,7 секунд на основе текстового описания.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

В основе модели лежат наработки нейросети Stable Diffusion. Решение NVIDIA имеет до 4,1 млрд параметров, но только 2,7 млрд из них использовали видео для тренировки. Это весьма скромно по меркам современных ИИ. Тем не менее, с помощью эффективного подхода к модели скрытой диффузии (LDM — Latent diffusion model) разработчики смогли создавать разнообразные и согласованные во времени видео высокого разрешения с весьма высоким качеством.

Исследователи выделяют следующие особенности данной модели: генерацию персонализированного видео и свёрточный синтез во времени. Временные слои, которые были обучены в VideoLDM для превращения текста в видео, вставляются в опорные сети LDM изображений, которые заранее точно настроены в наборе изображений DreamBooth. Временные слои обобщаются контрольными точками DreamBooth, что позволяет персонализировать преобразование текста в видео. Применяя изученные временные слои сверточно во времени, можно получить клипы чуть большей продолжительности с незначительным ухудшением качества.

Модель также способна генерировать видео сцен вождения. Видеоролики имеют разрешение 1024 × 512 точек и длительностью до 5 минут. Есть возможность моделирования конкретного сценария вождения, когда за основу берутся ограничивающие рамки для создания интересующей обстановки, синтезируется соответствующий начальный кадр, а затем создаются правдоподобные видеоролики. Помимо этого, модель может сделать мультимодальное прогнозирование сценариев движения, сгенерировав несколько правдоподобных развертываний на основе одного начального кадра.

Данная исследовательская работа является участником Конференции по машинному зрению и распознаванию образов, которая проходит в Ванкувере с 18 по 22 июня. Пока что представленная нейросеть является лишь исследовательским проектом и не ясно, когда что-то подобное NVIDIA выпустит в открытый доступ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Microsoft запатентовала технологию защиты от «визуального взлома» с помощью отслеживания взгляда 22 мин.
«Это был крупный провал»: создатель Okami рассказал, что пошло не так 42 мин.
Ещё капельку: Бирмингем дал Oracle ещё £10 млн на поддержку провального внедрения ERP Fusion, которое уже обошлось в £100+ млн 2 ч.
Создатели «Смуты» взялись за работу над прототипами новых игр 4 ч.
Бывший эксперт AMD по трассировке лучей поможет сделать компьютерные чипы Qualcomm пригодными для игр 5 ч.
Аниматор «засветил» неанонсированный ремейк от издателя Borderlands, BioShock и Mafia — фанаты теряются в догадках 6 ч.
Microsoft добавила в «Блокнот» проверку орфографии и автокоррекцию — через 40 лет после релиза 6 ч.
Telegram оштрафовали на 3 млн рублей за неудаление запрещённой в РФ информации 8 ч.
Что-то кончается, что-то начинается: Piranha Bytes всё-таки закрылась, а создатель Elex основал новую студию 9 ч.
Replaced порадует фанатов «проработанных мрачных миров и крутых стильных боёв» — ретрофутуристический экшен-платформер впечатлил журналистов 10 ч.
Gigabyte представила 27-дюймовый игровой монитор M27UA с 4K и 160 Гц 2 ч.
Asus анонсировала мини-ПК NUC 14 Pro Plus на базе процессоров Intel Core Ultra 100 2 ч.
NASA закончило симуляцию экспедиции на Марс — все исследователи живы и здоровы после года в полной изоляции 4 ч.
Google отказалась от углеродно-нейтрального статуса ради достижения реальных нулевых выбросов к 2030 году 5 ч.
Samsung рассказала об обновлённом датчике BioActive для будущих смарт-часов Galaxy Watch 5 ч.
Космический телескоп NASA NEOWISE для фотоохоты на астероиды скоро завершит работу и сгорит в атмосфере 6 ч.
«Лаборатория Касперского» представила единое решение для построения безопасных распределённых промышленных сетей 6 ч.
В России многократно выросли продажи отечественных мониторов, но доминирует на рынке Acer 7 ч.
Учёные создали 2D-кулер для квантовых компьютеров — он обеспечит температуру ниже, чем в открытом космосе 8 ч.
Всего за год «Сбер» захватил 5,2 % российского рынка телевизоров и обогнал «Яндекс» 9 ч.