Сегодня 18 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-генератор видео Veo 2, который создаёт двухминутные ролики в 4K

Подразделение Google DeepMind представило Veo 2 — основанный на искусственном интеллекте генератор видео нового поколения. Он создаёт видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в 4 раза превосходит OpenAI Sora по разрешению и в 6 раз — по продолжительности видео.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

На данный момент это преимущество, однако, носит лишь теоретический характер: испробовать Veo 2 можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720p, а длина видео — 8 секундами. Для сравнения, доступная для пользователей версия генератора OpenAI Sora предлагает 1080p и 20 секунд. Чтобы начать работу с VideoFX, придётся записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.

Veo 2, как и её предшественница, генерирует видео по текстовым подсказкам, которые можно сопровождать изображениями. По сравнению с Veo первого поколения, новая модель лучше «понимает» физику, изображение отличается повышенной чёткостью, усовершенствованы механизмы движения виртуальной камеры. Veo 2 более реалистично моделирует движение (например, изображает наливаемый в кружку кофе) и свойства света (тени и отражения); правдоподобно имитируются разные линзы на виртуальной камере и кинематографические эффекты.

Разработчик также уверяет, что у новой модели с меньшей вероятностью проявляются галлюцинации: дополнительные пальцы или «неожиданные объекты»; при этом, как показала практика, от эффекта «зловещей долины» избавиться не удалось. А на видео с движущимся автомобилем дорога при ближайшем рассмотрении оказывается чрезвычайно гладкой, пешеходы сливаются друг с другом, а некоторые фасады домов имеют вид, который противоречит законам физики.

Новый генератор видео был обучен на большом числе роликов; в DeepMind не уточнили, какие источники для этого использовались, но одним из них, вероятно, является принадлежащая Google платформа YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых моделью видео.

В DeepMind также сообщили, что улучшили работу генератора статических изображений Imagen 3 — созданные с его помощью картинки стали более яркими, детализированными, а сама модель теперь более точно следует запросам пользователя. В пользовательском интерфейсе ImageFX, где доступен генератор изображений, появились выпадающие списки, которые появляются прямо в поле запроса и помогают добиться более точного результата.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference 14 мин.
«Жду эту игру с самого рождения»: новый трейлер фэнтезийного шутера Covenant с элементами Dark Souls и Dishonored впечатлил геймеров 49 мин.
В Android вернётся переключатель «Не беспокоить» для тех, кому не понравились «Режимы» 3 ч.
Автор Loretta раскрыл дату выхода новой игры — хоррор-стратегии Anoxia Station про погоню за нефтью в недрах умирающей Земли 3 ч.
Создатели кинематографичного боевика Spine в духе «Джона Уика» заинтриговали игроков тизером хардкорного режима — новый геймплейный трейлер 4 ч.
Цифровой белорусский рубль «полноценно» заработает во второй половине 2026 года 4 ч.
Google вживую продемонстрировала возможности Android XR 5 ч.
Премьера аддона A Pirate’s Fortune, дата выхода на Switch 2 и бесплатное демо: Ubisoft разразилась новостями о Star Wars Outlaws 5 ч.
Взрывной геймплейный трейлер Painkiller порадовал фанатов демонстрацией нового и классического адского оружия 6 ч.
WhatsApp перенял ещё одну «фишку» Telegram — пользовательские наборы стикеров 6 ч.
Физики обнаружили аномальный эффект Холла в неожиданном месте 6 мин.
Из-за политики США европейские пользователи задумались об уходе из американских облаков 44 мин.
Intel расследует падение производительности видеокарт Arc при работе со старыми CPU 50 мин.
Китайская EHang пообещала запустить сервис летающих такси по разумной цене до конца года 2 ч.
$278 млрд налогов недоплатила «Кремниевая шестёрка» IT-гигантов благодаря лазейкам в законе 2 ч.
Tesla урезала производство пикапов Cybertruck, потому что их почти никто не покупает 3 ч.
Curiosity нашёл свидетельства того, что в древности на Марсе могла быть жизнь 3 ч.
В Индии представили ароматизированный смартфон Infinix Note 50s 5G+ 3 ч.
Трамповские тарифы могут стоить США лидерства в ИИ и возрождения производства чипов 3 ч.
ИИ-мегапроект Stargate может прийти в Великобританию и Евросоюз, но только в случае успеха в США 4 ч.