Сегодня 11 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайская Tencent представила генератор видео HunyuanVideo, который пользователи назвали лучшим из существующих

Китайский технологический гигант Tencent анонсировал HunyuanVideo — передовую модель искусственного интеллекта для генерации видео, опубликованную с открытым исходным кодом. Впервые код вывода и веса модели ИИ с такими возможностями доступны всем желающим.

 Источник изображения: Tencent

Источник изображения: Tencent

HunyuanVideo, как утверждает Tencent, способна генерировать видеоролики на уровне ведущих мировых систем с закрытым исходным кодом — эти видео отличают высокое качество картинки, разнообразие движений объектов в кадре, способность синхронизировать визуальный и звуковой ряд, а также стабильность генерации. Это крупнейшая модель для генерации видео — у неё 13 млрд параметров. Пакет HunyuanVideo включает в себя фреймворк с инструментами для управления данными; инструментами для совместного обучения моделей, работающих с изображениями и видео; а также инфраструктуру с поддержкой крупномасштабного обучения моделей и их запуска.

Tencent протестировала модель при поддержке профессионального сообщества, которое установило, что HunyuanVideo превосходит по качеству закрытые проекты Runway Gen-3 и Luma 1.6. Чтобы добиться такого результата, разработчик обратился к гибридной архитектуре передачи «двойного потока в одинарный» (Dual-stream to Single-stream). На начальном этапе видео- и текстовые токены обрабатываются независимо несколькими блоками модели-трансформера, благодаря чему данные разных форматов преобразуются без помех. На этапе единого потока видео- и текстовые токены передаются в последующие блоки трансформера, обеспечивая эффективное слияние мультимодальных данных. Это позволяет зафиксировать сложные отношения между визуальной и семантической информацией, а общая производительность модели повышается.

Выпустив HunyuanVideo, компания Tencent сделала значительный шаг к демократизации технологий создания видео при помощи ИИ. Благодаря открытому исходному коду модель способна произвести революцию в экосистеме генерации видео.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Илон Маск хотел похвастаться высокоуровневым геймплеем в Path of Exile 2, но не разобрался в базовых механиках — игроки заподозрили подвох 37 мин.
Ubisoft приготовилась к трансформации, но комментировать слухи о продаже Tencent отказывается 3 ч.
Halo на PS5, ремейк Final Fantasy VII на Xbox и Gears of War осенью: инсайдер рассказал, чего ждать от Xbox в 2025 году 4 ч.
Глава Larian: игроки Baldur’s Gate 3 установили через встроенный менеджер уже 100 миллионов модов 6 ч.
Bandai Namco уточнила, когда пройдёт закрытое тестирование Elden Ring Nightreign — запись уже открыта 6 ч.
После ослабления модерации наметился массовый исход пользователей из Facebook и Instagram 7 ч.
От новичков до ветеранов первого «Ведьмака»: в CD Projekt Red рассказали, кто разрабатывает The Witcher 4 11 ч.
На TikTok в США нашёлся новый покупатель за 10 дней до возможного запрета сервиса 11 ч.
Марк Цукерберг лично разрешил обучать ИИ-модели Llama на пиратских материалах 11 ч.
Глава X заявила о возвращении рекламодателей в соцсеть, но сторонняя статистика не согласна 12 ч.