Сегодня 03 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Нейросеть Flamingo от Google научилась составлять описания для роликов YouTube Shorts

Объединённая команда Google DeepMind рассказала о своём новом проекте — визуальной языковой модели Flamingo, которая составляет описания для коротких видео раздела YouTube Shorts. Такие записи публикуются в считанные минуты и зачастую лишены описаний и содержательных заголовков, что усложняет их поиск. Flamingo призвана решить эту проблему.

 Источник изображения: deepmind.com

Источник изображения: deepmind.com

Визуальная языковая модель составляет описания коротких видео, анализируя их начальные кадры и предлагая пояснения тому, что происходит, например: «собака удерживает на голове стопку крекеров». Созданные ИИ текстовые описания сохраняются в формате метаданных — это поможет «лучше классифицировать видео и сопоставлять результаты поиска с пользовательскими запросами». ИИ решает характерную для раздела YouTube Shorts проблему: авторы зачастую пренебрегают метаданными к видео, да и сами ролики в основном просматриваются в общей ленте, и в результате обнаружить их через поиск не получается.

Генерируемые Flamingo описания не показываются ни зрителям, ни даже самим авторам видео, рассказал директор по управлению продуктом YouTube Shorts Тод Шерман (Todd Sherman). Тем не менее, текст этих описаний соответствует этическим нормам продуктов Google, хотя и маловероятно, что ИИ незаслуженно попытается выставить видео в дурном свете. Flamingo уже запущен на YouTube и добавляет свои описания ко всем новым роликам раздела Shorts — процедуру также прошла значительная часть уже опубликованных материалов, и в первую очередь наиболее популярные.

Администрация платформы также не исключила, что ИИ-модель начнёт работать и с полноформатными длинными видео YouTube, хотя потребность в этом не столь высока: люди тратят часы, дни, недели и даже месяцы на съёмку и редактирование этих материалов, поэтому добавление метаданных к ним — лишь небольшая часть процесса создания видео. А поскольку зрители выбирают длинные видео с учётом миниатюры и заголовка, у создателей этих записей есть естественный стимул для правильного заполнения метаданных.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ЕС оштрафует TikTok на €500 млн за передачу данных европейцев в Китай 13 мин.
40 кадров/с и «местами даже хорошая» графика за $70: первые подробности Cyberpunk 2077 для Nintendo Switch 2 57 мин.
Представлена ранняя ПК-версия российской ОС «Аврора» — на ней уже запускается Telegram и не только 2 ч.
«РТК ИТ Плюс» пополнила ИТ-экосистему «Лукоморье» тремя новыми продуктами 3 ч.
Microsoft подтвердила дату выхода GTA V в PC Game Pass — подписчики получат доступ к GTA V Enhanced 3 ч.
Новый контент в Elden Ring: Tarnished Edition для Nintendo Switch 2 появится и на других платформах 4 ч.
Лавкрафтианский хоррор Stygian: Outer Gods готовится к старту открытой «беты» — новый геймплейный трейлер 5 ч.
Nintendo создала гибридный эмулятор Switch, но работать он будет только на Switch 2 6 ч.
Новая статья: Обзор системы резервного копирования и восстановления данных «Кибер Бэкап Малый Бизнес» 8 ч.
Годовая выручка «Группы Астра» взлетела на 80 %, а прибыль — на 66 % 8 ч.
Большой адронный коллайдер собрал базу для выхода за пределы известной физики 21 мин.
Восьмиядерные CPU стали самыми популярными в мире по статистике CPU-Z — AMD стремительно отбирает рынок у Intel и Nvidia 47 мин.
Apple потеряла $250 млрд стоимости за день — пошлины Трампа обвалили акции техногигантов 2 ч.
Nintendo Switch 2 получила поддержку трассировки лучей и DLSS, но их появление в играх зависит от разработчиков 2 ч.
Nikon представила полнокадровую камеру Z5 II с улучшенным автофокусом и повышенной скоростью съёмки за $1700 3 ч.
«Акустическое совершенство»: Bang & Olufsen представила каменную колонку Beosound Balance Natura 3 ч.
У россиян вырос интерес к планшетам — продажи подскочили на 15 % в первом квартале 4 ч.
«Идеальный снимок. Скоро» — Nothing намекнула на скорый выход CMF Phone 2 4 ч.
Samsung выпустила 20-метровые телевизоры для кинотеатров Onyx 4 ч.
Intel переосмыслила свой главный слоган и обновила фирменный стиль, чтобы вернуть пользователей 5 ч.