Сегодня 19 сентября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модель Voicebox, которая генерирует и редактирует устную речь

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу. Авторы проекта охарактеризовали её как прорыв в моделях речевого ИИ.

 Источник изображения: ***

Источник изображения: Meta

Voicebox озвучивает заданный текст с высоким качеством или производит обработку уже готовой записи голоса, например, удаляет из него посторонние звуки вроде автомобильных гудков и собачьего лая, сохраняя содержание и стилистику речи. При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово. Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский. Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.

Модель была обучена на 50 часах аудиокниг, и этого ей хватило, чтобы овладеть навыками устной речи в полной мере: она составляет профиль голоса и манеры речи на основе образца продолжительностью всего две секунды, после чего может воспроизвести её с любым текстом. На практике эти возможности могут оказаться полезными в приложениях метавселенной, обеспечив естественное звучание голосов для виртуальных помощников и неигровых персонажей; или для слабовидящих людей — модель может озвучивать письма голосами их авторов.

Meta часто делает свои ИИ-модели общедоступными, но не на сей раз. В компании не раскрыли, на каких материалах производилось обучение Voicebox, и не предложили испытать технологию на практике — опасаются злоупотреблений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Представлено приложение SocialAI — симулятор «Твиттера» с ИИ-ботами вместо пользователей 7 мин.
«Приготовьтесь к разочарованию»: инсайдер раскрыл, когда пройдёт новая State of Play 2 ч.
Власти ЕС расскажут Apple, как она должна открыть iPhone и iOS для конкурентов 3 ч.
На Apple подали в суд за высокие цены на подписку Spotify, YouTube Music и других музыкальных стримингов 3 ч.
Alibaba выпустила больше 100 открытых ИИ-моделей Qwen 2.5, а также ИИ-преобразователь текста в видео 3 ч.
Android 15 выйдет 15 октября, но только на Pixel — остальным придётся подождать 3 ч.
Одна из самых популярных игр на Steam Deck за последние годы теперь «не поддерживается» — Valve изменила статус GTA V 3 ч.
НАТО против ЧВК, новая система разрушений и возвращение CTE: подробности следующей Battlefield от надёжного инсайдера 4 ч.
Европол ликвидировал защищённый криминальный мессенджер Ghost 4 ч.
Google предложила продать часть своего рекламного бизнеса, но этого оказалось мало для прекращения антимонопольного дела в ЕС 4 ч.
Snowhawk инвестировала в CleanArc Data Centers, которая займётся постройкой 600-МВт ЦОД в Вирджинии 6 мин.
Xiaomi показала смартфоны Redmi Note 14 Pro и Pro+ в преддверии анонса на следующей неделе 8 мин.
Китайские машины для выпуска чипов в действительно оказались далеки от 8-нм техпроцесса 12 мин.
Испанская Solaria и японская Datasection построят в Испании 200-МВт ИИ ЦОД 56 мин.
В Европе создали твердотельный литиевый аккумулятор с повышенной на 33 % плотностью хранения энергии 3 ч.
Apple запустила производство iPhone 16 в Бразилии — это ещё больше снизит зависимость от Китая 4 ч.
Неправильную форму Марса объяснили давно потерянной третьей луной 4 ч.
Tesla рассказала об опасности удлинителей на зарядках для электромобилей 4 ч.
iPhone 16 уже приехали в Россию — МТС похвасталась, что привезла их первыми, но в «М.Видео-Эльдорадо» не согласны 4 ч.
Появились подробности о подводном кабеле Google Proa — он заработает в 2026 году 4 ч.