Сегодня 04 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модель Voicebox, которая генерирует и редактирует устную речь

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу. Авторы проекта охарактеризовали её как прорыв в моделях речевого ИИ.

 Источник изображения: ***

Источник изображения: Meta

Voicebox озвучивает заданный текст с высоким качеством или производит обработку уже готовой записи голоса, например, удаляет из него посторонние звуки вроде автомобильных гудков и собачьего лая, сохраняя содержание и стилистику речи. При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово. Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский. Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.

Модель была обучена на 50 часах аудиокниг, и этого ей хватило, чтобы овладеть навыками устной речи в полной мере: она составляет профиль голоса и манеры речи на основе образца продолжительностью всего две секунды, после чего может воспроизвести её с любым текстом. На практике эти возможности могут оказаться полезными в приложениях метавселенной, обеспечив естественное звучание голосов для виртуальных помощников и неигровых персонажей; или для слабовидящих людей — модель может озвучивать письма голосами их авторов.

Meta часто делает свои ИИ-модели общедоступными, но не на сей раз. В компании не раскрыли, на каких материалах производилось обучение Voicebox, и не предложили испытать технологию на практике — опасаются злоупотреблений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Представлена Midjourney V7 — ИИ-генератор изображений стал идеально понимать запросы и поразил качеством 15 мин.
Соавтор Dishonored «с радостью» бы взялся за Dishonored 3, но есть нюанс 2 ч.
ООН: ИИ уничтожит почти половину рабочих мест к 2033 году 2 ч.
Визг шин, рёв двигателей и атмосфера 90-х: гоночная игра #Drive Rally устремилась к выходу из раннего доступа 3 ч.
Inzoi установила новый рекорд скорости продаж для Krafton— игру раскупают быстрее, чем PUBG 4 ч.
«Буду плакать слезами счастья»: датамайнеры Apex Legends заявили, что Titanfall 3 жива и выйдет в 2026 году 5 ч.
ИИ впервые стал студентом вуза — Венский университет прикладного искусства зачислил систему Flynn 6 ч.
Бенчмарк MLPerf показал, что ускорители AMD Instinct не уступают NVIDIA H200 6 ч.
Россия заняла четвёртое место по размеру аудитории в Kingdom Come: Deliverance 2, хотя игра в стране даже не продаётся 7 ч.
Трамп заявил, что сделка с TikTok близка к заключению, и тарифы могут пригодиться в переговорах с Китаем 10 ч.
Каждый пятый проданный в России в этом году смартфон выпустила Xiaomi, но заработала больше всех Apple 40 мин.
В Европе установили самый мощный в мире ветрогенератор — мощностью 21,5 МВт и диаметром 276 м 49 мин.
McLaren заполучила арабские инвестиции и скоро может прийти к выпуску электромобилей 2 ч.
Российские операторы получат низкие частоты для 5G не раньше 2029 года — сейчас диапазон занят телевещателями 2 ч.
Рост российского рынка IT встал на паузу — заказчики ждут возвращения зарубежных разработчиков 3 ч.
G.Skill представила самые быстрые в мире 64-Гбайт модули памяти для ПК 3 ч.
Учёные разработали техпроцесс для массового производства перовскитных солнечных панелей на Луне 3 ч.
Многие контрактные производители электроники не знают, где им строить фабрики после введения новых тарифов США 3 ч.
Parasail привлекла $10 млн стартового капитала и выступила «агрегатором ускорителей» с парком чипов больше, чем у Oracle 4 ч.
Богатейшие люди мира за день потеряли $208 млрд из-за новых пошлин США 5 ч.