Сегодня 18 сентября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модель Voicebox, которая генерирует и редактирует устную речь

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу. Авторы проекта охарактеризовали её как прорыв в моделях речевого ИИ.

 Источник изображения: ***

Источник изображения: Meta

Voicebox озвучивает заданный текст с высоким качеством или производит обработку уже готовой записи голоса, например, удаляет из него посторонние звуки вроде автомобильных гудков и собачьего лая, сохраняя содержание и стилистику речи. При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово. Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский. Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.

Модель была обучена на 50 часах аудиокниг, и этого ей хватило, чтобы овладеть навыками устной речи в полной мере: она составляет профиль голоса и манеры речи на основе образца продолжительностью всего две секунды, после чего может воспроизвести её с любым текстом. На практике эти возможности могут оказаться полезными в приложениях метавселенной, обеспечив естественное звучание голосов для виртуальных помощников и неигровых персонажей; или для слабовидящих людей — модель может озвучивать письма голосами их авторов.

Meta часто делает свои ИИ-модели общедоступными, но не на сей раз. В компании не раскрыли, на каких материалах производилось обучение Voicebox, и не предложили испытать технологию на практике — опасаются злоупотреблений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft Research занялась разработкой нового поколения эффективных облачных хранилищ 9 мин.
AOC и Porsche Design выпустили изогнутый игровой монитор Porsche Design AGON PRO PD34 — 34 дюйма, QD-OLED, 1440p и 240 Гц 12 мин.
Куда по мокрому?! Alibaba Cloud ждёт пока просохнет оборудование, пострадавшее от пожара в сингапурском ЦОД Digital Realty 21 мин.
Дорогие фотоаппараты снова стали популярны — продажи беззеркалок подскочили на 12 % в этом году 27 мин.
HTC представила автономную VR-гарнитуру Vive Focus Vision с отслеживанием взгляда за $999 52 мин.
Apple рассказала, что значительно повысила ремонтопригодность iPhone 16 2 ч.
Процессоры Apple A16 начали выпускать в США — вероятно, их используют в новом iPhone SE 3 ч.
Зонд NASA «Юнона» обнаружил гигантский новорожденный вулкан на спутнике Юпитера Ио 3 ч.
Земля и энергия в обмен на долю в ЦОД: «зелёная» энергокомпания Iberdrola предложила застройщикам Испании необычную сделку 4 ч.
У Qualcomm не получилось отменить антимонопольный штраф в Европе, но удалось немного его снизить 4 ч.