Сегодня 11 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модель Voicebox, которая генерирует и редактирует устную речь

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу. Авторы проекта охарактеризовали её как прорыв в моделях речевого ИИ.

 Источник изображения: ***

Источник изображения: Meta

Voicebox озвучивает заданный текст с высоким качеством или производит обработку уже готовой записи голоса, например, удаляет из него посторонние звуки вроде автомобильных гудков и собачьего лая, сохраняя содержание и стилистику речи. При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово. Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский. Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.

Модель была обучена на 50 часах аудиокниг, и этого ей хватило, чтобы овладеть навыками устной речи в полной мере: она составляет профиль голоса и манеры речи на основе образца продолжительностью всего две секунды, после чего может воспроизвести её с любым текстом. На практике эти возможности могут оказаться полезными в приложениях метавселенной, обеспечив естественное звучание голосов для виртуальных помощников и неигровых персонажей; или для слабовидящих людей — модель может озвучивать письма голосами их авторов.

Meta часто делает свои ИИ-модели общедоступными, но не на сей раз. В компании не раскрыли, на каких материалах производилось обучение Voicebox, и не предложили испытать технологию на практике — опасаются злоупотреблений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Openai готовится запустить ИИ-модель GPT-4.1, но возможны задержки 3 ч.
Исследование Microsoft показало, что ИИ пока «так себе» исправляет ошибки в программном коде 4 ч.
OpenAI прокачала память ChatGPT, чтобы бот мог ссылаться на прошлые диалоги 8 ч.
«То, что я ждал от The Movies 2»: голливудская стратегия Hollywood Animal от авторов This is the Police вышла в прокат раннего доступа Steam 9 ч.
Масштабное дополнение к Katana Zero вернулось из небытия с новым трейлером — оно всё ещё бесплатное и почти готово 10 ч.
В графическом онлайн-редакторе Canva появился ИИ для генерации изображений и создания приложений 10 ч.
Новый геймплейный трейлер раскрыл дату выхода философского выживания The Alters от создателей Frostpunk 2 12 ч.
Журналисты раскопали причины провала Apple с внедрением ИИ в Siri 13 ч.
Cloud.ru готовит облачную платформу для локального развёртывания ИИ-сервисов 13 ч.
Kingdom Come: Deliverance 2 скоро станет ещё сложнее — объявлена дата выхода «беспощадного» хардкорного режима 14 ч.
Tesla начала предлагать заднеприводный пикап Cybertruck, но он оказался дороже обещанного 3 мин.
Нынешний глава Intel вложил сотни миллионов долларов в китайские компании, включая конкурирующую SMIC 2 ч.
Новая статья: Обзор Nothing Phone (3a) Pro: самый нескучный смартфон 2025 года 7 ч.
Новая статья: Обзор блока питания Ocypus Iota P1000 9 ч.
Акции Apple, Tesla и Meta рухнули вслед за Nasdaq после взлёта в среду — инвесторы обеспокоены пошлинами 9 ч.
Audio-Technica выпустила наушники за $6800 для фанатов «Звёздных войн» 10 ч.
Oppo представила флагманский планшет Pad 4 Pro, смарт-часы Watch X2 Mini и беспроводные наушники Enco Free4 11 ч.
В Австралии начали строить ультрасовременную антенну дальней космической связи — она обеспечит связь с «Вояджерами» и не только 12 ч.
Исправление опечатки на умных часах OnePlus Watch 3 увеличило их цену на 50 % до $500 13 ч.
Zotac выпустила GeForce RTX 5080 и RTX 5070 Ti в версиях Apocalypse с огромными системами охлаждения 13 ч.