Сегодня 12 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Брокеры данных собирают огромные объёмы информации о каждом человеке, но иногда можно попросить её удалить 41 мин.
В России появилась Ассоциация игровой индустрии — разработчики видеоигр будут сообща решать задачи регулирования 47 мин.
Роскомнадзор намерен получить право блокировать ресурсы без решения суда 17 ч.
Новая статья: Iron Meat — наконец-то новая Contra! Рецензия 18 ч.
«Беззаботный взгляд на мир ведьмаков»: CD Projekt Red анонсировала сборник комиксов The Little Witcher про приключения маленькой Цири в Каэр Морхене 18 ч.
Соавтор Disco Elysium основал «революционную новую RPG-студию» для создания ролевой игры под стать «нашему убогому и прекрасному миру» 19 ч.
Функция «Круг для поиска» появилась в складном смартфоне HONOR Magic V3 и серии смартфонов HONOR 200 20 ч.
Aspyr обновит ещё три игры из серии Tomb Raider — трейлер, подробности и предзаказ Tomb Raider IV-VI Remastered в российском Steam 23 ч.
В день релиза Metaphor: ReFantazio побила рекорд Persona 3 Reload по скорости продаж для игр Atlus 24 ч.
TikTok уволил сотни сотрудников — модерировать контент будет ИИ 24 ч.
Впервые в истории два человека обменялись сообщениями во сне на расстоянии, утверждает стартап REMspace с российскими корнями 18 мин.
AMD Ryzen 9000X3D будут на 2–13 % быстрее предшественников в играх, согласно тестам MSI 25 мин.
Япония установила рекорд по скорости оптической связи между спутниками на низкой и высокой орбитах 51 мин.
Российское подразделение Sony с одним сотрудником снова попытается самоликвидироваться 4 ч.
SpaceX разрешили возобновить запуски ракет Falcon 9, Starship приготовиться 6 ч.
Акции Tesla упали на 9 % — презентация Cybercab не впечатлила инвесторов 6 ч.
Casio представила пушистого робота Moflin — он поможет побороть стресс за $400 7 ч.
Поставки ПК и ноутбуков выросли на 1,3 % в прошлом квартале, подсчитали в Canalys 8 ч.
Внешний привод Apple USB SuperDrive для оптических дисков только сейчас исчез из продажи 9 ч.
Планшеты Huawei MatePad Pro 12,2” и MatePad 12 X поступили в продажу в России 21 ч.