Сегодня 07 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ сделала открытой ИИ-модель с поддержкой 4000 языков

Компания Meta выложила в открытый доступ модель искусственного интеллекта Massively Multilingual Speech (MMS), которая распознаёт разговорную речь на 4000 языках и воспроизводит её, то есть преобразует текст в речь более чем на 1100 языках.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

Модели распознавания речи и преобразования текста в речь обычно предполагают обучение на нескольких тысяч часов аудиозаписей с текстовой расшифровкой и разметкой. Но задача сильно усложняется для языков, которые в индустриальном мире не используются — для них исходных данных в традиционном формате просто не существует, рассказали в Meta. Поэтому в компании прибегли к нестандартному подходу и обратились к религиозным текстам — Библия и другие основополагающие книги переведены на большое количество языков, и существует множество общедоступных аудиозаписей, на которых эти тексты зачитываются. Обучение модели усложнилось из-за того, что аудиозаписи не имели точной текстовой разметки, но в итоге число поддерживаемых языков превысило 4000.

Авторы проекта подчеркнули, что, несмотря на содержание обучающих материалов, у обученной на этих текстах модели не появилось уклона в сторону религиозного мировоззрения; не возникло и гендерного перекоса, хотя большинство взятых за образец аудиозаписей зачитывали мужчины. Проблему с отсутствием текстовой разметки у аудиозаписей удалось преодолеть за счёт wav2vec 2.0 — ещё одной ИИ-модели Meta, предназначенной для «обучения представлению речи с самоконтролем». В компании предупредили, что результат может быть не идеальным — есть риск, что модель преобразования речи в текст могла неверно интерпретировать некоторые слова и фразы, и в некоторых контекстах такие ошибки порой носят оскорбительный характер. Но на практике, утверждают разработчики, MMS демонстрирует вдвое меньше ошибок, чем существующие аналоги, включая модель OpenAI Whisper, и поддерживает в 11 раз больше языков.

На практике проект откроет носителям редких языков доступ к информации и технологическим продуктам — большинство сервисов современных технологических гигантов ограничено набором в 100 языков, и такое положение вещей в Meta считают неприемлемым.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Новая статья: Frogun Encore — как в старые добрые. Рецензия 21 ч.
Новая статья: Gamesblender № 681: игроки против Ubisoft, наследница TES II: Daggerfall и релиз AMD FSR 3.1 22 ч.
Торговля акциями «Яндекса» на Мосбирже начнётся 24 июля 06-07 11:39
Apple наконец одобрила приложение Epic Games для iOS в Европе 06-07 04:39
Антимонопольный иск властей США ставит под угрозу сотрудничество Apple с Google 06-07 01:35
Новая статья: Elden Ring: Shadow of the Erdtree — сквозь страдания к катарсису. Рецензия 06-07 00:00
Выстрелил: инди-хоррор Buckshot Roulette об игре в русскую рулетку с дробовиком достиг впечатляющей вершины продаж 05-07 23:57
Проверенный инсайдер рассекретил дату выхода EA Sports FC 25 до анонса самой игры 05-07 22:25
Nvidia, Microsoft и Meta предупредили инвесторов о рискованности ставки на ИИ 05-07 22:09
Satisfactory доберётся до 1.0 спустя пять лет раннего доступа — дата выхода и трейлер самой важной новинки в релизной версии 05-07 21:21
CBRE: нехватка энергии ограничивает рост ЦОД, подстёгиваемый ИИ 2 ч.
Министерство энергетики США вложит $100 млн в создание «зелёных» энергохранилищ без использования лития 2 ч.
Zotac случайно опубликовала личные данные клиентов 6 ч.
Следующий полёт Starship состоится через четыре недели — ускоритель Super Heavy попытаются поймать при посадке 7 ч.
Стартап Phaidra, разрабатывающий ИИ для эффективного управления ЦОД, привлёк $12 млн 13 ч.
Первым владельцам Tesla Cybertruck бесплатно предлагается замена тягового электродвигателя 15 ч.
Huawei утверждает, что в развитии китайских систем ИИ не всё будет определяться передовыми чипами 15 ч.
Sequoia Capital: ИИ пока не оправдывает вложений и может превратиться в финансовый пузырь 22 ч.
China Mobile запустила в Китае ЦОД с 4000 ИИ-ускорителей, треть из которых — отечественные 22 ч.
Sipeed представила Lichee NanoKVM — крошечный IP-KVM на базе RISC-V чипа 24 ч.