Сегодня 07 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-переводчик Meta✴ научился переводить языки, не имеющие письменности

Приблизительно 2,8 тысяч языков мира из семи тысяч известных существуют без письменности. Такие языки не подходят для современных систем перевода на основе алгоритмов машинного обучения, поскольку обычно компьютеры переводят устную речь в письменную для последующего перевода на другой язык. Компании Meta, похоже, удалось решить эту проблему, благодаря новому ИИ-инструменту.

 Источник изображения:  bruce mars/unsplash.com

Источник изображения: bruce mars/unsplash.com

В рамках разработанной Meta программы Universal Speech Translator (UST) устная речь на одном языке будет переводиться в устную же на другом, благодаря чему будущие жители метавселенной, смогут намного легче взаимодействовать друг с другом.

В рамках проекта исследователи обратились к диалекту хоккиен — одному из официальных языков Тайваня и довольно широко распространённому в Азии, при этом не имеющему собственной письменности.

Для тренировки системам машинного перевода обычно необходимы письменные и устные образцы языка. Для того чтобы обойти подобные ограничения, используется модель т.н. speech-to-unit translation (S2UT), в рамках которой устная речь преобразуется в «акустические единицы» в режиме реального времени.

Речь на не имеющем письменности языке конвертируется сначала в текст на родственном языке-посреднике, имеющем письменность (в данном случае на мандаринском диалекте), который уже можно переводить на английский и наоборот с последующим машинным обучением системы. Пока система обеспечивает ограниченное общение носителей хоккиена и говорящих по-английски. Она переводит по предложению за раз, но глава Meta Марк Цукерберг (Mark Zuckerberg) уверен, что со временем модель будет использована с разными языками и позволит общаться в режиме реального времени.

Помимо моделей и тренировочных данных, уже выложенных Meta в открытый доступ, компания опубликовала и другие инструменты, потенциально позволяющие исследователям создавать собственные системы для перевода устной речи в устную (S2ST).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Новая статья: Frogun Encore — как в старые добрые. Рецензия 23 ч.
Новая статья: Gamesblender № 681: игроки против Ubisoft, наследница TES II: Daggerfall и релиз AMD FSR 3.1 23 ч.
Торговля акциями «Яндекса» на Мосбирже начнётся 24 июля 06-07 11:39
Apple наконец одобрила приложение Epic Games для iOS в Европе 06-07 04:39
Антимонопольный иск властей США ставит под угрозу сотрудничество Apple с Google 06-07 01:35
Новая статья: Elden Ring: Shadow of the Erdtree — сквозь страдания к катарсису. Рецензия 06-07 00:00
Выстрелил: инди-хоррор Buckshot Roulette об игре в русскую рулетку с дробовиком достиг впечатляющей вершины продаж 05-07 23:57
Проверенный инсайдер рассекретил дату выхода EA Sports FC 25 до анонса самой игры 05-07 22:25
Nvidia, Microsoft и Meta предупредили инвесторов о рискованности ставки на ИИ 05-07 22:09
Satisfactory доберётся до 1.0 спустя пять лет раннего доступа — дата выхода и трейлер самой важной новинки в релизной версии 05-07 21:21
CBRE: нехватка энергии ограничивает рост ЦОД, подстёгиваемый ИИ 3 ч.
Министерство энергетики США вложит $100 млн в создание «зелёных» энергохранилищ без использования лития 3 ч.
Zotac случайно опубликовала личные данные клиентов 7 ч.
Следующий полёт Starship состоится через четыре недели — ускоритель Super Heavy попытаются поймать при посадке 8 ч.
Стартап Phaidra, разрабатывающий ИИ для эффективного управления ЦОД, привлёк $12 млн 14 ч.
Первым владельцам Tesla Cybertruck бесплатно предлагается замена тягового электродвигателя 16 ч.
Huawei утверждает, что в развитии китайских систем ИИ не всё будет определяться передовыми чипами 16 ч.
Sequoia Capital: ИИ пока не оправдывает вложений и может превратиться в финансовый пузырь 23 ч.
China Mobile запустила в Китае ЦОД с 4000 ИИ-ускорителей, треть из которых — отечественные 24 ч.
Sipeed представила Lichee NanoKVM — крошечный IP-KVM на базе RISC-V чипа 06-07 21:58