Сегодня 08 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В Санкт-Петербурге разработали нейросеть, которая распознаёт речь по губам

В Санкт-Петербургском Федеральном исследовательском центре РАН (СПб ФИЦ РАН) создали приложение для смартфона, с помощью которого можно считывать речь пользователя в шумных местах по губам, что позволит повысить точность распознавания слов голосовыми помощниками в сложных условиях, пишет ТАСС.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В пресс-службе СПб ФИЦ РАН отметили, что приложение можно будет использовать в широком перечне отраслей с применением голосовых команд — от сферы услуг до тяжёлой промышленности.

Как сообщается, в основе приложения лежит нейросетевая модель, способная распознавать по аудиовизуальным сигналам (видеозаписям, сопровождающимися звуком) несколько сотен наиболее распространённых команд и автоматически определять, какой вид данных обеспечивает максимальную точность — видео или звук, или оба сразу.

«Исследователи Санкт-Петербургского Федерального исследовательского центра РАН научились при помощи алгоритмов искусственного интеллекта и компьютерного зрения распознавать речь человека по губам. Разработка поможет повысить точность работы голосовых помощников в шумных условиях, например, в людных местах или при управлении тяжёлой техникой», — рассказали в пресс-службе корреспонденту ТАСС.

Программа прошла тестирование в одной из логистических компаний в России. Для этого приложение было установлено на смартфоны водителей шумных большегрузных автомобилей. Тестирование подтвердило тот факт, что совмещение двух видов считывания информации повышает эффективность работы алгоритмов — если при чтении по губам точность распознавания команд составила 60–80 %, то в сочетании со звуковым сигналом точность распознавания превышает 90 %.

«Мы предполагаем, что в будущем наше приложение может найти применение у пилотов самолётов и тяжёлой промышленной техники или для использования в интерактивных информационных киосках в торговых центрах и других местах массового скопления людей», — сообщил старший научный сотрудник лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН Денис Иванько.

Также следует отметить, что на проведение разработки был выделен грант Российского научного фонда.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
«Это был крупный провал»: создатель Okami рассказал, что пошло не так 18 мин.
Ещё капельку: Бирмингем дал Oracle ещё £10 млн на поддержку провального внедрения ERP Fusion, которое уже обошлось в £100+ млн 2 ч.
Правительство Германии владеет биткоинами на $2 млрд — это пугает инвесторов 2 ч.
Создатели «Смуты» взялись за работу над прототипами новых игр 4 ч.
«Невероятно многообещающе»: блогер показал геймплей мультиплеерного мода в духе GTA Online для Cyberpunk 2077 4 ч.
Бывший эксперт AMD по трассировке лучей поможет сделать компьютерные чипы Qualcomm пригодными для игр 4 ч.
Аниматор «засветил» неанонсированный ремейк от издателя Borderlands, BioShock и Mafia — фанаты теряются в догадках 5 ч.
Microsoft добавила в «Блокнот» проверку орфографии и автокоррекцию — через 40 лет после релиза 6 ч.
Telegram оштрафовали на 3 млн рублей за неудаление запрещённой в РФ информации 8 ч.
Replaced порадует фанатов «проработанных мрачных миров и крутых стильных боёв» — ретрофутуристический экшен-платформер впечатлил журналистов 10 ч.
Gigabyte представила 27-дюймовый игровой монитор M27UA с 4K и 160 Гц 2 ч.
Asus анонсировала мини-ПК NUC 14 Pro Plus на базе процессоров Intel Core Ultra 100 2 ч.
Google отказалась от углеродно-нейтрального статуса ради достижения реальных нулевых выбросов к 2030 году 5 ч.
Samsung рассказала об обновлённом датчике BioActive для будущих смарт-часов Galaxy Watch 5 ч.
Космический телескоп NASA NEOWISE для фотоохоты на астероиды скоро завершит работу и сгорит в атмосфере 5 ч.
«Лаборатория Касперского» представила единое решение для построения безопасных распределённых промышленных сетей 6 ч.
В России многократно выросли продажи отечественных мониторов, но доминирует на рынке Acer 7 ч.
Учёные создали 2D-кулер для квантовых компьютеров — он обеспечит температуру ниже, чем в открытом космосе 7 ч.
Всего за год «Сбер» захватил 5,2 % российского рынка телевизоров и обогнал «Яндекс» 9 ч.
Nothing представила беспроводные наушники CMF Buds Pro 2 за €59 — автономность до 43 ч, шумоподавление и необычный чехол 9 ч.