Сегодня 27 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → сонар

Созданы очки с сонаром, которые переводят беззвучную речь в печатный текст

Аспирант Корнеллского университета (США) Жуйдун Чжан (Ruidong Zhang) разработал оборудованные сонаром очки EchoSpeech, способные «слышать» беззвучную речь своего владельца — достаточно лицевой артикуляции. Очки могут использоваться в качестве стандартного устройства ввода.

 Жуйдун Чжан (Ruidong Zhang). Источник изображения: ruidongzhang.com

Жуйдун Чжан (Ruidong Zhang). Источник изображения: ruidongzhang.com

Новый проект автора основан на предыдущей разработке, в рамках которой он установил камеры на беспроводные наушники. Формат очков оказался для этих целей более удобным: пользователю не нужно смотреть в камеру или вставлять что-то в ухо. Данные с установленных на очки динамиков и микрофонов по беспроводному каналу передаются на смартфон, где обрабатываются алгоритмами искусственного интеллекта.

При первом использовании требуется калибровка EchoSpeech, позволяющая ИИ изучить особенности мимики пользователя — достаточно всего нескольких минут, за которые человеку предлагается, например, зачитать несколько чисел. Когда настройка завершена, точность срабатывания системы достигает 95 %. Использование смартфона для обработки данных позволяет очкам оставаться компактными и ненавязчивыми, обеспечивать им до 10 часов автономной работы и гарантировать, что вся информация остаётся на телефоне — его производительности достаточно для локальной обработки всех данных.

На практике у EchoSpeech может быть множество самых разных применений: управление программами на ПК, беззвучное управление музыкальным проигрывателем без рук, возможность диктовки сообщения на громком концерте, или даже совместная работа с голосовым синтезатором для людей с нарушениями речи — они снова заговорят. Сейчас авторы проекта рассматривают возможности вывода технологий на рынок при участии действующей в Корнеллском университете программы финансирования.


window-new
Soft
Hard
Тренды 🔥
Microsoft и OpenAI договорились, как не проморгать появление сильного ИИ 37 мин.
Возможны осадки в виде падающих звёзд: первое крупное обновление Infinity Nikki получило дату выхода и атмосферный трейлер 2 ч.
Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле 2 ч.
«Рамблер» полностью превратится в ИИ-портал на основе GigaChat 3 ч.
Разработчики археологического приключения Heaven's Vault заинтриговали игроков зашифрованным тизером — фанаты надеются на продолжение 3 ч.
В «Яндексе 360 для бизнеса» появились федерации 3 ч.
Telegram перестал перегревать и быстро разряжать iPhone, но обновление сломало «Истории» 4 ч.
«Мы и представить не могли»: психологический инди-хоррор Mouthwashing поразил разработчиков продажами 4 ч.
Instagram и Facebook наполнятся пользователями, которых сгенерирует ИИ 4 ч.
Количество загрузок, планы на релиз и ограничения Steam: разработчики российской стратегии «Передний край» подвели итоги 2024 года 5 ч.