Сегодня 19 сентября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научит ИИ понимать интерфейсы приложений

Исследователи компании Apple опубликовали работу, в которой описали систему генеративного искусственного интеллекта Ferret-UI, предназначенную для распознавания интерфейсов мобильных приложений. С её помощью ИИ сможет без предварительного обучения понимать интерфейс разных приложений и взаимодействовать с ними.

 Источник изображения: Carl Heyerdahl / unsplash.com

Источник изображения: Carl Heyerdahl / unsplash.com

Ferret-UI представляет собой большую мультимодальную языковую модель (MLLM), характерная особенность которых — способность к обучению на самых разных материалах, включающих текст, изображения, видео- и аудиоконтент. MLLM пока плохо справляются с распознаванием интерфейсов приложений и тому есть множество причин, одна из которых — несоответствие пропорций используемых для обучения изображений соотношению сторон экрана типичного смартфона. Искусственный интеллект плохо понимает мелкие изображения, такие как значки и кнопки, а кроме того, для анализа интерфейса приложения ему необходимо с ним взаимодействовать. По словам исследователей, им уже удалось превзойти GPT-4V и другие специализирующиеся на анализе интерфейсов MLLM.

Сфера применения Ferret-UI описана довольно расплывчато. С одной стороны, Apple может делать это намеренно, дабы не подавать конкурентам идеи конкретных продуктов, с другой — исследователи разрабатывают технологии, а поиск возможностей их применения не входит в их задачи. Но есть очевидные варианты: например, с помощью Ferret-UI можно попробовать оценить эффективность пользовательского интерфейса или помочь слепым лучше понять происходящее на экране смартфона. Другим возможным применением нового ИИ может стать интеграция с Siri, благодаря чему последней можно будет отдавать команды для взаимодействия с приложениями, например, купить авиабилеты на определённое время и по указанному тарифу.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft Store станет быстрее «в ближайшем будущем» 14 мин.
Nintendo и The Pokemon Company подали в суд на создателей Palworld — «покемоны с пушками» нарушают сразу несколько патентных прав 37 мин.
Microsoft начнёт широко распространять Windows 11 24H2 в октябре 57 мин.
В русскоязычной «Википедии» стало более 2 миллионов статей 2 ч.
Уязвимость PKfail в Secure Boot оказалась более распространённой, чем ожидалось 5 ч.
В iOS 18 обнаружена ошибка, приводящая к постоянным сбоям приложения «Сообщения» 7 ч.
Clock Tower: Rewind нагонит страх на игроков к Хэллоуину — дата выхода улучшенной версии классического хоррора 29-летней давности 12 ч.
Блогеры на YouTube смогут группировать ролики по сезонам — так их будет удобней смотреть на телевизорах 12 ч.
Хакеры атаковали «Доктор Веб» — компания отключила серверы и приостановила обновление вирусных баз 12 ч.
В YouTube вот-вот появится ИИ для генерации идей, описаний и даже целых видео 14 ч.
Intel вывела производство чипов в отдельную компанию для привлечения клиентов 3 ч.
Waymo может поручить выпуск роботакси корейской компании Hyundai Motor 3 ч.
Европейский план «кремниевого суверенитета» терпит крах из-за поменявшихся планов Intel 4 ч.
Китайская флеш-память YMTC теряет слои: из-за санкций компании пришлось перейти с 232-слойной памяти к 160-слойной 5 ч.
Кластер на столе: Mini-ITX плата Turing Pi 2.5 объединяет до четырёх одноплатных компьютеров 11 ч.
Норвегия стала первой в мире страной, в которой электромобилей стало больше, чем машин на бензине 14 ч.
Asus выпустила GeForce RTX 4070 Ti Super Prime на графическом чипе от GeForce RTX 4090 14 ч.
3Logic Group создал системного интегратора «Берегит» 15 ч.
Fractal Design представила компактный корпус Era 2 формата SFF с верхней панелью из ореха 16 ч.
Xiaomi обогнала Apple и стала вторым крупнейшим в мире производителем смартфонов 16 ч.