Сегодня 05 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Российские исследователи научили ИИ точнее распознавать незнакомые объекты на фото

Учёные лаборатории исследований искусственного интеллекта T-Bank AI Research представили на Международной конференции по обработке изображений (IEEE ICIP) в Абу-Даби новый метод под названием SDDE (Saliency-Diversified Deep Ensembles), который позволяет значительно повысить точность распознавания объектов на изображениях с помощью ИИ.

 Источник изображения: BrianPenny/Pixabay

Источник изображения: BrianPenny/Pixabay

Новое решение, в разработке которого также участвовали студенты МИСИС и МФТИ, позволяет примерно на 20 % снизить риск ошибки при обработке и анализе изображений, пишет Forbes.

При распознавании объектов используются методы машинного обучения, повышающие его эффективность. В частности, применяются глубокие ансамбли, когда в процессе распознавания используется несколько нейронных сетей. При методе SDDE используются карты внимания, фокусирующиеся на разных аспектах данных, что позволяет моделям анализировать изображение под разными ракурсами, помогая получить более полную информацию и повысить общую точность анализа. Благодаря этому идентификация объектов становится более надёжной и диверсифицированной, отметили в T-Bank AI Research. По мнению исследователей, новый метод будет востребован в сфере беспилотных транспортных средств и медицинской диагностики.

Также ИИ-модель научили учитывать при анализе изображение не только наборы данных, которые использовались при её обучении, но и незнакомую ей информацию. Это расширило возможности модели при идентификации неизвестных ей объектов. Как отметил младший научный сотрудник группы «ИИ в промышленности» Института AIRI Максим Голядкин, нейросети зачастую не распознают, когда сталкиваются с незнакомыми входными данными, поэтому это решение очень важно. «Вместо того, чтобы признать неопределённость, они могут уверенно выдавать неправильные прогнозы подобно тому, как некоторые языковые модели могут предоставлять вводящую в заблуждение информацию, известную как “галлюцинации”, — говорит эксперт. — Разнообразив фокус каждой модели, ансамбль становится лучше в распознавании тех входных данных, с которыми он ранее не сталкивался».

Мировой рынок компьютерного зрения стремительно растёт с прогнозируемым увеличением с $25,8 млрд в 2024 до $47 млрд к 2030 году, подсчитали в Statista. В частности, в сфере здравоохранении объём рынка вырастет с $986 млн в 2022 году до $31 млрд в 2031 году с прогнозируемым ростом на 47 % в год, утверждают в Straits Research.

В России рынок в этом году вырастет до более чем $600 млн и далее по 10,5 % в среднем в год до 2030-го, когда он превысит $1,1 млрд, прогнозируют в Statista.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Симулятор жизни в беззаботном постапокалипсисе I Am Future готов вырваться из раннего доступа — новый трейлер и дата выхода 11 мин.
В «Google Сообщениях» можно будет выбирать качество отправляемых изображений 22 мин.
Арестован хакер, подозреваемый во взломе Ticketmaster и десятков других клиентов Snowflake 25 мин.
Вышла вторая бета iOS 18.2 — Siri с ChatGPT Plus, улучшенный «Локатор» и другие изменения 30 мин.
«Яндекс», подвинься: VK начнёт предустанавливать свои сервисы на автомобили в России 57 мин.
Система управления уязвимостями Security Vision Vulnerability Management получила крупное обновление 2 ч.
Meta оштрафовали в Южной Корее на $15 млн за незаконный сбор пользовательских данных 2 ч.
Ubisoft поделилась деталями самого крупного обновления для Star Wars Outlaws и сменила творческого руководителя игры 2 ч.
Хакер заявил о краже исходного кода Nokia — компания расследует инцидент 5 ч.
Apple позволит назначить «Google Карты» навигационным приложением по умолчанию, но не всем пользователям 7 ч.