Сегодня 13 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → dioptra

В США создали систему оценки рисков для ИИ-алгоритмов

Национальный институт стандартов и технологий (NIST), входящий в состав Министерства торговли США и занимающийся разработкой и тестированием технологий для американского правительства, компаний и общественности, представил обновлённый тестовый стенд Dioptra. Он предназначен для оценки того, как вредоносные атаки, включая те, что направлены на «отравление» используемых для обучения больших языковых моделей данных влияют на снижение производительности ИИ-систем.

 Источник изображения: Copilot

Источник изображения: Copilot

Первая версия модульного веб-инструмента с открытым исходным кодом Dioptra была представлена в 2022 году. Обновлённое ПО должно помочь разработчикам ИИ-моделей и людям, которые используют эти алгоритмы, оценивать, анализировать и отслеживать риски, связанные с ИИ. В NIST заявили, что Dioptra можно использовать для бенчмаркинга и исследования ИИ-моделей, а также в качестве общей платформы для симуляции воздействия на модели разного рода угроз.

«Тестирование влияния атак противника на модели машинного обучения — одна из целей Dioptra. Программное обеспечение с открытым исходным кодом доступно для бесплатной загрузки и может помочь сообществу, включая правительственные агентства, малые и средние компании, в проведении оценки, чтобы проверить заявления разработчиков ИИ о производительности их систем», — говорится в пресс-релизе NIST.

Вместе с Dioptra разработчики опубликовали ряд документов, в которых излагаются способы уменьшения рисков, связанных с ИИ-моделями. Это программное обеспечение было создано в рамках инициативы, которую поддержал президент США Джо Байден и которая предписывает NIST, помимо прочего, оказывать поддержку в тестировании ИИ-систем. Инициатива также устанавливает ряд стандартов безопасности в сфере ИИ, включая требования к компаниям, разрабатывающим ИИ-алгоритмы, об уведомлении федерального правительства и передачи данных по итогам оценки рисков безопасности до того, как ИИ станет доступен широкому кругу пользователей.

Проведение эталонной оценки ИИ является сложной задачей, в том числе потому, что сложные алгоритмы в настоящее время представляют собой «чёрные ящики», инфраструктура которых, данные для обучения и другие ключевые детали держатся разработчиками в секрете. Некоторые эксперты склоняются к мнению, что одних только оценок недостаточно для определения степени безопасности ИИ в реальном мире, в том числе потому, что разработчики имеют возможность выбирать, какие тесты будут проводиться для оценки их ИИ-моделей.

NIST не говорит, что Dioptra сможет исключить любые риски для ИИ-систем. Однако разработчики этого инструмента уверены, что он может пролить свет на то, какие виды атак могут сделать работу той или иной ИИ-системы менее эффективной, а также оценить негативное воздействие на производительность алгоритма. Отметим, что Dioptra способен работать только с моделями, которые можно загрузить на устройство и использовать локально.


window-new
Soft
Hard
Тренды 🔥
К концу года Microsoft прекратит поддержку приложений «Почта Windows», «Календарь», «Люди» и классического Outlook 4 ч.
Критики оценили «умный» детектив The Rise of the Golden Idol — игра уже вышла и доступна в российском Steam 5 ч.
Заждались: Farming Simulator 25 вышла в Steam и сразу же установила новый рекорд для серии 7 ч.
Создатели Stellar Blade подтвердили планы на ПК-версию — объявлена дата выхода фоторежима и дополнения по Nier: Automata 9 ч.
Северокорейские хакеры научились обходить защиту macOS и захватывать удалённый доступ к Mac 9 ч.
Apple Intelligence стал источником абсурдных, смешных и пугающих обобщений уведомлений 10 ч.
Третье дополнение к Atomic Heart выйдет «совсем скоро» — новые скриншоты и подробности 10 ч.
Nvidia App вышло из беты и вскоре полностью заменит GeForce Experience 10 ч.
Nvidia выпустила драйвер с поддержкой S.T.A.L.K.E.R. 2: Heart of Chornobyl и Microsoft Flight Simulator 2024 11 ч.
Французская и немецкая поисковые системы объединились против Google 12 ч.