Сегодня 12 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
YouTube позволит авторам тестировать несколько миниатюр к видео одновременно 48 мин.
Илон Маск отказался от иска против OpenAI 57 мин.
Акции Apple выросли до исторического максимума после анонса функций ИИ на конференции WWDC 2 ч.
В Сколково создадут передовой центр разработки отечественных видеоигр 6 ч.
Второй сезон сериала «Аркейн» по League of Legends станет последним — вышел новый трейлер 8 ч.
Еженедельный чарт Steam: ролевой экшен Black Myth: Wukong и шутер с видом из носимой камеры Bodycam ворвались в топ-5 8 ч.
Рандеву со смертью: новый трейлер раскрыл дату выхода олдскульного хоррора Conscript о событиях Верденской мясорубки 10 ч.
Adobe поменяет пользовательское соглашение на фоне скандала с доступом к контенту 12 ч.
«Группа Астра» увеличила выручку в I квартале на 43 % 12 ч.
Apple пообещала, что её ИИ обеспечит «прозрачную и проверяемую защиту любых пользовательских данных» 13 ч.
SpaceX снизит высоту орбиты своих спутников Starlink 2 ч.
Выяснились глобальные цены Apple Vision Pro — дороже всего гарнитура будет стоить в Великобритании 7 ч.
Новая статья: Обзор смартфона HUAWEI Pura 70 Pro: как по методичке 7 ч.
Netgear представила доступные сетевые устройства с Wi-Fi 7 — роутер за $330 и Mesh-систему за $700–1000 8 ч.
Не только Windows: Tuxedo анонсировала ноутбук с Linux и процессором Snapdragon X Elite 9 ч.
Apple создала кастомные серверы и ОС для безопасного ИИ-облака 9 ч.
Забрезжил свет: Atos выбрала партнёром по выходу из кризиса консорциум во главе с Onepoint — IT-гигант останется под контролем Франции 10 ч.
AMD подарит до двух игр покупателям видеокарт Radeon RX 7800 XT и RX 7700 XT 11 ч.
SK hynix показала чипы памяти GDDR7 на выставке Computex, но массовое производство начнёт только в 2025 году 11 ч.
Nvidia в прошлом году захватила 98 % рынка графических процессоров для ЦОД — поставки достигли 3,76 млн единиц 11 ч.