Сегодня 18 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Твиты нейросети GPT-3 оказались более убедительными, чем посты реальных людей

Судя по результатам исследования, проведённого учёными Института биомедицинской этики и истории медицины в составе Университета Цюриха в Швейцарии, твиты, созданные большой языковой моделью GPT-3 компании OpenAI, оказались убедительнее, чем посты настоящих людей. При этом GPT-3 — это далеко не самая современная версия модели.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Авторы исследования попросили участников опроса отличить твиты, написанные людьми, от сгенерированных ИИ. Кроме того, необходимо было решить, верна ли та или иная опубликованная информация, в том числе контент, связанный с вызывающими споры темами вроде эффективности вакцин и климатических изменений, часто используемых для массовых манипуляций общественным мнением в Сети.

Оказалось, что дезинформацию труднее выявить, если она написана ботами. При этом как это ни парадоксально, достоверную информацию, написанную ботами, легче распознавать. Другими словами, люди, участвовавшие в исследовании, охотнее верили ИИ, чем другим людям, независимо от того, насколько точными на самом деле были сведения — это свидетельствует о том, каким опасным могут стать языковые модели при их использовании для дезинформации.

Исследователи выбрали 11 научных тем, обсуждавшихся в Twitter, включая тему вакцин и COVID-19, климатические изменения и теорию эволюции, после чего поставили GPT-3 задачу создавать посты с верной или ложной информацией. После этого были опрошены более 600 англоговорящих респондентов из США, Великобритании, Канады, Австралии и Ирландии — созданный GPT-3 контент оказался неотличимым от созданного людьми. При этом сами исследователи не были на 100 % уверены в том, что «органический» контент, собранный из социальной сети для сравнения, не был написан сервисами вроде ChatGPT. Кроме того, участникам опроса предлагалось оценивать посты «вне контекста» — они не видели профиля автора, что, возможно, помогло бы им сделать верный вывод, поскольку даже прошлые посты в ленте аккаунта и изображение в профиле могут дать подсказку о его природе.

Успешнее всего участники могли отличать дезинформацию, написанную реальными пользователями Twitter, а GPT-3 убеждала пользователей несколько эффективнее. Стоит помнить, что уже существуют как минимум модели GPT-3.5 и GPT-4, которые справляются с разнообразными задачами ещё лучше. При этом оказалось, что GPT-3 хуже справляется с оценкой твитов, чем люди, по крайней мере, в некоторых случаях. Так, при выявлении верной информации в постах GPT-3 показал себя хуже, чем люди, а при обнаружении дезинформации ИИ и люди справлялись примерно одинаково.

Возможно, дальнейшее совершенствование механизмов безопасности языковых моделей помешает создавать вредоносный контент с их помощью. Так, GPT-3 иногда отказывалась генерировать недостоверные материалы по заданию учёных, в частности, о вакцинах и аутизме. Вероятно, дело в том, что при тренировке использовалось много данных, посвящённых разоблачению конспирологических теорий. Впрочем, по мнению исследователей, лучшим инструментом распознавания ложной информации пока по-прежнему остаётся человеческие здравый смысл и критическое отношение к любой предлагаемой информации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Discord внедряет функцию сканирования лица для проверки возраста пользователей 2 ч.
Отчёт Google о Gemini 2.5 Pro раскритиковали за отсутствие прозрачности о безопасности ИИ 4 ч.
Дуров после задержания объяснил французской полиции, как правильно направлять запросы к Telegram 9 ч.
Ubisoft случайно устроила утечку сюжетного дополнения A Pirate's Fortune к Star Wars Outlaws — новый трейлер и дата выхода 10 ч.
«Как завещала матушка Westwood»: олдскульная стратегия Tempest Rising в духе Command & Conquer заслужила дифирамбы критиков 10 ч.
UserGate расширила экосистему UserGate SUMMA образовательными проектами и ИБ-услугами 12 ч.
Epic Games Store устроил на PC, Android и iOS раздачу очаровательного приключения Botanicula от создателей Samorost 13 ч.
На суде Марк Цукерберг обвинил TikTok в замедлении роста Meta 13 ч.
В работе Telegram произошёл глобальный сбой: приложение не запускается, сообщения не отправляются 13 ч.
Продажи легендарного симулятора колонии дварфов Dwarf Fortress в Steam превысили 1 миллион копий 14 ч.
Конкурент Neuralink получил разрешение на длительные клинические испытания своего мозгового импланта 2 ч.
В Китае вводятся повышенные требования к пожарной безопасности тяговых аккумуляторов электромобилей 4 ч.
Новая статья: Обзор и тестирование корпуса DeepCool CH690 Digital: свобода выбора 9 ч.
Китай достиг полного цикла работы первого в мире ториевого реактора 12 ч.
AOC выпустила 27-дюймовый игровой монитор Q27G40XMN с QHD, 180 Гц и подсветкой Mini-LED 14 ч.
Nothing представила наушники CMF Buds 2 с гибридным шумоподавлением и автономностью до 55 часов за  $59 15 ч.
TSMC пообещала треть 2-нм и более тонких чипов выпускать в США, но фабрики будут готовые ещё не скоро 15 ч.
Motorola представила зелёный планшет Moto Pad 60 Pro с Dimensity 8300 и батареей на 10 200 мА·ч за $315 15 ч.
Archer Aviation запустит летающую электромаршрутку между Манхэттеном и ближайшими аэропортами 15 ч.
Tesla ответит в суде за махинации с показаниями одометров для ускоренного истечения гарантии 16 ч.