Сегодня 09 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Больше половины ответов ChatGPT на вопросы по программированию неверны — исследование

В последнее время на фоне ажиотажа вокруг технологий ИИ программисты стали всё чаще обращаться за помощью в написании кода программ к чат-ботам на базе ИИ, таким как ChatGPT от OpenAI, что повлекло за собой снижение посещаемости ресурса Stack Overflow, вынужденного уволить в прошлом году почти 30 % персонала.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как оказалось, полагаться на ИИ в написании программ пока рано. Согласно исследованию команды специалистов Университета Пердью, представленному в этом месяце на конференции Computer-Human Interaction («Взаимодействие компьютера и человека»), 52 % ответов по программированию, сгенерированных ChatGPT, оказались неверны.

В ходе исследования программисты Университета Пердью просмотрели более 517 вопросов в сервисе Stack Overflow и проанализировали ответы на них чат-бота ChatGPT. «Мы обнаружили, что 52 % ответов ChatGPT содержат дезинформацию, 77 % ответов более многословны, чем человеческие ответы, а 78 % ответов характеризуются различной степенью несоответствия ответам людей», — отметили исследователи.

Команда исследователей также провела лингвистический анализ 2000 случайно выбранных ответов ChatGPT и обнаружила, что они «более формальные и аналитические», но при этом отражают «менее негативные настроения» — чем обычно отличается ИИ.

Комментируя результаты исследования, сайт Futurism выразил обеспокоенность тем, что многие программисты предпочитают обращаться за помощью к ChatGPT. Исследователи Университета Пердью опросили 12 программистов и обнаружили, что 35 % респондентов предпочитают полагаться на ответы ChatGPT и не замечают ошибок в ответах, сгенерированных ИИ, в 39 % случаев.

Исследователи допускают, что пользователей подкупает вежливость, проявляемая ИИ. «Последующие полуструктурированные интервью показали, что вежливый язык, чётко сформулированные ответы в стиле учебника, а также полнота являются одними из основных причин, по которым ответы ChatGPT выглядели более убедительными, поэтому участники ослабили бдительность и упустили из виду некоторую дезинформацию в ответах ChatGPT», — сообщили они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
WhatsApp тестирует ИИ-редактирование фотографий с помощью текстовых запросов 20 мин.
Психологический хоррор Scotophobia от российской студии отправит игроков в кромешную тьму отвоёвывать свой дом у нечисти — дата выхода и жуткий трейлер 2 ч.
Microsoft запатентовала технологию защиты от «визуального взлома» с помощью отслеживания взгляда 2 ч.
«Это был крупный провал»: создатель Okami рассказал, что пошло не так 3 ч.
Ещё капельку: Бирмингем дал Oracle ещё £10 млн на поддержку провального внедрения ERP Fusion, которое уже обошлось в £100+ млн 3 ч.
Создатели «Смуты» взялись за работу над прототипами новых игр 5 ч.
«Невероятно многообещающе»: блогер показал геймплей мультиплеерного мода в духе GTA Online для Cyberpunk 2077 6 ч.
Бывший эксперт AMD по трассировке лучей поможет сделать компьютерные чипы Qualcomm пригодными для игр 6 ч.
Аниматор «засветил» неанонсированный ремейк от издателя Borderlands, BioShock и Mafia — фанаты теряются в догадках 7 ч.
Microsoft добавила в «Блокнот» проверку орфографии и автокоррекцию — через 40 лет после релиза 8 ч.
Новая статья: Обзор смартфона TECNO CAMON 30 Pro 5G: еще один из рода «камон» 53 мин.
Европа завтра впервые запустит ракету Ariane 6 — она должна стать альтернативой американской SpaceX Falcon 9 2 ч.
Key Point построит в Ростовской области ЦОД на тысячу стоек 2 ч.
Gigabyte представила 27-дюймовый игровой монитор M27UA с 4K и 160 Гц 4 ч.
Asus анонсировала мини-ПК NUC 14 Pro Plus на базе процессоров Intel Core Ultra 100 4 ч.
NASA закончило симуляцию экспедиции на Марс — все исследователи живы и здоровы после года в полной изоляции 5 ч.
Google отказалась от углеродно-нейтрального статуса ради достижения реальных нулевых выбросов к 2030 году 6 ч.
Samsung рассказала об обновлённом датчике BioActive для будущих смарт-часов Galaxy Watch 7 ч.
Космический телескоп NASA NEOWISE для фотоохоты на астероиды скоро завершит работу и сгорит в атмосфере 7 ч.
«Лаборатория Касперского» представила единое решение для построения безопасных распределённых промышленных сетей 8 ч.