Сегодня 13 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ чат-боты «думают» на английском, даже когда говорят на других языках

Большие языковые модели (LLM), лежащие в основе чат-ботов, «думают» на английском языке, даже если вопросы задаются на других языках, пишет ресурс New Scientist со ссылкой на исследование учёных Федеральной политехнической школы Лозанны. Чтобы понять, какой язык на самом деле используют LLM при обработке запросов, учёные изучили три версии модели Llama 2 компании Meta. Благодаря тому, что Llama 2 имеет открытый исходный код, исследователи смогли ознакомиться с каждым этапом обработки запроса.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

По словам одного из исследователей, они открыли эти модели и изучили каждый из их слоёв. ИИ-модели состоят из нескольких слоёв, каждый из которых отвечает за определённый этап обработки запроса: один переводит письменные подсказки в токены, другой контекстуализирует каждый токен, чтобы в итоге дать ответ.

Моделям были предложены три типа запросов на китайском, французском, немецком и русском языках. В одном случае предлагалось повторить заданное слово, во втором — перевести с одного неанглийского языка на другой, и в третьем — заполнить пробел в одно слово в предложении, например: «___ используется для занятий такими видами спорта, как футбол и баскетбол».

Отследив процессы, через которые проходит LLM, чтобы ответить на запрос, учёные обнаружили, что путь обработки через слои почти всегда проходит через то, что они называют английским подпространством. То есть, если предложить модели перевести с китайского на русский, русские символы проходят через английское подпространство, прежде чем вернуться на русский, говорит учёный, что является убедительным признаком того, что модели используют английский, чтобы помочь себе понять суть запроса.

Это вызвало у учёных обеспокоенность по поводу того, что использование английского языка в качестве посредника для обучения модели анализу языка несёт с собой риск распространить связанные с этим ограничения в мировоззрении на другие лингвистически и культурно отличающиеся регионы.

«Если английский станет основным языком, на котором системы обрабатывают запросы, мы, скорее всего, потеряем концепции и нюансы, которые можно оценить только на других языках», — говорит Карисса Велиз (Carissa Véliz) из Оксфордского университета.

Существуют также более фундаментальные риски, связанные с кодированием используемых во всем мире генеративных ИИ с англоцентрическими ценностями, сообщила Алия Бхатия (Aliya Bhatia) из Центра демократии и технологий в Вашингтоне (округ Колумбия). «Если модель используется для генерации текста на языке, которому она не обучена, это может привести к культурно нерелевантным галлюцинациям, а если модель используется для принятия решений о предоставлении убежища для сообщества, которое не вписывается в англоцентрическое воображение обществе, модель может стоять между человеком и доступом к безопасности», — говорит она.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Witchfire — дикая охота… играть снова и снова. Предварительный обзор 12 ч.
Новая статья: Gamesblender № 695: слухи о продаже Ubisoft, Red Dead Redemption на ПК, новый «Мор» и будущее Halo 12 ч.
Xbox Cloud Gaming позволит запускать в облаке игры из библиотек пользователей уже в ноябре 16 ч.
ПАК OpenYard с СУБД YDB будет доступен для предзаказа в этом году 17 ч.
Брокеры данных собирают огромные объёмы информации о каждом человеке, но иногда можно попросить её удалить 19 ч.
В России появилась Ассоциация игровой индустрии — разработчики видеоигр будут сообща решать задачи регулирования 19 ч.
Роскомнадзор намерен получить право блокировать ресурсы без решения суда 12-10 01:07
Новая статья: Iron Meat — наконец-то новая Contra! Рецензия 12-10 00:03
«Беззаботный взгляд на мир ведьмаков»: CD Projekt Red анонсировала сборник комиксов The Little Witcher про приключения маленькой Цири в Каэр Морхене 11-10 23:31
Соавтор Disco Elysium основал «революционную новую RPG-студию» для создания ролевой игры под стать «нашему убогому и прекрасному миру» 11-10 22:42
Представлен смартфон Oppo K12 Plus — экран 120 Гц, чип Snapdragon 7 Gen 3 и батарея на 6400 мА·ч за $270 3 ч.
Роботы Tesla Optimus, взаимодействующие с публикой на мероприятии в октябре, не были полностью автономными 5 ч.
В Китае создали крупнейший в мире детектор нейтрино — он начнёт работу в 2025 году 16 ч.
Supermicro представила широкий ассортимент серверов H14 на платформе AMD EPYC Turin 17 ч.
Lenovo анонсировала серверы ThinkSystem с чипами AMD EPYC Turin и ускорителями Instinct MI325X 18 ч.
Giga Computing выпустила серверы с чипами AMD EPYC Turin и ускорителями Instinct MI325X 18 ч.
Dell представила ИИ-серверы PowerEdge на базе AMD EPYC Turin 18 ч.
HPE представила мощную ИИ-систему ProLiant Compute XD685 с Instinct MI325X и другие серверы на чипах AMD EPYC Turin 18 ч.
Впервые в истории два человека обменялись сообщениями во сне на расстоянии, утверждает стартап REMspace с российскими корнями 19 ч.
AMD Ryzen 9000X3D будут на 2–13 % быстрее предшественников в играх, согласно тестам MSI 19 ч.