Сегодня 29 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Тестировщики оценивают ответы ИИ-бота Google Bard наугад, чтобы не терять деньги

Компания Google в прошлом месяце начала ограниченное бета-тестирование своего ИИ-чат-бота Bard. С тех пор сотрудники некоторых крупных подрядчиков IT-гиганта участвуют в тестировании нейросети, а также проверяют точность выдаваемых им ответов. Оказалось, что зачастую участникам тестирования не хватает времени на проверку ответов Bard, из-за чего им приходится давать оценку наугад.

 Источник изображения: Google

Источник изображения: Google

Так, сотрудники компании Appen, которые помогают Google в тестировании алгоритма Bard, на условиях анонимности сообщили представителям СМИ, что им не хватает времени на осмысленную оценку ответов, выдаваемых ИИ-ботом. В полученных ими инструкциях сказано, что в процессе тестирования необходимо подготовить запрос для чат-бота, а после получения двух ответов выбрать наиболее связный и корректный ответ. У них также есть возможность добавить комментарий, чтобы объяснить, почему выбран тот или иной вариант.

Участники тестирования отмечают, что на обработку каждого запроса даётся несколько минут, но иногда на это отводится только 60 секунд. Зачастую дать корректную оценку полученного от чат-бота ответа за такое время весьма затруднительно, особенно в случаях, когда запрос связан с малознакомой темой. Оплата за эту работу начисляется на основе времени, выделяемого для решения каждой задачи. Чтобы не терять деньги тестировщикам приходится выполнять задачи за отведённое время даже в случаях, когда они не уверены в том, какой из предложенных ИИ-алгоритмом ответов является более точным. Проще говоря, чтобы не терять деньги участники тестирования вынуждены наугад выполнять задания, поскольку им не хватает времени на качественную проверку ответов Bard.

Источник отмечает, что сотрудники подрядных организаций Google всё чаще призывают к улучшению условий труда. Ещё в феврале участники бета-тестирования системы Bard передали петицию руководству Google с призывом повысить оплату труда. Согласно имеющимся данным, сотрудники Appen, участвующие в тестировании Bard, зарабатывают от $14 до $14,50 в час.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Google, Meta и другие незаметно меняют политику конфиденциальности для обучения ИИ 3 ч.
Ticketmaster подтвердил кражу данных банковских карт, номеров телефонов и адресов электронной почты клиентов 7 ч.
Новая статья: Fallen Aces — карта в рукаве жанра. Предварительный обзор 7 ч.
Lenovo портировала свою облачную платформу на китайские процессоры Loongson 9 ч.
FromSoftware: виновником проблем с производительностью в ПК-версии Elden Ring: Shadow of the Erdtree может быть стороннее ПО для мышки 9 ч.
Роглайк-экшен Castle Come доверит игрокам управление ходячей крепостью в странном мире — первый трейлер и подробности 11 ч.
«Стало бы мечтой наяву»: продюсер Konami признался, что «больше всего» хотел бы снова поработать с Кодзимой над Metal Gear 12 ч.
В Казахстане официально разрешили торговать Toncoin 12 ч.
Windows 10 будет получать обновления безопасности до 2030 года благодаря 0Patch 13 ч.
Создатели Warhammer 40,000: Space Marine 2 раскрыли продолжительность сюжетной кампании и отменили обещанную «бету» 13 ч.
Испытан контейнер для жидкого азота, разработанный ИИ и напечатанный на 3D-принтере 46 мин.
Спрос на память в серверном сегменте поднимет цены на DRAM в третьем квартале на 8–13 % 2 ч.
На закупку оборудования и подготовку к выпуску 2-нм продукции TSMC потратит $12,3 млрд за два года 4 ч.
Audi интегрирует ChatGPT в систему MIB3, расширив возможности голосового интерфейса 4 ч.
Рынок флеш-памяти NAND столкнулся с избытком предложения и низким потребительским спросом 8 ч.
Apple может упростить замену аккумуляторов iPhone 8 ч.
SK hynix представила оптимизированный для ИИ твёрдотельный накопитель PCB01 с PCIe 5.0 и скоростью до 14 Гбайт/с 9 ч.
У электромобилей по-прежнему большие проблемы с качеством — большинство проблем из-за ПО 14 ч.
Vivo представила 12,1-дюймовый планшет Pad3 с чипом Snapdragon 8s Gen 3 и аккумулятором на 10 000 мА·ч 14 ч.
Lian Li представила серию СЖО HydroShift LCD 360 с большими дисплеями и держателями для трубок 14 ч.