Сегодня 20 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Исследователи нашли способ масштабирования ИИ без дополнительного обучения, но это не точно

Группа исследователей из Google и Калифорнийского университета в Беркли предложила новый метод масштабирования искусственного интеллекта (ИИ). Речь идёт о так называемом «поиске во время вывода», который позволяет модели генерировать множество ответов на запрос и выбирать лучший из них. Этот подход может повысить производительность моделей без дополнительного обучения. Однако сторонние эксперты усомнились в правильности идеи.

 Источник изображения: сгенерировано AI

Источник изображения: сгенерировано AI

Ранее основным способом улучшения ИИ было обучение больших языковых моделей (LLM) на всё большем объёме данных и увеличение вычислительных мощностей при запуске (тестировании) модели. Это стало нормой, а точнее сказать, законом для большинства ведущих ИИ-лабораторий. Новый метод, предложенный исследователями, заключается в том, что модель генерирует множество возможных ответов на запрос пользователя и затем выбирает лучший. Как отмечает TechCrunch, это позволит значительно повысить точность ответов даже у не очень крупных и устаревших моделей.

В качестве примера учёные привели модель Gemini 1.5 Pro, выпущенную компанией Google в начале 2024 года. Утверждается, что, используя технику «поиска во время вывода» (inference-time search), эта модель обошла мощную o1-preview от OpenAI по математическим и научным тестам. Один из авторов работы, Эрик Чжао (Eric Zhao), подчеркнул: «Просто случайно выбирая 200 ответов и проверяя их, Gemini 1.5 однозначно обходит o1-preview и даже приближается к o1».

Тем не менее, эксперты посчитали эти результаты предсказуемыми и не увидели в методе революционного прорыва. Мэтью Гуздиал (Matthew Guzdial), исследователь ИИ из Университета Альберты, отметил, что метод работает только в тех случаях, когда можно чётко определить правильный ответ, а в большинстве задач это невозможно.

С ним согласен и Майк Кук (Mike Cook), исследователь из Королевского колледжа Лондона. По его словам, новый метод не улучшает способность ИИ к рассуждениям, а лишь помогает обходить существующие ограничения. Он пояснил: «Если модель ошибается в 5 % случаев, то, проверяя 200 вариантов, эти ошибки просто станут более заметны». Основная проблема состоит в том, что метод не делает модели умнее, а просто увеличивает количество вычислений для поиска наилучшего ответа. В реальных условиях такой подход может оказаться слишком затратным и малоэффективным.

Несмотря на это, поиск новых способов масштабирования ИИ продолжается, поскольку современные модели требуют огромных вычислительных ресурсов, а исследователи стремятся найти методы, которые позволят повысить уровень рассуждений ИИ без чрезмерных затрат.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«VK Видео» показал лучший рост среди сервисов VK в 2024 году — компания отчиталась о подскочившей выручке и скромном росте аудитории 15 мин.
«ВКонтакте» упростит получение «синей галочки» 2 ч.
В России придумали, как идентифицировать человека по клавиатурному почерку 2 ч.
OpenAI предоставила разработчикам свою самую дорогую ИИ-модель o1-pro 2 ч.
Huawei представит первый ПК на собственной HarmonyOS в мае 2025 года 3 ч.
«Яндекс» представил ИИ-художника YandexART 2.5 с повышенной точностью и сторублёвую подписку «Шедеврум Про» 3 ч.
Новый геймплейный трейлер раскрыл дату выхода Deliver At All Costs — взрывного симулятора курьера, который оставляет после себя хаос и разрушения 3 ч.
«То, чего так не хватало игре»: анонсирована неофициальная русская озвучка RoboCop: Rogue City 4 ч.
МТС объявила о закрытии своего заменителя YouTube и TikTok 6 ч.
Meta AI добрался до Европы, но с ограничениями и без обучения на данных пользователей 7 ч.
Почти вся ИТ-инфраструктура «Почты России» фактически «дышит на ладан», пожаловался глава госкомпании 24 мин.
Huawei представила футуристические беспроводные наушники FreeBuds 6 с очень мощным шумоподавлением за $140 30 мин.
Supermicro анонсировала петабайтное 1U-хранилище All-Flash на базе Arm-суперчипа NVIDIA Grace 51 мин.
Рукастый робот-пылесос Roborock Saros Z70, обученный убирать разбросанные носки, поступит в продажу за $1899 58 мин.
ViewSonic выпустила 27-дюймовый игровой монитор XG275D-4K с поддержкой FHD@320 Гц и 4K@160 Гц 2 ч.
Samsung опровергла слухи о прекращении разработки 1,4-нм техпроцесса 3 ч.
SK hynix и Samsung рассказали про память HBM4E: до 20 ярусов и 64 Гбайт в одном стеке 3 ч.
Все подробности о планшетах Samsung Galaxy Tab S 10 FE раскрыты в преддверии анонса 3 ч.
SoftBank решила купить производителя Arm-процессоров Ampere Computing за $6,5 млрд 3 ч.
Учёные показали как выглядела Вселенная до появления первых звёзд 4 ч.