Сегодня 20 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Исследователи нашли способ масштабирования ИИ без дополнительного обучения, но это не точно

Группа исследователей из Google и Калифорнийского университета в Беркли предложила новый метод масштабирования искусственного интеллекта (ИИ). Речь идёт о так называемом «поиске во время вывода», который позволяет модели генерировать множество ответов на запрос и выбирать лучший из них. Этот подход может повысить производительность моделей без дополнительного обучения. Однако сторонние эксперты усомнились в правильности идеи.

 Источник изображения: сгенерировано AI

Источник изображения: сгенерировано AI

Ранее основным способом улучшения ИИ было обучение больших языковых моделей (LLM) на всё большем объёме данных и увеличение вычислительных мощностей при запуске (тестировании) модели. Это стало нормой, а точнее сказать, законом для большинства ведущих ИИ-лабораторий. Новый метод, предложенный исследователями, заключается в том, что модель генерирует множество возможных ответов на запрос пользователя и затем выбирает лучший. Как отмечает TechCrunch, это позволит значительно повысить точность ответов даже у не очень крупных и устаревших моделей.

В качестве примера учёные привели модель Gemini 1.5 Pro, выпущенную компанией Google в начале 2024 года. Утверждается, что, используя технику «поиска во время вывода» (inference-time search), эта модель обошла мощную o1-preview от OpenAI по математическим и научным тестам. Один из авторов работы, Эрик Чжао (Eric Zhao), подчеркнул: «Просто случайно выбирая 200 ответов и проверяя их, Gemini 1.5 однозначно обходит o1-preview и даже приближается к o1».

Тем не менее, эксперты посчитали эти результаты предсказуемыми и не увидели в методе революционного прорыва. Мэтью Гуздиал (Matthew Guzdial), исследователь ИИ из Университета Альберты, отметил, что метод работает только в тех случаях, когда можно чётко определить правильный ответ, а в большинстве задач это невозможно.

С ним согласен и Майк Кук (Mike Cook), исследователь из Королевского колледжа Лондона. По его словам, новый метод не улучшает способность ИИ к рассуждениям, а лишь помогает обходить существующие ограничения. Он пояснил: «Если модель ошибается в 5 % случаев, то, проверяя 200 вариантов, эти ошибки просто станут более заметны». Основная проблема состоит в том, что метод не делает модели умнее, а просто увеличивает количество вычислений для поиска наилучшего ответа. В реальных условиях такой подход может оказаться слишком затратным и малоэффективным.

Несмотря на это, поиск новых способов масштабирования ИИ продолжается, поскольку современные модели требуют огромных вычислительных ресурсов, а исследователи стремятся найти методы, которые позволят повысить уровень рассуждений ИИ без чрезмерных затрат.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Xbox упомянула Hollow Knight: Silksong в списке игр 2025 года — фанаты замерли в предвкушении 7 ч.
ЕС обязал Apple упростить подключение сторонних смарт-часов к iPhone — в компании заявили, что это «это плохо для пользователей» 7 ч.
Исследователи нашли способ масштабирования ИИ без дополнительного обучения, но это не точно 7 ч.
ЕС потребовал от Google прекратить ущемлять конкурентов в поисковой выдаче и пригрозил штрафом до $35 млрд 9 ч.
По мотивам творчества легендарной метал-группы Voivod выйдет «умопомрачительная» метроидвания Voivod: The Nuclear Warrior 9 ч.
Лошадь есть, ума не надо: сюжетный платформер Brute Horse отправит игроков в абсурдный мир, где даже конь может стать оружием 10 ч.
Microsoft исправила баг с автоматическим удалением ИИ-помощника Copilot из Windows 11 11 ч.
Дуров похвастался миллиардом активных пользователей Telegram и назвал WhatsApp «дешёвой имитацией» 11 ч.
Будущее Baldur's Gate прояснится «довольно скоро» — у владельца Dungeons & Dragons большие планы на франшизу 12 ч.
В России официально разрешат торговать криптовалютой, но лишь особым людям 13 ч.
Лунный аппарат Blue Ghost сделал первые в истории фотографии лунного заката в высоком разрешении 14 мин.
SoftBank купит за $6,5 млрд разработчика серверных процессоров Ampere Computing 16 мин.
Анонсированы суперускорители на Rubin и Rubin Ultra, в которых NVIDIA не будет ошибаться в подсчётах 6 ч.
Человекоподобный робот Atlas научился танцевать брейк-данс и ходить колесом, насмотревшись на людей 7 ч.
Новая статья: Жидкостное охлаждение ID-Cooling DashFlow 360 XT Pro: лучше, дешевле, но ещё не идеал 7 ч.
Сезон охоты за тёмной материей и не только открыт — опубликован первый пакет данных с телескопа «Евклид» 9 ч.
«Увеон — облачные технологии» выпустил отечественный контроллер доставки приложений 10 ч.
Micron и SK hynix представили компактные модули памяти SOCAMM для ИИ-систем Nvidia GB300 11 ч.
«Джеймс Уэбб» впервые обнаружил углекислый газ на далёкой экзопланете 12 ч.
Xiaomi отчиталась о рекордной годовой выручке в $50 млрд — помогли дорогие смартфоны и электромобили 12 ч.