Apple, Microsoft, Meta и Google сосредоточились на создании небольших ИИ-моделей с мощными возможностями из-за высокой стоимости LLM

Специализирующиеся в сфере ИИ компании, вложившие миллиарды долларов на создание больших языковых моделей (LLM), теперь делают ставку на «небольшие» языковые модели в качестве нового источника повышения доходов, пишет газета Financial Times. Затраты на создание и обучение таких ИИ-моделей гораздо меньше, чем на LLM.

Источник изображения: geralt/Pixabay

Apple, Microsoft, Meta✴ и Google недавно выпустили новые ИИ-модели с меньшим количеством параметров, но при этом с мощными возможностями. На этот шаг их толкнула высокая стоимость LLM, а также опасения по поводу использования собранных для обучения данных в связи с возможным нарушением авторских прав.

Такие компании, как Meta✴ и Google, начали предлагать небольшие языковые модели всего с несколькими миллиардами параметров как более дешёвую, энергоэффективную, настраиваемую альтернативу большим языковым моделям. К тому же на обучение и запуск таких моделей требуется меньше энергии, и они способны обеспечить защиту конфиденциальных данных.

«Обладая таким высоким качеством при меньших затратах, вы фактически предоставляете клиентам возможность использовать гораздо больше приложений и выполнять такие действия, которые, по их мнению, не принесли бы им достаточной отдачи от этих инвестиций (в LLM), чтобы оправдать их реальное использование», — отметил Эрик Бойд (Eric Boyd), корпоративный вице-президент Microsoft Azure AI Platform.

Google, Meta✴, Microsoft и французский стартап Mistral также выпустили небольшие языковые модели с расширенными возможностями и более ориентированными на выполнение конкретных задач.

Преимущество небольших языковых моделей также заключается в том, что они могут выполнять задачи локально на устройстве, не отправляя информацию в облако, что подойдёт клиентам, заботящимся о конфиденциальности и не желающим отправлять информацию за пределы внутренних сетей. Также такие модели можно использовать на смартфонах. Например, модель Gemini Nano от Google установлена на смартфонах Pixel и Samsung S24. Apple тоже намекнула, что разрабатывает ИИ-модели для работы на смартфонах iPhone.

В свою очередь, глава OpenAI Сэм Альтман (Sam Altman) заявил, что его компания по-прежнему будет работать над созданием более крупных моделей ИИ с расширенными возможностями, способными рассуждать, планировать и выполнять задачи, и которые в конечном итоге смогут достичь такого же уровня интеллекта, как у человека.