Сегодня 26 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple, Microsoft, Meta✴ и Google сосредоточились на создании небольших ИИ-моделей с мощными возможностями из-за высокой стоимости LLM

Специализирующиеся в сфере ИИ компании, вложившие миллиарды долларов на создание больших языковых моделей (LLM), теперь делают ставку на «небольшие» языковые модели в качестве нового источника повышения доходов, пишет газета Financial Times. Затраты на создание и обучение таких ИИ-моделей гораздо меньше, чем на LLM.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Apple, Microsoft, Meta и Google недавно выпустили новые ИИ-модели с меньшим количеством параметров, но при этом с мощными возможностями. На этот шаг их толкнула высокая стоимость LLM, а также опасения по поводу использования собранных для обучения данных в связи с возможным нарушением авторских прав.

Такие компании, как Meta и Google, начали предлагать небольшие языковые модели всего с несколькими миллиардами параметров как более дешёвую, энергоэффективную, настраиваемую альтернативу большим языковым моделям. К тому же на обучение и запуск таких моделей требуется меньше энергии, и они способны обеспечить защиту конфиденциальных данных.

«Обладая таким высоким качеством при меньших затратах, вы фактически предоставляете клиентам возможность использовать гораздо больше приложений и выполнять такие действия, которые, по их мнению, не принесли бы им достаточной отдачи от этих инвестиций (в LLM), чтобы оправдать их реальное использование», — отметил Эрик Бойд (Eric Boyd), корпоративный вице-президент Microsoft Azure AI Platform.

Google, Meta, Microsoft и французский стартап Mistral также выпустили небольшие языковые модели с расширенными возможностями и более ориентированными на выполнение конкретных задач.

Преимущество небольших языковых моделей также заключается в том, что они могут выполнять задачи локально на устройстве, не отправляя информацию в облако, что подойдёт клиентам, заботящимся о конфиденциальности и не желающим отправлять информацию за пределы внутренних сетей. Также такие модели можно использовать на смартфонах. Например, модель Gemini Nano от Google установлена на смартфонах Pixel и Samsung S24. Apple тоже намекнула, что разрабатывает ИИ-модели для работы на смартфонах iPhone.

В свою очередь, глава OpenAI Сэм Альтман (Sam Altman) заявил, что его компания по-прежнему будет работать над созданием более крупных моделей ИИ с расширенными возможностями, способными рассуждать, планировать и выполнять задачи, и которые в конечном итоге смогут достичь такого же уровня интеллекта, как у человека.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«К чёрту Embracer Group»: неизвестный устроил утечку исходного кода Saints Row IV 2 ч.
Отечественная платформа Tantor повысит производительность и удобство работы с СУБД на базе PostgreSQL 5 ч.
В Steam вышла новая демоверсия голливудской стратегии Hollywood Animal от авторов This is the Police 5 ч.
IT-холдинг Т1 подал иск к «Марвел-Дистрибуции» в связи с уходом Fortinet из России 6 ч.
Рождественское чудо: в открытый доступ выложили документы Rockstar начала 2000-х, включая планы на GTA Online от 2001 года 6 ч.
«Битрикс24» представил собственную ИИ-модель BitrixGPT 7 ч.
За 2024 год в Китае допустили к релизу более 1400 игр — это лучший результат за последние пять лет 7 ч.
Google применила конкурирующего ИИ-бота Anthropic Claude для улучшения своих нейросетей Gemini 8 ч.
Apple призналась, почему из российского App Store стали пропадать VPN-приложения 9 ч.
Платформер Restitched отправит исследовать и создавать красочные миры — геймплейный трейлер духовного наследника LittleBigPlanet 9 ч.
Omdia: быстрый рост спроса на TPU Google ставит под вопрос доминирование NVIDIA на рынке ИИ-ускорителей 44 мин.
Российскую игровую приставку собрались построить на процессоре «Эльбрус», для которого не существует игр 2 ч.
Ubitium придумала универсальный процессор — он один выполняет работу CPU, GPU, FPGA и DSP 2 ч.
Equinix предложил ИИ-фабрики на базе систем Dell с ускорителями NVIDIA 3 ч.
NASA показало «рождественскую ель» галактического масштаба 3 ч.
Китайский оператор ЦОД Yovole может выйти на IPO в США — после неудавшейся попытки в Китае 3 ч.
Patriot представила SSD P400 V4 PCIe 4.0 — до 4 Тбайт и до 6200 Мбайт/с 4 ч.
OnePlus представила доступные флагманы Ace 5 и Ace 5 Pro со Snapdragon, большими экранами и до 16 Гбайт ОЗУ 4 ч.
Китайский робопёс Unitree B2-W показал чудеса ловкости при езде по пересечённой местности и воде 5 ч.
В серию трёхфазных ИБП Ippon Intatum ML вошли модели мощностью до 300 кВА 5 ч.