Сегодня 26 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила большую языковую ИИ-модель LLaMA для создания чат-ботов вроде ChatGPT, но лучше и экономичнее

Meta Platforms представила в пятницу большую языковую модель Large Language Model Meta AI (LLaMA) на базе ИИ, предназначенную для исследовательского сообщества. LLaMA будет доступна по некоммерческой лицензии исследователям и организациям, связанным с правительством, гражданским обществом и академическими кругами, сообщается в блоге компании. Разработчики смогут использовать LLaMA для создания чат-ботов и других продуктов на основе ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

LLaMA отличается от ChatGPT тем, что вовсе не является системой, с которой можно поговорить, а скорее исследовательским инструментом, который может помочь экспертам выявить проблемы языковых моделей ИИ, от предвзятости и токсичности до их склонности выдумывать информацию. Также следует отметить, что LLaMA Meta будет доступна в нескольких версиях — LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров — 7, 13, 33 и 65 млрд соответственно.

Инструмент, LLaMA, является новейшим достижение Meta в области больших языковых моделей, которые «показали многообещающие возможности для создания текста, ведения разговоров, обобщения письменного материала и более сложных задач, таких как решение математических теорем или предсказание белковых структур»,сообщил исполнительный директор Марк Цукерберг в своём аккаунте в Instagram.

LLaMA является более новой и продвинутой системой по сравнению с вышедшей в мае прошлого года большой языковой моделью OPT-175B, тоже предназначенной для исследователей, которая легла в основу новой версии чат-бота Meta BlenderBot.

Meta утверждает, что вторая по размеру версия модели LLaMA, LLaMA-13B, «в большинстве тестов» работает лучше популярной модели OpenAI GPT-3, в то время как самая большая модель LLaMA-65B, «конкурирует с лучшими моделями», такими как Chinchilla70B от DeepMind и PaLM 540B от Google.

В конце прошлого года компания выпустила ещё одну языковую модель Galactica, демонстрационную версию которой вскоре закрыла после того, как исследователи обнаружили, что она регулярно делилась предвзятой или неточной информацией.

Сообщается, что компания предоставит пользователям базовый код для настройки модели и её применения в сценариях использования, связанных с исследованиями. Модель, которая, по словам Meta, требует «гораздо меньше» вычислительной мощности, обучается на 20 языках с упором на языки с латиницей и кириллицей. После обучения LLaMA-13B сможет работать на одном ускорителе NVIDIA Tesla V100.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В работе ChatGPT произошёл глобальный сбой 3 мин.
Разработчики Assetto Corsa Evo подтвердили, с каким контентом игра выйдет на старт раннего доступа и чего ждать от полноценного релиза 8 мин.
Российский аниме-хоррор MiSide внезапно оказался хитом Steam — восторженные отзывы игроков, сотни тысяч проданных копий 2 ч.
Киберпанковый слешер Ghostrunner 2 стал новой бесплатной игрой в Epic Games Store — раздача доступна в России и продлится всего 24 часа 4 ч.
Activision сыграет в кальмара: новый трейлер раскрыл, когда в Call of Duty: Black Ops 6 стартует кроссовер со Squid Game 2 5 ч.
«К чёрту Embracer Group»: неизвестный устроил утечку исходного кода Saints Row IV 6 ч.
Отечественная платформа Tantor повысит производительность и удобство работы с СУБД на базе PostgreSQL 9 ч.
В Steam вышла новая демоверсия голливудской стратегии Hollywood Animal от авторов This is the Police 9 ч.
IT-холдинг Т1 подал иск к «Марвел-Дистрибуции» в связи с уходом Fortinet из России 10 ч.
Рождественское чудо: в открытый доступ выложили документы Rockstar начала 2000-х, включая планы на GTA Online от 2001 года 10 ч.