Сегодня 28 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Для обучения ИИ-модели Google PaLM 2 использовали впятеро больше текстовых данных, чем для предыдущей

Анонсированная на прошлой неделе большая языковая модель Google PaLM 2 была обучена на объёме, который в пять раз превышает аналогичный показатель модели 2022 года. Это позволяет новой нейросети решать более сложные задачи по программированию, математике и написанию текстов, выяснили журналисты CNBC.

 Источник изображения: blog.google

Источник изображения: blog.google

При обучении Google PaLM 2 было использовано 3,6 трлн токенов — эти элементы обучения больших языковых моделей помогают нейросетям предсказывать последующие слова в последовательностях. Алгоритмы предсказания, в свою очередь, позволяют большим языковым моделям составлять связные фразы. Предыдущую её версию, Google PaLM, которая была выпущена в 2022 году, обучили на 780 млрд токенов.

На прошедшем мероприятии Google I/O компания активно демонстрировала возможности искусственного интеллекта при его интеграции в поиск, электронную почту, работу с текстовыми документами и электронными таблицами, но не сообщала подробностей об объемах обучающих данных. Аналогичной стратегии предпочла придерживаться компания OpenAI, недавно представившая GPT-4. Свои действия компании объясняют конкурентным характером бизнеса, а общественность настаивает на большей прозрачности в отношении ИИ.

Google всё же рассказала, что новая модель оказалась меньше предыдущих, то есть эффективность технологии при выполнении более сложных задач выросла. PaLM 2, согласно внутренним документам компании, обучена на 340 млрд параметров, тогда как у первой версии их было 540 млрд — это свидетельствует, что увеличилась сложность модели. В компании подтвердили, что PaLM 2 обучена сотне языков, и это позволяет ей интегрироваться в 25 функций и продуктов экосистемы Google, включая экспериментальный чат-бот Bard.

Google PaLM 2, если верить общедоступным данным, может оказаться мощнее всех существующих моделей. Для сравнения, анонсированная в феврале Meta LlaMA обучена на 1,4 трлн токенов; OpenAI, когда ещё делилась информацией, докладывала, что GPT-3 обучалась на 300 млрд токенов; а представленная ещё два года назад Google LaMDA была обучена на 1,5 трлн токенов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Китайские хакеры взломали девять американских телекоммуникационных компаний 38 мин.
Данные 800 тысяч владельцев электромобилей Volkswagen оказались в открытом доступе 47 мин.
Роскомнадзор зарегистрировал более 49 тыс. каналов и страниц в соцсетях с аудиторией свыше 10 тыс. человек 12 ч.
Соучредителя Terraform Labs, из-за банкротства которой инвесторы потеряли более $40 млрд, экстрадируют в США 12 ч.
В Windows 11 появятся расширенные настройки камеры — с их помощью можно менять качество съёмки и частоту кадров 12 ч.
FTC подозревает Microsoft в монополизации госзаказов США 15 ч.
Дональд Трамп просит Верховный суд поставить на паузу действие закона, угрожающего запретом TikTok в США 15 ч.
Хакеры взломали ряд расширений для Chrome для кражи паролей и личных данных пользователей 20 ч.
«Взорвёт вам мозг»: энтузиасты показали трейлер мода, который добавит в Marvel's Spider-Man мультиплеер на 16 игроков 20 ч.
Разработчики Hades II раскрыли, когда выйдет второе крупное обновление, и чего ждать дальше 22 ч.
Пара виноградин вдвое усилила магнитное поле, и открыла путь к лучшим квантовым датчикам 27 мин.
В ремешках популярных смарт-часов нашли токсичную и опасную для здоровья химию 2 ч.
МТС распродала первую партию своих консолей для облачного гейминга всего за 14 часов 4 ч.
В Китае создали самый мощный в мире электрогенератор на водороде — за час он сжигает 444 т чистого водорода 5 ч.
Китайские компании лидируют в гонке по снижению времени заряда электромобиля до пяти минут 5 ч.
В России заблокировали возможность использования IP-телефонии для звонков на мобильные и стационарные телефоны 6 ч.
Minisforum представила миниатюрные материнские платы с встроенными 16-ядерными Ryzen 9 6 ч.
Тяжёлая ракета New Glenn Blue Origin прожгла маршевые двигатели и допущена к первому запуску 7 ч.
Итальянская нефтегазовая компания Eni запустила суперкомпьютер HPC6 с производительностью 478 Пфлопс 7 ч.
Xiaomi создаст ИИ-кластер с 10 тыс. GPU 8 ч.