Сегодня 12 сентября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Фанат обнаружил в Doom для Sega Saturn чит-код, о котором никто не знал 27 лет 8 мин.
Сегодня в России прекратил работать ряд зарубежных IT-сервисов, но рядовые пользователи этого почти не заметили 11 мин.
Три пути: аналитики предсказали развитие рынка видеоигр в России до 2030 года 50 мин.
«Это должно быть партнёрство, основанное на доверии»: Unity окончательно отменила комиссию Runtime за количество установок игр 2 ч.
Команда фанатов приобрела права на Flappy Bird и перезапустит легендарную мобильную игру в 2025 году 3 ч.
Telegram начал отвечать на запросы властей Франции после ареста Павла Дурова 5 ч.
«Аппетиты» ремейка Until Dawn не напугают игроков — системные требования и особенности ПК-версии 5 ч.
Cyberpunk 2077 получила долгожданную поддержку технологии масштабирования AMD FSR 3 7 ч.
Китайские техногиганты бросили вызов США в гонке ИИ 8 ч.
Microsoft уволит ещё 650 сотрудников игрового подразделения ради успехов в будущем 8 ч.
Sony добавила в PlayStation 5 функцию адаптивной зарядки, но доступна она будет не всем 19 мин.
SiMa.ai представила чипы Modalix для мультимодальных рабочих нагрузок ИИ на периферии 51 мин.
У российских корпораций растёт интерес к строительству собственных ЦОД 2 ч.
SpaceX доставила на орбиту пять огромных спутников связи конкурирующей AST SpaceMobile 4 ч.
Lenovo засветила ноутбук ThinkPad T14s Gen 6 с загадочным процессором Ryzen AI 7 Pro 360 4 ч.
Huawei готовится к глобальному запуску трёхстворчатого смартфона Mate XT, но это не точно 5 ч.
Samsung представила 95-долларовый смартфон Galaxy M05 с Helio G85 и 4 Гбайт оперативной памяти 5 ч.
ViewSonic представила профессиональный 27-дюймовый монитор ColorPro VP2776T-4K с двумя портами Thunderbolt 4 6 ч.
Tecno представила бюджетный смартфон Pova 6 Neo 5G со 108-Мп камерой, ИИ и чипом Dimensity 6300 6 ч.
Starlink становится монополистом, заметили в FCC и порекомендовали развиваться конкурентам 6 ч.