Сегодня 31 марта 2025

18+

О сайте Реклама Рассылка Контакты

ии-помощник

Теги → ии-помощник

Быстрый переход

05:15 31.01.2025 Google запустила ИИ-функцию Ask for Me для звонков в автомастерские и маникюрные салоны вместо пользователя
07:43 23.01.2025 Google научила ИИ Gemini использовать сразу несколько приложений для одного запроса
15:20 18.01.2025 OpenAI завершила разработку мощной ИИ-модели o3-mini со способностью к рассуждению
04:24 17.01.2025 Microsoft решила, что подписчики Microsoft 365 будут платить на 30 % больше за ИИ-инструменты
07:15 15.01.2025 ChatGPT научился планировать и напоминать о делах, как Siri и «Google Ассистент»
22:52 14.01.2025 ИИ-модель OpenAI o1 иногда думает на китайском языке, и никто не знает почему
00:00 13.01.2025 ИИ заменит человека в качестве основного пользователя приложений к 2030 году
13:04 09.01.2025 Gigabyte представила мощные игровые ноутбуки Aorus Master, Aero и Gaming, а также ИИ-помощника GiMATE
22:34 06.01.2025 Глава OpenAI рассказал, когда появятся сильный ИИ, сопоставимый с человеком — ждать осталось недолго
06:21 06.01.2025 Apple Intelligence стала занимать слишком много дискового пространства
00:45 13.12.2024 Anthropic выпустила мощную текстовую нейросеть Claude 3.5 Haiku — она вчетверо дороже флагманской Claude 3 Opus
01:54 12.12.2024 Google показала ИИ-агента, который помогает проходить игры, наблюдая за действиями игрока
08:00 23.11.2024 Google Gemini сможет управлять приложениями без пользователя и даже не открывая их
11:12 14.11.2024 OpenAI планирует выпустить ИИ-агента Operator в январе — он сможет управлять ПК без пользователя
04:41 29.10.2024 ИИ-поиск Google теперь доступен в 100 странах, в том числе Узбекистане и Кыргызстане — России в списке не оказалось

← В прошлое В будущее →

Google запустила ИИ-функцию Ask for Me для звонков в автомастерские и маникюрные салоны вместо пользователя

31.01.2025 [05:15], Николай Хижняк

Google тестирует новый ИИ-инструмент, который обзванивает компании от имени пользователей, чтобы выяснить интересующие их вопросы и записать на встречу. Функция под названием Ask for Me собирает информацию о ценах и доступности услуг, но пока поддерживается только для поиска подходящих под те или иные критерии пользователей маникюрных салонов и автомастерских.

Источник изображения: Google

Включение экспериментальной функции в Google Search Labs добавит в результаты веб-поиска местных маникюрных салонов или автомастерских сноску Ask for Me. При её выборе Google задаст пользователю ряд вопросов. Например, если речь об обслуживании автомобиля, то система спросит марку и модель авто, желаемый тип обслуживания (например, замена масла, смена шин и т.д.), а также время и дату, на которые пользователь хотел бы записаться для посещения автомастерской. Также необходимо будет ввести свой адрес электронной почты и/или номер телефона, на которые пользователь будет получать обновления по его запросу.

По словам руководителя отдела продуктов Google Роуз Яо (Rose Yao), функция Ask for Me создана на базе Duplex — инструмента в виде бесплатного сервиса, который использует ИИ для звонков в рестораны и, имитируя человеческий голос, от имени пользователя резервирует места.

В разговоре с порталом The Verge представитель Google Крейг Эвер (Craig Ewer) добавил, что с помощью Ask for Me «каждый звонок начинается с сообщения том, что это автоматизированная система Google, звонящая от имени пользователя». Компании могут отказаться от получения автоматизированных звонков в настройках своего профиля Google Business Profile или при непосредственном общении с ИИ-ботом. Эвер говорит, что для системы предусмотрена система квот по звонкам, чтобы компании не получали такие автоматические звонки слишком часто. Он также добавил, что любая собираемая ИИ-ботом информация «может быть использована для помощи с аналогичными запросами от других пользователей».

Google научила ИИ Gemini использовать сразу несколько приложений для одного запроса

23.01.2025 [07:43], Анжелла Марина

Компания Google объявила о масштабном обновлении ИИ-ассистента Gemini, который теперь сможет выполнять задачи, затрагивающие несколько приложений, в рамках одного запроса. Обновление было анонсировано одновременно с запуском новых устройств Samsung Galaxy S25, в которых Gemini станет виртуальным ассистентом по умолчанию, заменив «коллегу» Bixby.

Источник изображения: Google

Как сообщает The Verge, теперь Gemini способен на выполнение более сложных мультимодальных задач. Например, по запросу пользователя ассистент сможет найти ресторан итальянской кухни, где разрешено посещение с собаками, и сразу же отправить информацию об этом другу. В другом примере Gemini сможет найти расписание предстоящих игр любимой команды и добавить эту информацию в календарь, так же в рамках одного запроса.

Ранее функциональность взаимодействия с несколькими приложениями была основана на существующих расширениях Gemini, которые охватывали ряд приложений Google и ограниченное количество сторонних сервисов, таких как WhatsApp и Spotify. С сегодняшним же обновлением в этот список добавлены приложения Samsung для пользователей S25, включая Samsung Calendar, Notes, Reminder и Clock. При этом возможность использования одновременно нескольких расширений Gemini доступна для всех пользователей Android, iOS, а также через веб-браузер.

Также получил обновление голосовой режим Gemini Live, но пока функция доступна только для телефонов Galaxy S25 и S24, а также для серии Google Pixel 9. Владельцы этих устройств смогут отправлять изображения, файлы и видео с YouTube в интерфейс чата, запрашивая у Gemini отзывы и информацию. Google также сообщает, что анонсированные ранее возможности мультимодальной модели Project Astra, такие как совместное использование экрана и потоковая передача видео в реальном времени, появятся на Android в ближайшие месяцы.

Улучшена функция и Circle to Search. Теперь она автоматически распознаёт телефонные номера, адреса электронной почты и ссылки для упрощения взаимодействия. Кроме того, ИИ-обзоры в поисковых результатах стали поддерживать больше типов визуальных данных, включая изображения мест, объектов и произведений искусства.

Google также объявила об изменениях, которые упростят подключение брайлевских дисплеев и слуховых аппаратов к устройствам Android, сделав технологию более доступной для людей с ограниченными возможностями. Напомним, все эти нововведения были представлены на мероприятии Galaxy Unpacked, где Samsung также анонсировала свои новые устройства, включая Galaxy S25, S25 Plus, S25 Ultra и Galaxy Watch 7 LTE.

OpenAI завершила разработку мощной ИИ-модели o3-mini со способностью к рассуждению

18.01.2025 [15:20], Владимир Мироненко

Генеральный директор OpenAI Сэм Альтман (Sam Altman) сообщил в пятницу на платформе X о завершении работы над большой языковой моделью o3-mini, которую предполагается запустить в ближайшие пару недель. Он добавил, что компания учла пожелания пользователей и планирует выпустить интерфейс прикладного программирования (API) и ChatGPT одновременно.

Источник изображения: Mariia Shalabaieva/unsplash.com

OpenAI представила большие языковые модели нового поколения o3 и o3-mini со способностью рассуждать в декабре прошлого года, охарактеризовав их как самые умные среди ИИ-решений в мире.

Модели o3 и o3-mini превосходят по производительности и возможностям «думающую» ИИ-модель o1, анонсированную в сентябре прошлого года. Компания ранее сообщила, что планирует запустить модель o3-mini к концу января 2025 года, после чего выйдет полномасштабная модель o3, рассчитывая, что более надёжные и умные большие языковые модели смогут превзойти существующие версии нейросетей, и это позволит привлечь новые инвестиции и увеличить аудиторию пользователей.

Также на этой неделе OpenAI представила бета-версию новой функции Scheduled tasks in ChatGPT («Запланированные задачи в ChatGPT»), позволяющую пользователям автоматизировать свою работу с помощью запланированных задач в ChatGPT. Как отметило агентство Reuters, это говорит о «вторжении» OpenAI в сферу деятельности умных помощников, превращая чат-бот ChatGPT в конкурента персональных ассистентов, таких как Siri, Alexa и др.

Microsoft решила, что подписчики Microsoft 365 будут платить на 30 % больше за ИИ-инструменты

17.01.2025 [04:24], Анжелла Марина

Microsoft добавила функции Copilot в офисные приложения пакета Microsoft 365, увеличив стоимость подписки «Персональный» (Personal) и «Для семьи» (Home) на $3 в месяц. Существующие подписчики смогут продолжить использовать сервисы Microsoft 365 по старым тарифам до истечения оплаченного срока подписки. Также пользователи смогут остаться на прежних тарифах, отказавшись от функций Copilot.

Источник изображения: Microsoft

Ранее доступ к ИИ-Ассистенту Copilot для приложений Word, Excel и PowerPoint предоставлялся лишь через отдельную подписку Copilot Pro за $20 в месяц. Теперь функция будет встроена в базовые пакеты Microsoft 365 с увеличением их стоимости. Однако, как сообщает The Verge, несмотря на изменение базовой подписки, Copilot Pro останется доступным за прежнюю цену в $20 в месяц для тех, кто хочет получать приоритетный доступ к новейшим ИИ-моделям и функциям. Подписка Microsoft 365 «Персональный» теперь стоит $99,99, а «Для семьи», позволяющая подключить до шести пользователей — $129,99.

Изначально Microsoft тестировала интеграцию Copilot в Microsoft 365 в Австралии, Новой Зеландии и некоторых странах Азии. Теперь функции искусственного интеллекта станут доступны пользователям практически по всему миру. По словам старшего директора по маркетингу Copilot Pro и Microsoft 365 Гарета Ойстрика (Gareth Oystryk), компания всегда стремилась сделать Copilot более массовым. «Мы знаем, что пользователи готовы платить за интеграцию ИИ в Microsoft 365, и нашей целью является возможность донести ценность этого до как можно большего числа людей», — подчеркнул Ойстрик.

Microsoft также вводит альтернативные планы для текущих подписчиков Personal Classic и Family Classic. Эти тарифы позволят сохранить прежнюю стоимость подписки без включения ИИ-функций. Однако, как отметили в компании, такие планы будут лишены значимых обновлений, ограничиваясь лишь обновлениями безопасности и незначительными улучшениями. Новые подписчики, напротив, автоматически получат доступ к ИИ, если обновят свой тариф.

Интересно, что в рамках изменений Microsoft также запускает систему ИИ-кредитов, которая будет работать в приложениях Word, Excel, PowerPoint, Outlook и OneNote. Подписчики офисного пакета будут ежемесячно получать кредиты на использование ИИ-функций, например генерацию изображений в Designer или других приложениях Windows. При этом пользователи Copilot Pro получат неограниченный доступ к всем возможностям. Для тех, кто не захочет использовать ИИ, Microsoft добавит возможность отключения Copilot — уже можно сделать это в Word, и в ближайшие недели в Excel и PowerPoint.

ChatGPT научился планировать и напоминать о делах, как Siri и «Google Ассистент»

15.01.2025 [07:15], Анжелла Марина

OpenAI представила новую функцию под названием «Задачи» (Tasks), которая позволяет ChatGPT создавать напоминания и выполнять запланированные действия. Функция уже доступна в бета-версии и является попыткой превратить чат-бот в нечто большее, приблизив его к функциональности таких виртуальных помощников, как «Google Ассистент» или Siri.

Источник изображения: Andrew Neel / Unsplash

Tasks позволяет дать задание ChatGPT, что именно и когда нужно сделать. Например, можно попросить ежедневно присылать прогноз погоды в определённое время, напомнить о сроке действия паспорта или даже подготовить сказку для рассказа детям перед сном, поясняет The Verge.

Чтобы воспользоваться функцией, подписчикам нужно выбрать в меню ChatGPT модель «4o with scheduled tasks», затем просто сформулировать свою просьбу относительно того, что нужно сделать, и указать время выполнения. Кроме того, Tasks может рекомендовать задачи на основе предыдущих бесед, но пользователь должен вручную подтвердить каждую из таких рекомендаций. Управлять заданиями можно как в самих чатах, так и в новом разделе Tasks, доступном через веб-версию. После выполнения задач пользователи смогут получать уведомления на все свои устройства. Важно отметить, что одновременно может выполняться до 10 активных задач.

Нововведение уже доступно в бета-версии для подписчиков тарифов Plus, Team и Pro. OpenAI пока не уточняет, станет ли функция доступной для бесплатного использования, но предположительно, Tasks останется частью премиум-тарифов, которые стоят $20 или $200 в месяц.

Напомним, ранее чат-бот работал исключительно в режиме реального времени, отвечая на запросы в момент их поступления. Однако OpenAI решила несколько расширить рамки возможностей ChatGPT, превратив его в инструмент для долгосрочного планирования. Более того, на подходе новые разработки, такие как автономный агент Operator, который сможет управлять компьютерами, и проект Caterpillar, способный интегрироваться с Tasks для поиска информации, анализа данных, навигации по сайтам и работы с документами.

Отмечается, что несмотря на перспективы, у функции остаются нерешённые вопросы. Например, насколько надёжно Tasks будет справляться с задачами, особенно если речь идёт о важной и срочной информации. А запуск в бета-версии свидетельствует о том, что OpenAI пока лишь тестирует эту функцию с целью сбора отзывов от пользователей, не гарантируя стопроцентную надёжность.

ИИ-модель OpenAI o1 иногда думает на китайском языке, и никто не знает почему

14.01.2025 [22:52], Анжелла Марина

Рассуждающая ИИ-модель OpenAI o1 удивляет лингвистическими способностями, переключаясь в процессе решения задач на разные языки, в том числе на китайский, даже если запрос был сделан на английском. Эксперты теряются в догадках, а OpenAI не спешит с объяснениями.

Источник изображения: hdhAI

OpenAI в прошлом году представила свою первую модель искусственного интеллекта (ИИ) с функциями рассуждения — o1. Однако пользователи заметили любопытную особенность: модель иногда начинает размышлять на китайском, персидском или других языках, даже если вопрос был задан на английском. Например, при решении задачи «Сколько букв R в слове strawberry?» o1 может выполнить часть рассуждений на китайском, прежде чем выдать окончательный ответ на английском.

Эксперты выдвигают несколько теорий, объясняющих это явление. Одной из них является гипотеза о влиянии китайских данных, на которых обучалась модель. Клемент Деланж (Clement Delangue), генеральный директор компании Hugging Face, разрабатывающей инструменты для создания приложений с использованием машинного обучения, и Тед Сяо (Ted Xiao), исследователь из Google DeepMind, отмечают, что многие компании, включая OpenAI, используют услуги сторонних китайских компаний для разметки данных, необходимых для обучения моделей. Это, по их мнению, и может приводить к тому, что модель o1 в некоторых случаях предпочитает в своих рассуждениях китайский язык, как более эффективный для обработки информации.

Однако не все согласны с этой теорией. Некоторые специалисты указывают на то, что влияние китайских данных не подтверждено и модель на самом деле может переключаться на разные языки, включая хинди и тайский. Это может быть связано с тем, что o1 просто выбирает наиболее удобный для себя способ решения задачи. По словам Мэтью Гуздиала (Matthew Guzdial), исследователя ИИ из университета Альберты, модель o1 не воспринимает языки как отдельные сущности, для неё это обычный текст, состоящий из набора токенов, который она обрабатывает.

В конечном итоге, точные причины поведения модели, рассуждающей на разных языках остаются загадкой. Лука Солдаини (Luca Soldaini), научный сотрудник Allen Institute for AI, подчёркивает, что из-за «непрозрачности ИИ-моделей невозможно точно установить, что происходит внутри» и как это всё функционирует. Сама OpenAI пока отмалчивается.

ИИ заменит человека в качестве основного пользователя приложений к 2030 году

13.01.2025 [00:00], Анжелла Марина

Согласно исследованию компании Accenture, в ближайшее десятилетие может произойти кардинальная трансформация в сфере использования цифровых технологий, которая вызвана стремительным развитием искусственного интеллекта. К 2030 году ИИ-агенты станут основными пользователями приложений на предприятиях, а к 2032 году обычные потребители будут взаимодействовать с ИИ-агентами чаще, чем с приложениями, сообщает ZDNet.

Источник изображения: Kandinsky

Эту трансформацию авторы доклада называют «большим бинарным взрывом», который произошёл в тот момент, когда фундаментальные ИИ-модели преодолели барьер естественного языка. По словам главного технического директора Accenture Картик Нараина (Karthik Narain), это событие дало старт изменениям в технологических системах и в том, как люди их проектируют и используют.

Нараин подчёркивает, что новые разработки «расширяют границы программного обеспечения, многократно увеличивают цифровой потенциал компаний и создают основу для когнитивных цифровых систем, которые глубоко интегрируют искусственный интеллект в структуру предприятий».

В отчёте также выделены три ключевых направления, которые будут определять технологическое развитие в ближайшие годы — это агентные системы, цифровое ядро и генеративные пользовательские интерфейсы. Эти направления будут развёрнуты на основе гибких и модульных строительных блоков, что позволит компаниям создавать легко масштабируемые и интеллектуальные цифровые компоненты.

Таким образом, исследование Accenture указывает на то, что в ближайшие годы главную роль в использовании цифровых технологий будут играть не люди, а автономные агенты, управляемые ИИ.

Gigabyte представила мощные игровые ноутбуки Aorus Master, Aero и Gaming, а также ИИ-помощника GiMATE

09.01.2025 [13:04], Владимир Мироненко

Компания Gigabyte представила на выставке CES 2025 ноутбуки следующего поколения серий Aorus Master, Gigabyte Aero и Gigabyte Gaming с поддержкой ИИ, а также ИИ-помощника GiMATE для бесшовного управления оборудованием и программным обеспечением.

Источник изображения: Gigabyte

В новинках используются видеокарты серии GeForce RTX 50 от Gigabyte на базе архитектуры Nvidia Blackwell, получившие модернизированные решения для отвода тепла, гарантирующие высокую производительность видеокарт.

Флагманская серия ноутбуков Aorus Master включает модели с 18-дюймовым mini-LED-дисплеем и 16-дюймовым OLED-экраном. Ноутбуки Aorus Master предлагаются с процессором Intel Core Ultra 9 275HX и мобильной видеокартой Nvidia GeForce RTX 5090, обеспечивающими высокую производительность для тех, кто ищет игровые ПК с ИИ класса hi-end. Усовершенствованная система охлаждения WindForce Infinity EX обеспечивает пиковую эффективность до 270 Вт, что делает ее лучшей в своём классе на рынке. В её основе лежит передовой вентилятор Frost Fan высотой 158 мм с асимметричными лопастями для повышения эффективности охлаждения.

Модель Gigabyte Aero X16, сертифицированная Microsoft Copilot+ PC и оснащённая видеокартами GeForce RTX, предлагает самые передовые возможности ИИ для повседневных рабочих процессов, включая ChatRTX, RTX Remix, RTX Video, Nvidia Broadcast и многое другое. Ноутбук выполнен в компактном корпусе толщиной 16,7 мм весом 1,9 кг и обладает автономностью более 12 часов. Как сообщает Copilot+ PC, устройство отлично подходит как для игр, так и для создания контента, предлагая для работы полный набор функций Microsoft AI.

В свою очередь, Gigabyte Gaming A16 — тонкий игровой ноутбук с поддержкой ИИ, разработанный с учетом эргономики. Ноутбук оснащён удобной клавиатурой Gigabyte Golden Curve Keyboard и шарниром на 180 градусов, позволяющим его использовать для различных сценариев. Все новинки Gigabyte поддерживают технологию Dolby Atmos, обеспечивающую звук кинематографического качества.

Как сообщила Gigabyte, эксклюзивный GiMATE интегрируется с усовершенствованной моделью большого языка (LLM) и функцией Press and Speak, делая управление ноутбуком более естественным и интуитивным. Используя функцию AI Power Gear II для оптимальной энергоэффективности и AI Boost II для точного разгона аппаратной платформы, ИИ-агент обеспечивает оптимальные настройки для любого сценария. Функция AI Cooling позволяет снизить громкость работы кулера до 0 дБ, в то время как AI Audio и AI Voice оптимизируют звук для любых настроек. Функция AI Privacy обнаруживает присутствие посторонних и мгновенно активирует защиту экрана.

Глава OpenAI рассказал, когда появятся сильный ИИ, сопоставимый с человеком — ждать осталось недолго

06.01.2025 [22:34], Анжелла Марина

Генеральный директор OpenAI поделился своим мнением о перспективах перехода от обычного искусственного интеллекта (ИИ) к созданию сильного искусственного интеллекта (AGI) или сверхинтеллекта, который способен думать как человек и даже превзойти его. По мнению Сэма Альтмана (Sam Altman), первые ИИ-агенты, соответствующие уровню AGI, могут появится уже в 2025 году.

Источник изображения: Jonathan Kemper / Unsplash

В своём блоге Альтман рассказал о будущем OpenAI. Основной целью компании на данный момент является создание «сверхинтеллекта в истинном смысле этого слова». Альтман подчеркнул, что инструменты на основе сверхинтеллекта приведут к инновациям и, как следствие, к росту благосостояния всего человечества. По его словам, новые ИИ-агенты будут превосходить интеллектуальные возможности людей и существенно изменят структуру компаний и результат их работы, войдя в «состав полноценной рабочей силы».

Однако, несмотря на оптимизм и обещания, в прошлом месяце Альтман попытался снизить ожидания в отношении AGI, заявив, что технология «будет иметь гораздо меньшее значение», чем полагают люди. И как отмечает The Verge, снижение акцента на традиционное определение AGI может быть выгодным для OpenAI в виду её тесного партнёрства с Microsoft, так как в рамках эксклюзивных соглашений от 2023 года OpenAI обязана официально объявить о создании AGI.

Однако Microsoft определяет свой интерес к AGI, в первую очередь, как к системе, способной генерировать $100 млрд прибыли, что на сегодня может создать определённые сложности, так как OpenAI пока не приносит прибыли и даже наоборот. Даже подписка ChatGPT Pro за $200 в месяц остаётся убыточной. «Люди используют этот инструмент гораздо чаще, чем мы ожидали», — написал Альтман в серии постов на платформе X. То есть, затраченные технические ресурсы на запросы и обработку пользовательских данных превышают цену подписки.

Хотя Альтман напрямую не упоминает о соглашении OpenAI с Microsoft о разделе прибыли, он вспоминает о произошедших событиях, которые привели к его увольнению с поста генерального директора OpenAI, затем найму в Microsoft и последующему возвращению в OpenAI в ноябре 2023 года. «Оглядываясь назад, я, конечно, хотел бы сделать всё по-другому, — говорит Альтман. — Необходимо построить более сильную систему управления OpenAI и следовать нашей миссии по достижению системы AGI, которая принесёт пользу всему человечеству».

Apple Intelligence стала занимать слишком много дискового пространства

06.01.2025 [06:21], Анжелла Марина

Apple Intelligence обещала упростить жизнь, но пока лишь создаёт проблемы. Функция, запущенная в сентябре 2024 года, за четыре месяца увеличила свои требования к хранилищу с 4 до 7 Гбайт. Пользователи задаются вопросом, оправданы ли затраты на память и батарею, учитывая низкую эффективность функции Apple Intelligence в её текущем виде.

Источник изображения: macrumors.com

Как сообщает издание Gizmodo, проблемы начались с выходом iOS 18.2 и macOS Sequoia 15.2. И хотя новые версии операционных систем расширили функциональность Apple Intelligence, добавив возможности генеративного ИИ, такие как Image Playground (создание изображений по запросу пользователя) и Genmoji для создания пользовательских эмодзи, это привело к значительному увеличению объёма данных, необходимых для работы системы.

Одной из причин возросших требований к памяти является использование локальной обработки. То есть, данные обрабатываются непосредственно на устройстве для обеспечения большей конфиденциальности, но при этом требуется хранение ИИ-моделей на самом гаджете. Кстати, именно поэтому доступ к Apple Intelligence имеют только устройства с мощными чипами M1, A17 или более новыми.

Так как Apple планирует и дальше развивать возможности ИИ, включая обновление голосового помощника Siri, то это значит, что требования к свободному пространству будут только расти. «Ожидайте, что эта функция будет продолжать заполнять ваше доступное хранилище в обозримом будущем», — отмечает не без доли горечи Gizmodo.

Между тем, согласно исследованию SellCell, большинство пользователей не в восторге от Apple Intelligence. 73 % владельцев iPhone, попробовавших функцию, считают, что она «не имеет особой ценности» для их пользовательского опыта. Кроме того, отмечаются жалобы на повышенный расход заряда батареи, связанный с работой искусственного интеллекта. В итоге, на данный момент Apple Intelligence, по мнению многих, не оправдывает затрат ресурсов, предлагая взамен лишь неточные пересказы новостей и необходимость чаще заряжать устройство.

Пока неясно, изменится ли отношение пользователей к Apple Intelligence с появлением новых, более востребованных функций, однако, несмотря на недовольство части пользователей и рост требований к хранилищу, Apple не собирается сворачивать с намеченного курса, делая серьёзную ставку на внедрение ИИ в свои устройства.

Anthropic выпустила мощную текстовую нейросеть Claude 3.5 Haiku — она вчетверо дороже флагманской Claude 3 Opus

13.12.2024 [00:45], Анжелла Марина

Anthropic обновила свой чат-бот Claude, добавив большую языковую модель 3.5 Haiku. Новая нейросеть превосходит по производительности предыдущие версии, но и использование её будет обходиться дороже. При этом модель предлагает улучшенную генерацию текста, но пока не поддерживает анализ изображений.

Источник изображения: Anthropic

Издание TechCrunch подтверждает, что модель, начиная со вчерашнего дня доступна в веб-версии Claude и на мобильных устройствах. Впервые представленная в ноябре, Claude 3.5 Haiku по некоторым тестам показывает результаты, равные или даже превосходящие флагманскую модель Anthropic, Claude 3 Opus. По словам компании, новинка идеально подходит для рекомендаций по программированию, извлечению и классификации данных, а также модерации контента. В отличие от своего предшественника, эта версия способна генерировать более длинные текстовые фрагменты и в неё заложена более свежая информации.

Однако в Claude 3.5 Haiku отсутствует поддержка анализа изображений, что ставит версию в невыгодное положение по сравнению с другими моделями Anthropic, такими как Claude 3 Haiku и 3.5 Sonnet. Релиз также вызвал определённую реакцию из-за изменения ценовой политики. Первоначально Anthropic заявляла, что стоимость новой модели будет такой же, как у её предшественника. Однако позже компания пересмотрела свою позицию, объяснив высокую стоимость улучшенными интеллектуальными возможностями новинки. «Во время финального тестирования мы обнаружили, что Haiku превзошёл Claude 3 Opus по многим показателям. В результате мы увеличили цену модели 3.5 Haiku, чтобы отразить её возможности», — заявила компания в своём посте на платформе X.

Стоимость использования Claude 3.5 Haiku начинается с $1 за миллион входных токенов (примерно 750 000 слов) и $5 за миллион выходных токенов. Для сравнения, использование Claude 3 Haiku обходится в 25 центов за миллион входных токенов и $1,25 за миллион выходных, что делает новую модель в четыре раза дороже. Несмотря на это, Anthropic продолжает предлагать Claude 3 Haiku как более экономичное решение с поддержкой анализа изображений. «Claude 3 Haiku останется доступным для пользователей, которым важна максимальная экономичность и функциональность обработки изображений», — отметил глава отдела по работе с разработчиками Алекс Альберт (Alex Albert).

Несмотря на критику из-за роста цен, Anthropic подчёркивает, что Claude 3.5 Haiku обладает улучшенными возможностями генерации текста и может ссылаться на более актуальные события. Однако повышение стоимости для модели в рамках одной серии, как отмечает TechCrunch, редкая практика в индустрии, которая ставит вопрос в плане дальнейшей стратегии ценовой политики компании на её продукты.

Google показала ИИ-агента, который помогает проходить игры, наблюдая за действиями игрока

12.12.2024 [01:54], Анжелла Марина

Google представила новую версию платформы искусственного интеллекта Gemini 2.0, с помощью которой можно создавать ИИ-агентов для советов и подсказок в видеоиграх. Агенты способны анализировать игровой процесс и предлагать оптимальные стратегии, а пользователи смогут получать рекомендации в режиме реального времени.

Источник изображения: Supercell, theverge.com

Как сообщают в блоге компании генеральный директор Google DeepMind Демис Хассабис (Demis Hassabis) и технический директор Корай Кавукчуоглу (Koray Kavukcuoglu), агенты «делают выводы об игре, основываясь исключительно на действиях на экране, и предлагают решения в режиме реального времени». Кроме того, они могут использовать поиск Google по базам знаний для предоставления более полной информации. Агенты уже тестируются в популярных играх, таких как Clash of Clans и Hay Day от Supercell. Однако, как пишет The Verge, технология находится на ранней стадии разработки, и пока не ясно, насколько полезными такие наставники окажутся для игроков.

Помимо помощи в видеоиграх, Google развивает и другие направления применения Gemini 2.0. Например, ведётся работа над проектом Genie 2, который создаёт виртуальные игровые миры на основе лишь одного изображения. Пока эти миры остаются стабильными только около минуты, однако эксперты видят большой потенциал технологии.

Также компания представила мультимодальные возможности Gemini 2.0 Flash, которые уже доступны разработчикам через API в Google AI Studio и Vertex AI. Новая версия отличается высокой скоростью работы, улучшенной обработкой данных и способностью генерировать изображения и текст, а также преобразовывать текст в речь на нескольких языках. Эти функции уже тестируются ранними партнёрами, а в январе платформа станет доступна широкой аудитории.

Среди других проектов можно выделить Project Astra, Mariner и Jules. Project Astra, созданный для использования на Android-устройствах, был улучшен с помощью Gemini 2.0. Теперь ассистент на базе Astra может разговаривать на нескольких языках, использовать Google Search, Maps и Lens, а также запоминать больше данных, сохраняя при этом конфиденциальность. Project Mariner исследует, как ИИ может помогать в браузере, распознавая текст, изображения, код и другие элементы интерфейса, а Jules предназначен для помощи разработчикам в их рабочих процессах на GitHub.

ИИ-агенты также могут применяться в физическом мире. Исследования Google показывают, что Gemini 2.0 способен использовать пространственное мышление в робототехнике. Хотя эти разработки находятся на ранней стадии, сама компания видит большой потенциал в создании агентов, которые способны взаимодействовать с реальной средой.

Чтобы минимизировать риски и обеспечить безопасность своих ИИ-сервисов, компания проводит масштабные тестирования, сотрудничает с доверенными тестировщиками и внешними экспертами. В ближайшем будущем Google планирует интегрировать возможности Gemini 2.0 во все свои продукты, включая мобильное приложение Gemini.

Google Gemini сможет управлять приложениями без пользователя и даже не открывая их

23.11.2024 [08:00], Анжелла Марина

Система искусственного интеллекта Google Gemini получит новые возможности благодаря API App Functions, который позволяет выполнять действия в приложениях без их открытия. По данным The Verge, новая функция обнаружена в коде Android 16 для разработчиков и может стать доступна для всех пользователей уже в следующем году.

Источник изображения: Solen Feyissa / Unsplash

Функция App Functions, основанная на программном интерфейсе API (Application programming interface), может дать ассистенту Gemini возможность выполнять действия внутри приложений. На сайте разработчиков Google описывает app functions как «конкретную функциональность, которую приложение предоставляет системе, и которая одновременно может быть интегрирована в различные системные функции».

И хоть пока это звучит довольно расплывчато, Мишаал Рахман (Mishaal Rahman) из Android Authority приводит пример из документации, который проясняет суть. Например, разработчики приложений смогут открывать доступ посредством API к отдельным действиям, как, например, заказ еды, а Gemini сможет сделать заказ, не открывая приложения.

Интересно, что подобную функцию разрабатывает и Apple. В iOS 18 Siri также сможет выполнять действия внутри приложений через обновлённый фреймворк app intents. Например, пользователи смогут заказать что-либо в магазине через Siri, если разработчики определённого приложения подключат такую возможность. Однако внедрение этой функции в случае с Apple ожидается не раньше весны 2025 года.

Стоит отметить, что способность «выполнять действия за пользователя» изначально была одной из главных целей умных ассистентов, но её реализация начала появляться лишь недавно. Пока Gemini в основном ограничен поиском информации в Gmail или Google Maps. Что касается голосового помощника Siri в iOS 18, то он получил интеграцию с ChatGPT, за счёт чего можно задавать более сложные вопросы, но с выполнением действий Siri пока справляется хуже.

Судя по всему, и Google, и Apple закладывают фундамент для более «умных» ассистентов, которые смогут выполнять сложные задачи внутри приложений, и это произойдёт уже очень скоро.

OpenAI планирует выпустить ИИ-агента Operator в январе — он сможет управлять ПК без пользователя

14.11.2024 [11:12], Дмитрий Федоров

Компания OpenAI готовится к выпуску нового ИИ-агента под кодовым названием Operator, который позволит выполнять разнообразные задачи на компьютере пользователя. Релиз этого инструмента может состояться уже в январе 2025 года.

Источник изображения: OpenAI

На первом этапе упомянутое решение будет доступно в качестве предварительной исследовательской версии через API для разработчиков. Operator призван конкурировать с аналогичными ИИ-агентами, такими как недавно представленный Computer Use компании Anthropic и разрабатываемый ИИ-агент Google, ориентированный на потребительский рынок.

OpenAI стремится создать универсальный инструмент, способный выполнять различные операции в веб-браузере и подходящий для решения повседневных задач пользователей. Однако, как отмечает издание Bloomberg, пока неизвестно, предложит ли Operator пользователям значительные преимущества перед аналогичными решениями конкурентов. Исследовательская версия инструмента будет полезна для оценки его потенциальных преимуществ и выявления областей, требующих доработки на основе обратной связи.

Запуск Operator совпадает с публикацией документа OpenAI, содержащего рекомендации для правительства США по вопросам стратегии развития ИИ. В этом документе предлагается создание «экономических зон» для активного развития ИИ-инфраструктуры, а также формирование альянсов с союзниками США, что позволит усилить позиции страны в технологической гонке с Китаем.

ИИ-поиск Google теперь доступен в 100 странах, в том числе Узбекистане и Кыргызстане — России в списке не оказалось

29.10.2024 [04:41], Анжелла Марина

Компания Google объявила о запуске поисковых ИИ-обзоров в более чем 100 странах. Сгенерированные сводки (AI Overviews) будут отображаться для пользователей в Канаде, Австралии, Южной Африке, Нигерии, Узбекистане, Туркменистане, Кыргызстане и многих других странах. Полный список добавленных стран доступен на официальном сайте Google.

Источник изображения: Copilot

По информации The Verge, ИИ-обзоры будут отображаться на всех поддерживаемых языках, включая английский, хинди, индонезийский, японский, португальский и испанский. Это означает, что пользователи в таких странах, как США, смогут выполнять поиск, например, на испанском языке и получать результаты суммирования информации на том же языке.

Кроме того, ссылки на цитируемые источники в ИИ-обзорах стали более заметными, что сделано для удобства пользователей, если они захотят получить больше информации, перейдя на первоисточник, а также чтобы не лишать сайты трафика.

Ранее сообщалось, что в октябре Google добавила рекламу в ИИ-обзоры на мобильных устройствах, но пока только для пользователей в США. В других странах реклама будет продолжать показываться в специальных слотах на странице, а не внутри самих сводок.

Напомним, функция AI Overviews была впервые запущена в США в мае, а затем в августе стала доступна пользователям в Великобритании, Индии, Японии, Индонезии, Мексике и Бразилии.

← В прошлое В будущее →

выдано Федеральной Службой по надзору за соблюдением законодательства в сфере массовых коммуникаций и охране культурного наследия

При цитировании документа ссылка на сайт с указанием автора обязательна. Полное заимствование документа является нарушением
российского и международного законодательства и возможно только с согласия редакции 3DNews.