Сегодня 25 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-помощник
Быстрый переход

Apple разрабатывает «ИИ-личность» для роботов-помощников, и это не Siri

Apple готовится выпустить вместе с iOS 18.1 обновлённую версию ИИ-помощника Siri, который получит множество интересных функций. При этом, согласно данным 9to5Mac, Apple начала разрабатывать новую «ИИ-личность», которая будет совершенно независима от Siri и предназначена для роботов-помощников.

 Источник изображения: Copilot

Источник изображения: Copilot

Как сообщает Марк Гурман (Mark Gurman) из Bloomberg, Apple активно работает над новым, продвинутым ИИ-ассистентом для своих роботов и роботизированных устройств для использования в быту и не только. Одним из ключевых аспектов этой разработки является создание не просто помощника, а «ИИ-личности».

В то время как Siri является цифровым ассистентом на текущих устройствах Apple, «ИИ-личность», которая уже получила кодовое название J595, будет представлять из себя человекоподобный интерфейс на основе генеративного ИИ. «Мне сказали, что интерфейс может быть внедрён на настольные устройства и другие будущие робототехнические гаджеты Apple», — пишет Гурман в своей рассылке Power On.

J595 будет похож на iPad, но с камерами и основанием, оснащённым роботизированным приводом. Планируется, что этот продукт появится около 2026 или 2027 года, а позднее последуют мобильные роботы и, возможно, даже человекоподобные модели. В основе идеи лежит уверенность Apple в том, что устройство полезно только в том случае, если до него можно дотянуться. При этом довольно много ситуаций, когда необходим компьютер, но его нет поблизости, или руки заняты чем-то другим.

Например, присоединение роботизированной «руки» к iPad потенциально сделает устройство более полезным для видеоконференций или поиска рецептов в интернете. Робот сможет поворачивать и экран, если получит такую команду. Apple уже размышляет над возможностью создания роботов, которые смогут выполнять и домашние дела — например, загружать стиральную машину или мыть грязные тарелки. Однако это идеи будущего, которые пока не выходят за рамки идей и набросков на бумаге.

Китайские ИИ-компании в поисках монетизации нацелились на зарубежные рынки

Геополитическая напряжённость и технологический разрыв вынуждают китайских разработчиков искать новые стратегии для выхода на мировой рынок. Alibaba, ByteDance и другие крупные китайские компании стали запускать приложения на базе искусственного интеллекта не только для домашнего рынка, но и для глобальной аудитории, адаптируя свои продукты к различным рынкам.

 Источник изображения: Copilot

Источник изображения: Copilot

По сообщению издания South China Morning Post со ссылкой на исследование Unique Capital, среди 1500 активных компаний в сфере ИИ по всему миру, 103 китайские фирмы уже начали расширяться на зарубежные рынки. Эта тенденция обусловлена сложностью в убеждении китайских пользователей платить за ИИ-сервисы, что побудило некоторые компании искать возможности роста за рубежом.

Например, компания Alibaba, в соответствии со своей стратегией в области электронной коммерции и облачных вычислений в регионе, запустила ИИ-модель SeaLLMs, адаптированную для рынков Юго-Восточной Азии. Компания ByteDance, владелец TikTok, представила ряд приложений для потребителей на глобальном рынке, включая ИИ-помощника по дому Gauth, приложение с интерактивными персонажами AnyDoor и платформу для ИИ-ботов Coze. Minimax, один из ведущих китайских стартапов в области ИИ, также запустил приложение Talkie AI для международных пользователей.

По мнению экспертов отрасли, зарубежные рынки предлагают больший потенциал для роста на фоне жёсткой конкуренции внутри страны. Райан Чжан Хаоран (Ryan Zhang Haoran), соучредитель Motiff, компании-разработчика платформы для дизайна пользовательского интерфейса на базе ИИ, отмечает: «Зарубежные пользователи более охотно платят за программное обеспечение, и там больше профессионалов, способных предоставить ценную обратную связь». Чжан подчёркивает, что компания с самого начала ориентировалась на возможности бизнеса как внутри страны, так и за рубежом. При этом Motiff удалось довольно быстро привлечь первых клиентов из США, Японии, Юго-Восточной Азии и Латинской Америки.

Другая пекинская компания Kunlun Tech, являющаяся ветераном среди китайских технологических компаний, также нацелена на зарубежных пользователей. Генеральный директор Фан Хан (Fang Han) отмечает, что конкурентная среда за рубежом становится более насыщенной по мере того, как китайские компании выходят на международный рынок. «Контент, генерируемый ИИ, фундаментально снижает барьеры и затраты для создателей, что приводит к революции в индустрии изготовления контента», — говорит Фан. Недавно Kunlun Tech запустила ряд приложений на базе ИИ, включая музыкальный стриминговый сервис Melodio, коммерческую платформу Mureka для создания музыки с помощью ИИ и платформу для генерации короткометражных фильмов SkyReels.

Выход китайских разработчиков ИИ на международный рынок обусловлен также как высокой конкуренцией на внутреннем рынке, так и стремлением к расширению и монетизации своих продуктов. Однако китайским разработчикам ИИ приходится учитывать не только рыночные реалии, но и политическую ситуацию, особенно в свете ухудшения отношений между Вашингтоном и Пекином. Некоторые компании даже пытаются скрыть своё китайское происхождение.

Например, стартап HeyGen, занимающийся генеративным ИИ, переместил свою штаб-квартиру в Лос-Анджелес и призвал своих китайских инвесторов продать акции в пользу американских партнёров, чтобы минимизировать связи с материковым Китаем в условиях ужесточения контроля. «Соблюдение норм является критически важным. Вход на новый рынок означает соответствие его правилам», — отметил Чжан из Motiff. Он добавил, что, несмотря на единообразие продуктов на глобальном уровне, инфраструктура компании адаптирована для различных рынков с использованием различных моделей с открытым исходным кодом и облачных сервисов.

Microsoft скоро перестанет нанимать программистов, которые не используют ИИ

Инвестиции в помощников по программированию на базе ИИ достигли почти $1 млрд с начала прошлого года. Microsoft, Amazon и Google включились в гонку за лидерство в этом сегменте, внедряя технологию в свои продукты, что уже приносит значительную прибыль как компаниям, так и разработчикам. Более того, в Microsoft заявили, что скоро перестанут нанимать программистов, которые не используют ИИ-помощников.

 Источник изображения: Copilot

Источник изображения: Copilot

Компании, разрабатывающие ИИ-ассистентов для программирования, такие как Replit, Anysphere, Magic, Augment, Supermaven и Poolside AI, привлекли $433 млн только в этом году, что в совокупности с инвестициями прошлого года составляет почти $1 млрд. Стремление вкладывать деньги в ИИ-помощников для программирования указывает на то, что кодинг может стать первой областью, которая существенно трансформируется под влиянием последней волны технологий ИИ.

«Сегодня программная инженерия и программирование — это номер один среди областей, на которые влияет ИИ, — заявил Хади Партови (Hadi Partovi), генеральный директор некоммерческой образовательной организации Code.org, давний инвестор проектов Кремниевой долины и советник Airbnb, Uber, Dropbox и Facebook. — На сегодняшний день программирование без ИИ немного похоже на письмо без текстового редактора».

Интересно, что растущая уверенность в преимуществах ИИ-кодирования контрастирует с вопросами некоторых инвесторов об экономической выгоде генеративного ИИ и вероятной окупаемости прогнозируемых триллионных инвестиций в крупнейшие технологические компании (Big Tech) в вычислительную инфраструктуру для поддержки этой технологии в ближайшие годы. Но в то время как некоторые инвесторы сомневаются в экономической выгоде ИИ и рентабельности инвестиций Big Tech в его инфраструктуру, в Кремниевой долине наоборот растёт уверенность.

Ханна Сил (Hannah Seal), партнёр Index Ventures, которая инвестировала в стартап Augment, сказала, что «гораздо проще монетизировать ИИ, если вы можете встроить свой продукт в существующий рабочий процесс и сделать все преимущества мгновенно видимыми». Для неё вопросы монетизации ИИ-инструментов заключаются в следующем: «Каково время получения прибыли и насколько эта прибыль значима?». При этом она отмечает, что с ИИ-помощниками по кодированию таких вопросов уже не возникает.

Энтузиазм в отношении ИИ побудил стартапы и технологических гигантов Microsoft, Amazon, Meta и Google бороться за доминирование в переполненном секторе, создавая ИИ-помощников и агентов, которые могут писать и редактировать программный код. Более того, руководитель совета директоров Code.org, в который входят Дэвид Тредвелл (David Treadwell), глава электронной коммерции Amazon, и Кевин Скотт (Kevin Scott), технический директор Microsoft, недавно сказал Партови, что их компания к концу года прекратит нанимать людей, которые программируют без использования ИИ.

Напомним, GitHub, пионер в области ИИ-кодирования, стал одним из первых, кто интегрировал большие языковые модели (LLM) в свои продукты. «Когда мы начали использовать GPT-3, мы быстро поняли, что он очень хорошо пишет код, и решили создать на его основе GitHub Copilot», — заявил Томас Дохмке (Thomas Dohmke), генеральный директор GitHub. GitHub Copilot, был запущен в 2022 году и уже насчитывает почти 2 млн платных подписчиков и, как утверждает Дохмке, он пишет код гораздо лучше, чем средний разработчик.

 Источник изображения: GitHub

Источник изображения: GitHub

Доход GitHub, по состоянию на апрель, увеличился на 45 % по сравнению с прошлым годом, и по словам генерального директора Microsoft Сатьи Наделлы (Satya Nadella), годовой доход GitHub на начало этого месяца составил $2 млрд. «Copilot стал причиной более чем 40-% роста доходов GitHub в этом году и уже превышает по размеру весь бизнес GitHub с момента его приобретения», — отметил Наделла.

Тем не менее, IT-отделы крупных компаний всё ещё имеют некоторые опасения по поводу безопасности использования автоматизированных инструментов программирования для создания кода, готового к производству. Дохмке подчеркнул, что пока не следует ожидать внедрения сгенерированного искусственным интеллектом кода без ручного тестирования.

Google перестаралась с ИИ-редактором изображений Reimagine — он выдаёт слишком реалистичные результаты

Компания Google вместе со смартфонами Pixel 9 анонсировала новый инструмент редактирования фотографий с применением искусственного интеллекта под названием Reimagine. Эта функция, являющаяся развитием инструмента Magic Editor, позволяет не только изменять фон, но и добавлять объекты на фото с помощью текстовых подсказок.

 Источник изображения: Google for Developers/YouTube

Источник изображения: Google for Developers/YouTube

По словам журналистов из The Verge, тестировавших новую функцию, результаты часто выглядят очень убедительно, с правильно подобранным освещением, тенями и перспективой. Однако, как показало тестирование, Reimagine может быть использован для создания тревожного контента, включая сцены насилия, и добавления запрещённых предметов. Журналисты смогли сгенерировать множество изображения аварий и, соответственно, всё, что с этим может быть связано.

Представитель Google, Алекс Мориконе (Alex Moriconi), прокомментировал ситуацию: «Мы разрабатываем наши инструменты генеративного ИИ с учётом намерений пользователей, но у нас есть чёткие правила и условия использования, определяющие, какой контент допустим, а какой нет». Несмотря на слова Мориконе, журналисты с лёгкостью обошли ограничения, используя креативные формулировки в текстовых запросах.

 Источник изображения: Chris Welch/The Verge

Источник изображения: Chris Welch/The Verge

Хотя редактирование фотографий не является чем-то новым, Reimagine делает этот процесс невероятно простым и доступным. Теперь любой пользователь нового Pixel может реалистично добавить на фотографию любые объекты, в том числе, в обход правил Google, сцены аварий или других тревожных элементов, потратив на это всего несколько секунд.

«Возможно, все будут соблюдать правила Google в отношении ИИ и использовать Reimagine для добавления цветов и радуг на свои фотографии. Это было бы замечательно! Но на всякий случай стоит относиться с некоторым скептицизмом к фотографиям, которые вы видите в интернете», — заключает Allison Johnson из The Verge.

Android получит обновление с ИИ-функцией защиты от кражи устройства

Google тестирует новую функцию безопасности для Android, которая использует искусственный интеллект для определения кражи смартфона и мгновенной блокировки устройства.

 Источник изображения: Google

Источник изображения: Google

Эта функция, получившая название Theft Detection Lock (блокировка при обнаружении кражи), была анонсирована компанией ещё в мае этого года и ожидалась к релизу с Android 15. Как сообщает издание ZDNet со ссылкой на источник, функция уже начала появляться у некоторых пользователей.

Google объясняет, что функция Theft Detection Lock использует гироскоп и акселерометр смартфона для отслеживания «типичных движений, связанных с кражей». Хотя компания не уточнила, какие именно движения подразумеваются, но можно предположить, что речь идёт о резких движениях или толчках, за которыми следует быстрое ускорение. Если такое происходит, экран устройства немедленно блокируется.

На данный момент Theft Detection Lock доступна ограниченному числу пользователей в Бразилии, которые зарегистрировались в бета-программе Google. Ожидается, что после полного запуска функция сначала появится на новых телефонах Google, а затем станет доступна практически на всех современных устройствах с операционной системой Android 10 и выше.

Отметим, что Theft Detection Lock лишь одна из нескольких новых функций безопасности, анонсированных Google. Также появится усложнение процедуры сброса настроек до заводских и усложнение настройки телефона под новой учётной записью, возможность отметить телефон как потерянный в Find My Device для упрощения отслеживания, автоматическая блокировка при чрезмерном количестве неудачных попыток аутентификации, ещё возможность блокировки телефона, если он находится в автономном режиме. Также появится удалённая блокировка, позволяющая заблокировать экран телефона, используя только номер телефона и быструю проверку безопасности.

Google планирует сделать новые инструменты доступными через обновление сервисов Google Play уже в этом году. Некоторые функции будут доступны только в Android 15.

Opera выпустила для iOS браузер Opera One с голосовым ИИ-помощником Aria

Компания Opera выпустила iOS-версию браузера Opera One со встроенным помощником Aria на базе искусственного интеллекта. Мобильное приложение повторяет минималистичный дизайн десктопной версии веб-обозревателя и позволяет скрывать ненужные элементы, обеспечивая комфортный просмотр веб-страниц.

 Источник изображения: Opera

Источник изображения: Opera

Строка поиска для удобства расположена в нижней части интерфейса и предоставляет быстрые подсказки при вводе запроса. В поиск также интегрирован ИИ-ассистент Aria. Кроме того, как сообщает MacRumors, новая функция Swipe to search позволяет активировать строку поиска простым свайпом вниз, аналогично поиску приложений через Spotlight на домашнем экране iPhone. Несмотря на то, что панель поиска по умолчанию располагается внизу, пользователи могут выбрать стандартную навигацию.

Встроенный ИИ-помощник Aria способен выполнять широкий спектр задач — от поиска в интернете до генерации текста и изображений. С помощью функции голосового ввода можно задавать вопросы устно, не прибегая к вводу текста с клавиатуры, а с помощью ИИ-генератора Imagen2 от Google создавать визуальный контент путём ввода текстовых запросов.

Кроме того, в Opera One на стартовом экране появилась новая карусель, которая предназначена для информирования пользователей. В неё интегрированы новости, спортивные результаты и советы по продуктам Opera. В браузер также встроен блокировщик рекламы. Предусмотрена возможность настройки тем оформления.

Скачать Opera One для iOS можно в магазине приложений App Store.

Вышла крупнейшая ИИ-модель Llama 3.1 от Meta✴ — её самая большая версия имеет 405 млрд параметров

Компания Meta объявила о выпуске крупнейшей на сегодня открытой языковой модели искусственного интеллекта Llama 3.1, насчитывающей более 400 миллиардов различных параметров. По заявлению генерального директора Meta Марка Цукерберга (Mark Zuckerberg) модель может превзойти GPT-4 по производительности уже в ближайшее время, а к концу года станет самым популярным ИИ-помощником в мире.

 Источник изображения: Reuters

Источник изображения: Reuters

Как сообщает издание The Verge, разработка новой модели потребовала больших инвестиций. Llama 3.1 значительно сложнее, чем более ранние версии, выпущенные всего несколько месяцев назад. Старшая версия ИИ-модели имеет 405 миллиардов параметров и была обучена с использованием более 16 000 ускорителей H100 от Nvidia. Meta не раскрывает вложенных средств в её разработку, но, исходя из стоимости одних только чипов Nvidia, можно с уверенностью предположить, что речь идёт о сотнях миллионов долларов.

Несмотря на высокую стоимость разработки, Meta решила сделать код модели открытым (Open Source). В письме, опубликованном в официальном блоге компании, Цукерберг утверждает, что ИИ-модели с открытым исходным кодом обгонят проприетарные модели, подобно тому, как Linux стал операционной системой с открытым исходным кодом, которая сегодня управляет большинством телефонов, серверов и гаджетов.

Одним из ключевых обновлений стало расширение географии доступности сервиса Meta AI, который построен на Llama. Теперь ассистент доступен в 22 странах, включая Аргентину, Чили, Колумбию, Эквадор, Мексику, Перу и Камерун. Кроме того, если раньше Meta AI поддерживала только английский язык, то сейчас добавлены французский, немецкий, хинди, итальянский, португальский и испанский. Однако стоит отметить, что некоторые из новых функций пока доступны только в определённых регионах или для конкретных языков.

 Источник изображения: ***

Источник изображения: Meta

Также появилась интересная функция Imagine me (представь меня), которая использует генеративную ИИ-модель Imagine Yourself, сообщает TechCrunch. Эта модель способна создавать изображения на основе фотографии пользователя и текстового запроса в требуемом контексте. Например, «Представь меня сёрфингистом» или «Представь меня на пляже». После чего искусственный интеллект сгенерирует соответствующее изображение. Функция доступна в бета-версии и активируется вводом фразы «Imagine me».

 Источник изображения: ***

Источник изображения: Meta

В ближайшее время Meta AI также получит новые инструменты редактирования изображений. Пользователи смогут добавлять, удалять и изменять объекты на изображениях с помощью текстовых запросов. А со следующего месяца разработчики обещают внедрить кнопку «Edit with AI» (редактирование с помощью ИИ) для доступа к дополнительным опциям тонкой настройки. Позднее появятся новые ярлыки для быстрой публикации изображений, созданных ИИ, в лентах, историях и комментариях в приложениях Meta.

Напомним, запуск Meta AI состоялся в сентябре 2023 года. Сервис основан на большой языковой модели Llama 2 и предоставляет пользователям возможность получать информацию, генерировать текст, делать переводы на различные языки и выполнять другие задачи с помощью искусственного интеллекта.

Proton выпустила ИИ-помощника для электронной почты, который работает на компьютере пользователя

Швейцарская компания Proton, известная своими приложениями, такими как Proton Mail и Proton VPN, ориентированными на конфиденциальность, запустила новый инструмент на основе искусственного интеллекта, который будет помогать пользователям в составлении электронных писем, перерабатывать их и проверять орфографию перед отправкой с помощью простых подсказок.

 Источник изображения: Proton

Источник изображения: Proton

Новый продукт Proton Scribe продолжает воспроизводить функциональность решений, появившихся у Google, отвечая на запуск AI Gemini в Gmail.

Основанный на открытой модели языка Mistral 7B от французского стартапа Mistral, Proton Scribe обеспечивает максимальную безопасность данных пользователей. Как сообщает TechCrunch, инструмент можно устанавливать полностью на локальном уровне, что исключает передачу информации за пределы устройства. Компания также обещает, что ИИ не будет обучаться на пользовательских данных, что особенно важно для корпоративного использования.

«Мы поняли, что независимо от того, разрабатывает ли Proton инструменты ИИ или нет, пользователи всё равно будут использовать искусственный интеллект, часто со значительными последствиями для конфиденциальности», — сказал основатель и генеральный директор Энди Йен (Andy Yen). «Вместо того, чтобы копировать свои сообщения в сторонние инструменты ИИ, которые часто имеют ужасные методы обеспечения конфиденциальности, было бы лучше встроить инструменты ИИ, ориентированные на конфиденциальность, непосредственно в Proton Mail».

 Источник изображения: Proton

Источник изображения: Proton

Интересно, что Proton Scribe также может работать непосредственно на серверах Proton, если пользователи, менее обеспокоенные безопасностью, выберут этот способ взаимодействия с приложением. Это позволит быстрее обрабатывать запросы, в зависимости от аппаратного обеспечения пользователя. При этом компания подчёркивает, что не ведёт никаких журналов и не передаёт данные третьим лицам. «На сервер передаётся только подсказка, введённая пользователем, и никакие данные не сохраняются после создания черновика электронного письма», — сообщил представитель компании изданию TechCrunch.

Хотя Proton Scribe ограничен только электронной почтой, компания заявила, что может расширить инструмент и на другие свои продукты в будущем «в зависимости от спроса». Возможно, в дальнейшем в Scribe появится интеграция с недавно запущенным приложением для совместной работы с документами.

Новый инструмент доступен уже сегодня для Proton Mail в веб-версии и десктопной версии. Компания подтвердила, что в будущем планирует добавить поддержку мобильных устройств. Что касается стоимости, то Proton Scribe в основном ориентирован на бизнес-пользователей и те, кто уже использует тарифные планы Mail Essentials, Mail Professional или Proton Business Suite, могут получить доступ к инструменту за дополнительные $2,99 в месяц. Пользователи устаревших и лимитированных тарифных планов, таких как Visionary или Lifetime, получат доступ к Proton Scribe бесплатно.

Во флагманских смартфонах Samsung появится обновлённый помощник Bixby с фирменным ИИ

Samsung готовится к выпуску обновлённой версии своего голосового помощника Bixby, основанной на технологии генеративного ИИ. Он сможет предоставлять пользователям информацию по запросу подобно ChatGPT от OpenAI. При этом Samsung не откажется от сотрудничества с другими разработчиками ИИ и по-прежнему будет поддерживать голосового помощника Google.

 Источник изображения: Mark Chan / Unsplash

Источник изображения: Mark Chan / Unsplash

Новая версия Bixby будет основана на собственной большой языковой модели (LLM) Samsung, что позволит существенно расширить возможности помощника. «Мы собираемся усовершенствовать Bixby, применяя технологию генеративного ИИ», — заявил в интервью CNBC глава мобильного подразделения компании Тэ Мун Ро (ТМ Roh).

Bixby был запущен в 2017 году вместе со смартфоном Galaxy S8 и с тех пор постоянно развивался. Сейчас помощник поддерживает множество функций, включая синхронный перевод (Live Translate) на другой язык в режиме реального времени, поиск ресторанов и распознавание объектов через камеру смартфона.

 Источник изображения: Samsung

Источник изображения: Samsung

Обновление Bixby — это часть более широкой стратегии Samsung по внедрению искусственного интеллекта в свои устройства, так как компания стремится сделать ИИ-функции ключевым преимуществом своих флагманских смартфонов. «Поскольку потребители всё чаще используют возможности ИИ, они реально могут почувствовать удобство и преимущества, которые приносит эта технология. Я твёрдо верю, что Galaxy AI и мобильный ИИ станет сильной мотивацией для покупки новых продуктов», — отметил Ро. Samsung не планирует отказываться от поддержки других голосовых помощников на своих устройствах. Например, на последних смартфонах компании по-прежнему доступен Google Assistant.

Анонс обновлённого Bixby происходит на фоне растущего интереса к генеративному ИИ, вызванного успехом ChatGPT от OpenAI. Недавно о планах по улучшению своего голосового помощника Siri с помощью ИИ также объявила и Apple. Эксперты в свою очередь отмечают, что конкуренция на рынке голосовых помощников обостряется. Соответственно Samsung стремится не отстать от конкурентов и укрепить свои позиции за счёт инвестиций в ИИ, а её улучшенный Bixby может стать важным фактором в борьбе за покупателей премиальных смартфонов.

Ожидается, что новая версия Bixby дебютирует во флагманских устройствах Samsung в конце этого года. Компания уже начала внедрять новые ИИ-функции в свои последние складные смартфоны Galaxy Z Fold6 и Z Flip6.

WhatsApp тестирует ИИ-редактирование фотографий с помощью текстовых запросов

Популярный мессенджер приступил к тестированию инновационной функции, позволяющей пользователям редактировать фотографии и получать информацию о них с помощью искусственного интеллекта Meta AI.

 Источник изображения: Heiko / Pixabay

Источник изображения: Heiko / Pixabay

Новая функция, о которой рассказал WABetaInfo, была замечена в последней бета-версии WhatsApp 2.24.14.20 для Android. С её помощью пользователи смогут загружать фотографии в чат с ИИ от Meta, который сможет анализировать изображения, отвечать на дополнительные вопросы об этих изображениях.

Например, можно попросить ИИ определить объекты на фотографии или объяснить её смысл. Кроме того, ИИ сможет быстро редактировать изображения по текстовым запросам, введённым в чат. Хотя на данный момент неясно, насколько широкими будут возможности редактирования, WABetaInfo отмечает, что новая функция «добавит удобства в пользовательский опыт» и поможет людям сэкономить время.

 Источник изображения: wabetainfo.com

Источник изображения: wabetainfo.com

Кстати, для пользователей, которые беспокоятся о конфиденциальности, WhatsApp предусмотрел возможность удаления загруженных фотографий в любое время. Помимо этого, как ранее сообщали источники, Meta также разрабатывает генератор аватаров с использованием ИИ, который позволит пользователям создавать свои изображения на различных фонах и в разных стилях.

Новая функция редактирования фото с помощью ИИ пока находится на стадии тестирования и доступна только в бета-версии WhatsApp для Android. О сроках её запуска для всех пользователей без ограничения пока не сообщается.

Геймерский браузер Opera GX получил масштабное обновление встроенного ИИ Aria

Популярный браузер для геймеров Opera GX получил масштабное обновление встроенного искусственного интеллекта Aria. Добавлена функция генерации и анализа изображений, голосового вывода и другие интересные возможности.

 Источник изображения: Opera Software

Источник изображения: Opera Software

Компания Opera Software объявила о значительном обновлении браузера Opera GX, ориентированного на геймеров. Главным нововведением стало расширение функциональности встроенного искусственного интеллекта Aria, который теперь способен работать с изображениями, озвучивать текст и предоставлять более подробную информацию пользователям.

Обновление включает ряд новых функций, ранее доступных только в экспериментальном приложении AI Feature Drops для браузера Opera One. Теперь геймеры Opera GX смогут воспользоваться передовыми технологиями искусственного интеллекта прямо в своем браузере.

 Источник изображения: Opera Software

Источник изображения: Opera Software

Одной из ключевых особенностей стала возможность генерации изображений на основе текстовых описаний. Используя модель Imagen2 от Google, Aria может создавать уникальные визуальные материалы по запросу пользователя. Ограничение установлено на уровне 30 бесплатных изображений в день.

Кроме того, Aria получила функцию анализа изображений. Теперь можно загружать картинки и задавать вопросы о содержании. Например, ИИ может определить марку и модель неизвестной гарнитуры или помочь решить математическую задачу по скриншоту.

 Источник изображения: Opera Software

Источник изображения: Opera Software

Еще одним важным дополнением стала возможность голосового вывода информации. Используя технологию WaveNet от Google, Aria может озвучивать свои ответы, что особенно полезно для людей с ограниченными возможностями или тех, кто предпочитает аудиоформат.

Представители Opera Software отметили, что новые функции значительно расширяют возможности искусственного интеллекта Aria, делая его более эффективным и доступным инструментом для игрового сообщества. Обновление уже доступно для всех пользователей Opera GX и по замыслу разработчиков должно сделать взаимодействие с браузером еще более удобным и интуитивным.

ИИ Gemini оказался совсем не так хорош в обработке больших объёмов данных, как заявляла Google

Новые исследования ставят под сомнение заявления Google о возможностях больших языковых моделей моделей Gemini по обработке больших объёмов данных, показывая, что их эффективность в анализе длинных текстов и видео значительно ниже заявленной.

 Источник изображения: Google

Источник изображения: Google

Недавние исследования выявили существенные недостатки в работе флагманских генеративных моделей искусственного интеллекта Google Gemini 1.5 Pro и 1.5 Flash, пишет издание TechCrunch. Google неоднократно подчёркивала способность Gemini обрабатывать огромные объёмы данных благодаря большому контекстному окну, утверждая, что модели могут анализировать документы объёмом в сотни страниц и искать информацию в видеозаписях. Однако два независимых исследования показали, что на практике эти модели справляются с такими задачами гораздо хуже.

Учёные из Массачусетского университета в Амхерсте (UMass Amherst), Института Аллена по искусственному интеллекту (Allen Institute for AI) и Принстона (Princeton University) тестировали Gemini на способность отвечать на вопросы о содержании художественных книг. Представленная для теста книга содержала около 260 000 слов (около 520 страниц). Результаты оказались неутешительными. Gemini 1.5 Pro правильно ответил только в 46,7 % случаев, а Gemini 1.5 Flash лишь в 20 % случаев. Далее усреднив результаты, выяснилось, что ни одна из моделей не смогла достичь точности ответов на вопросы выше случайной.

Маржена Карпинска (Marzena Karpinska), соавтор исследования, отметила: «Хотя такие модели, как Gemini 1.5 Pro, технически могут обрабатывать длинные контексты, мы видели много случаев, указывающих на то, что модели на самом деле не понимают содержание».

Второе исследование, проведённое учёными из Калифорнийского университета в Санта-Барбаре, фокусировалось на способности Gemini 1.5 Flash анализировать видеоконтент, а точнее слайды с изображениями. Результаты также оказались неудовлетворительными — из 25 изображений ИИ дал правильные ответы только в половине случаев, а при увеличении количества картинок точность ответов понизилась до 30 %, что ставит под сомнение эффективность модели в работе с мультимедийными данными.

Правда отмечается, что ни одно из исследований не прошло процесс рецензирования, и к тому же не тестировались самые последние версии моделей с контекстом в 2 миллиона токенов. Тем не менее, полученные результаты вызывают серьёзные вопросы в отношении реальных возможностей генеративных моделей ИИ в целом, и о том, насколько обоснованы маркетинговые заявления технологических гигантов.

Данные исследования появились на фоне растущего скептицизма в отношении генеративного ИИ. Так, недавние опросы международной консалтинговой компании Boston Consulting Group показали, что около половины опрошенных руководителей высшего звена не ожидают существенного повышения производительности от использования генеративного ИИ и обеспокоены возможными ошибками и проблемами с безопасностью данных.

Эксперты же призывают к разработке более объективных критериев оценки возможностей ИИ и к большему вниманию и независимой критике. Google пока не прокомментировал результаты этих исследований.

ChatGPT превзошёл студентов на экзаменах, но только на первых курсах

Исследователи провели эксперимент, который показал, что ИИ способен успешно сдавать университетские экзамены, оставаясь при этом незамеченным специальными программами. Экзаменационные работы ChatGPT получили более высокие оценки, чем работы студентов, пишет издание Ars Technica.

 Источник изображения: Headway/Unsplash

Источник изображения: Headway/Unsplash

Команда учёных из Редингского университета в Англии (University of Reading) под руководством Питера Скарфа (Peter Scarfe) провела масштабный эксперимент, чтобы проверить, насколько эффективно современные системы искусственного интеллекта могут справляться с университетскими экзаменами. Исследователи создали более 30 фиктивных учётных записей студентов-психологов и использовали их для сдачи экзаменов, используя ответы, сгенерированные ChatGPT. Эксперимент охватил пять модулей бакалавриата по психологии, включая задания для всех трёх лет обучения.

Результаты оказались ошеломляющими — 94 % работ, созданных ИИ, остались незамеченными экзаменаторами. Более того, почти 84 % этих работ получили более высокие оценки, чем работы студентов-людей, в среднем на полбалла выше. «Экзаменаторы были весьма удивлены результатами», — отметил Скарф. Причём интересно, что некоторые работы ИИ были обнаружены не из-за их роботизированности, а из-за слишком высокого качества.

Эксперимент также выявил ограничения существующих систем обнаружения контента, созданного ИИ. По словам Скарфа, такие инструменты, как GPTZero от Open AI и система Turnitin, показывают хорошие результаты в лабораторных условиях, но их эффективность значительно снижается в реальной жизненной ситуации. Однако не все результаты были в пользу ИИ. На последнем курсе, где требовалось более глубокое понимание и сложные аналитические навыки, студенты-люди показали лучшие результаты, чем ChatGPT.

Скарф подчеркнул, что ввиду постоянного совершенствования ИИ и отсутствия надёжных способов обнаружения его использования, университетам придётся адаптироваться и интегрировать ИИ в образовательный процесс. «Роль современного университета заключается в подготовке студентов к профессиональной карьере, и реальность такова, что после окончания учёбы они, несомненно, будут использовать различные инструменты искусственного интеллекта», — заключил исследователь. Данный эксперимент, по сути, поднимает проблему, которая уже сегодня требует пересмотра существующих методов обучения и экзаменации.

Instagram✴ позволил некоторым авторам создавать ИИ-версии самих себя — в будущем такую возможность могут получить все

Генеральный директор Meta Марк Цукерберг (Mark Zuckerberg) объявил, что компания начинает тестирование ИИ-аватаров в Instagram, созданных пользователями с помощью инструмента Meta AI Studio. Первоначально ИИ-аватары будут отображаться в основном в сообщениях и будут обозначены ярлыком «AI».

 Источник изображения: ***

Источник изображения: Meta

В рамках теста в ближайшие недели подписчики известных каналов смогут пообщаться со своими кумирами через их ИИ-аватары, которые фактически являются ИИ-чат-ботами. Отмечается, что в будущем любой пользователь или компания сможет создать на платформе собственного чат-бота для взаимодействия со своим сообществом и клиентами.

Эта инновационная функция поможет не оставить без внимания ни одного сообщения от поклонников, тогда как физически отвечать на все входящие сообщения просто невозможно. Со временем такие ИИ-персонажи станут более совершенными и даже могут стать своего рода искусством, считает Цукерберг.

Изначально в тестировании примут участие примерно 50 создателей контента и небольшой процент обычных пользователей. Затем Meta развернёт эту функцию для большего количества людей в течение следующих нескольких месяцев, что произойдёт примерно в августе.

Цукерберг подчеркнул, что это не просто расширение функционала, это новый уровень взаимодействия, позволяющий установить более тесную связь с аудиторией и клиентами через персонализированных чат-ботов на базе искусственного интеллекта. Конечной целью является разработка различных API-интерфейсов, отражающих разнообразие интересов людей, и возможность адаптировать ИИ-аватары под личные нужды.

Учёные нашли способ запускать большие ИИ-модели на системах мощностью 13 Вт, вместо 700 Вт

Исследователи из Калифорнийского университета в Санта-Круз разработали метод, позволяющий запускать большие языковые модели искусственного интеллекта (LLM) с миллиардами параметров при значительно меньшем потреблении энергии, чем у современных систем.

 Источник изображения: Stefan Steinbauer/Unsplash

Источник изображения: Stefan Steinbauer/Unsplash

Новый метод позволил запустить LLV с миллиардами параметров при энергопотреблении системы всего в 13 Вт, что эквивалентно потреблению бытовой светодиодной лампы. Это достижение особенно впечатляет на фоне текущих показателей энергопотребления ИИ-ускорителей. Современные графические процессоры для центров обработки данных, такие как Nvidia H100 и H200, потребляют около 700 Вт, а грядущий Blackwell B200 вообще может использовать до 1200 Вт на один GPU. Таким образом, новый метод оказывается в 50 раз эффективнее популярных сегодня решений, пишет Tom's Hardware.

Ключом к успеху стало устранение матричного умножения (MatMul) из процессов обучения. Исследователи применили два метода. Первый — это перевод системы счисления в троичную, использующую значения -1, 0 и 1, что позволило заменить умножение на простое суммирование чисел. Второй метод основан на внедрении временных вычислений, при котором сеть получила эффективную «память», позволившую работать быстрее, но с меньшим количеством выполняемых операций. Работа проводилась на специализированной системе с FPGA, но исследователи подчёркивают, что большинство их методов повышения эффективности можно применить с помощью открытого программного обеспечения и настройки уже существующих на сегодня систем.

Исследование было вдохновлено работой Microsoft по использованию троичных чисел в нейронных сетях, а в качестве эталонной большой модели учёные использовали LLaMa от Meta. Рюдзи Чжу (Rui-Jie Zhu), один из аспирантов, работавших над проектом, объяснил суть достижения в замене дорогостоящих операций на более дешёвые. Хотя пока неясно, можно ли применить этот подход ко всем системам в области ИИ и языковых моделей в качестве универсального, потенциально он может радикально изменить ландшафт ИИ.

Немаловажно, что учёные открыли исходный код своей разработки, что позволит крупным игрокам рынка ИИ, таким как Meta, OpenAI, Google, Nvidia и другим беспрепятственно воспользоваться новым достижением для обработки рабочих нагрузок и создания более быстрых и энергоэффективных систем искусственного интеллекта. В конечном итоге это приведёт к тому, что ИИ сможет полнофункционально работать на персональных компьютерах и мобильных устройствах, и приблизится к уровню функциональности человеческого мозга.


window-new
Soft
Hard
Тренды 🔥
В Иране сняли запрет на пользование WhatsApp и Google Play 32 мин.
Бывшие разработчики Serious Sam анонсировали умный шутер, вдохновлённый Half-Life — первый трейлер и детали Invariant 35 мин.
Apple хочет самостоятельно защищать свои интересы в антимонопольном расследовании против Google 4 ч.
Гладко было на бумаге: забагованное ПО AMD не позволяет раскрыть потенциал ускорителей Instinct MI300X 10 ч.
Netflix подал в суд на Broadcom, заявив, что VMware нарушает его патенты в области виртуализации 11 ч.
На Nintendo Switch выйдет подражатель Black Myth: Wukong, который позиционируется как «одна из важнейших игр» для консоли 12 ч.
Датамайнеры нашли в файлах Marvel Rivals следы лутбоксов — NetEase прокомментировала ситуацию 13 ч.
Надёжный инсайдер раскрыл, когда в Game Pass добавят Call of Duty: World at War и Singularity 14 ч.
Лавкрафтианские ужасы на море: Epic Games Store устроил раздачу рыболовного хоррора Dredge, но не для российских игроков 15 ч.
VK запустила инициативу OpenVK для публикации ПО с открытым кодом 16 ч.