Сегодня 06 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → искусственный
Быстрый переход

С началом учебного года аудитория ChatGPT выросла на четверть — это 50 млн новых пользователей

OpenAI продолжает удерживать лидерство на рынке чат-ботов на основе искусственного интеллекта. Компания отчиталась о невероятном росте аудитории ChatGPT. За два месяца число пользователей выросло на 50 миллионов, достигнув 250 миллионов.

 Источник изображения: Kandinsky

Источник изображения: Kandinsky

Несмотря на то, что сегодня на рынке представлены такие мощные ИИ-инструменты, как Gemini, Grok, Claude, Perplexity и другие, ChatGPT становится нарицательным именем для всего многообразия чат-ботов. Когда люди говорят о том, чтобы попросить чат-бот что-то сделать, они говорят «спросить у ChatGPT», что сравнимо с выражением «погуглить», которое давно стало синонимом поиска информации в интернете.

По информации издания Android Headlines, каждую неделю более 250 миллионов человек по всему миру используют ChatGPT для разных целей. Однако впечатляют не только цифры, но и то, с какой скоростью этот показатель растёт. Если в августе ChatGPT пользовались 200 миллионов человек, то менее, чем за два месяца еженедельная аудитория выросла на 50 миллионов пользователей.

Высказывается мнение, что такой скачок обусловлен началом нового учебного года. Не исключено, что школьники и студенты обращаются к ChatGPT за «помощью» в выполнении домашних заданий. Если это действительно так, то навряд ли можно рассчитывать, что в долгосрочной перспективе их успеваемость повысится.

В целом успех ChatGPT показывает, что, несмотря на довольно большой выбор чат-ботов на рынке, именно продукт OpenAI пока остаётся ИИ-помощником номер один для большинства пользователей, несмотря на сильных конкурентов в лице Microsoft, Google и Meta. При этом, хотя Microsoft и использует модели OpenAI, она предлагает пользователям собственный уникальный ИИ-продукт Copilot.

Сэму Альтману и Марку Цукербергу прислали перчатки с лишними пальцами — это намёк на опасности ИИ

Киношный преступник всегда оставляет на месте преступления визитную карточку — предмет-загадку, намекающий на новые злодейства. Альтман, Цукерберг, Йоханссон и верхушка Европейского союза получили по почте перчатки с шестью пальцами, символизирующие будущие ужасы, которые последуют за бесконтрольным внедрением искусственного интеллекта. Эту пиар-кампанию организовал финский стартап Saidot, у которого есть идеи, как не допустить неизбежное.

 Источник изображения: Saidot

Источник изображения: Saidot

Шесть пальцев на руках стали своеобразной визитной карточкой изображений, сгенерированных ИИ-алгоритмами. Сегодня этот баг ушёл или почти ушёл в прошлое. Будут новые несуразности, но их тоже исправят — это всё дело техники и наработка базы. Беда в том, что многие вещи плохо поддаются прогнозу, а сфера ИИ развивается так быстро, что времени не хватает не только на прогноз, но даже на анализ простейших ситуаций. Железо куют, пока горячо. Финны просто красиво напомнили об этом.

«Искусственный интеллект развивается так быстро, что никто не может в полной мере предвидеть его последствия и возникающие риски, — предупредила Вира Сиивонен (Veera Siivonen ), технический директор и соучредитель компании. — Вот почему мы хотим рассказать как о шагах, которые были предприняты для обеспечения более безопасного ИИ, так и о некоторых шагах, которые следует предпринять».

Сэму Альтману (Samuel Altman) из OpenAI перчатки прислали с требованием привести искусственный интеллект в соответствие с общечеловеческими ценностями. Но финны также похвалили его за то, что он проявляет осторожность — сдерживает выпуск всё более мощных версий больших языковых моделей.

Урсула фон дер Ляйен (Ursula von der Leyen), президент Европейской комиссии, также получила жуткую посылку. Компания Saidot пояснила, что перчатки, отправленные лидеру ЕС, символизируют необходимость эффективного регулирования отрасли ИИ.

Ещё один комплект был доставлен Скарлетт Йоханссон (Scarlett Johansson). В мае 2024 года актриса попала в заголовки газет после того, как OpenAI запустила чат-бота с «её» голосом. Перчатки актрисе — это напоминание о цифровых правах на личное.

Четвёртая пара была отправлена Марку Цукербергу (Mark Zuckerberg). Финны похвалили главу компании Meta за поддержку моделей с открытым исходным кодом, но предупредили, что данные для обучения должны быть из надёжных источников.

Руководители компаний Hugging Face и Klarna также удостоились шестипалого напоминания. Оно же досталось премьер-министру Великобритании Сэру Киру Стармеру (Keir Starmer), техническому комиссару ЕС Хенне Вирккунен (Henna Virkkunen) и эксперту по искусственному интеллекту Риши Боммасани (Rishi Bommasani). Всем им компания Saidot посоветовала опасаться предвзятых результатов, нарушений авторских прав и ложной информации.

Среди прочего финны прозрачно намекнули, что они располагают собственной платформой для управления ИИ. Тем, кто откажется от предложения, придется столкнуться с последствиями.

Заметим, как в любом хорошем детективе, улики на месте киношного преступления должны запутать зрителя и главных героев. Но ИИ — не злодей. Недальновидно поступают те, кто безоговорочно доверяет этому так называемому искусственному интеллекту. Это как доверять поисковику в браузере. Его дело предложить, но анализировать ответы будет пользователь, опираясь на собственные знания или мнения живых специалистов.

Google надеется догнать OpenAI, создав собственный рассуждающий ИИ

Компания Google работает над созданием модели искусственного интеллекта, способной рассуждать подобно человеку. За счёт этого IT-гигант намерен усилить конкуренцию с OpenAI, которая уже представила аналогичный продукт под названием o1. Об этом пишет Bloomberg со ссылкой на собственные осведомлённые источники.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

В сообщении сказано, что за последние месяцы Google добилась значительного прогресса в разработке моделей искусственного интеллекта, способных справляться с решением многоэтапных задач в таких областях, как математика и программирование. По данным источника, как и OpenAI, Google пытается создать рассуждающий ИИ-алгоритм с помощью техники, называемой «цепочка мыслей». Она подразумевает, что прежде чем дать ответ на письменный запрос ИИ-алгоритм на несколько секунд берёт паузу, чтобы проанализировать связанные с запросом тематики и затем дать обобщённый ответ на поставленный вопрос. Официальные представители Google отказались от комментариев по данному вопросу.

Google и OpenAI ведут напряжённую борьбу за доминирование в сфере искусственного интеллекта. Противостояние обострилось с появлением ИИ-бота ChatGPT, который, как считают некоторые инвесторы, со временем способен устранить необходимость в поисковике Google. IT-гигант всячески стремится избежать этого, для чего ведущие исследовательские команды разработчиков компании были объединены в подразделение DeepMind. Несмотря на это, Google продолжает двигаться медленнее, когда дело доходит да запуска новых ИИ-продуктов, делая паузу, чтобы рассмотреть этические проблемы, необходимость оправдать ожидания общественности в отношении доверия к бренду компании и др.

Анонимный источник издания сообщил, что после того, как в середине сентября OpenAI представила алгоритм o1, некоторые сотрудники DeepMind были разочарованы отставанием Google в гонке за лидерство в сфере ИИ. Однако сотрудники уже не так обеспокоены, как после запуска ChatGPT, поскольку сейчас Google успела выпустить некоторые из своих собственных разработок.

Adobe выпустила Photoshop и Premiere Elements 2025 с продвинутыми ИИ-функциями и ценой по $90

Photoshop Elements и Premiere Elements — «облегчённые» версии самого популярного ПО для редактирования изображений и видео компании Adobe, которые стоят в разы меньше, чем подписка на Adobe Creative Cloud. Теперь в них появились ИИ-функции, которые упрощают исправление, ретушь или превращение фотографий и видео в произведения визуального искусства путём изменения размера, обрезки, добавления звукового сопровождения или включения анимации.

 Источник изображений: Adobe

Источник изображений: Adobe

В Adobe Photoshop Elements 2025 добавлены функции редактирования фотографий, включая возможность объединять несколько изображений, изменять цветовую гамму, удалять нежелательные объекты или добавлять размытие глубины резкости с помощью новой технологии ИИ.

При помощи новых ИИ-инструментов Remove и Object Removal Guided Edit можно одним движением удалить нежелательные объекты на фотографиях.

Для добавления реалистичного эффекта боке к фотографии достаточно использовать фильтр Depth Blur на базе ИИ, просто указав точку фокусировки. Доступна регулировка таких параметров, как интенсивность размытия, фокусное расстояние и диапазон фокусировки.

Цвет любого объекта на фотографии можно легко изменить при помощи нового ИИ-инструмента. Достаточно выбрать объект, изменить оттенок и другие параметры, а затем применять изменения к объекту.

Добавлены быстрые действия для имитации эффектов движения одним движением мыши. Пользователю также доступны такие элементы оформления, как анимированные блёстки, мигающее сердце или «живые» рамки.

Ещё одна новая функция — возможность объединять несколько изображений, накладывая объект с одного изображения на фон другого и добавляя элементы с других фотографий.

Редактирование в Premiere Elements 2025 значительно ускорено благодаря новой и упрощённой временной шкале. Возможность видеть сгруппированные видеодорожки и аудиодорожки упрощает навигацию. Появилось новое меню быстрых инструментов, а отдельные дорожки теперь можно заблокировать, чтобы предотвратить случайное редактирование.

В заголовках стал доступен пользовательский стиль текста. Динамические заголовки видео получили больше элементов управления текстом. Имеется набор готовых шаблонов, которые можно стилизовать в соответствии с историей, используя элементы управления выравниванием, размером, направлением, цветом и интервалом.

Новый инструмент баланса белого гарантирует, что облака, снег и другие белые объекты будут отображаться без цветовых искажений. Точные настройки цвета и яркости теперь можно вносить в сцену или даже в определённые области с помощью новых кривых цветокоррекции.

Цветовую гамму видео теперь можно корректировать или преобразовывать с помощью предустановок. Имеется возможность импорта пользовательских настроек.

Появилась возможность экспорта видео в несколько мест назначения одним щелчком мыши. Видеоматериалы можно импортировать и перемещаться по клипам с помощью нового медиабраузера. Использование сочетаний клавиш существенно ускоряет рабочий процесс.

Помимо обновления программных пакетов Elements, Adobe также улучшила веб-приложения-компаньоны, которые в настоящее время находятся в стадии бета-тестирования. Представлены функции добавления движущихся наложений, автоматической смены фона и настройки внешнего вида фотографии перед публикацией в социальных сетях с помощью QR-кодов.

Новая функция редактирования и создания фотографий в мобильном приложении-компаньоне предлагает украсить изображение забавными фигурами и узорами. Появились настройки яркости, цветности и насыщенности эффектов. Изображения можно обрезать и корректировать их поворот, а фон удалять одним нажатием.

Пользователи Apple Mac будут рады услышать, что последние версии Photoshop и Premiere Elements теперь поддерживают чип Apple M3, что заметно повышает производительность при работе на компьютерах Mac.

Adobe Photoshop Elements 2025 и Adobe Premiere Elements 2025 уже доступны по одинаковой цене $89,99. В комплекте обе программы обойдутся существенно дешевле — $129,99.

Системные требования Windows:

  • Процессор Intel 6-го поколения или более новый, или эквивалент AMD с поддержкой SSE4.2;
  • Microsoft Windows 10 (версия 22H2) или Windows 11 (версия 23H2), только 64-разрядные версии;
  • 8 Гбайт ОЗУ
  • 9 Гбайт свободного места на жёстком диске для установки приложения;
  • Дополнительное место на накопителе для загрузки онлайн-контента и временных файлов;
  • Разрешение экрана 1440 x 900 (при масштабном коэффициенте 100%).
  • Драйвер звука и дисплея, совместимый с Microsoft DirectX 12.
  • Windows Media Player (требуется при импорте файлов Windows Media).

Системные требования macOS:

  • Процессор Intel 6-го поколения или более новый, процессор Apple Silicon M1 или более новый.
  • macOS 13, macOS 14 (14.4 или более поздняя версия);
  • 8 Гбайт ОЗУ;
  • 10 Гбайт свободного места на жёстком диске для установки приложения;
  • Дополнительное место для загрузки онлайн-контента и временных файлов;
  • Разрешение экрана 1440 x 900 (при масштабном коэффициенте 100%).

Nvidia выпустила мультимодальную модель ИИ с открытым исходным кодом, и она не уступает GPT-4

Nvidia представила новое семейство больших мультимодальных языковых моделей NVLM 1.0, включая обученную на 72 миллиардах параметров NVLM-D-72B. Модели демонстрируют высокую производительность в широком спектре задач, таких как машинное зрение, создание программного кода, анализ изображений, решение математических задач и генерация текстов. Похоже, что лидерам отрасли во главе с OpenAI и Google придётся потесниться.

 Источник изображения: freepik.com

Источник изображения: freepik.com

«Мы представляем NVLM 1.0, семейство передовых мультимодальных больших языковых моделей, которые достигают самых современных результатов в задачах зрения и языка, конкурируя с ведущими фирменными моделями (например, GPT-4o) и моделями с открытым доступом», — утверждают разработчики Nvidia. По их мнению, открытый исходный код предоставляет исследователям и разработчикам беспрецедентный доступ к передовым технологиям.

Флагманская модель NVLM-D-72B демонстрирует адаптивность при обработке сложных визуальных и текстовых входных данных. Исследователи подчёркивают способность модели интерпретировать мемы, анализировать изображения и пошагово решать математические задачи. Разработчики также отметили, что NVLM-D-72B улучшает свою производительность в текстовых задачах после мультимодального обучения, в отличие от большинства аналогичных моделей.

Проект NVLM также представляет инновационные архитектурные решения, включая гибридный подход, который объединяет различные методы мультимодальной обработки. По оценкам сторонних исследователей, модель NVLM-D-72B «находится на одном уровне с Llama 3.1 405B по математике и кодированию, а также имеет видение».

Выпуск Nvidia NVLM 1.0 знаменует собой поворотный момент в разработке ИИ. Открывая исходный код модели, которая конкурирует с проприетарными гигантами, Nvidia не просто делится кодом — она бросает вызов самой структуре индустрии ИИ. Благодаря Nvidia множество небольших организаций и независимых исследователей смогут вносить более значительный вклад в развитие ИИ, что может открыть эру беспрецедентного сотрудничества и инноваций в области ИИ.

Этот шаг может вызвать цепную реакцию — другим лидерам в области ИИ также придётся открыть свои исследования, что потенциально ускорит прогресс ИИ по всем направлениям.

Нужно отметить, что выпуск NVLM 1.0 не лишён рисков. По мере того, как мощный ИИ становится все более доступным, возрастают и опасения по поводу его неправильного использования и возможных этических последствий. Сообщество ИИ уже столкнулось с необходимостью ответственного использования новых технологий.

Одно можно сказать наверняка: политика Nvidia в отношении ИИ затронет всю индустрию. Вопрос только в том, насколько радикальным окажется её влияние, и смогут ли конкуренты адаптироваться достаточно быстро, чтобы преуспеть в этом новом мире открытого ИИ.

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Microsoft улучшила поиск в Windows 11 с помощью ИИ и добавила в ОС аналог Circle to Search

Microsoft задействовала алгоритмы на базе искусственного интеллекта, чтобы улучшить поиск в Windows 11 на новых компьютерах Copilot Plus PC. Одним из заметных нововведений стала функция Click to Do, которая похожа на представленный ранее инструмент Google Circle to Search и предназначена для упрощения поиска по изображениям, электронным письмам, документам и даже видео. Эта и другие ИИ-функции поиска Windows 11 будут развёрнуты на Copilot Plus PC в следующем месяце.

 Источник изображений: Microsoft

Источник изображений: Microsoft

«Поиск на основе искусственного интеллекта значительно упростит поиск практически чего угодно. Вам больше не нужно запоминать имена файлов и расположение документов, а также какие-то конкретные слова. Windows будет лучше понимать ваши намерения и найдёт нужный документ, изображение, файл или электронное письмо», — прокомментировал запуск новых функций Юсуф Мехди (Yusuf Mehdi), вице-президент Microsoft, отвечающий за развитие Windows.

Улучшенный поиск также будет доступен «в ближайшие месяцы» в основном интерфейсе поиска Windows 11 и поле поиска, которое появляется в разделе настроек. Это облегчит поиск не только файлов, но и определённых разделов с настройками. Например, в поиске по настройкам можно будет написать «добавить мои наушники», чтобы быстро перейти к взаимодействию с соответствующим меню. Много лет поиск в Windows был не очень хорош, поэтому возможность искать что-либо на основе запросов на естественном языке должна существенно улучшить ситуацию.

В дополнение к этому в следующем месяце Microsoft начнёт развёртывание функции Click to Do. Для взаимодействия с ней достаточно зажать клавишу Windows на клавиатуре и кликнуть по экрану левой кнопкой мыши. После этого на экране появится инструмент интерактивного наложения, с помощью которого можно выделить часть изображения или текста для выполнения дальнейших действий. Функцию Click to Do можно задействовать в разных ситуациях, например, для осуществления поиска в интернете по каким-то визуальным элементам, которые пользователь увидел при просмотре видео на YouTube. В дополнение к этому функция может работать с текстами, поэтому будет полезна при обобщении или переписывании документов, отправке электронных писем и др.

Microsoft начнёт тестировать функцию Click to Do и улучшенный поиск в Windows в рамках программы предварительной оценки на компьютерах Copilot Plus PC в этом месяце. В ноябре начнётся постепенное развёртывание нововведений на совместимых устройствах. Ранее анонсированная функция Recall, которая фиксирует все действия пользователей в ОС, также станет доступна инсайдерам с устройствами на базе процессоров от Qualcomm в октябре, а в ноябре она появится на компьютерах Copilot Plus PC с чипами от Intel и AMD. Когда планируется начать массовое развёртывание функции Recall, пока неизвестно.

Сбежавшую от Сэма Альтмана Миру Мурати осаждают венчурные инвесторы с деньгами

Технический директор OpenAI Мира Мурати (Mira Murati) объявила о своём уходе из компании на прошлой неделе. По её словам, она решила «освободить время и пространство для собственных исследований». Сразу после увольнения Мурати несколько крупных венчурных компаний объявили о желании профинансировать её следующий проект. Интрига заключается в том, что Мурати пока не делала никаких заявлений о своих дальнейших планах и отказалась комментировать возникшие слухи.

 Источник изображения: Pixabay

Источник изображения: Pixabay

«Мои шесть с половиной лет в команде OpenAI были исключительной привилегией… Никогда не бывает идеального времени, чтобы уйти из места, которое ты лелеешь, но этот момент кажется правильным» — написала Мурати в своём аккаунте в соцсети X.

Генеральный директор OpenAI Сэм Альтман (Sam Altman) прокомментировал внезапный уход Мурати в X: «Я, конечно, не буду притворяться, что такая внезапность [увольнения] естественна, но мы не обычная компания, и я думаю, что причины, которые мне объяснила Мира, имеют смысл».

Мурати присоединилась к OpenAI в 2018 году. До этого она занималась проектированием электромобиля Model X в Tesla. В OpenAI Мурати возглавила разработку двух флагманских продуктов компании — ChatGPT и Dall-E.

Уход Мурати произошёл на фоне реструктуризации OpenAI из некоммерческой организации в коммерческую, что даст Альтману возможность получить пакет акций. Очередной недавний сбор средств принёс OpenAI инвестиции в размере $6,5 млрд от таких компаний, как Thrive Capital, SoftBank, Coatue и Microsoft.

Венчурные капиталисты конкурируют за право быть первыми инвесторами стартапов, основанных выходцами из OpenAI, так как все эти проекты выглядят очень многообещающе. Десятки бывших сотрудников OpenAI, включая уволившихся соучредителей стартапа, за последние несколько лет основали свои компании, к примеру:

  • Илья Суцкевер (Ilya Sutskever) привлёк $1 млрд для свой исследовательской лаборатории ИИ Safe Superintelligence.
  • Андрей Карпати (Andrej Karpathy) основал Eureka Labs, сосредоточенную на применении ИИ в образовании.
  • Стартап в области ИИ Anthropic был создан Дарио Амодеи (Dario Amodei) и группой исследователей из OpenAI.
  • Аравинд Шринивас (Aravind Srinivas) основал поисковую систему искусственного интеллекта Perplexity.

Одновременно с Мурати о своём уходе из OpenAI заявили ещё два технических специалиста — главный научный сотрудник Боб МакГрю (Bob McGrew) и вице-президент по исследованиям Барретт Зоф (Barret Zoph). Теперь Альтман и Войцех Заремба (Wojciech Zaremba) — единственные оставшиеся учредители из одиннадцати основателей компании.

«Их уход заставил меня задуматься о трудностях, с которыми сталкивались родители в Средние века, когда 6 из 8 детей умирали преждевременно, — написал Заремба в сообщении в соцсети X, ставшем вирусным. — Несмотря на тяжёлую утрату, родителям пришлось смириться с ней и найти глубокую радость и удовлетворение в тех двоих, кто выжил».

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

SoftBank вызвалась заменить Apple в списке ключевых инвесторов OpenAI

Японская инвестиционная холдинговая компания SoftBank планирует вложить $500 млн в OpenAI, разработчика чат-бота ChatGPT, сообщает Bloomberg. Инвестирование станет частью более крупного раунда финансирования, в ходе которого OpenAI рассчитывает привлечь $6,5 млрд при оценке компании в $150 млрд.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Лидером раунда предположительно выступит Thrive Capital при участии Microsoft, крупнейшего инвестора OpenAI, а также других инвесторов. В частности, компания обсуждала инвестиции с Nvidia и Apple. Однако последняя больше не участвует в переговорах об участии в раунде, зато в списке инвесторов возможно будет фигурировать SoftBank через свой фонд Vision Fund. Если сделка состоится, OpenAI закрепит за собой статус одного из самых дорогих стартапов в мире. Официальные представители OpenAI и SoftBank пока не дали комментариев по этому поводу.

В то же время компания переживает не самый простой период. На прошлой неделе о своём уходе объявила технический директор и ключевой сотрудник OpenAI Мира Мурати (Mira Murati), что стало ещё одним звеном в цепи увольнений топ-менеджеров компании в этом году. Кроме того, по данным Bloomberg, OpenAI рассматривает возможность реструктуризации, чтобы стать полностью коммерческой организацией. Напомним, ранее основатели OpenAI позиционировали свою компанию как некоммерческую организацию, сосредоточившись на исследованиях в «создании положительного долгосрочного воздействия на человека».

Отметим, что SoftBank ранее не проявлял инвестиционного интереса к OpenAI, однако поддерживал одного из его конкурентов. В частности, в июне Vision Fund, управляемый SoftBank Investment Advisers, дочерней компанией SoftBank, вложился в Perplexity AI — стартап, занимающийся поиском на основе искусственного интеллекта, оценив его в $3 млрд.

Raspberry Pi и Sony представили модуль ИИ-камеры для «малинки» стоимостью $70

Компании Raspberry Pi и Sony совместно разработали для микрокомпьютера Raspberry Pi модуль камеры с искусственным интеллектом. Новинка совместима со всеми версиями микрокомпьютера и не нуждается в дополнительных ускорителях или графическом процессоре. По утверждению Raspberry Pi, камера позволит пользователям с лёгкостью разрабатывать «передовые решения ИИ для обработки визуальных данных». Камера уже поступила в продажу по цене $70.

 Источник изображений: Raspberry Pi

Источник изображений: Raspberry Pi

Новая 12,3-мегапиксельная камера Raspberry Pi AI может снимать видео со скоростью 10 кадров в секунду с разрешением 4056 × 3040 пикселей или 40 кадров в секунду с разрешением 2028 × 1520 точек. Она имеет ручную регулировку фокуса, поле зрения 76 градусов и размеры 25 × 24 × 11,9 мм, что делает её практически идентичной по размерам модулю камеры 3, выпущенному Raspberry Pi в прошлом году.

Камера совместима со всеми одноплатными компьютерами Raspberry Pi и объединяет чип микроконтроллера RP2040 с датчиком изображения Sony IMX500, который обеспечивает ИИ-функциональность устройства. Такое сочетание устраняет необходимость в дополнительных компонентах, таких как ускорители ИИ или графический процессор, которые обычно используются для обработки визуальных данных.

Новая камера стала дальнейшим развитием планов Raspberry Pi по расширению ассортимента чипов и дополнений для своего микрокомпьютера. Начиная с 2013 года, компания выпустила несколько модулей камер без ИИ, а теперь предлагает и вариант с ИИ.

«Обработка изображений на базе ИИ становится привлекательным инструментом для разработчиков по всему миру, — сказал генеральный директор Raspberry Pi Эбен Аптон (Eben Upton). — Мы с нетерпением ждём, чего смогут достичь члены нашего сообщества, используя мощь камеры на базе ИИ Raspberry Pi».

Google запустила новую ИИ-функцию в NotebookLM для краткого пересказа видео на YouTube

Google представила обновлённую версию ИИ-приложения для заметок NotebookLM, которая теперь умеет анализировать видео на YouTube и быстро извлекать ключевые моменты из длинных видеороликов, преобразуя их в текст и тематические ссылки. Раньше приложение могло обрабатывать только текстовые форматы.

 Источник изображения: Copilot

Источник изображения: Copilot

В основе новой функции лежит технология транскрибирования — преобразование аудио в текст. После того, как пользователь вставит ссылку в NotebookLM на видео, которое нет возможности посмотреть целиком, искусственный интеллект самостоятельно создаст краткий обзор основных тем, обсуждаемых в видео, поясняет издание The Verge. Пользователи также смогут получить более подробную информацию, кликнув на ссылку с определённой темой.

 Источник изображения: Theverge.com

Источник изображения: Theverge.com

При тестировании новой функции в видеообзоре iPhone 16 Pro на канале The Verge, NotebookLM сгенерировало такие темы, как «Искусственный интеллект Apple», «Камера iPhone 16 Pro» и «Обработка фотографий». При выборе одной из тем приложение не только предоставляло информацию, но и ссылалось на конкретные моменты в видео, где эта информация упоминается, что позволило быстро найти нужные фрагменты. Примечательно, что на основе содержимого видео пользователи также могут создать аудиорезюме для прослушивания в формате подкаста.

 Источник изображения: Google

Источник изображения: Google

Стоит отметить, что новая функция может не сработать с недавно добавленными роликами, в частности, опубликованными менее чем за два дня до запроса. Тем не менее, в большинстве случаев приложение NotebookLM продемонстрировало высокую степень точности и надёжности.

В то время как Gemini от Google и Copilot от Microsoft могут транскрибировать и обобщать видео, новая версия NotebookLM способна обрабатывать также и аудиозаписи, что делает приложение универсальным инструментом для использования в различных областях.

Защита от роботов перестала работать: ИИ научился идеально проходить проверку reCAPTCHAv2

Исследователи Андреас Плеснер (Andreas Plesner), Тобиас Фонтобель (Tobias Vontobel), Роджер Ваттенхофер (Roger Wattenhofer) из Швейцарской высшей технической школы Цюриха с помощью ИИ взломали систему проверки reCAPTCHAv2, которая используется на сайтах для подтверждения того, что пользователь является человеком, а не роботом. Учёные утверждают, что обученная ими нейросеть способна пройти 100 % проверок, тогда как раньше этот процент не превышал 71 %.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Исследователи изучали эффективность использования передовых методов машинного обучения для решения проверок (капч) из системы reCAPTCHAv2 от Google. Они пытались оценить эффективность автоматизированных систем в решении капч, используя передовые модели YOLO (You Only Look Once) для сегментации и классификации изображений.

reCAPTCHAv2 требует от пользователей отмечать на изображении области с определёнными предметами, подразумевая, что бот на такое не способен. Исследователи пришли к выводу, что на современном этапе развития ИИ разница в сложности подобных задач для человека или нейросети нивелируется. Это означает, что современные технологии ИИ могут без проблем проходить проверки, основанные на распознавании изображений.

 Источник изображения: humansnotinvited.com

Источник изображения: humansnotinvited.com

«Мы также заглядываем под капот reCAPTCHAv2 и находим доказательства того, что reCAPTCHAv2 в значительной степени основана на данных cookie и истории браузера при оценке того, является ли пользователь человеком или нет», — добавили исследователи.

Европейцы могут остаться без «Яблочного интеллекта» — Apple не согласна с правилами ЕС по регулированию ИИ

Компания Apple, возможно, откажется от запуска функций на базе искусственного интеллекта Apple Intelligence на территории Евросоюза. Разработанный в регионе Закон об искусственном интеллекте, представляющий собой свод правил для регулирования отрасли, обязались соблюдать ряд крупных компаний, включая OpenAI, Microsoft и Google. Однако производитель iPhone не спешит поступать аналогичным образом.

 Источник изображений: Apple

Источник изображений: Apple

Apple заявила, что «сотрудничает» с регулирующими органами Евросоюза, чтобы предоставить пользователям в регионе доступ к функциям Apple Intelligence. Однако на данном этапе нет признаков того, что компании удалось продвинуться в этом направлении.

Любопытно, что новые правила регулирования ИИ-сегмента были согласованы со 115 компаниями. Многие из них входят в число крупнейших игроков сферы искусственного интеллекта на мировом рынке. Соответствовать действующему законодательству согласились, в том числе, Adobe, Amazon, Google, Microsoft, OpenAI, Samsung и Snap.

«Инициатива Евросоюза по внедрению мер по контролю над искусственным интеллектом получила в среду не самый удачный старт, поскольку технологические гиганты Meta и Apple отказались соответствовать выдвинутым требованиям <…> Все компании и отрасли должны будут соблюдать правила, перечисленные в Пакте в рамках принятого в ЕС Закона об искусственном интеллекте, который будет поэтапно внедряться в ближайшие годы. Цель добровольного пакта в том, чтобы заставить компании как можно раньше начать соблюдать правила Закона об искусственном интеллекте», — пишет издание Politico со ссылкой на собственные источники.

Apple и Meta трудно назвать дружественными компаниями, когда речь заходит о множестве других вопросов. Однако в плане отсутствия оптимизма по поводу мер регулирования ИИ-сферы в ЕС они, похоже, заняли одну позицию.

Google потратила $2,7 млрд, чтобы вернуть бывшего сотрудника

Google заплатила $2,7 млрд за лицензии на технологии ИИ-стартапа Character AI, который в 2021 году создал бывший сотрудник IT-гиганта Ноам Шазир (Noam Shazeer). По данным источника, главной целью Google было возвращение в компанию IT-гения, прославившегося исследованиями в сфере искусственного интеллекта. В настоящее время Шазир является вице-президентом Google и работает над развитием ИИ-алгоритмов компании, таких как Gemini.

 Источник изображения: Alex Dudar / unsplash.com

Источник изображения: Alex Dudar / unsplash.com

В сообщении сказано, что именно ради возвращения Шазира Google дала согласие на выплату огромного лицензионного сбора. По данным осведомлённого источника, Шазир заработал сотни миллионов долларов на своей доле в стартапе Character AI. Отмечается, что выплаченная Google сумма является необычно большой для основателя, который не продал свою компанию и не вывел её на биржу.

Ноам Шазир работал в Google с 2000 года. В 2017 году он вместе с группой других авторов опубликовал статью под названием «Внимание — это всё, что вам нужно», которая стала основой для технологии генеративных нейросетей. Позднее он вместе с коллегами создал чат-бота Meena и предсказал, что в скором будущем чат-ботом сможет заменить поисковую систему Google и принесёт триллионы долларов дохода. Google отказалась от публичного запуска чат-бота, и в 2021 году Шазир покинул компанию, обвинив её в бюрократической волоките при интеграции технологий в пользовательские продукты.

Позднее он создал стартап Character AI, который через два года привлёк $150 млн инвестиций и был оценён в 1 млрд. На фоне конкуренции с OpenAI и Microsoft Шазир пытался привлечь для своего стартапа больше средств и в конечном счёте сумел договориться с Alphabet, материнской компанией Google. В результате сделки Шазир и ещё несколько десятков сотрудников Character AI перешли в Google.


window-new
Soft
Hard
Тренды 🔥
Новая статья: Gamesblender № 694: глобальный сбой в PSN, релиз Unreal Engine 5.5 и новый шутер по StarCraft 2 ч.
СМИ сообщают о грядущей ликвидации одной из российских альтернатив «Википедии» 4 ч.
В обновлённом Telegram появились подарки, подтверждение телефонов, улучшенные жалобы и RTMP-трансляции 7 ч.
Accenture сформировала подразделение NVIDIA Business Group и обучит 30 тысяч сотрудников полному стеку ИИ-технологий NVIDIA 11 ч.
Linux-вирус Perfctl заразил с 2021 года тысячи серверов и скрытно майнит на них криптовалюту 12 ч.
Началось открытое бета-тестирование браузера Arc для Android — он умеет ходить по сайтам за пользователя 14 ч.
Обновление Samsung привело к поломке смартфонов Galaxy S10 и Note 10 по всему миру 19 ч.
Минцифры опубликовало правила регистрации блогеров-десятитысячников в реестре Роскомнадзора 05-10 01:00
Telegram объяснил недавние сбои событиями на Ближнем Востоке 05-10 00:23
Надёжный инсайдер: ремейк Assassin’s Creed IV: Black Flag выйдет раньше, чем можно было представить 05-10 00:19