Сегодня 06 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → иена
Быстрый переход

Meta✴ представила ИИ-генератор видео Movie Gen: он создаёт ролики со звуком и умеет вставлять в них реальных людей

Meta представила основанный на искусственном интеллекте генератор видео Movie Gen, который позволяет по простому текстовому запросу создавать или редактировать видеоролики — компания становится всё более серьёзным конкурентом OpenAI и Google в области ИИ, пишет Bloomberg.

 Источник изображений: Gerd Altmann / pixabay.com

Источник изображений: Gerd Altmann / pixabay.com

На основе текстовых запросов Movie Gen создаёт новые видео длиной до 16 секунд. Эти же запросы могут использоваться для генерации звука к существующим видеозаписям, для редактирования готовых роликов или для создания видео с участием реального человека на основе предложенной фотографии. Пока пользоваться Movie Gen могут лишь некоторые сотрудники компании, а также её партнёры, в том числе некоторые режиссёры; а в будущем году Meta намеревается добавить поддержку нейросети в свои популярные приложения.

Руководство компании пока ещё обсуждает, как лучше реализовать эту интеграцию, но цель Movie Gen состоит в том, чтобы побудить пользователей соцсетей активнее создавать или редактировать публикации с видеозаписями, рассказал Коннор Хейс (Connor Hayes), вице-президент Meta, курирующий направление генеративного ИИ. «Инструмент будет удобным в использовании, полезным для блогеров, хорошим для общего взаимодействия в приложениях, но на данный момент у нас нет конкретного плана продукта, как он будет выглядеть», — рассказал Хейс.

Meta располагает большими объёмами данных, которых достаточно для обучения ИИ, способного генерировать текст, звук или видео. Компания вложила в это направление несколько миллиардов долларов и встроила в большинство своих приложений чат-бот Meta AI, способный отвечать на вопросы пользователей и поддерживать разговор. Собственные генераторы видео есть и у других крупных компаний — например, это OpenAI Sora и Google Veo.

С запуском Movie Gen компания не спешит: сейчас создание видео по текстовому запросу занимает «несколько десятков минут», и едва ли рядовой пользователь соцсетей будет пользоваться таким инструментом на телефоне. Meta также предстоит решить несколько важных вопросов, «связанных с безопасностью и ответственностью»: к примеру, у одного человека не должно быть возможности создать видео недопустимого содержания с участием другого; компания также намеревается помечать генерируемые ИИ видео, чтобы люди знали об их источнике — истории с дипфейками стали для неё важным уроком.

Сейчас направление ИИ является приоритетным для Meta — ИИ, уверен её глава Марк Цукерберг (Mark Zuckerberg), способен стать фактором роста как пользовательской базы на сервисах компании, так и её доходов. Кроме того, роль ИИ будет возрастать как в приложениях Meta, так и в устройствах будущего, которые она выпускает или намеревается выпускать — включая умные очки. ИИ занимал важное место на презентации прототипа голографических очков дополненной реальности Orion, который Meta представила на минувшей неделе.

OpenAI запустил новый интерфейс «Canvas» для работы с большими проектами и кодом

OpenAI добавила в ChatGPT новый инструмент Canvas, который позволяет редактировать текст и код, сгенерированный ИИ, не создавая новых запросов. Пользователи могут легко вносить изменения, добавлять комментарии и переводить текст на другой язык. Новый интерфейс позволяет взаимодействовать с ChatGPT на более интуитивном уровне.

 Источник изображения: Levart_Photographer/Unsplash

Источник изображения: Levart_Photographer/Unsplash

Решение OpenAI ввести редактируемое рабочее пространство вписывается в тенденцию того, что уже делают другие разработчики искусственного интеллекта. Например, Anthropic выпустила в июне инструмент Artifacts с аналогичной функцией, а компания Anysphere ИИ-помощника Cursor, который представляет из себя альтернативу Visual Studio Code и уже успел приобрести большую популярность у программистов.

В настоящее время чат-боты не способны выполнять масштабные проекты по одному единственному запросу, требуется множество запросов и часто с многократным повторением одного и того же кода. Редактируемое рабочее пространство Canvas позволит корректировать ошибки в результатах работы ИИ без необходимости заново генерировать весь текст или код. «Это более естественный интерфейс для сотрудничества с ChatGPT», — отметил менеджер по продукту OpenAI Дэниел Левайн (Daniel Levine).

 Источник изображения: Techcrunch.com

Источник изображения: Techcrunch.com

В ходе демонстрации интерфейса Левайн выбрал модель «GPT-4o с Canvas» из выпадающего списка в ChatGPT. Однако в будущем окно Canvas будет появляться автоматически, если система определит, что для выполнения задачи, например для написания длинного текста или сложного кода, потребуется отдельное рабочее пространство. Пользователи также смогут просто ввести команду «use canvas», чтобы открыть окно проекта.

ChatGPT может помочь и в написании письма. Пользователь просто вводит запрос на его создание и готовый текст появится в окне Canvas. Затем можно использовать ползунок для изменения длины текста, а также выделить отдельные предложения, чтобы попросить ChatGPT внести изменения, например, сделать текст дружелюбнее или добавить эмодзи. Кроме того, есть возможность попросить ИИ переписать письмо на другом языке.

Аналогично происходит и с программным кодом. Пользователи могут выделять его фрагменты и задавать дополнительные вопросы ИИ. Отметим, что функции для работы с кодом в Canvas несколько отличаются от обычного рабочего окна ChatGPT. Например, появится новая кнопка «Проверить код», после нажатия на которую ChatGPT проанализирует данные и предложит конкретные правки, вне зависимости от того, сгенерирован ли этот код ИИ или написан человеком.

Canvas с 3 октября уже доступна в бета-версии для пользователей ChatGPT Plus и Teams, а на следующей неделе будет запущена и для пользователей Enterprise и Edu, сообщает ресурс TechCrunch.

Google добавляет в поисковик ещё больше ИИ и начинает показывать рекламу в ИИ-ответах

Google начинает показывать рекламу в AI Overview — кратких сводках, сгенерированных искусственным интеллектом для обобщения результатов поиска. В эти обзоры также будут добавляться ссылки на веб-страницы, которые послужили источником информации. А ещё в поисковике появится новый формат результатов, скомпонованный с помощью ИИ.

 Источник изображения: Copilot

Источник изображения: Copilot

Как пишет издание TechCrunch, нововведения являются частью стратегии Google по удержанию пользователей от перехода к альтернативным ИИ-площадкам, таким как ChatGPT от OpenAI и Perplexity, предоставляющим ответы, которые пользователи ранее задавали поисковой системе Google. Кроме того, компания Perplexity, которая существует всего два года, сообщила о росте аудитории до 85 миллионов посещений в месяц, что, хотя и не сравнится с масштабами Google, но всё же является не очень приятным сигналом для техногиганта.

Напомним, с самого момента запуска функция AI Overview подверглась критике за ошибки и сомнительные советы (добавить клей в пиццу). Кроме того, согласно отчёту платформы SE Ranking, ИИ-сводки частенько ссылались на сайты, содержащие устаревшие данные. Также ИИ не мог отличить факты от вымысла.

Однако Google уже внесла изменения в работу алгоритма, ограничив ответы на запросы, связанные с текущими событиями и темами здравоохранения. «Мы продолжим инвестировать в AI Overview и сделаем функцию ещё полезнее», — заявила Рианнон Белл (Rhiannon Bell), вице-президент по пользовательскому опыту Google Search, на пресс-брифинге. По её словам, компания делает всё возможное, чтобы предоставить пользователям качественный контент.

В настоящее время предпринимаются шаги по монетизации AI Overview. Пользователи в США скоро увидят рекламные объявления в ИИ-сводках на мобильных устройствах. Такие объявления будут помечены как «Реклама» и будут отображаться наряду с обычным контентом в ответах ИИ. Google заявила, что протестировала показ этой рекламы на ограниченной аудитории и получила положительные отзывы. «Пользователи находят рекламу в AI Overview полезной, потому что она позволяет быстро находить нужные товары и услуги в момент, когда они в них нуждаются», — отметил Шаши Такур (Shashi Thakur), вице-президент подразделения Google Ads.

Важно отметить, что по оценкам экспертов, сгенерированные ИИ-сводки могут привести к потере более $2 млрд доходов издателей из-за сокращения показов рекламы на их сайтах. По предварительным подсчётам, AI Overviews фактически отнимет у сайтов около 25 % трафика в виду того, что пользователи, получив нужную информацию в поисковике в кратком формате, не станут переходить на сайты-источники.

«Яндекс» представил «Поиск с Нейро» и внёс другие улучшения в поисковую систему

«Яндекс» представил «Нейро» — новый механизм работы поисковой службы с использованием искусственного интеллекта. Система изучает информацию из доступных источников и представляет её сводку в едином ответе. Это поможет разобраться в вопросах, на которые нет готовых ответов в интернете. «Поиск с Нейро» готов консультировать пользователей по товарам в интернет-магазинах и решать математические задачи. Поисковая машина также помогает разбираться в банковских продуктах и искать врачей.

 Источник изображений: yandex.ru

Источник изображений: yandex.ru

Ответ «Нейро» появляется в выдаче на запросы, где ИИ может оказаться полезным и сэкономить время, но его можно выбрать и вручную. В традиционном варианте для получения некоторых ответов на такие запросы приходится обращаться к поисковой машине несколько раз и самостоятельно сверять их или составлять сводки. «Поиск с Нейро» самостоятельно разбивает крупный запрос на несколько мелких, обрабатывает выдачу и предлагает готовый ответ — так, система ответит, кто больше: слон или стегозавр. Обновлённая поисковая машина способна оценить актуальность информации и, например, рассказать о ближайших предстоящих концертах или выдать результат последней игры любимой спортивной команды.

ИИ «Нейро» позволяет задавать вопросы об изображениях в «Поиске по картинкам» и «Умной камере» — ему помогает новая нейросеть, которая научилась эффективнее распознавать объекты. Можно прямо в музее сделать фотографию картины и уточнить, какие значения имеют элементы на ней. «Поиск с Нейро» также готов помочь с математическими задачами для начальной и средней школы. Поисковым запросом может служить текстовый запрос или фотография примера — система подробно распишет решение и даст ответ, даже если он отсутствует в поисковой выдаче по сайтам.

База «Поиска» содержит данные о 2,7 млрд товарах в интернет-магазинах. При получении запроса о товаре система показывает его цену и изображения, помогает в подборе оптимального варианта и предлагает перейти на сайт магазина. «Поиск» лучше определяет, когда пользователь собирается выбрать и купить товар, и предсказывает, приобретёт ли он его на том или ином ресурсе. В режиме диалога «Поиск с Нейро» даст ответы на дополнительные вопросы о товарах, поможет уточнить характеристики и подобрать аналоги.

Поиск «Яндекса» способен помочь в поиске интересных банковских продуктов — это может быть ипотека, дебетовая карта с оптимальными условиями или вклад с самым высоким процентом. Наконец, в системе есть объединённая база по 740 тыс. российских врачей — при запросе о специалисте в определённом районе выдача демонстрируется в виде карточек с подробными сведениями; ближайшую клинику или врача можно найти и на карте. 3 млн отзывов на врачей в базе «Поиска» могут ранжироваться в зависимости от заболевания или процедуры, сведения о которых ищет пользователь.

Голосовой помощник Gemini Live от Google стал доступен для всех Android-смартфонов, причём бесплатно

С 1 октября Google сделала бесплатной работу с голосовым помощником Gemini Live на телефонах под управлением Android. Система помогает в управлении устройствами, ориентируется в происходящем на экране и генерирует тексты в различных приложениях.

 Источник изображения: blog.google

Источник изображения: blog.google

Запуск Gemini Live производится долгим нажатием кнопки питания — вместо традиционного значка «Google Ассистента» появилась иконка с голубой звездой Gemini. Интеллектуальный помощник понимает, что происходит на экране — ему, например, можно задать вопрос о просматриваемом в настоящий момент видео на YouTube. В любом приложении он может создать изображение или текст. Ранее эти функции были доступны только пользователям подписки Gemini Advanced — в первый месяц она бесплатна, а в каждый последующий придётся отдавать $20. Если нажать и удерживать кнопку питания, появится всплывающее окно со значком сервиса в правом нижнем углу; далее потребуется изучить одностраничное руководство и выбрать мужской или женский голос с одним из диалектов английского языка.

В интерфейсе Gemini Live можно общаться с ИИ естественным образом, не беспокоясь о речевых ошибках, запинках или акценте, которые могли помешать «Google Ассистенту». При запущенном приложении микрофон по умолчанию включён — чтобы его отключить, придётся нажать соответствующие кнопки в интерфейсе. Расшифровки разговоров хранятся в журнале пользователя Gemini Apps в течение 72 часов. Для сравнения, представленная ранее функция Microsoft Copilot Vision не предполагает сохранения данных ни локально на устройстве, ни в облаке — они удаляются сразу по завершении работы с системой, уверяет разработчик.

Meta✴ созналась, что все фото, снятые пользователями на умные очки Ray-Ban, она применит для обучения ИИ

Компания Meta призналась, что любое снятое умными очками Ray-Ban изображение, которое пользователи отправляют помощнику с искусственным интеллектом, она может использовать для обучения новых систем ИИ.

 Источник изображений: ray-ban.com

Источник изображений: ray-ban.com

«В регионах, где доступен мультимодальный ИИ (в настоящий момент это США и Канада) изображения и видео, передаваемые Meta AI, могут в соответствии с нашей политикой конфиденциальности использоваться для его улучшения», — заявил представитель компании Эмиль Васкес (Emil Vazquez) ресурсу TechCrunch. Ранее компания заявляла, что снимаемые на очки Ray-Ban Meta фото и видео не используются компанией для обучения систем, пока пользователь сам не отправит их ИИ на анализ — в этот момент материалы попадают под другой набор политик. Другими словами, компания использует своё первое потребительское устройство с ИИ для создания большого набора данных, который можно направить на разработку ещё более мощных моделей ИИ. Единственный способ отказаться — просто не обращаться к мультимодальным системам Meta AI.

Владельцы умных очков Ray-Ban Meta могут не осознавать, что сами предоставляют компании большие объёмы изображений — это могут быть интерьеры их домов, фото близких и личные документы — для обучения новых моделей ИИ. Представители Meta утверждают, что эти сведения есть в пользовательском интерфейсе устройства, но в действительности руководство компании либо само не знало, либо не хотело раскрывать эти сведения. Ранее стало известно, что модели ИИ Llama обучаются на публичных материалах американских пользователей в Instagram и Facebook, но теперь определение «общедоступных данных» компания расширила на всё, что пользователи умных очков отправляют ИИ на анализ.

Накануне компания начала развёртывать новые функции ИИ для очков Ray-Ban Meta — общение с устройством становится всё более естественным, и владельцы очков будут всё чаще отправлять ИИ свои данные, которые компания станет использовать для обучения новых систем. На мероприятии Meta Connect 2024 она подробно рассказала об этих новых функциях, но умолчала о том, что будет делать с пользовательскими данными. В условиях обслуживания Meta AI говорится: «Вы соглашаетесь, что Meta будет анализировать эти изображения, включая черты лица, с помощью ИИ» — при этом компания недавно выплатила властям штата Техас $1,4 млрд, чтобы урегулировать судебное разбирательство, связанное с системой распознавания лиц. Примечательно, что некоторые связанные с обработкой изображений функции Meta AI не работают в Техасе.

Meta также по умолчанию хранит расшифровки всех голосовых диалогов пользователей с умными очками — тоже для обучения ИИ. А вот от записи самого голоса можно отказаться: при первом входе в приложение для управления устройством пользователь выбирает, можно ли использовать записи голоса для этих целей. К слову, американские студенты уже модифицировали программную часть очков Ray-Ban Meta — теперь они раскрывают имя, адрес и номер телефона любого, на кого смотрит пользователь.

OpenAI запретила своим спонсорам поддерживать её конкурентов и Илона Маска

Изданию Financial Times удалось разведать интересные подробности заключённой на этой неделе сделки по новому раунду финансирования OpenAI на сумму $6,6 млрд, которая оценила капитализацию компании в $157 млрд. На этапе переговоров OpenAI настаивала на том, чтобы инвесторы отказались от намерений вкладывать средства в капитал конкурирующих стартапов в области искусственного интеллекта.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Подобное требование довольно редко встречается, как отметили венчурные инвесторы, что позволяет многим из них диверсифицировать риски, вкладывая деньги в различные компании одного сектора. Sequoia Capital и Andreessen Horowitz, например, одновременно поддерживают как OpenAI, так и xAI. Специфика этого раунда финансирования OpenAI, однако, заключалась в наличии большого количества желающих принять участие, а потому стартап мог устанавливать нетипичные для подобных сделок условия, не желая способствовать развитию бизнеса конкурентов. Помимо основанного Илоном Маском xAI, в перечень запрещённых к поддержке OpenAI стартапов попал Safe Superintelligence, основанный покинувшим OpenAI Ильёй Суцкевером. Anthropic, Perplexity и Glean также оказались в "чёрном списке" OpenAI для своих инвесторов.

Один из участников переговоров напомнил, что Uber в своё время диктовала подобные условия, поскольку считала себя доминирующей в своём сегменте компанией. Крупнейшим участником данного раунда финансирования стал венчурный фонд Thrive Capital, который вложил $750 млн собственных средств и привлёк около $550 млн у более мелких инвесторов через проектную компанию. Этот фонд также договорился инвестировать ещё $1 млрд до конца следующего года, но исходя из текущей оценки капитализации OpenAI в $150 млрд до последнего раунда финансирования. Фонд Khosla Ventures вложил $500 млн, по данным источника.

Менее года назад капитализация OpenAI не превышала $87 млрд, а в апреле прошлого года была в пять раз ниже текущего уровня. Подобная динамика показывает, что инвесторы верят в потенциал стартапа на рынке систем искусственного интеллекта, поскольку считают его одним из первопроходцев в сфере создания чат-ботов, работающих с генеративными технологиями.

Сообщается, что глава компании Сэм Альтман (Sam Altman) принял участие в обсуждении вопроса о выделении ему пакета акций в случае реструктуризации OpenAI и превращении стартапа в коммерческую организацию, хотя ранее сам он отрицал проведение подобных переговоров. Новый раунд финансирования превратил OpenAI в крупнейший стартап Кремниевой долины, но ByteDance и SpaceX превосходят его по этому критерию в целом.

OpenAI собрала с инвесторов $6,6 млрд, теперь её стоимость — $157 млрд

Долго обсуждаемая сделка по привлечению в капитал OpenAI дополнительных средств, по данным Bloomberg, была заключена на этой неделе, позволив этому стартапу получить $6,6 млрд и оценить свою капитализацию в $157 млрд. Обе суммы оказались выше ожидаемых, а среди участников этого раунда инвестирования оказались Microsoft и Nvidia.

 Источник изображения: Unsplash, Andrew Neel

Источник изображения: Unsplash, Andrew Neel

Вообще, как поясняют источники, решающую роль в этом раунде финансирования играл венчурный инвестиционный фонд Thrive Capital, который вложил в OpenAI около $1,3 млрд. Корпорация Microsoft отделалась $750 млн, и на фоне уже инвестированных ею ранее $13 млрд это не такая большая сумма. Так или иначе, новый раунд позволил OpenAI войти в число трёх стартапов, максимально поддерживаемых венчурными капиталистами. Этого статуса также в своё время удостоились SpaceX Илона Маска (Elon Musk) и социальная сеть TikTok китайской компании ByteDance.

Tiger Global Management вложила в OpenAI свои $350 млн, Altimeter Capital довольствовалась $250 млн, согласно неофициальным данным. OpenAI удалось привлечь и внимание международных инвесторов. Владеющая Arm японская корпорация SoftBank вложила $500 млн, какие-то суммы внесли MGX и Coatue. Из сообщений OpenAI становится известно, что полученные средства она направит на дальнейшие исследования в сфере искусственного интеллекта, а также расширение своих вычислительных мощностей. Представители Altimeter Capital заявили, что следующим логическим шагом для OpenAI мог бы стать выход на IPO, этот стартап они назвали важнейшей в США компанией в сфере ИИ после Nvidia.

В сделке не участвовала Apple, хотя ранее участвовала в переговорах, как подчёркивает Bloomberg. Часть средств в капитал OpenAI была привлечена через специально созданные проектные компании, которые позволяют собирать средства более мелких инвесторов для финансирования определённого проекта. По крайней мере Thrive Capital не ограничилась собственными средствами, а привлекла дополнительные ресурсы как раз по такой схеме. Будут ли реализованы структурные преобразования в OpenAI, которые до этого активно обсуждались с потенциальными инвесторами, не уточняется. Компания располагает 11 млн подписчиков сервиса ChatGPT Plus, корпоративных подписчиков при этом насчитывается более 1 млн. В следующем году компания рассчитывает выручить более $10 млрд, но пока она остаётся убыточной. В ходе переговоров со своими инвесторами, как сообщается, OpenAI рекомендовала им воздержаться от финансирования деятельности конкурирующих компаний типа Anthropic и xAI.

Microsoft прокачала Copilot: человеческий голос, сёрфинг с пользователем и глубокие размышления

Microsoft представила радикальное обновление помощника с искусственным интеллектом Copilot — он получил зрение и голос, благодаря чему стал более персонализированным. Новые возможности Copilot включают режим виртуального ведущего новостей, который зачитывает заголовки; голосовая функция позволяет общаться с ним естественным образом, как Advanced Voice Mode от OpenAI; наконец, ИИ-помощник может «увидеть» то, на что ему укажет пользователь.

 Источник изображений: blogs.microsoft.com

Источник изображений: blogs.microsoft.com

Microsoft Copilot был радикально переработан на мобильных устройствах, в веб-версии и в приложении для Windows — он теперь напоминает ИИ-помощник Pi, созданный компанией Inflection, значительное число сотрудников которой перешло в Microsoft. Бывший гендиректор Inflection и сооснователь Google DeepMind Мустафа Сулейман (Mustafa Suleyman) сейчас возглавил ИИ-отдел Microsoft. Существенной переработке подвергся интерфейс ИИ-помощника — теперь это персонализированная страница Copilot Discover, более полезная и привлекательная, чем одно только текстовое поле для запросов к чат-боту. Домашняя страница настраивается на основе истории пользователя с чат-ботом; со временем на ней будут представлены полезные поисковые запросы, советы и релевантная информация.

ИИ-помощник получил полноценный голосовой интерфейс аналогично ChatGPT — теперь с ним можно общаться, задавать вопросы, прерывать его, как при разговоре с товарищем или коллегой. В Copilot доступны четыре варианта голоса, один из которых придётся выбирать при первом использовании. Вторая крупная ставка Microsoft — функция зрения Copilot Vision, позволяющая ассистенту видеть то, что видит пользователь на открытой веб-странице. Можно задавать вопросы о тексте, изображениях и любом другом содержимом, и помощник даст естественный ответ. Это поможет при совершении покупок в интернете — система предложит различные варианты товаров и отзывы. Подключать Copilot Vision придётся вручную, и просматриваемый системой контент нигде не хранится и не используется для обучения ИИ, уверяет Microsoft. Кроме того, компания наложила ограничения на типы сайтов, с которым может работать Copilot Vision; платные и конфиденциальные материалы система тоже не поддерживает. В одном из приведённых Microsoft примеров функция используется для сканирования рукописных кулинарных рецептов — ИИ поясняет, о каком блюде идёт речь, и сколько времени уйдёт на его приготовление.

Copilot Daily, ещё одна функция, представляет аудиосводку новостей и погоды, которую ИИ-помощник зачитывает как диктор новостной службы. Сводка представляет собой короткую заметку, которую пользователь может слушать по утрам — в качестве источников используются только ресурсы, которые согласились на использование контента системой Copilot. На начальном этапе это Reuters, Axel Springer, Hearst и Financial Times, но в перспективе их число будет расширяться. Многообещающей также представляется функция Think Deeper — благодаря новейшим ИИ-моделям OpenAI система Copilot теперь может отвечать и на сложные вопросы, предлагая пошаговые ответы или проводя сравнения. Функция пока остаётся на ранней стадии разработки, и доступна она на площадке Copilot Labs наряду с Copilot Vision — участники тестирования могут отправить в Microsoft отзывы об их работе. Компания осторожничает неспроста, если учесть опасения, которые вызвала функция Recall до того, как подверглась переработке.

Обновлённый пакет Copilot доступен в мобильных приложениях для iOS и Android, на сайте copilot.microsoft.com, а также в приложении Copilot для Windows. Функция Copilot Voice на начальном этапе доступна на английском языке в Австралии, Канаде, Новой Зеландии, Великобритании и США, а в перспективе появится и в других регионах. Copilot Daily пока можно пользоваться лишь в США и Великобритании, а Copilot Vision работает лишь у некоторых подписчиков Copilot Pro в США.

Выяснилось, что ИИ-ассистенты не повышают продуктивность программистов

Авторы исследования Uplevel, охватившего деятельность примерно 800 разработчиков программного обеспечения, утверждают, что применение инструментов с искусственным интеллектом для написания программного кода пока не выявило ни повышения производительности труда профильных специалистов, ни снижения их эмоционального выгорания.

 Источник изображения: Unsplash, Luca Bravo

Источник изображения: Unsplash, Luca Bravo

В ходе исследования сравнивались результаты труда выборки из 800 разработчиков на протяжении двух трёхмесячных периодов. В первом периоде программисты трудились с использованием традиционных инструментов, во втором они перешли на использование ИИ-ассистента GitHub Copilot. Примечательно, что на производительности труда разработчиков подобная миграция особо не сказалась в рамках данного эксперимента.

Первоначально ожидалось, что применение GitHub Copilot снизит количество ошибок в программном коде и увеличит производительность труда, но по факту в первом случае наблюдался рост количества ошибок на 41 %, а ещё попытки применять ИИ-ассистента не привели к существенному улучшению ситуации с эмоциональным выгоранием специалистов. По данным GitHub, применение помощника Copilot способно на 55 % повысить скорость написания кода разработчиками.

Некоторые эксперты признались, что написанные с помощью ИИ участки программного кода трудно поддаются анализу и выявлению ошибок, поэтому порой проще переписать нужный фрагмент заново. На ранних этапах развития ChatGPT, например, отмечалось, что этот чат-бот более половины всех запросов, связанных с оптимизацией работы создателей программного кода, просто неверно истолковывает. Представители Gehtsoft, например, убеждены, что разработка программного обеспечения на 90 % зависит от функций человеческого мозга, в части понимания требований, разработки системы и определения ограничений. Превращение сформированных взаимных зависимостей в программный код является самой простой частью работы программиста.

С другой стороны, находятся и те, кто восхваляет возможности ИИ в разработке программного кода. Представители провайдера облачных услуг Innovative Solutions, например, отмечают почти троекратное повышение производительности после перехода на использование ИИ-ассистентов типа Claude Dev и Copilot.

В Microsoft Paint добавили ИИ-функции заливки и стирания, прямо как в Photoshop

Microsoft представила новые основанные на генеративном искусственном интеллекте функции для приложений Paint и «Фотографии» на компьютерах класса Copilot Plus PC с ИИ-ускорителями. Новые возможности предназначаются для редактирования изображений и выступают своего рода аналогами функций, которые уже есть в Adobe Photoshop.

 Источник изображений: blogs.windows.com

Источник изображений: blogs.windows.com

Для работы обоих инструментов используется кисть с регулируемым размером, помогающая указывать на подлежащие редактированию области изображения. Функция Generative Erase удаляет с изображений нежелательные элементы — так же это делает Magic Eraser на телефонах Google Pixel. Generative Fill, напротив, добавляет на изображения новые элементы — пользователю необходимо создать текстовый запрос и выбрать, где их разместить. Схожим образом работает и одноимённый инструмент в Photoshop.

Основу для работы новых функций заложил инструмент Paint Cocreator, анонсированный для компьютеров Copilot Plus PC в этом году — он предназначен для генерации изображений при помощи текстовых запросов и выступающих образцами эскизов. Обеспечивающая работу функций диффузионная модель получила обновление, с которым повысились качество и скорость работы, а также появилась «встроенная модерация», предотвращающая злоупотребления.

Инструмент Generative Erase появился и в приложении «Фотографии» наряду с функцией Super-Resolution, которая при помощи локального ИИ масштабирует размытые или пикселизированные изображения. Степень увеличения картинки можно регулировать при помощи ползунка — оно может быть восьмикратным. Это соответствует возможностям масштабирующего средства на платформе Canva и вдвое превосходит возможности четырёхкратного увеличения Super Resolution в Adobe Lightroom. Функция доступна бесплатно и работает достаточно быстро, «за считанные секунды» повышая разрешение изображений до 4K, уверяют в Microsoft.

Разработчик ИИ-ускорителей Cerebras Systems готовится к выходу на IPO

Основанная в 2016 году в Калифорнии компания Cerebras Systems разрабатывает непривычно крупные чипы для ускорения работы систем искусственного интеллекта, а их выпуском на квадратных подложках занимается TSMC. Американский стартап остаётся убыточным, но уже начал готовиться к выходу на IPO, опубликовав проспект для инвесторов.

 Источник изображения: Cerebras

Источник изображения: Cerebras

Прежде всего, из опубликованных данных становится понятно, что по итогам первого полугодия компания получила чистые убытки составили $66,6 млн при выручке $136,4 млн. За год до этого выручка не превышала $8,7 млн при чистых убытках в размере $77,8 млн. По итогам всего прошлого года выручка Cerebras достигла $78,7 млн при убытках в размере $127,2 млн. Во втором квартале прошлого года компания выручила $69,8 млн и получила убытки в размере $50,9 млн. За год до этого выручка не превышала $5,7 млн, а чистые убытки составили $26,2 млн. В текущем году операционные расходы Cerebras выросли из-за необходимости найма дополнительного персонала в связи с расширением бизнеса.

В прошлом году компания G42 из ОАЭ формировала 83 % выручки Cerebras. Помимо продажи собственно чипов ускорителей, компания занимается предоставлением доступа к собственным облачным мощностям на их основе. Получив в 2021 году $250 млн финансирования, Cerebras оценивала свою капитализацию в $4 млрд. На какую сумму она претендует по итогам IPO, пока не уточняется. Арабская G42 сейчас владеет примерно 5 % акций Cerebras, примерно столько же сосредоточено в руках основателя Эндрю Фельдмана (Andrew Feldman). Компания G42 обязуется до марта 2025 года потратить около $1,43 млрд на покупку ускорителей Cerebras. По мере увеличения объёмов закупок G42 получит право купить большее количество акций американской компании.

Пакетами акций Cerebras не менее 5 % владеют около шести институциональных инвесторов. Основатель и глава OpenAI Сэм Альтман (Sam Altman) также является акционером Cerebras, как и сооснователь Sun Microsystems Энди Бехтольсхайм (Andy Bechtolsheim).

Новые правила экспортного контроля США облегчат поставки ускорителей вычислений на Ближний Восток

Министерство торговли США, как сообщает Reuters, начало неделю с публикации нового правила экспортного контроля, которое теоретически способно облегчить поставки ускорителей вычислений на Ближний Восток, где они будут использоваться для строительства новых центров обработки данных.

 Источник изображения: Nvidia

Источник изображения: Nvidia

С октября прошлого года экспортёры ускорителей вычислений из США должны получать специальные лицензии, дающие им возможность поставлять передовые ускорители вычислений в определённые районы Ближнего Востока и Центральной Азии. Каждая партия требовала отдельного согласования, что в значительной мере затрудняло поставки. Теперь же, как поясняет Reuters, центры обработки данных, которым требуются ускорители вычислений американского происхождения, смогут получить лицензию через подтверждение статуса верифицированного конечного пользователя. В этом случае конкретный получатель сможет запасаться ускорителями без необходимости отдельного согласования каждой поставки.

Власти регионов, в которых расположены центры обработки данных, смогут оказать содействие их владельцам в оформлении необходимых для США документов. С одной стороны, на Ближнем Востоке появляется немало желающих развивать инфраструктуру вычислительных мощностей для систем искусственного интеллекта. С другой стороны, американские власти опасаются, что по этим каналам ускорители вычислений могут попасть в Китай, куда они не поставляются напрямую из-за санкций США.

В апреле Microsoft объявила о намерениях вложить $1,5 млрд в капитал компании G42 из ОАЭ, которая собирается развивать в регионе направление систем искусственного интеллекта. Принято считать, что через эту сделку США купили лояльность ОАЭ в вопросах развития ИИ, а также предостерегли власти ближневосточной страны от потенциального сближения с Китаем. Чтобы получить статус верифицированного конечного пользователя, ближневосточные центры обработки данных будут проходить тщательную процедуру аудита. Информация о потенциальных клиентах этих ЦОД будет приниматься во внимание при выдаче экспортной лицензии. Количество и тип предоставляемых конкретному ЦОД ускорителей будет оговариваться американской стороной.

Huawei приступила к поставкам образцов новейших ускорителей Ascend 910C

В прошлом месяце стало известно о завершении компанией Huawei Technologies разработки новых ускорителей вычислений на базе чипа Ascend 910C, которые по уровню быстродействия должны быть сопоставимы с попадающими под санкции США в Китае Nvidia H100. По данным китайских СМИ, крупные клиенты Huawei уже начали получать образцы ускорителей на базе Ascend 910C.

 Источник изображения: Huawei Technologies

Источник изображения: Huawei Technologies

Протестировав новинку Huawei, клиенты компании смогут сделать вывод о целесообразности дальнейшей закупки. Как отмечалось ранее, клиенты Huawei могут заказать до 70 тысяч таких ускорителей. В лучшем случае Huawei сможет выпускать от 1,3 до 1,4 млн ускорителей Ascend 910C, но всё будет зависеть от экспортных ограничений США, ведь если 7-нм чипы ускорителей для Huawei выпускает китайская SMIC, то память класса HBM китайским производителям до сих пор приходится получать из-за рубежа.

Клиенты признались South China Morning Post, что Huawei нередко при покупке ускорителей Ascend навязывает им свою сопутствующую продукцию типа телекоммуникационного оборудования и систем хранения данных. Nvidia сохранила возможность поставлять в Китай ускорители H20 и сейчас готовит для местного рынка B20, и многие крупные игроки рынка облачных услуг в Китае продолжают закупать решения этого американского поставщика, чтобы сохранить совместимость с уже работающими проектами и обеспечить себя и клиентов технической поддержкой Nvidia. По некоторым прогнозам, Nvidia в этом году поставит в Китай не менее 1 млн ускорителей H20, а её выручка на местном рынке достигнет $12 млрд даже в условиях санкций.

Google представила технологию проектирования микросхем AlphaChip с помощью ИИ

Google представила AlphaChip — метод обучения искусственного интеллекта с подкреплением для проектирования микросхем. Он обещает значительно ускорить проектирование плана кристалла, а также усовершенствовать чипы с точки зрения производительности, мощности и площади. Google использовала это решение при проектировании ИИ-ускорителей TPU (Tensor Processing Unit), применяли его и другие компании, включая MediaTek.

 Источник изображений: Google

Источник изображений: Google

Проектный макет микросхемы или план кристалла является самым долгим и трудоёмким этапом разработки полупроводникового компонента. Synopsys, которая выпускает ПО для проектирования чипов, внедрила ИИ для решения этой задачи, но её продукт имеет очень высокую цену. Google решила демократизировать этот подход. В настоящий момент создание плана кристалла для сложной микросхемы, например, графического процессора, занимает около двух лет, если его разрабатывают люди. Менее сложные компоненты проектируются за несколько месяцев, но этот процесс сопряжён с миллионными затратами, поскольку крупные производители привлекают значительное число специалистов. AlphaChip, по утверждению Google, решает задачу за несколько часов. Более того, эта система выдаёт превосходный результат, оптимизированный по производительности и энергоэффективности. Google также продемонстрировала график, который показывает сокращение длины проводников в предыдущих версиях TPU и новом Trillium.

Основу механизма работы AlphaChip составляет модель обучения с подкреплением, при которой ИИ выполняет операцию в заранее заданной среде, изучает результаты и учится на этом опыте, чтобы повысить качество работы в будущем. В случае AlphaChip проектирование плана кристалла ИИ рассматривает как своего рода игру, за один ход которой на поле размещается один компонент схемы. Нейросеть помогает выстроить граф взаимосвязей между компонентами, и чем больше макетов создаёт система, тем выше качество её работы.

Google использует AlphaChip в разработке ИИ-ускорителей TPU с 2020 года — на них компания запускает крупномасштабные модели ИИ и облачные службы. На этих процессорах работают модели-трансформеры — эта архитектура используется в Gemini и Imagen. Система AlphaChip помогала совершенствовать схему каждого последующего поколения TPU, включая новейшие Trillium — она сокращала время разработки и обеспечивала более высокую производительность. Тем не менее, и Google, и MediaTek используют эту систему для ограниченного набора блоков, а значительную часть работы проделывает всё-таки человек.

Помимо Google TPU, AlphaChip использовалась при проектировании мобильных 5G-чипов MediaTek Dimensity, которые широко применяются в актуальных смартфонах. Система была предварительно обучена на широком ассортименте микросхем, говорят в Google, что позволяет ей генерировать все более эффективные макеты по мере проделанного объёма работы. Человек учится быстро, а ИИ — ещё быстрее.

Успех AlphaChip побудил Google продолжить внедрение ИИ на разных этапах проектирования микросхем, включая логический синтез, выбор макросов и оптимизацию по времени — Synopsys и Cadence предлагают это за большие деньги. Компания считает, что в перспективе AlphaChip можно будет применять на всём цикле разработки чипов от проектирования архитектуры до компоновки и производства — оптимизация при помощи ИИ поможет ускорить микросхемы, сделать их компактнее, энергоэффективнее и дешевле. В будущем решение будет использоваться не только для серверных ускорителей Google и мобильных платформ MediaTek. Разработка AlphaChip продолжается.


window-new
Soft
Hard
Тренды 🔥
Чтобы разблокировать соцсеть X в Бразилии, Маск заплатил штраф $5 млн, но не туда 14 ч.
Новая статья: Gamesblender № 694: глобальный сбой в PSN, релиз Unreal Engine 5.5 и новый шутер по StarCraft 17 ч.
СМИ сообщают о грядущей ликвидации одной из российских альтернатив «Википедии» 19 ч.
В обновлённом Telegram появились подарки, подтверждение телефонов, улучшенные жалобы и RTMP-трансляции 22 ч.
Accenture сформировала подразделение NVIDIA Business Group и обучит 30 тысяч сотрудников полному стеку ИИ-технологий NVIDIA 05-10 15:36
Linux-вирус Perfctl заразил с 2021 года тысячи серверов и скрытно майнит на них криптовалюту 05-10 14:28
Началось открытое бета-тестирование браузера Arc для Android — он умеет ходить по сайтам за пользователя 05-10 11:54
Обновление Samsung привело к поломке смартфонов Galaxy S10 и Note 10 по всему миру 05-10 06:59
Минцифры опубликовало правила регистрации блогеров-десятитысячников в реестре Роскомнадзора 05-10 01:00
Telegram объяснил недавние сбои событиями на Ближнем Востоке 05-10 00:23