Сегодня 13 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → машина
Быстрый переход

Беспилотные автомобили с трудом распознают детей и темнокожих пешеходов

Разработчики систем автономного вождения утверждают, что их программное обеспечение одинаково хорошо распознаёт взрослых светлокожих людей, детей и темнокожих пешеходов. Однако исследование учёных из Королевского колледжа в Лондоне показало, что это не совсем так.

 Источник изображения: metamorworks / Shutterstock

Источник изображения: metamorworks / Shutterstock

Исследователи проверили восемь систем обнаружения пешеходов, построенных на базе нейросетей. В ходе тестирования использовалось более 8 тыс. изображений пешеходов. Оказалось, что системы обнаружения пешеходов на 20 % лучше распознают взрослых людей, чем детей. Кроме того, программное обеспечение на 7,5 % точнее определяет светлокожих людей, чем темнокожих пешеходов. По мнению исследователей, проблема распознавания темнокожих людей заключается в том, что системы автономного вождения преимущественно обучаются на изображениях людей со светлой кожей.

«Хотя влияние несправедливых систем искусственного интеллекта хорошо задокументировано, начиная с того, что ИИ-алгоритмы при приёме на работу предпочитают кандидатов-мужчин и заканчивая тем, что алгоритмы распознавания лиц менее точно определяют темнокожих женщин, чем белых мужчин, опасность, которую могут представлять беспилотные автомобили, очень велика. Раньше представителям меньшинств могли отказать в жизненно важных услугах, а теперь они могут столкнуться с серьёзными травмами», — считает доктор Цзе Чжан (Jie Zhang), один из авторов исследования.

Учёные также установили, что точность распознавания темнокожих людей сильно снижается в условиях недостаточной освещённости и низкой контрастности. Это может приводить к возникновению опасных ситуаций при использовании систем обнаружения пешеходов на основе ИИ в тёмное время суток. Автопроизводители не раскрывают подробностей о программном обеспечении, используемом для распознавания пешеходов. Однако исследователи утверждают, что эти алгоритмы, как правило, построены на основе тех же систем с открытым исходным кодом, которые были проверены в ходе исследования.

Учёные с помощью ИИ в четыре раза ускорили преобразование мыслей в речь через нейроинтерфейс

В журнале Nature вышли две статьи, в которых учёные рассказали о новых методиках трансляции мыслей пациентов с поражениями мозга в речь и эмоции. Преобразование мозговой активности в текст и голосовое общение происходит с помощью алгоритма машинного обучения. Учёным удалось увеличить скорость преобразования почти в четыре раза с 18 слов в минуту до 78. Это ниже среднего для обычного разговора темпа в 160 слов в минуту, но кратно быстрее, чем было до этого.

 Источник изображений: Noah Berger/UCSF

Источник изображений: Noah Berger/UCSF

Нейродегенеративные заболевания, инсульты или травмы способны лишить человека речи разными способами, но один из них достаточно легко поддаётся исправлению. Современные технологии позволяют создать мостик между здоровыми участками мозга, отвечающими за речь или мысленное произношение, и мышцами, управляющими мимикой и позволяющими говорить. Естественный канал коммуникации между мышцами и мозгом может быть разорван в случае болезни или травмы, и тогда на помощь приходит интерфейс человек-компьютер и обучаемый алгоритм.

В мозг пациента встраивается датчик или несколько датчиков с электродами, входящими в зоны активности мозга человека, ответственные за произношение и речь (хотя учёные пока не до конца понимают, какие это зоны). В одном случае, например, учёные установили на речевую область сенсомоторной коры и на область верхней височной извилины женщины после инсульта 253 электрода. После болезни она не могла говорить и даже печатать.

В течение нескольких недель ИИ обучался на примере произношения пациенткой 1024 слов из специально подобранного словаря. Для упрощения работы алгоритма он разбивал все слова на фонемы, которых было всего 39. Затем словарный запас женщины был расширен до 125 тыс. слов. Машинный алгоритм смог распознавать мысленное произношение женщины с ошибками на уровне 25 %, но со скоростью до 78 слов в минуту.

Алгоритм также научили распознавать эмоции пациентки — горе, радость, удивление. Наконец, используя старую видеозапись женщины, учёные создали её компьютерный образ — аватар — и заставили его транслировать текстовые сообщения в голосовые. По сути, они вернули пациентке возможность разговаривать.

Сегодня подобные процедуры восстановления сопряжены с длительным обучением ИИ и необходимостью быть постоянно подключённым к компьютеру. Учёные из Калифорнийского университета в Сан-Франциско (UCSF) и Калифорнийского университета в Беркли, которые реализовали представленную методику, теперь работают над беспроводными вариантами транслятора. Когда-нибудь это повысит социальную вовлечённость людей с подобными медицинскими проблемами.

ИИ воссоздал композицию Pink Floyd по мозговой активности слушателей, и звучит это ужасно

Исследователи Калифорнийского университета (UC) в Беркли впервые получили музыкальную композицию, воссозданную по сигналам из мозга человека. Пациенты прослушивали трек «Another Brick in the Wall (Part 1)» группы Pink Floyd, а имплантированные в мозг датчики снимали показания. Различение ритма и мелодии в сигналах мозга поможет разработать имплантаты для людей, страдающих нарушениями в области восприятия речи и эмоций и не только.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Для поиска зон мозга, ответственных за восприятие музыки в широком смысле этого слова, в мозг 29 пациентов были имплантированы по 2268 электродов. Всем им ставили композицию Pink Floyd «Ещё один кирпич в стене», ставшую классикой рока. Параллельно прослушиванию с датчиков снимались показания мозговой активности, которые затем расшифровывали с помощью линейного и нелинейного ИИ-алгоритма.

Что в итоге получилось, можно прослушать в ролике ниже. Ценители Pink Floyd могут прийти в ужас от услышанного. С другой стороны, мозг может служить своеобразным фильтром, придающим композиции новизну и определённую оригинальность. Нельзя исключать, что это, в том числе, приведёт к появлению новых музыкальных находок и даже направлений.

При поиске ориентированных на музыку областей в головном мозге учёные решали другую задачу. Есть большой класс пациентов, страдающих от нарушений в восприятии и воспроизведении речи. В общем случае это называется просодией. Просодия подразумевает невозможность выделить в речи эмоции, ударения, акценты и другие нюансы, что сильно ограничивает страдающих ею в социализации. Считывание мелодии прямо с мозга помогло определить центры, отвечающие за мелодику и ритм. Фактически это путь к преодолению недуга с помощью имплантатов и ИИ-алгоритмов.

 Источник изображения: Ludovic Bellier/CC-BY 4.0

Источник изображения: Ludovic Bellier/CC-BY 4.0

Оказалось, что за музыкальную активность мозга отвечают другие отделы, чем те, которые поддерживают речь. Прежде всего — это верхняя височная извилина, а также области в сенсорно-моторной коре и нижней лобной извилине. В этих областях были расположены 347 электродов из 2268, установленных для эксперимента. Это то разрешение, с которым была считана с мозга легендарная композиция Pink Floyd, что наверняка можно улучшить в последующих экспериментах. Интересно, как к этому отнесутся правообладатели?

Zoom обновил условия обслуживания и начал обучать свой ИИ на данных пользователей

Zoom обновил условия обслуживания, дав себе право обучать собственный ИИ на основе данных пользователей. Это изменение вызывает споры о том, насколько допустимо использовать личные данные клиентов для обучения ИИ, даже если они агрегированы или анонимизированы.

 Источник изображения: Alexandra_Koch / Pixabay

Источник изображения: Alexandra_Koch / Pixabay

Согласно недавно обновлённым условиям обслуживания, Zoom намерен обучать собственные ИИ-модели, используя данные пользователей. Нововведение, вступившее в силу 27 июля, подтверждает право компании использовать информацию о продукте, телеметрические и диагностические данные, а также другой контент или данные, собранные компанией. Такой подход к пользовательским данным со стороны технологических компаний не является новым, однако новые условия являются важным шагом в реализации стратегии Zoom в области ИИ.

Условия Zoom гласят: «Вы даёте согласие на доступ, использование, сбор, создание, изменение, распространение, обработку, совместное использование, обслуживание и хранение генерируемых Службой данных компанией Zoom в любых целях, в объёме и в порядке, разрешённых действующим законодательством, в том числе в целях разработки продуктов и услуг, маркетинга, аналитики, обеспечения качества, машинного обучения или искусственного интеллекта (в том числе в целях обучения и настройки алгоритмов и моделей), обучения, тестирования, улучшения Служб, Программного обеспечения или других продуктов, услуг и программного обеспечения компании Zoom или любой их комбинации, а также в соответствии с другими положениями настоящего Соглашения».

Контент пользователей, такой как сообщения, файлы и документы, в эту категорию, по-видимому, не входит. В блоге компании представитель Zoom уточнил: «Для ИИ мы не используем аудио, видео или чат без согласия клиента». Ключевая фраза здесь — «без согласия клиента».

В июне Zoom на бесплатной основе представил две новые функции генеративного ИИ — инструмент для составления резюме встречи и инструмент для создания сообщений в чате. Однако при активации этих функций Zoom просит пользователей подписать форму согласия на обучение своих ИИ-моделей с использованием их контента. Представитель компании заявил, что пользователи Zoom сами решают, следует ли им активировать функции генеративного ИИ и делиться индивидуальным контентом с Zoom для улучшения продукта. «Ваш контент используется исключительно для улучшения производительности и точности этих ИИ-услуг», — пояснил предствитель Zoom в блоге.

Обновление условий произошло на фоне растущей обеспокоенности, в какой степени ИИ должен обучаться на данных отдельных лиц, независимо от того, насколько они агрегированы или анонимизированы. Инструменты, такие как ChatGPT — OpenAI, Bard — Google и Bing — Microsoft, обучаются на больших объёмах текста или изображений из интернета. В секторе генеративного ИИ недавно были поданы иски от писателей и художников, которые утверждают, что их произведения были незаконно использованы техногигантами для обучения своих ИИ-моделей.

Обновление условий обслуживания Zoom подчёркивает растущую роль ИИ в современных технологиях и вызывает вопросы о балансе между инновациями и конфиденциальностью данных. Пока компании стремятся улучшить свои услуги с помощью ИИ, важно помнить о необходимости защиты личной информации пользователей.

Мозговые имплантаты и ИИ частично вернули подвижность и тактильные ощущения парализованному человеку

Исследователи из Института Файнштейна американской медицинской сети Northwell Health впервые обеспечили двойной искусственный обход поражённой нервной системы пациента. Встроенные в головной мозг человека имплантаты вернули подвижность и чувствительность руки. Не обошлось и без помощи искусственного интеллекта.

 Источник изображений: Matthew Libassi / Northwell Health’s Feinstein Institutes for Medical Research

Источник изображений: Matthew Libassi / Northwell Health’s Feinstein Institutes for Medical Research

При подготовке к операции хирурги с помощью фМРТ провели многочисленные оценки зон головного мозга пациента, чтобы с максимальной точностью определить место размещения имплантатов — чипов, распознающих активность головного мозга в его отдельных областях. Но даже после этого в процессе 15-часовой операции на открытом мозге они консультировались с пациентом для уточнения мест установки датчиков.

Два имплантата считывали «мысли» пациента о желании двигать рукой, а три других принимали сигналы от датчиков на руке и запястье. Фактически врачи запустили два обходных пути для нейросигналов, барьером на пути которых стала травма позвоночника (спинного мозга). Один шунт заставлял руку совершать движения через систему накладных электродов (на позвоночник и предплечье), а другой возвращал в мозг сигналы от датчиков тактильных ощущений. Дальше мозг справлялся сам — связывал одно и другое и выстраивал новые нейронные цепи в головном мозге таким образом, чтобы человек воспринимал движение руки и тактильный отзыв в едином пакете.

По словам хирургов, это первый в истории случай, когда спинной мозг обошли двумя маршрутами. Ранее проводились экспериментальные операции, когда шунт, минуя поражённый спинной мозг, передавал расшифрованные компьютерным алгоритмом желания двигаться в мышцы конечностей. Но обратной связи до сих пор никто не организовывал, чтобы тактильные ощущения возвращались в мозг в обход повреждённых нервных тканей.

Между тем, обратная связь может помочь в восстановлении функций мозга, отвечающих за движения конечностей и их чувствительность. Проще говоря, по мере обучения мозг может научиться обходиться без компьютерных алгоритмов и случай с этим конкретным пациентом Northwell Health это подтвердил. После двойной стимуляции 45-летний парень с парализованными руками и ногами смог частично вернуть чувствительность руки и в два раза увеличил силу её сжатия.

Миллионы пациентов с подобными травмами могут надеяться вернуть подвижность и чувствительность конечностей, что обеспечит им развитие подобных технологий.

США уже шесть лет никак не могут принять законы по беспилотному транспорту

Уже более шести лет в Конгрессе США никак не могут принять законодательство для регулирования индустрии беспилотных автомобилей, пишет The Verge. Это связано с разногласиями среди конгрессменов по целому ряду вопросов, начиная от увеличения количества автономных транспортных средств на дорогах страны и заканчивая отсутствием единства по поводу запрета штатам самостоятельно устанавливать свои собственные технические требования для такого вида транспорта.

 Источник изображения: getcruise.com

Источник изображения: getcruise.com

В минувшую среду в Конгрессе США прошли слушания по теме «Законодательная база для беспилотных автомобилей: повышение безопасности, улучшение жизни и мобильности и победа над Китаем», которые были первыми более чем за год, касающимися автономных транспортных средств.

Член палаты представителей Фрэнк Паллоне (Frank Pallone, штат Нью-Джерси), участник комитета по энергетике и торговле, заявил на слушаниях, что Конгресс США «не может просто стряхнуть пыль с законодательства шестилетней давности и игнорировать существенные проблемы, возникшие в последние годы. Появляются лазейки в сфере ответственности. Воздействие на рабочую силу становится все более очевидным».

С тех пор, как шесть лет назад в Конгресс США был внесён первый законопроект, связанный с автономным транспортом, многое изменилось. Финансирование индустрии беспилотных автомобилей значительно сократилась, а радужные прогнозы о росте количества самоуправляемых транспортных средств на дорогах не сбылись. Небольшие стартапы были поглощены более крупными компаниями, и у операторов сервисов автономного транспорта прошли увольнения сотрудников.

Результаты тестирования компаниями Waymo (Alphabet) и Cruise (GM) сервисов полностью беспилотных роботакси в Сан-Франциско оказались неоднозначными, поскольку компании сообщают о сотнях тысяч миль, пройдённых робомобилями без серьёзных аварий или травм, а городские власти жалуются на блокирование автомобилями роботакси проезда автобусов и машин скорой помощи, и местные жители протестуют против беспрепятственного распространения этого вида транспорта в городе.

Джон Боззелла (John Bozzella), президент и гендиректор Альянса автомобильных инноваций (Alliance for Automotive Innovation), заявил, что Конгресс США должен действовать быстро в создании нормативно-правовой базы отрасли, чтобы не потерять компании и инновационное преимущество перед другими странами.

Между тем точки преткновения по данному вопросу пока остаются неизменными. Например, споры по поводу юридической ответственности и страховании в случае попадания в аварию беспилотного автомобиля пока ни к чему не привели.

В Китае создали датчик активности мозга, который подключается через ухо

Современные технологии не позволяют осуществлять высокоточное дистанционное считывание активности мозга человека. Самым действенным способом по-прежнему остаётся установка электродов на кожу головы или имплантация непосредственно в мозг. Возможно, с этим сможет помочь новый китайский датчик активности мозга, который очень просто устанавливается в ушной канал пациента.

 Источник изображений: Nature Communications (2023)

Источник изображений: Nature Communications (2023)

Разработанное группой ученых из китайского Университета Цинхуа устройство получило название SpiralE. Это тонкая многослойная полоска длиной 50 мм и шириной 3 мм. Полоска состоит из двух слоёв полимера с памятью формы, слоя электротермической активации формы и слоя с сенсорами для снятия электроэнцефалограммы.

Для ввода в ушной проход пациента датчик скручивается в плотный жгут. Уже на месте на датчик воздействуют электромагнитным полем, которое вызывает нагрев в его активирующем слое и, как следствие, заставляет полимерные слои с памятью формы распрямляться. Этот процесс приводит к тому, что датчик плотно соприкасается с кожей, и это обеспечивает аккуратное снятие сигналов мозговой активности. При этом каждый раз датчик принимает индивидуальные формы слухового канала, что делает его универсальным. Наконец, он не загораживает слуховой проход и не снижает чувствительность слуха человека, и легко извлекается.

Лабораторные испытания показали, что датчик удобен для длительного ношения и определяет активность мозга с точностью до 95 %. Учёные рассчитывают, что подобный датчик найдёт применение в изучении качества сна пациентов (спать с современными наголовными датчиками то ещё удовольствие), при выявлении эпилепсии и даже для слежения за активностью водителей, о чём они рассказали в своей статье в журнале Nature Communications.

Учёные создали компьютерный чип с клетками человеческого мозга — он показал способность к обучению

Учёные из Университета Монаша создали DishBrain — полубиологический компьютерный чип, в электроды которого интегрированы около 800 000 клеток мозга человека и мыши. Демонстрируя что-то вроде разума, он научился играть в Pong за пять минут. Исследование, проведённое в партнёрстве с мельбурнским стартапом Cortical Labs, получило грант в размере 407 000 долларов США от Австралийской национальной программы грантов на исследования в области разведки и безопасности.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Массив микроэлектродов в основе DishBrain способен не только считывать активность в клетках мозга, но и стимулировать их электрическими сигналами, поэтому исследовательская группа создала версию Pong, в которой клетки полубиологического искусственного мозга получали информацию о перемещении мяча и могли воздействовать на ракетку, перемещая её влево и вправо.

Затем была разработана очень простая система стимуляции, использующая стремление небольших скоплений клеток мозга сводить к минимуму непредсказуемость окружающей их среды. Если ракетка отбивает мяч, клетки получают поощрение — предсказуемый стимул, а при промахе — четыре секунды непредсказуемого воздействия. Это первый случай, когда клетки мозга, выращенные в лаборатории, получили возможность не только ощущать мир, но и воздействовать на него, и результаты были впечатляющими.

 Нейроны DishBrain, растущие на массиве электродов / Источник изображения: Cortical Labs

Нейроны DishBrain, растущие на массиве электродов / Источник изображения: Cortical Labs

Такие чипы, объединяющие биологические вычисления с ИИ, «в будущем могут в конечном итоге превзойти по производительности существующее чисто кремниевое оборудование, — уверен руководитель проекта доцент Адил Рази (Adeel Razi). — Результаты таких исследований будут иметь серьёзные последствия в таких областях как планирование, робототехника, передовая автоматизация, интерфейсы мозг-машина и разработка лекарств».

Расширенные возможности DishBrain могут стать основой нового поколения машинного обучения, особенно когда оно будет воплощено в автономных транспортных средствах, дронах и роботах. По словам Рази, это может дать им «новый тип машинного интеллекта, способный учиться на протяжении всей своей жизни». Технология обещает машины, которые могут продолжать изучать новые способности без ущерба для старых, хорошо адаптируются к изменениям и могут использовать старые знания в новых ситуациях, оптимизируя использование вычислительной мощности, памяти и энергии.

 DishBrain с клетками, выделенными с помощью флуоресцентных маркеров / Источник изображения: Cortical Labs

DishBrain с клетками, выделенными с помощью флуоресцентных маркеров / Источник изображения: Cortical Labs

«Мы используем этот грант для разработки более совершенных моделей ИИ на основе обучающихся биологических нейронных сетей, — говорит Рази. — Это поможет расширить возможности оборудования и методов до такой степени, что они станут жизнеспособной заменой для классических вычислений».

Похоже, скоро мы узнаем, мечтают ли андроиды об электроовцах. И нам может не понравиться то, что мы узнаем.

Платная версия ChatGPT отупела, в то время как бесплатная набралась ума, выяснили учёные из Стэнфорда

Новое исследование, проведённое учёными из Стэнфордского университета и Калифорнийского университета в Беркли, выявило тревожное снижение качества ответов платной версии ChatGPT. Так, например, точность определения простых чисел у новейшей модели GPT-4, которая лежит в основе ChatGPT Plus, с марта по июнь 2023 года упала с 97,6 % до всего лишь 2,4 %. Напротив, GPT-3.5, являющаяся основной для обычного ChatGPT, точность ответов в некоторых задачах повысила.

 Источник изображения: OpenAI

Источник изображения: OpenAI

В последние месяцы всё чаще обсуждается снижение качества ответов ChatGPT. Группа учёных из Стэнфордского университета и Калифорнийского университета в Беркли решила провести исследование с целью определить, действительно ли произошла деградация качества работы этого ИИ, и разработать метрики для количественной оценки масштабов этого негативного явления. Как выяснилось, снижение качества ChatGPT — это не байка или выдумка, а реальность.

Трое учёных — Матей Захария (Matei Zaharia), Линцзяо Чэнь (Lingjiao Chen) и Джеймс Цзоу (James Zou) — опубликовали научную работу под названием «Как меняется поведение ChatGPT с течением времени» (How is ChatGPT’s behavior changing over time). Захария, профессор компьютерных наук в Калифорнийском университете, обратил внимание на удручающий факт: точность GPT-4 в ответе на вопрос «Это простое число? Подумай шаг за шагом» снизилась с 97,6 % до 2,4 % с марта по июнь.

OpenAI открыла доступ к API языковой модели GPT-4 около двух недель назад и объявила её своей самой продвинутой и функциональной ИИ-моделью. Поэтому общественность была расстроена тем, что новое исследование обнаружило значительное снижение качества ответов GPT-4 даже на относительно простые запросы.

Исследовательская группа разработала ряд заданий, чтобы оценить различные качественные аспекты основных больших языковых моделей (LLM) ChatGPT — GPT-4 и GPT-3.5. Задания были разделены на четыре категории, каждая из которых отражает различные навыки ИИ и позволяет оценить их качество:

  • решение математических задач;
  • ответы на деликатные вопросы;
  • генерация кода;
  • визуальное мышление.

В следующих графиках представлен обзор эффективности работы ИИ-моделей OpenAI. Исследователи оценили версии GPT-4 и GPT-3.5, выпущенные в марте и июне 2023 года.

 График 1. Производительность GPT-4 и GPT-3.5 в марте и июне 2023 года на четырех задачах. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou / arxiv.org

Слайд 1. Производительность GPT-4 и GPT-3.5 в марте и июне 2023 года. Источник: Matei Zaharia, Lingjiao Chen, James Zou

Первый слайд демонстрирует эффективность выполнения четырёх задач — решения математических задач, ответа на деликатные вопросы, генерации кода и визуального мышления — версиями GPT-4 и GPT-3.5, выпущенными в марте и июне. Заметно, что эффективность GPT-4 и GPT-3.5 может значительно варьироваться со временем и в некоторых задачах ухудшаться.

 График 2. Решение математических задач. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou / arxiv.org

Слайд 2. Решение математических задач. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou

Второй слайд иллюстрирует эффективность решения математических задач. Измерялась точность, многословность (в символах) и совпадение ответов GPT-4 и GPT-3.5 в период с марта по июнь 2023 года. В целом, наблюдались значительные колебания в эффективности обеих ИИ-моделей. Также приведён пример запроса и соответствующие ответы за определенный промежуток времени. GPT-4 в марте следовала инструкциям по цепочке мыслей для получения правильного ответа, но в июне их проигнорировала, выдав неверный ответ. GPT-3.5 всегда следовала цепочке мыслей, но настаивала на генерации неправильного ответа в марте. Эта проблема была устранена к июню.

 График 3. Ответы на деликатные вопросы. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou / arxiv.org

Слайд 3. Ответы на деликатные вопросы. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou

На третьем слайде показан анализ ответов на деликатные вопросы. С марта по июнь GPT-4 ответила на меньшее количество вопросов, в то время как GPT-3.5 ответила на немного больше. Также приведён пример запроса и ответов GPT-4 и GPT-3.5 в разные даты. В марте GPT-4 и GPT-3.5 были многословны и давали подробные объяснения, почему они не ответили на запрос. В июне они просто извинились.

 График 4. Генерация кода. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou / arxiv.org

Слайд 4. Генерация кода. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou

Четвёртый слайд демонстрирует снижение эффективности генерации кода. Общая тенденция показывает, что для GPT-4 процент непосредственно исполняемых генераций сократился с 52 % в марте до 10 % в июне. Также наблюдалось значительное падение для GPT-3.5 (с 22 % до 2 %). Многословность GPT-4, измеряемая количеством символов в генерациях, также увеличилась на 20 %. Также приведён пример запроса и соответствующие ответы. В марте обе ИИ-модели следовали инструкции пользователя («только код») и таким образом генерировали непосредственно исполняемый код. Однако в июне они добавили лишние тройные кавычки до и после фрагмента кода, делая код неисполняемым.

 График 5. Визуальное мышление. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou / arxiv.org

Слайд 5. Визуальное мышление. Источник изображения: Matei Zaharia, Lingjiao Chen, James Zou / arxiv.org

Пятый слайд демонстрирует эффективность визуального мышления ИИ-моделей. В части общих результатов и GPT-4, и GPT-3.5 показали себя на 2 % лучше в период с марта по июнь, точность их ответов улучшилась. Вместе с тем, объём информации, которую они генерировали, остался примерно на том же уровне. 90 % визуальных задач, которые они решали, не изменились за этот период. На примере конкретного вопроса и ответов на него можно заметить, что, несмотря на общий прогресс, GPT-4 в июне показала себя хуже, чем в марте. Если в марте эта модель выдала правильный ответ, то в июне уже ошиблась.

Пока неясно, как обновляются эти модели, и могут ли изменения, направленные на улучшение некоторых аспектов их работы, негативно отразиться на других. Эксперты обращают внимание, насколько хуже стала новейшая версия GPT-4 по сравнению с версией марта в трёх тестовых категориях. Она только незначительно опережает своего предшественника в визуальном мышлении.

Ряд пользователей могут не обратить внимания на снижение качества результатов работы одних и тех же версий ИИ-моделей. Однако, как отмечают исследователи, из-за популярности ChatGPT упомянутые модели получили широкое распространение не только среди рядовых пользователей, но и многих коммерческих организаций. Следовательно, нельзя исключать, что некачественная информация, сгенерированная ChatGPT, может повлиять на жизни реальных людей и работу целых компаний.

Исследователи намерены продолжать оценку версий GPT в рамках более долгосрочного исследования. Возможно, OpenAI следует регулярно проводить и публиковать свои собственные исследования качества работы своих ИИ-моделей для клиентов. Если компания не сможет стать более открытой в этом вопросе, может потребоваться вмешательство бизнеса или государственных организаций с целью контроля некоторых базовых показателей качества ИИ.

Cruise и Waymo назвали людей плохими водителями и призвали активнее внедрять беспилотные такси

Компании Cruise и Waymo, специализирующиеся на разработке технологий автономного вождения, выступили на этой неделе с заявлениями о том, что люди — плохие водители, и что разработанные ими технологии имеют решающее значение для повышения безопасности на дорогах.

 Источник изображения: getcruise.com

Источник изображения: getcruise.com

Cruise разместила своё заявление в форме рекламного объявления на всю страницу в крупных газетах — San Francisco Chronicle, New York Times, Los Angeles Times и Sacramento Bee — с заголовком: «Люди — ужасные водители». Waymo оказалась скромнее и опубликовала заявление в своём блоге.

Выступить с похожими заявлениями компании решили из-за того, что регулирующий орган — Комиссия по коммунальному хозяйству Калифорнии (CPUC) — уже во второй раз откладывают выдачу им расширенных разрешений на предоставление в Сан-Франциско коммерческих услуг по перевозке пассажиров на полностью автономных транспортных средствах без присутствия водителя за рулём в любое время суток. CPUC отложила намеченное на четверг слушание по этому вопросу на 10 августа без указания причин переноса, заявив, что вопросы требуют «дальнейшего рассмотрения».

«Вы можете быть хорошим водителем, но многие из нас — нет, — говорится в объявлении Cruise. — Каждый год в США люди становятся причиной миллионов несчастных случаев. Беспилотные автомобили Cruise созданы для спасения жизней». Cruise также отметила, что её автомобили участвовали в столкновениях на 92 % меньше в качестве основного участника и на 54 % меньше в столкновениях в целом по сравнению с водителями-людьми в сопоставимой среде вождения.

В свою очередь Waymo сообщила в блоге, что использовала роботакси для анализа скорости автомобилей в Сан-Франциско и Финиксе в течение 10-дневного периода и обнаружила, что многие автомобили ездят с превышением установленного ограничения по скорости в размере 25 миль в час (40 км/ч). Компания привела данные Национального управления дорожной безопасности США (NHTSA), согласно которым в 2020 году треть всех дорожно-транспортных происшествий и 13 % травм в США были связаны с превышением скорости. Waymo отметила, что в отличие от водителей-людей система автономного вождения Waymo Driver чётко соблюдает скоростной режим, и может «прогнозировать вероятные манёвры транспортных средств вокруг него и реагировать соответствующим образом».

Следует отметить, что многие гражданские активисты улиц не считают самоуправляемые автомобили решением проблемы, утверждая, что города должны продвигать общественный транспорт и микромобильность, а не решения технологических гигантов.

В настоящее время Cruise имеет разрешение на коммерческие пассажирские перевозки в отдельных районах Сан-Франциско с 22:00 до 6:00, а также на бесплатное обслуживание пассажиров по городу в любое время суток как с присутствием водителя в салоне, так и без него. Waymo предоставляет бесплатные услуги по перевозке пассажиров по всему Сан-Франциско в любое время суток, но в автомобиле должен присутствовать сотрудник, отвечающий за безопасность вождения.

Илон Маск основал ИИ-компанию xAI, чтобы «разобраться в истинной природе Вселенной»

Илон Маск (Elon Musk) сообщил об основании компании xAI, которая будет заниматься вопросами искусственного интеллекта. На недавно заработавшем сайте организации указано, что её миссия заключается в том, чтобы «разобраться в истинной природе Вселенной».

 Источник изображения: xAI

Источник изображения: xAI

О планах Маска открыть новую компанию стало известно несколько месяцев назад, после того как миллиардер зарегистрировал в Неваде компанию X.AI Corp., чьё название косвенно указывало на профиль её будущей деятельности. В одном из апрельских интервью он подтвердил, что хочет основать стартап, для «создания ИИ, который попытается разобраться в истинной природе Вселенной» и хотел бы, чтобы этот ИИ «принёс больше пользы, чем вреда».

О новой компании xAI пока мало что известно. На сайте организации указано, что команда xAI собирается в эту пятницу провести голосовой чат в Twitter Spaces, в ходе которого, вероятно, более подробно расскажет о своей деятельности и целях. Более ранние заявления Маска намекали на его желание создать противовес таким компаниям, как OpenAI и Google, представившим свои разработки в области ИИ и машинного обучения. Ранее также стало известно, что Маск закупил тысячи специализированных графических ускорителей, чтобы наделить Twitter искусственным интеллектом. Связаны ли эти два проекта — неизвестно.

В списке сотрудников xAI значатся ветераны и выходцы из DeepMind, OpenAI, Google Research, Microsoft Research, Tesla, а также эксперты в области ИИ из Университета Торонто. Они принимали участие в разработке моделей и методов, ускоряющих обучение ИИ, в частности Adam, Batch Normalization и Layer Normalization, инновационных методов и анализов, таких как Transformer-XL Autoformalization, Memorizing Transformer, Batch Size Scaling и μTransfer. Кроме того, они приложили руку к созданию передовых моделей ИИ AlphaStar, AlphaCode, Inception, Minerva, GPT-3.5 и GPT-4.

Среди ведущих специалистов xAI значатся Игорь Бабушкин (Igor Babuschkin), Мануэль Кройсс (Manuel Kroiss), Юхуай Тони Ву (Yuhuai Tony Wu), Кристиан Сегеди (Christian Szegedy), Джимми Ба (Jimmy Ba), Тоби Полен (Toby Pohlen), Росс Нордин (Ross Nordeen), Кайл Косич (Kyle Kosic), Грег Ян (Greg Yang), Годун Чжан (Guodong Zhang) и Цзыхан Дай (Zihang Dai).

OpenAI открыла доступ к API языковой модели GPT-4 — самой продвинутой в своём арсенале

OpenAI открыла доступ к GPT-4, своей наиболее продвинутой языковой модели ИИ, через облачный API. Вместе с этим компания предоставила сторонним разработчикам доступ к API трёх других своих моделей ИИ. Кроме того, OpenAI объявила о своих планах постепенно отказаться от ряда более ранних нейронных сетей.

 Источник изображения: OpenAI

Источник изображения: OpenAI

OpenAI представила GPT-4 в марте как преемника GPT-3, ИИ-модели, которая за три года до этого привлекла к компании внимание всей отрасли. GPT-4 более эффективно интерпретирует инструкции пользователя, может принимать изображения в качестве входных данных и обладает расширенными возможностями обработки поставленных задач. Последние усовершенствования позволяют модели легче выполнять сложные запросы пользователей, например, решать математические задачи.

API GPT-4 позволяет разработчикам интегрировать модель в свои приложения. Сервис теперь доступен для всех клиентов, которые ранее приобрели доступ к API. Компания откроет доступ для новых разработчиков позднее в этом месяце. В дальнейшем OpenAI намерена увеличить лимиты использования API. В долгосрочные планы компании входит запуск так называемой возможности тонкой настройки, которая позволит разработчикам повысить точность GPT-4 путём обучения на пользовательских наборах данных.

Вместе с API GPT-4 был открыт доступ к программному интерфейсу трёх других моделей. Первая из них — GPT-3.5 Turbo, предшественница GPT-4, которая предлагает более ограниченные возможности за значительно меньшую стоимость. OpenAI также открыла доступ к API своих моделей DALL-E и Whisper. Последние две нейронные сети оптимизированы для генерации изображений и транскрибирования речи соответственно.

В связи с этим событием OpenAI также объявила о планах прекратить работу ряда ранних языковых моделей, доступных через API. Они будут отключены 4 января 2024 года. Некоторые из затронутых моделей будут автоматически обновлены до более новых продуктов OpenAI, в то время как другие потребуют от разработчиков ручного перехода.

Изменения частично связаны с обновлением API. Многие из моделей, которые будут постепенно отменены, используют прикладной интерфейс программирования, который OpenAI называет Completions API. Первоначально он стал доступен в 2020 году. Например, энтузиасту, чтобы подключиться к Chat Completion API и запустить ChatGPT на 39-летнем компьютере IBM , пришлось вручную написать весь запрос POST на языке C. В марте этого года OpenAI представила новый интерфейс под названием Chat Completions API, который станет основным направлением дальнейшей разработки.

«Первоначально Completions API был представлен в июне 2020 года, чтобы обеспечить текстовую подсказку свободной формы для взаимодействия с нашими языковыми моделями. С тех пор мы поняли, что часто можем обеспечить лучшие результаты с помощью более структурированного интерфейса подсказок», — сообщает OpenAI в своём блоге.

Новый API Chat Completions вносит несколько улучшений. В первую очередь, он обеспечивает защиту от атак с внедрением подсказок, которые представляют собой попытки хакеров изменить вывод модели ИИ с помощью вредоносных инструкций. Это усовершенствование должно помочь разработчикам повысить безопасность своих приложений на базе OpenAI.

Продвинутые инструменты OpenAI и их растущая доступность открывают новые возможности для разработчиков и исследователей по всему миру. Однако как и с любыми новыми технологиями, важно использовать их ответственно и с учётом возможных рисков. OpenAI продолжает работать над улучшением своих моделей и сервисов, стремясь обеспечить безопасность и эффективность их использования.

Владелец «Пятёрочки» запустил беспилотные грузоперевозки между Санкт-Петербургом и Москвой

Российская продуктовая розничная компания X5 Group объявила о старте регулярных беспилотных грузоперевозок на трассе М11 «Нева» Санкт-Петербург — Москва. На своём маршруте автомобили будут преодолевать в полностью беспилотном режиме около 600 км. Поначалу компания будет отправлять по одному автономному грузовику в сутки из Москвы и из Санкт-Петербурга.

 Источник изображения: КамАЗ

Источник изображения: КамАЗ

«X5 стала первой продуктовой розничной компанией, осуществившей запуск регулярных коммерческих перевозок для реальных поставок в торговые сети»,отметила компания в пресс-релизе.

Для беспилотных грузоперевозок будет использоваться тягач KAMAZ-54901 с полуприцепом-рефрижератором объёмом 20 т, обеспечивающим надлежащий температурный режим для перевозки продуктов. По всему маршруту тягач с полуприцепом будет перемещаться в автономном режиме. После его прибытия в специальный хаб будет производиться замена на обычный тягач для продолжения транспортировки груза.

Как сообщается в пресс-релизе, ретейлер в рамках подготовки к пилотному запуску занимался совместно с ключевым партнёром проекта ПАО «КАМАЗ» разработкой беспилотных логистических коридоров, нормативных требований для проведения пилотного запуска, а также тестированием грузовиков. В частности, стороны определили маршрут транспортировки и потенциальные объёмы грузов.

Intel подтвердила, что чипы Arrow Lake-S и Lunar Lake получат инструкции AVX-VNNI для ускорения ИИ и машинного обучения

Intel обновила документ под названием Architecture Instruction Set Extensions and Future Features, внеся некоторые коррективы в спецификации настольных процессоров следующего поколения, сообщает VideoCardz. В частности, в документе указывается, что процессоры семейств Arrow Lake и Lunar Lake получат поддержку множества инструкций, среди которых SHA512, SM3 и SM4, а также новые AVX-VNNI, ориентированные на ускорение операций, связанных с ИИ.

 Источник изображений: Intel

Источник изображений: Intel

Появление AVX-VNNI в процессорах Arrow Lake и Lunar Lake заслуживает особого внимания. Это набор инструкций, которые повышают производительность при работе с нейросетями, предоставляя отдельные алгоритмы для 8-битных и 16-битных целочисленных операций. Это означает, что приложения, использующие алгоритмы искусственного интеллекта, машинного и глубокого обучения, будут быстрее работать и эффективнее использовать процессоры. Внесённые в документ изменения отмечены фиолетовым.

Поддержка инструкций SHA512, SM3 и SM4 в этих потребительских процессорах увеличит их защитные и криптографические возможности. Включение SHA512, широко используемой криптографической хэш-функции, обеспечивает лучшее сохранение целостности данных и безопасную передачу данных. Кроме того, в документе указана поддержка криптографических хэш-алгоритмов SM3 и SM4, используемых при обмене данными.

В документе также есть намёки на будущие обновлённые процессоры Raptor Lake Refresh. В частности, там перечисляются CPUID, которые подтверждают, что обновленные чипы станут представителями 14-го поколения. Анонс Raptor Lake Refresh ожидается одновременно с запуском мобильных процессоров Meteor Lake.

Два из трёх беспилотников «КАМАЗа» потребовали дополнительной настройки после начала тестов на трассе М-11

14 июня между Москвой и Санкт-Петербургом начали курсировать три беспилотных грузовика «КАМАЗ». По результатам недельной обкатки двум машинам потребовалась корректировка алгоритмов. Глава Минтранса Виталий Савельев сообщил об этом в ходе совещания членов правительства РФ с президентом Владимиром Путиным.

 Источник изображения: «КАМАЗ»

Источник изображения: «КАМАЗ»

Со слов министра в первый день начала эксперимента все три грузовика проехали маршрут нормально. «Сейчас работает пока один "КАМАЗ", в двух — мы переписываем математику, но это нормальный процесс», — уточнил он, отвечая на соответствующий вопрос президента. Вопрос донастройки находится под личным контролем гендиректора «КАМАЗа» Сергея Когогина и этим вечером оба грузовика уже должны вернуться на трассу.

Со следующего месяца число «КАМАЗов», курсирующих по трассе М-11 Санкт-Петербург – Москва, планируется расширить до шести, а с 2024 года до 18 автомобилей. Все грузовики построены на базе магистрального тягача «КАМАЗ-54901». Для самостоятельного движения модель оснащена программно-вычислительным комплексом, системами машинного зрения, связи и навигации. Безопасности уделено должное внимание: обязательным пунктом является наличие в кабине водителя, контролирующего движение многотонной машины и готового перехватить управления в случае внештатной ситуации.

На текущем этапе эксперимента предполагается, что беспилотные тягачи перевозят грузы между определенными логистическими хабами, освобождая водителей-людей от монотонного передвижения между относительно простыми, но продолжительными участками. Следующий этап эксперимента с полностью беспилотным управлением грузовиками начнется в России с 2025-2026 годов.


window-new
Soft
Hard
Тренды 🔥
Ранний доступ стартовал раньше времени: в руки игроков попала рабочая бета-версия Titan Quest 2 25 мин.
Пиковый онлайн Marvel Rivals в Steam превысил 644 тыс. человек — в геройском шутере стартовал первый сезон 13 ч.
Новая статья: Gamesblender № 708: анонсы Nvidia и AMD на CES 2025, новые слухи о Half-Life 3 и реплика Switch 2 23 ч.
Энтузиаст запустил современную ИИ-модель на консоли Xbox 360 20-летней давности 23 ч.
Новая статья: Legacy of Kain: Soul Reaver 1 & 2 Remastered — похититель душ вернулся, но с подвохом. Рецензия 12-01 00:10
FTC и Минюст США поддержали Илона Маска в судебной тяжбе с OpenAI 11-01 16:08
AMD скрытно показала работу FSR 4 на видеокартах Radeon RX 9070 11-01 16:04
Microsoft объявила 2025 год «годом обновления ПК с Windows 11» 11-01 15:37
TikTok может быть заблокирован в США 19 января по решению Верховного суда 11-01 06:04
Илон Маск хотел похвастаться высокоуровневым геймплеем в Path of Exile 2, но не разобрался в базовых механиках — игроки заподозрили подвох 11-01 00:12