Опрос
|
реклама
Быстрый переход
Google представила ИИ-модель Gemini — она должна стать главным конкурентом GPT-4
06.12.2023 [22:11],
Владимир Фетисов
Google объявила о запуске модели искусственного интеллекта Gemini, которая станет основой ИИ-функций компании и бросит вызов конкурентам, включая ChatGPT от OpenAI. По словам гендиректора Google Сундара Пичаи (Sundar Pichai), появление нового алгоритма знаменует начало новой эры искусственного интеллекта в компании. «Одна из самых важных особенностей этого момента в том, что вы можете работать над одной базовой технологией и улучшать её, и это сразу будет распространяться на все наши продукты», — сказал господин Пичаи. Гендиректор Google отметил, что запуск языковой модели Gemini является огромным шагом вперёд и в конечном счёте это окажет влияние практически на все продукты компании. Gemini представляет собой нечто большее, чем одна языковая модель. Существует более лёгкая версия ИИ-модели Gemini Nano, которая предназначена для автономной работы на устройствах с Android. Кроме того, существует более мощная версия Gemini Pro, которая в будущем станет основой многих сервисов Google, а с сегодняшнего дня является основой чат-бота Bard. В дополнение к этому Google создала ИИ-модель Gemini Ultra, которая является самой мощной языковой моделью компании и в основном предназначена для использования в центрах обработки данных и интеграции с корпоративными приложениями. На потребительский рынок компания выводит свою ИИ-модель сразу несколькими способами. Чат-бот Bard теперь работает на основе Gemini Pro, а пользователи Pixel 8 Pro получат доступ к нескольким новым функциям благодаря интеграции с Gemini Nano. Возможность использования Gemini Ultra появится в следующем году. Разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Google Generative AI Studio или Vertex AI в Google Cloud, начиная с 13 декабря. На данный момент Gemini может обрабатывать запросы на английском языке, но, очевидно, что в дальнейшем, появится поддержка других языков. По словам Сундара Пичаи, эта ИИ-модель в конечном счёте будет интегрирована в поисковую систему Google, рекламные продукты компании, браузер Chrome и другие сервисы. Похоже, что Google, являющаяся создателем большей части основополагающих технологий, способствовавших нынешнему буму в сфере ИИ, и уже около десяти лет называвшая себя компанией, ориентированной на искусственный интеллект, готова дать отпор запущенному год назад ChatGPT, который оказался настолько хорош, что явно заставил нервничать IT-гиганта. В рамках презентации Gemini гендиректор Google DeepMind Демис Хассабис (Demis Hassabis) рассказал, что Google провела тщательное сравнение своей языковой модели с GPT-4, наиболее актуальной версией нейросети, лежащей в основе ChatGPT. «Мы провели очень тщательный сравнительный анализ систем. Я думаю, что мы существенно опережаем конкурента по 30 из 32 показателей», — сказал Хассабис, указывая на 32 хорошо себя зарекомендовавших теста сравнения больших языковых моделей. Он также отметил, что в некоторых тестах превосходство Gemini над GPT-4 минимально, тогда как в других оно более ощутимо. В этих тестах наиболее явным преимуществом Gemini стала способность понимать видео и аудио, а также взаимодействовать с ними. По большому счёту, Google так и задумывала, поскольку компания не создавала отдельные ИИ-модели для обработки изображений и аудио, как сделала OpenAI, создав DALL-E и Whisper. С самого начала Google работала над созданием единой модели, способной распознавать изображения и звуки. На данный момент базовые версии Gemini поддерживают ввод и вывод текста, но более мощные версии алгоритма, такие как Gemini Ultra, могут работать с изображениями, видео и аудио. Конечно, эти модели всё ещё галлюцинируют, они не лишены предубеждений и других проблем, но со временем Google планирует улучшить их понимание окружающего мира. Несмотря на проведённые разработчиками тесты, главную проверку Gemini проведут рядовые пользователи, которые захотят использовать алгоритм для поиска информации, создания контента, написания программного кода и многого другого. В плане генерации кода алгоритм Google использует новую систему AlphaCode 2, которая, по словам представителей компании, работает лучше по сравнению с 85 % аналогами конкурентов и на 50 % лучше по сравнению с оригинальным алгоритмом AlphaCode. Не менее важно для Google и то, что Gemini, вероятно, является максимально эффективной моделью. Она обучалась с использованием тензорных процессоров Google, благодаря чему может работать быстрее и эффективнее, чем предыдущие алгоритмы компании, такие как PaLM. Наряду с новой языковой моделью Google представила ускорители TPU v5p, которые предназначены для использования в центрах обработки данных для обучения и запуска больших языковых моделей. Презентация Gemini даёт понять, что Google рассматривает новый алгоритм как масштабный проект и одновременно большой шаг вперёд для всей компании. Gemini — это ИИ-модель, к которой Google шла годами, возможно, даже та, которую ей следовало выпустить до того, как мир захватил ChatGPT. Google приложили массу усилий, чтобы обеспечить безопасность и надёжность Gemini, проведя внутреннее и внешнее тестирование алгоритма, но и это, по словам руководителей компании, не гарантирует, что нейросеть будет работать безошибочно. В течение многих лет Сундар Пичаи и другие руководители Google поэтически рассуждали о потенциале искусственного интеллекта. Сам Пичаи не раз говорил, что ИИ окажет на человечество более сильное влияние, чем огонь или электричество. Первое поколение модели Gemini, скорее всего, не изменит мир. В лучшем случае она поможет компании догнать ChatGPT, но руководство Google, уверено, что это начало чего-то большего. «Яндекс» запустил сервис «Нейростат» для отслеживания популярности искусственного интеллекта в России
05.12.2023 [14:04],
Владимир Фетисов
Компания «Яндекс» объявила о запуске сервиса «Нейростат», который представляет собой инструмент для оценки уровня осведомлённости и использования генеративных нейросетей на территории России. Решение предоставляет статистические данные и позволяет следить за тем, как ИИ-алгоритмы всё глубже проникают в повседневную жизнь людей. Статистические данные «Яндекса» указывают на то, что в настоящее время 58 % россиян в возрасте от 18 до 45 летзнают о существовании алгоритмов для генерации текстов по короткому описанию. В ноябре этого года 31 % пользователей применяли такие нейросети для создания текстов, что существенно больше 23 % пользователей, которые взаимодействовали с генераторами текста в мае. О существовании генеративных алгоритмов, способных создавать изображения и видео по текстовому описанию, осведомлены 75 % пользователей в возрасте от 18 до 45 лет. В ноябре 31 % пользователей использовали такие алгоритмы для создания изображений. По данным поисковой системы «Яндекса», с начала 2022 года интерес к ИИ-алгоритмам со стороны пользователей вырос более чем в 15 раз. В настоящее время слово «нейросеть» встречается в запросах так же часто, как «фитнес», «психолог» или «пиво». Для взаимодействия с нейросетями используются «промты» или «промпты» — текстовое описание задания или инструкция. Этот термин менее распространён, сейчас о нём знают 13 % пользователей текстовых нейросетей, из которых 18 % уже ими пользуются. Apple вкладывает «достаточно много» средств в ИИ, заявил Тим Кук
03.11.2023 [15:36],
Владимир Фетисов
Сегодня Apple озвучила финансовые результаты по итогам прошедшего квартала. Вместе с этим руководство компании ответило на вопросы аналитиков и инвесторов. Так, главу Apple Тима Кука (Tim Cook) спросили, каким образом компания планирует монетизировать возможности генеративных нейросетей. Он, конечно, не дал прямого ответа на этот вопрос, но отметил, что компания инвестирует «достаточно много» в искусственный интеллект. «Если вы посмотрите масштабнее на то, что мы сделали с помощью технологий искусственного интеллекта и машинного обучения, и как мы их использовали, вы увидите, что это фундаментальные вещи, являющиеся неотъемлемыми для каждого нашего продукта. Когда мы выпустили iOS 17, в ней появились такие функции, как Personal Voice и Live Voicemail, в основе которых лежит ИИ. Можно дойти до функций, спасающих жизнь, на часах и смартфоне, таких как обнаружение падения, обнаружение аварий и ЭКГ на часах. Они были бы невозможны без ИИ. Мы не называем их как таковыми, поскольку мы определили их потребительскую выгоду, но основополагающими технологиями, лежащими в их основе, являются ИИ и машинное обучение <…> Что касается генеративного ИИ, то здесь у нас, безусловно, есть над чем работать. Я не буду вдаваться в подробности, потому что мы этим не занимаемся, но вы можете быть уверены, что мы инвестируем. Мы инвестируем достаточно много. Мы собираемся делать это ответственно. Со временем вы увидите новые продукты, в основе которых будут лежать эти технологии», — рассказал Тим Кук. Глава Apple заявил, что компания намерена ответственно подойти к внедрению генеративных нейросетей в свои продукты, отметив, что этот процесс будет проходить постепенно. По слухам, Apple планирует в следующем году продолжить интеграцию технологий на базе ИИ в свои продукты. Возможно, речь, в том числе, идёт об использовании генеративных нейросетей. По данным источника, Apple тратит миллиарды долларов на исследования и разработки в сфере генеративных нейросетей. Российские власти рассматривают возможность создания платформы для разработки ПО на базе нейросетей
18.10.2023 [08:08],
Владимир Фетисов
Совет Федерации предложил Минцифры создать за счёт бюджета государственную платформу развития искусственного интеллекта для предоставления разработчикам доступа к вычислительной инфраструктуре и данным для развития программного обеспечения на базе нейросетей. Об этом пишет «Коммерсантъ» со ссылкой на решение Совета по развитию цифровой экономики при Совете Федерации. Из документа следует, что Минцифры в рамках обновления Национальной стратегии развития искусственного интеллекта до 2030 года рекомендуется сформировать государственную платформу развития ИИ для разработчиков. Соответствующие рекомендации в адрес регулятора 17 октября направил зампред Совета по развитию цифровой экономики при Совете Федерации Артём Шейкин. О результатах рассмотрения данной инициативы сенатор попросит сообщить не позднее 13 ноября. «Российские разработчики, не имеющие достаточных ресурсов, должны иметь доступ к государственным данным для создания технологий искусственного интеллекта», — считает господин Шейкин. Он также добавил, что на платформе должны размещаться дата-сеты, пригодные для обучения ИИ-алгоритмов. Кроме того, разработчики получат доступ к вычислительной инфраструктуре. Он считает, что этот проект должен быть профинансирован из бюджета. По данным источника, после обострения ситуации на Украине и ухода с российского рынка иностранных вендоров вычислительной техники и IT-сервисов стоимость разработки ИИ-алгоритмов в стране выросла на 30-40 %. Раньше небольшие отечественные компании могли задействовать для этого ресурсы Amazon, Google и других поставщиков, но сейчас такая возможность отсутствует. Создание государственной платформы может поспособствовать развитию ИИ-алгоритмов небольшими компаниями, которые в сложившихся условиях не могут позволить себе создание собственной инфраструктуры, необходимой для обучения нейросетей. YouTube наполнится генеративным ИИ — он будет выполнять дубляж, создавать фоны для видео и помогать с идеями
21.09.2023 [23:02],
Владимир Фетисов
В рамках мероприятия Made on YouTube видеосервис анонсировал ряд любопытных новинок, предназначенных для создателей контента. Как и следовало ожидать, в скором времени всё больше роликов на платформе будет создаваться с использованием генеративных нейросетей. На данном этапе наиболее заметными нововведениями станут возможность генерации фото- и видеофона, идей и схем для новых роликов, а также функция дубляжа контента на другие языки. Новая функция Dream Screen позволит генерировать с помощью нейросети видео и изображения, которые в дальнейшем авторы контента смогут использовать в качестве фона для своих коротких видеороликов в Shorts. На начальном этапе генерация таких видео и фото будет осуществляться на основе подсказок пользователя. В дальнейшем, по словам представителей YouTube, авторы контента получат возможность создавать ремиксы и редактировать существующие ролики с помощью набора ИИ-инструментов, чтобы получить что-то новое. Во время демонстрации возможностей функции Dream Screen в ходе презентации фоновые изображения на основе подсказок генерировались в течение считанных секунд. Новая функция на основе ИИ в YouTube Studio будет генерировать идеи и схемы для потенциальных роликов. Согласно имеющимся данным, авторы контента будут получать персонализированные рекомендации, основанные на том, какой контент популярен среди их аудитории. В дополнение к этому алгоритм сможет на основе текстового запроса подбирать музыку для видео по его описанию. Ещё YouTube анонсировал функцию дубляжа на базе искусственного интеллекта. С её помощью авторы контента смогут дублировать свои ролики на разные языки. Этот инструмент разрабатывался специалистами команды Aloud, входящей в инкубатор стартапов Area 120. Появление новых ИИ-функций на YouTube может ознаменовать сдвиг в том, как авторы планируют, создают и структурируют свой контент. Постепенно созданный с использованием генеративных нейросетей контент станет более распространённым. На фоне роста количества сгенерированного контента другие популярные платформы, такие как TikTok, уже используют специальные метки, которыми помечается контент, созданный ИИ. Владелец ТНТ и Rutube создаст студию по производству контента с помощью ИИ
11.09.2023 [15:29],
Владимир Фетисов
Холдинг «Газпром-Медиа» (владеет каналами НТВ, ТНТ и ТВ-3, кинокомпанией «Централ Партнершип», хостингом Rutube и др.) запустит экспериментальную студию производства контента с помощью нейросетей. Об этом в беседе с журналистами на Восточном экономическом форуме рассказал глава принадлежащей холдингу цифровой лаборатории D. Lab Эдуард Маас. Согласно имеющимся данным, в студии будут использоваться около 20 моделей искусственного интеллекта, включая проекты Open Source (например, генератор изображений Stable Diffusion и языковая модель LLaMA) и собственные разработки «Газпром-Медиа». Студия займётся производством анимации с использованием генеративных алгоритмов, а также будет создавать виртуальных ведущих, перерабатывать архивный контент, работать над рекламными спецпроектами. Объём инвестиций, которые будут направлены для развития проекта, озвучен не был. Господин Масс считает, что технологии создания контента с помощью генеративных нейросетей будут полезны продакшен-студиям, рекламным агентствам и блогерам, в первую очередь использующим видеохостинг Rutube и социальную сеть Yappy. В дополнение к этому холдинг будет предлагать свои технологии внешним заказчикам, включая представителей банковского сектора и госкорпорации. В настоящее время компания ведёт переговоры с одним из крупнейших банков с точки зрения маркетинга и крупным издательством, где генеративные алгоритмы могут использоваться для иллюстрации книг. Сам же холдинг может использовать эти технологии для создания промо в соцсетях, генерации анимации из аудио, создания виртуальных ведущих и др. Для производства «сериального хита или топового шоу» предложенные технологии использоваться не будут, уточнил господин Маас. При этом искусственный интеллект может существенно снизить затраты на отдельные производственные процессы. К примеру, такие технологии можно задействовать для отрисовки фонов, персонажей и деталей видеоряда. Нейросети также могут быть полезными для дорисовки вертикальных видео, чтобы делать их горизонтальными, озвучивания произведений реалистично синтезированными голосами и др. Беспилотные автомобили с трудом распознают детей и темнокожих пешеходов
27.08.2023 [13:55],
Владимир Фетисов
Разработчики систем автономного вождения утверждают, что их программное обеспечение одинаково хорошо распознаёт взрослых светлокожих людей, детей и темнокожих пешеходов. Однако исследование учёных из Королевского колледжа в Лондоне показало, что это не совсем так. Исследователи проверили восемь систем обнаружения пешеходов, построенных на базе нейросетей. В ходе тестирования использовалось более 8 тыс. изображений пешеходов. Оказалось, что системы обнаружения пешеходов на 20 % лучше распознают взрослых людей, чем детей. Кроме того, программное обеспечение на 7,5 % точнее определяет светлокожих людей, чем темнокожих пешеходов. По мнению исследователей, проблема распознавания темнокожих людей заключается в том, что системы автономного вождения преимущественно обучаются на изображениях людей со светлой кожей. «Хотя влияние несправедливых систем искусственного интеллекта хорошо задокументировано, начиная с того, что ИИ-алгоритмы при приёме на работу предпочитают кандидатов-мужчин и заканчивая тем, что алгоритмы распознавания лиц менее точно определяют темнокожих женщин, чем белых мужчин, опасность, которую могут представлять беспилотные автомобили, очень велика. Раньше представителям меньшинств могли отказать в жизненно важных услугах, а теперь они могут столкнуться с серьёзными травмами», — считает доктор Цзе Чжан (Jie Zhang), один из авторов исследования. Учёные также установили, что точность распознавания темнокожих людей сильно снижается в условиях недостаточной освещённости и низкой контрастности. Это может приводить к возникновению опасных ситуаций при использовании систем обнаружения пешеходов на основе ИИ в тёмное время суток. Автопроизводители не раскрывают подробностей о программном обеспечении, используемом для распознавания пешеходов. Однако исследователи утверждают, что эти алгоритмы, как правило, построены на основе тех же систем с открытым исходным кодом, которые были проверены в ходе исследования. Alibaba выпустила ИИ-модели, которые могут распознавать изображения и вести диалог
26.08.2023 [20:31],
Владимир Фетисов
Китайский технологический гигант Alibaba представил две языковые модели — Qwen Large Vision Language Model (Qwen-VL) и Qwen-VL-Chat — демонстрирующие расширенные возможности интерпретации изображений и ведения диалогов на естественном языке. Учитывая растущий спрос на доступ к продвинутым ИИ-алгоритмам, появление языковых моделей Alibaba может оказаться весьма своевременным. Представленные языковые модели не ограничиваются понимаем текстовых сообщений. Qwen-VL способен воспринимать и понимать изображения, текст и соблюдать ограничения. Алгоритм может обрабатывать запросы, связанные с разными изображениями, и генерировать ответы на них. Qwen-VL-Chat предназначен для более сложного взаимодействия. Например, он может сравнивать несколько изображений, отвечать на серии вопросов, писать истории на основе предоставленных пользователем картинок. К примеру, пользователь может спросить ИИ о местоположении больницы по фото её вывески и получить точный ответ на этот вопрос. Одно из преимуществ представленных языковых моделей состоит в том, что они работают с высокой точностью. По данным Alibaba, Qwen-VL значительно превосходит существующие схожие языковые модели с открытым исходным кодом по нескольким критериям оценки английского языка. Алгоритм также поддерживает новую функцию «общение с чередованием нескольких изображений», которая предполагает, что пользователь предоставит ИИ несколько изображений, после чего будет задавать связанные с ними вопросы. Используя стандартные эталоны, специалисты Alibaba оценили возможности новых алгоритмов при выполнении разных задач, начиная от генерации комментариев к изображениям и заканчивая ответами на вопросы по загруженным снимкам. Обе модели также тестировались по разработанному в Alibaba эталону, который основан на оценке GPT-4 для определения диалоговых возможностей и соответствия человеческому восприятию. Отмечается, что Qwen-VL и Qwen-VL-Chat достигли наилучших результатов в разных категориях. Alibaba стала одной из первых китайских компаний, представивших конкурентоспособную систему генеративного ИИ, что свидетельствует о быстром прогресс исследований в сфере нейросетей в Поднебесной. Выпуская модели с открытым исходным кодом, Alibaba гарантирует, что исследователи, учёные и компании по всему миру смогут использовать их для создания собственных приложений, не прибегая к трудоёмкому и дорогостоящему процессу обучения нейросетей с нуля. «Это майнинг 2.0»: на оборудовании для добычи криптовалюты теперь обучают ИИ-алгоритмы
04.07.2023 [00:23],
Владимир Фетисов
Стремительный рост популярности генеративных нейросетей, таких как ChatGPT, открыл новые возможности для компаний, занимающихся майнингом криптовалюты. Ярким примером такой деятельности стала испанская компания Satoshi Spain, которая продавала и сдавала в аренду оборудование для майнинга в период бума криптовалют, а в последнее время помогает своим клиентам перепрофилировать оборудование под нужды ИИ. «Вы всё ещё можете зарабатывать деньги на своём оборудовании для майнинга. Это майнинг 2.0», — считает основатель Satoshi Spain Алехандро Ибаньес де Педро (Alejandro Ibanez de Pedro). В настоящее время оборудование компании используется для обучения ИИ-алгоритмов разных стартапов и университетов в Европе. Satoshi Spain не единственный представитель криптовалютного рынка, обративший внимание на стремительный рост популярности ИИ-алгоритмов, для обучения которых необходимы производительные графические ускорители. Спрос на производительные GPU вырос благодаря успеху чат-бота ChatGPT от OpenAI. На фоне затишья в сегменте майнинга криптовалют некоторые компании перепрофилируют оборудование для добычи цифровых активов под нужды ИИ-алгоритмов. После того, как изменился способ майнинга криптовалюты Ethereum, миллионы графических ускорителей перестали использоваться для добычи цифровых активов. Возможность перепрофилировать оборудование для обучения ИИ-алгоритмов даёт майнинговым компаниям новые перспективы для извлечения выгоды. На создателей ChatGPT подали в суд за незаконное использование данных миллионов интернет-пользователей
29.06.2023 [17:31],
Владимир Фетисов
Юридическая компания Clarkson обратилась в федеральный суд северного округа Калифорнии с коллективным иском против OpenAI, разработчика популярного ИИ-бота ChatGPT. Заявитель считает, что разработчик нарушил права миллионов интернет-пользователей, используя их публично доступные данные для обучения больших языковых моделей, которые являются основой ИИ-алгоритмов. По словам управляющего партнёра Clarkson Райана Кларксона (Ryan Clarkson), компания хочет представлять в суде интересы «реальных людей, чьи данные были украдены и незаконно присвоены для создания этой очень мощной технологии». Согласно имеющимся сведениям, речь идёт об общедоступных данных пользователей, таких как комментарии в социальных сетях, сообщения в блогах, статьи в «Википедии» и др. Официальные представители OpenAI пока воздерживаются от комментариев по данному вопросу. Судебный иск Clarkson затрагивает главную нерешённую проблему в сфере генеративных нейросетей, таких как ИИ-боты и генераторы изображений. Такие инструменты обучаются на огромном количестве данных, доступных в интернете. После завершения обучения большие языковые модели могут формировать ответы при общении с человеком, сочинять стихи или рассказы, вести сложные беседы и др. Однако люди, чьи данные используются при обучении нейросетей, не давали согласия на использование этой информации кем-то вроде OpenAI. «Вся эта информация используется масштабно, хотя она никогда не предназначалась для обучения больших языковых моделей», — заявил Кларксон. Он также рассчитывает, что суд установит определённые ограничения в плане того, как могут обучаться ИИ-алгоритмы, и как люди могут получить компенсацию за использование их данных. По данным источника, у компании уже есть группа истцов, и она активно ищет новых клиентов. Иск Clarkson к OpenAI является не первым случаем, когда разработчиков ИИ-алгоритмов обвиняют в незаконном использовании данных. В ноябре прошлого года был подан иск против OpenAI и Microsoft в связи с тем, что компании использовали программный код на платформе GitHub для обучения ИИ-инструментов. В феврале платформа Getty Images подала в суд на Stability AI, обвинив компанию в незаконном использовании изображений сервиса для обучения своей генеративной нейросети. OpenAI обновила GPT-3.5-turbo и GPT-4 новыми функциями и снизила стоимость их использования
14.06.2023 [13:33],
Владимир Фетисов
По мере роста конкуренции в сфере генеративных нейросетей один из лидеров направления в лице OpenAI представил обновлённые версии алгоритмов генерации текста, а также снизил стоимость их использования. Компания выпустила обновлённые версии языковых моделей GPT-3.5-turbo и GPT-4, которые обеспечат ещё больше возможностей для создания контента по сравнению с предыдущими версиями языковых моделей стартапа. Одним из любопытных нововведений стало появление инструмента, позволяющего разработчикам описывать программные функции естественным языком и получать полноценный код для их выполнения. Например, данный инструмент подходит для создания чат-ботов, которые отвечают на вопросы, вызывая внешние инструменты, преобразовывая естественный язык в запросы к базам данных и извлекая структурированные данные из текста. Обе модели способны определять, когда функция должна быть вызвана и отвечать в формате JSON, который соответствует сигнатуре функции. Это нововведение также позволит разработчикам получать более точные и структурированные данные. Вместе с этим модель GPR-3.5-turbo получила расширенное контекстное окно (количество текста, учитываемое в процессе генерации). Увеличение контекстного окна позволяет модели лучше понимать смысл запросов и выдавать более соответствующие им ответы, не отклоняясь от темы. Модель GPR-3.5-turbo имеет контекстное окно в 16 тыс. токенов, что в четыре раза больше по сравнению с аналогичным показателем GPT-3.5. Также было объявлено, что в настоящее время OpenAI тестирует модель GPT-4 с контекстным окном в 32 тыс. токенов. Стоимость использования стандартной версии GPT-3.5-turbo (без расширенного контекстного окна) снижена на 25 % до $0,0015 за 1 тыс. входных токенов и $0,002 за 1 тыс. выходных токенов, что соответствует примерно 700 страницам текста за $1. Стоимость использования модели text-embedding-ada-002, которая позволяет измерить сходство текстов, снижена на 75 % до $0,0001 за 1 тыс. токенов. Apple создаст свой ChatGPT, а пока запретила сотрудникам использовать чужие
21.05.2023 [21:15],
Владимир Фетисов
На фоне взрывного роста популярности генеративных нейросетей, таких как ChatGPT от Open AI, вполне логично предположить, что многие крупные IT-компании планируют запустить собственные аналоги. Одной из таких компаний, вероятно, станет Apple, поскольку в настоящее время производитель iPhone активно расширяет штат сотрудников, которые занимаются разработками, связанными с искусственным интеллектом. В настоящее время на странице Apple в США размещено 176 открытых вакансий в разных подразделениях компании, занимающихся разработками в сфере ИИ и машинного обучения. При этом 43 новые вакансии появились в этом месяце, 68 предложений связаны с голосовым помощником Siri, 52 вакансии — с iOS и 46 вакансий — с macOS. Некоторые из предложений о работе связаны с разработками в разных областях. Если отсортировать вакансии по сочетанию «искусственный интеллект», то останется 88 предложений. Если же добавить к поиску слово «генеративный», то количество предлагаемых вакансий сократится до 48 единиц. При этом слово «генеративный» встречается в названии нескольких вакансий: инженер-исследователь мультимодального генеративного моделирования, инженер-исследователь визуального генеративного моделирования, инженер по машинному обучению — генеративный ИИ, научный сотрудник прикладных исследований — генеративный ИИ и др. Ранее сообщалось, что Apple заморозила процесс набора новых сотрудников. Однако новые вакансии указывают на то, что компания не намерена отказываться от работы в направлениях, которые на данный момент являются наиболее актуальными. Ранее в этом году Apple заявляла о намерении подходить к генеративному ИИ «сознательно и продуманно», а на этой неделе стало известно, что сотрудникам компании запретили использовать ИИ-ботов на рабочих местах, чтобы предотвратить утечку данных. Созданный с помощью ИИ виртуальный аватар обошёл защиту банка и ввёл в заблуждение родственников
30.04.2023 [17:30],
Владимир Фетисов
Обозреватель The Wall Street Journal Джоанна Стерн (Joanna Stern) попыталась выяснить, насколько натуральным может получиться цифровой аватар человека, созданный с помощью передовых алгоритмов на базе генеративного ИИ. Результат эксперимента оказался пугающим, поскольку Джоанне удалось получить собственный цифровой клон, который смог ввести в заблуждение её родственников и обмануть систему голосовой идентификации банка. Для создания виртуального аватара Джоанна использовала инструмент Synthesia, который позиционируется разработчиками как сервис создания видеоаватаров на основе видео- и аудиозаписей реальных людей. После создания аватара пользователь может вводить любой текст, который виртуальный клон послушно повторяет. Исходным материалом для обучения алгоритма стали 30 минут видео и около двух часов аудиозаписей голоса Джоанны. Стартап Synthesia берёт $1000 в год за создание и поддержку виртуального аватара, а также взимает с пользователей дополнительную ежемесячную плату. Через несколько недель цифровой клон журналиста был готов, после чего начались его испытания. Джоанна сгенерировала с помощью ChatGPT текст для TikTok-ролика про iOS и загрузила его в Synthesia, после чего аватар создал готовый видеоролик. У неё сложилось впечатление, что она смотрит в зеркало и видит своё отражение. Однако на данном этапе технология не совсем идеальна. Если при воспроизведении коротких предложений аватар выглядит достаточно убедительным, то более длинные фразы дают понять, что их произносит не человек. Несмотря на то, что в TikTok далеко не все пользователи отличаются внимательностью, некоторые из подписчиков обратили внимание на то, что созданное с использованием виртуального аватара видео выглядит неестественно. Аналогичная проблема обнаружилась при попытке использовать цифровой аватар во время видеозвонков в Google Meet. К некачественному воспроизведению длинных предложений добавилась то, что аватар всё время держит идеальную осанку и практически не движется. Несмотря на это, очевидно, что в скором времени видеоаватар станет более совершенным, поскольку в разработке Synthesia уже есть несколько бета-версий, способных кивать головой, поднимать и опускать брови, а также выполнять некоторые другие свойственные человеку движения. После проверки возможностей видеоаватара Джоанна решила испытать голосовой клон, созданный с помощью генеративного ИИ-алгоритма ElevenLabs. Потребовалось загрузить в сервис около 90 минут записей голоса, и менее чем через две минуты голосовой клон был готов. Аудиоаватар может воспроизводить любой текст голосом пользователя. За создание голосового клона ElevenLabs берёт от $5 в месяц. По сравнению с видеоаватром от Synthesia, аудиоклон более похож на реального человека. Он добавляет в речь интонации, а само воспроизведение текста происходит более плавно. Сначала Джоанна позвонила сестре и использовала в беседе с ней голосовой клон. Отмечается, что сестра не сразу заметила подвох, но через некоторое время обратила внимание на то, что в процессе беседы голосовой клон не делает пауз, чтобы перевести дух. После этого был звонок отцу с просьбой напомнить номер социального страхования. Он сумел заметить подвох, поскольку голос Джоанны звучал как бы в записи. Несмотря на это, родственники журналиста не сразу заметили, что с ними общается не живой человек, хотя долго обманывать их не удалось. Ещё один звонок был совершён в службу поддержки Chase Bank. Предварительно алгоритму были заданы несколько вопросов, на которые предстояло ответить в процессе голосовой идентификации банка. После непродолжительного общения Джоанну соединили с представителем банка, поскольку система идентификации голоса не обнаружила каких-либо проблем. Позднее представитель Chase сообщил, что банк использует голосовую идентификацию вместе с другими инструмента подтверждения личности клиентов, отметив, что идентификация по голосу позволяет перейти к общению с сотрудником поддержки, но с её помощью нельзя провести транзакцию или выполнить иную операцию. Голос, который генерирует сервис ElevenLabs, оказался максимально похож на голос Джоанны. Он учитывал интонации и другие особенности речи. Любопытно, что для создания такого голосового клона достаточно загрузить в сервис несколько аудиозаписей и согласиться с правилами платформы, в которых говорится, что пользователь обязуется не использовать алгоритм в мошеннических целях. Это означает, что любой желающий может запросто сгенерировать голос кого-то из своих знакомых или знаменитостей. Представитель ElevenLabs рассказал, что компания разрешает клонировать голос только владельцам платных аккаунтов. В случае нарушения политики платформы аккаунт пользователя будет заблокирован. Кроме того, разработчики планируют выпустить сервис, который позволит загружать в него любое аудио для проверки, использовался ли при его создании алгоритм ElevenLabs. Отмечается, что разработчики могут идентифицировать весь генерируемый пользователями контент для его фильтрации или применения иных мер к нарушителям, включая сотрудничество с правоохранительными органами. Джоанна отметила, что каждый из используемых ей алгоритмов пока не в состоянии сделать копию, которую невозможно отличить от оригинала. ChatGPT генерировал текст, не опираясь на знания и опыт журналиста. Сервис Synthesia создал аватар, который хоть и выглядит похожим на человека, но не способен передать все характерные особенности пользователя. Наконец, система ElevenLabs генерирует очень похожую речь, но и она не идеальна. В дальнейшем ИИ-технологии продолжат развиваться и, вероятно, в будущем отличить виртуальный аватар от живого человека в процессе общения будет только сложнее. Великобритания потратит £100 млн на создание суверенного ИИ
24.04.2023 [20:21],
Владимир Фетисов
Премьер-министра Великобритании Риши Сунак (Rishi Sunak) и министр по науке и технологиям Мишель Донелан (Michelle Donelan) анонсировали выделение £100 млн (около $124 млн) на создание рабочей группы, которая начнёт разработку «суверенного» искусственного интеллекта. Предполагается, что этот алгоритм сделает страну «конкурентоспособной на глобальном уровне», а участники рабочей группы помогут сделать ИИ-системы более безопасными и надёжными. Группа по разработке искусственного интеллекта будет отчитываться непосредственно перед премьер-министром и министром по науке и технологиям, а её председателя назначат летом этого года. Объявленное финансирование выделяется наряду с £900 млн, которые предусмотрены бюджетом Великобритании и предназначены для создания суперкомпьютера, проведения исследований в сфере искусственного интеллекта и др. Британские власти ожидают, что этот проект позволит создать «суверенный ИИ-алгоритм», который поможет стимулировать экономику страны, избегая этических и технологических проблем. Существующие в настоящее время ИИ-алгоритмы не всегда предоставляют достоверную информацию и могут вести себя непредсказуемо. Британские власти хотят создать заслуживающий доверия алгоритм, который может оказаться полезным в разных сферах, включая разработку новых медицинских препаратов, борьбу с климатическими изменениями и др. Форум Stack Overflow сделает платным доступ к своим данным для тренировки нейросетей
21.04.2023 [13:31],
Владимир Фетисов
Разработка ИИ-алгоритмов вроде ChatGPT и DALL-E стоит сотни миллионов долларов, и скоро она станет ещё дороже. Это связано с тем, что всё больше платформ, являющихся источником данных для обучения больших языковых моделей (LLM), планируют запретить бесплатное использование своего контента для тренировки нейросетей. Ранее о таком решении объявило сообщество Reddit, а теперь аналогичным образом поступил форму для разработчиков Stack Overflow. Согласно имеющимся данным, Stack Overflow планирует начать взимать плату с разработчиков ИИ-алгоритмов в середине этого года. Взамен платформа готова предложить доступ к более чем 50 млн вопросов и ответов на них. Эти планы подтвердил генеральный директор Stack Overflow Прашант Чандрасекар (Prashanth Chandrasekar). В настоящее время на площадке зарегистрировано более 20 млн пользователей. «Платформы сообществ, которые подпитывают развитие LLM, абсолютно точно должны получать компенсацию за свой вклад, чтобы такие компании как наша могли реинвестировать обратно в сообщества для поддержания их процветания. Мы поддерживаем подход Reddit к этому вопросу», — заявил Чандрасекар. Как и в случае с Reddit, представители Stack Overflow ещё не озвучили размер платы, которая будет взиматься с разработчиков ИИ-алгоритмов. Stack Overflow продолжает изучать стратегию Reddit и проводит консультации с потенциальными клиентами. Обе компании ведут обсуждение финансовых вопросов и обещают поделиться информацией с общественностью в ближайшие несколько недель. |