Итоги 2020 года: самые интересные AI-решения и проекты

Прошедший год отметился множеством разработок, использующих технологии машинного обучения и системы искусственного интеллекта (Artificial Intelligence, AI) на базе нейронных сетей. Будем кратки — в 2020 году искусственный интеллект научился не только нюхать, писать музыку, стихи и картины, но и просто... читать мысли человека! Вспоминаем наиболее яркие и значимые достижения в этой сфере

В последние годы на рынке IT наблюдается настоящий бум в области решений на базе искусственного интеллекта. И в этом нет ничего удивительного: современные вычислительные и нейросетевые технологии достигли уровня, позволяющего AI-системам решать весьма сложные для человека практические задачи, а разработчикам — создавать инновационные приложения и сервисы, демонстрирующие безграничный потенциал электронного разума.

Источник изображения: emarsys.com

⇡#Чувство обоняния

Одним из ярчайших примеров интенсивного развития технологий искусственного интеллекта стал созданный специалистами Intel Labs и Корнелльского университета AI-комплекс, способный различать запахи и имитировать работу обонятельной нервной системы человека. В основу разработки легли нейроморфные процессоры Intel Loihi, сочетающие процессы обучения, тренировки и принятия решений в одном чипе и позволяющие системе быть автономной и «сообразительной» без подключения к облаку (к базе данных). В ходе экспериментов спроектированный и оснащённый химическими датчиками комплекс продемонстрировал высокую эффективность при распознавании в воздухе запахов опасных веществ даже в условиях сильных помех. Подобного рода решения, уверены в Intel, помогут в развитии робототехники, когда роботы смогут сами сортировать продукты, ориентируясь на запах, подтолкнут развитие систем слежения за состоянием окружающей среды, приведут к повышению безопасности труда на производстве и в целом дадут толчок к развитию когнитивных способностей кремниевых процессоров.

Нейроморфный процессор Intel Loihi (источник изображения: intel.com)

⇡#Болезни отступят

Значительного прогресса в 2020 году разработчики AI-систем добились в области медицины. Так, компанией DeepMind, принадлежащей холдингу Alphabet (Google), было объявлено о существенном прорыве в предсказании фолдинга (сворачивания) белков. Проблема предсказания сворачивания белка считается одной из 125 важнейших для решения задач современности, а также одной из величайших проблем биологии за последние 50 лет. Дело в том, что белки собираются из линейных последовательностей аминокислот, которые после синтеза принимают уникальную пространственную форму, и таких форм огромное множество. В настоящий момент из сотен миллионов белков (комбинаций аминокислот) изучено только 0,1 % соединений, чья пространственная структура также хорошо известна. Неизвестные белки, а также соединения, свойства которых ещё не были подтверждены экспериментальным путём, учёные пытаются предсказать с помощью компьютеров. Но до сих пор никто не мог с достаточной степенью точности вычислить, какую 3D-форму примет белок из заданных набора и последовательностей аминокислот. В DeepMind утверждают, что нашли ключ к решению этой задачи. Если это действительно так, то нас может ждать прорыв в открытии новых лекарств и вакцин, а также в понимании возникновения и течения многих болезней.

роблема восстановления трёхмерной структуры белков является одной из самых сложных вычислительных задач (источник изображения: independent.co.uk)

Проблема восстановления трёхмерной структуры белков является одной из самых сложных вычислительных задач (источник изображения: independent.co.uk)

По мнению экспертов, повсеместное внедрение технологий искусственного интеллекта в медицину сулит огромные перспективы, позволяя значительно улучшить качество лечения и принципиально изменить подход к ранней диагностике опасных заболеваний. Аналогичной позиции придерживается небезызвестный Билл Гейтс (Bill Gates), считающий, что использование нейронных сетей в сложных биологических системах способно кардинально изменить жизнь людей в будущем. Потенциал AI только сейчас начинает раскрываться, считает основатель Microsoft, — вычислительные мощности в этой области удваиваются каждые 3,5 месяца. Господин Гейтс указал, что, наряду с улучшениями в обработке данных, это даёт возможность синтезировать, анализировать, выявлять закономерности и делать прогнозы по гораздо большему количеству направлений, чем может осознать человек.

⇡#Сила мысли

Чтение мыслей пока что остаётся уделом фантастических фильмов и книг. Однако наука и техника не стоят на месте, и есть все основания считать, что в будущем подобного рода технологии станут реальностью. На шаг вперёд в этом направлении удалось продвинуться группе учёных из Калифорнийского университета в Сан-Франциско, экспериментально доказавшим возможность распознавания нервных сигналов в головном мозге человека и их трансляции в понятные слова с помощью рекурентной нейросети и вживлённых в мозг электродов. В эксперименте приняли участие пациенты с эпилепсией, электроды которым были вживлены для борьбы с неврологическим заболеванием и отслеживания приступов. Так получилось, что часть электродов оказались в зонах мозга, в которых происходит подбор слов, составление выражений и осуществляется обратная связь с участками мозга, воспринимающими собственную речь человека. Испытуемым было предложено мысленно, а затем вслух произнести несколько предложений с ограниченным набором слов. Одновременно снимались сигналы с имплантированных в мозг датчиков. Полученные данные были переданы в нейронную сеть для обучения, а промежуточный результат был отдан для анализа другой AI-сети. Вероятность ошибочного определения слов составила всего 3 процента. Впечатляющий показатель!

Перевод на лету нервных импульсов мозга в речь мог бы помочь людям с травмами конечностей и речевого аппарата, а это общение и возможность пользоваться электроникой и информацией (источник изображения: darpa.mil)

⇡#От классики до рока

Интересное применение искусственному интеллекту нашли программисты компании OpenAI, разработавшие Jukebox — искусственный интеллект, сочиняющий музыку с осмысленными текстами и вокалом. Для обучения нейронной сети системы было использовано множество отрывков из песен самых разных жанров, от рока, джаза и блюза до хип-хопа с кантри и классическими произведениями. Такой подход позволил команде OpenAI расширить возможности проекта и добиться эффекта имитации музыкальных композиций исполнителей, на треках которых он обучался. Например, Jukebox может сочинить музыку в стиле кантри-певца Джонни Кэша, рэпера Drake и даже российской поп-группы «Тату». На создание одной минуты музыкального трека с вокальными партиями искусственному интеллекту требуется около 9 часов и огромный объём вычислительных ресурсов. Именно по этой причине компания не может предоставить открытый доступ к своей AI-системе. Зато разработчики опубликовали результаты работы Jukebox. Послушать их можно на сайте jukebox.openai.com.

На данный момент музыка Jukebox впечатляет, но далека по качеству от идеала. Искусственному интеллекту пока явно не хватает мастерства, чтобы воссоздать полную структуру композиции с куплетами и повторяющимися припевами

⇡#Уроки рисования

Электронный разум нашёл применениеи в изобразительном искусстве. Аккурат в середине 2020 года стало известно о создании специалистами Лаборатории искусственного интеллекта Массачусетского технологического института системы машинного обучения Timecraft, позволяющей воссоздать процесс написания картин и нанесения мазков для произведений живописи известных художников, будь то Моне, Винсент Ван Гог или Сальвадор Дали. Сообщается, что нейросеть вначале была обучена на двух сотнях видеороликов с ускоренной съёмкой техники написания реальных цифровых и акварельных картин. После этого исследователи создали свёрточную нейронную сеть, которая призвана «деконструировать» художественные работы на основе своих знаний о процессе создания картин. В результате система Timecraft сумела показать более высокую эффективность, чем существующие подобные проекты, более чем в 90 % случаев. Неплохой результат. Помимо уроков виртуальной истории, AI-система Timecraft может быть полезна для иллюстрации общих приёмов и техники рисования новичкам.

Исследователи обещают опубликовать исходный код Timecraft, чтобы любой желающий мог опробовать технологию или использовать её в работе

Успела отметиться в творческом AI-сегменте и компания «Яндекс», открывшая виртуальную галерею нейросетевого искусства, в которой представлено четыре тысячи уникальных картин, созданных искусственным интеллектом. Галерея размещена по адресу yandex.ru/lab/ganart и разделена на четыре тематических зала: «Люди», «Природа», «Город» и «Настроение». Для обучения нейросети специалистами «Яндекса» были использованы произведения, принадлежащие к разным направлениям живописи: от фовизма и кубизма до минимализма и стрит-арта. В процессе обучения AI-система изучила 40 тысяч картин, после чего взялась за создание собственных произведений. Для отбора картин по разным категориям использовалась другая нейросеть, которая применяется в сервисе «Яндекс.Картинки» для поиска изображений по запросам. Именно она смогла увидеть на картинах людей, природу, город и разные настроения, отсортировав имеющиеся в наличии работы по категориям.

В виртуальной галерее «Яндекса» собраны картины, нарисованные искусственным интеллектом

⇡#Игры разума

Немало применений искусственный интеллект нашёл и в других сферах человеческой деятельности. К примеру, NVIDIA задействовала AI для воссоздания игрового процесса знаменитой аркадной видеоигры Pac-Man с помощью нейросети GameGAN. Для решения этой задачи искусственному интеллекту потребовалось всего 4 дня. Компания обучила нейросеть с помощью 50 тысяч игровых сессий в Pac-Man. Затем перед ней поставили задачу — воссоздать увиденную игру целиком, начиная от статичных стен и точек и заканчивая двигающимися призраками и самим Пакманом. Обучение и воссоздание игры проводилось с использованием квартета графических ускорителей NVIDIA Quadro GP100. Самое интересное заключается в том, что GameGAN не предоставили доступ к оригинальному коду игры или её движку. Всё обучение сводилось к тому, что одна нейросеть наблюдала за тем, как в Pac-Man играла другая нейросеть. «Для создания игры, подобной Pac-Man, программисту требуется придумать и прописать правила поведения и взаимодействия всех имеющихся агентов внутри игры. Это очень кропотливая работа. GameGAN может упростить эту задачу. Нейросеть способна обучаться новым правилам через наблюдение. В идеале алгоритмы, подобные GameGAN, можно будет обучить процедурной генерации правил для той игры, которую вы хотите создать», — поясняют исследователи NVIDIA, подчёркивающие, что в перспективе их разработка может быть задействована не только в игровой индустрии, но и в других областях.

По словам разработчиков, GameGAN — первый шаг к созданию искусственного интеллекта, способного решать куда более серьёзные и масштабные задачи

⇡#Вкалывают роботы

Любопытной разработкой в области искусственного интеллекта отметилась Mail.ru Group, представившая в 2020 году платформу dictor.mail.ru, которая позволяет в несколько кликов создавать новостные и репортажные видео студийного качества. Чтобы создать видео, достаточно загрузить в систему текст новости — и виртуальный ведущий его зачитает. Дикторы выглядят и разговаривают, как живые люди: при чтении новостей они реалистично воспроизводят мимику, эмоционально реагируют и расставляют смысловые акценты. Внешность диктора выбирает пользователь: в компании создали несколько моделей цифровых ведущих, прототипами для которых послужили реальные люди. В Mail.ru Group подчёркивают, что при создании виртуальных ведущих использовались методы машинного обучения. Синтез речи построен на основе наработок голосового ассистента Маруси. А видеоизображение синхронизируется с речью в режиме реального времени с помощью системы компьютерного зрения Vision от той же Mail.ru Group, обученной на реальных прототипах и видеозаписях.

В Mail.ru Group считают, что платформа для создания видео будет полезна как крупным изданиям, которые активно экспериментируют с технологиями, так и нишевым медиа

⇡#Взгляд в будущее

Прошедший 2020-й можно смело назвать годом самых ярких достижений искусственного разума, который продолжит интенсивное развитие, несмотря на пандемию коронавируса и непростую экономическую обстановку в мире. Согласно оценкам аналитиков International Data Corporation (IDC), в прошедшем году глобальные затраты в этой сфере составили примерно 156,5 млрд долларов США. К 2024-му объём рынка вырастет в два раза и превысит $300 млрд. При этом самым крупным сегментом в отрасли останется программное обеспечение. На втором месте по размеру расходов окажутся различные AI-сервисы. Оставшаяся часть придётся на аппаратные решения. В отдалённом будущем искусственный интеллект затронет практически все сферы человеческой деятельности. У рынка AI большой задел на будущее и хорошие перспективы для развития, а поэтому есть все основания полагать, что динамика его роста окажется выше ожиданий и прогнозов экспертов.