Сегодня 03 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → клонирование

YouTube разрабатывает ИИ-инструмент для создания музыкальных треков с голосами известных вокалистов

Согласно сообщению Bloomberg, YouTube в настоящее время разрабатывает инструмент на базе ИИ, который позволит пользователям имитировать голоса известных музыкантов при записи звука. В настоящее время сервис пытается получить у музыкальных компаний права на обучение своей нейросети на песнях из их музыкальных каталогов. Ни один крупный звукозаписывающий лейбл пока не дал согласия, но источники утверждают, что переговоры между сторонами продолжаются.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В прошлом месяце YouTube представил несколько новых инструментов на базе ИИ для авторов, в том числе созданные с помощью нейросети фоновые изображения и видео. Компания планировала включить в эти объявления и новый инструмент для клонирования голосов известных музыкантов, но не смогла вовремя получить разрешения от правообладателей.

Музыка, сгенерированная ИИ, в настоящее время находится в юридической «серой» зоне из-за трудностей с установлением прав собственности на песни, которые воспроизводят уникальный голос исполнителя, но не используют напрямую защищённых текстов или аудиозаписей. В настоящее время с точки зрения существующего законодательства неясно, является ли обучение генеративного ИИ клонированию голоса на музыкальном каталоге звукозаписывающей компании нарушением авторских прав. Тем не менее, это не подорвало интерес к разработке и обучению «музыкальных» нейросетей — в этом году Meta, Google и Stability AI выпустили ИИ-инструменты для создания музыки.

YouTube позиционирует себя в качестве партнёра, который поможет отрасли двигаться вперёд с помощью технологии генеративного ИИ, которую, по данным Bloomberg, приветствуют музыкальные компании. Хотя Alphabet в течение последнего года активно продвигала свои разработки в области генеративного ИИ, далеко не факт, что ей удастся на законных основаниях предоставить создателям YouTube инструменты клонирования голоса на базе ИИ, не вызвав многочисленных исков о нарушении авторских прав.

В настоящее время неясно, помогут ли дискуссии об ИИ-инструменте клонирования голоса YouTube решить возникающие претензии о нарушении авторских прав от звукозаписывающих компаний на фоне увеличения количества треков, созданных с помощью ИИ и подражающих популярным музыкантам. Широкое внимание к этой проблеме было привлечено в начале года, когда созданная ИИ песня Drake стала вирусной в интернете. В то время как некоторые музыканты, такие как Граймс (Grimes), поддерживают музыку, генерируемую ИИ, многие другие, в том числе Стинг (Sting), Джон Ледженд (John Legend) и Селена Гомес (Selena Gomez), призывают к введению правил, защищающих их голоса от копирования.

ИИ сгенерировал новые песни с голосом популярной певицы, которые стали вирусными в Китае

Сингапурская певица и композитор популярной музыки в стиле Mandopop Стефани Сан (Stefanie Sun) неожиданно обрела вирусную популярность на Bilibili, крупнейшем в Китае видео-хостинге. Внезапное возрождение интереса к Стефани, не выпускавшей альбомов с 2017 года, объясняется отнюдь не её творческим прорывом. В треках, получивших миллионы просмотров на Bilibili, голос Сан клонирован ИИ, что, кроме всего прочего, вызывает вопросы о защите авторских прав.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Mandopop (Mandarin popular music) — жанр китайской популярной музыки. Он популярен в Азии, особенно среди людей, говорящих на стандартном китайском языке, в Китае, Малайзии, Сингапуре, Тайване и Японии. Ностальгируя по золотому веку Mandopop, технически подкованные китайские интернет-пользователи стали имитировать вокал Стефани Сан, используя преобразование голоса певицы при помощи глубокого машинного обучения. Использование ИИ позволяет воспроизводить пение одного человека голосом другого.

Поиск по запросу AI Stefanie Sun выдаёт сотни видео, загруженных на Bilibili за последний месяц. Самые популярные ролики набрали более миллиона просмотров. Индекс WeChat, отслеживающий ключевые слова в социальной и контент-экосистеме приложения, показывает, что 5 мая показатель тренда запроса взлетел до 50 000 с нуля всего двумя днями ранее. После появления дипфейков Сан на Bilibili, подобные ролики также были размещены на других крупных социальных платформах, включая Douyin, китайскую версию TikTok.

 Источник изображения: TechCrunch

Источник изображения: TechCrunch

Дипфейковое пение очаровало публику и на Западе. В конце апреля созданная искусственным интеллектом песня с голосами The Weekend и Drake взорвала Spotify и TikTok. Певица Grimes произвела фурор, написав в Twitter, что поделится 50 % гонорара за любую успешную песню, созданную искусственным интеллектом, с использованием её голоса.

Как и на Западе, действующий закон об авторском праве в Китае не содержит конкретных указаний для песен, созданных с помощью ИИ, которые копируют голоса знаменитостей, но регулирующие органы страны быстро сформулировали юридические ограничения в области синтетических технологий в целом.

В то время как китайские технологические фирмы стремились извлечь выгоду из прорывов в области генеративного ИИ с помощью своих альтернатив Midjourney и ChatGPT, в ноябре Китай принял постановление, определяющее, как следует использовать передовые технологии. Поставщики услуг обязаны, например, проверять реальные личности пользователей и фиксировать их незаконные действия.

Компания Douyin, принадлежащая ByteDance, опубликовала сегодня руководство по контенту, создаваемому ИИ, которое в значительной степени основано на новом китайском регулировании синтетических технологий. Пользователи, загружающие контент, должны помечать творчество ИИ «отличительными ярлыками» и нести ответственность за последствия такого контента, говорится в руководстве платформы коротких видео. Любой контент, нарушающий авторские права, запрещён и подлежит «суровому наказанию».

Возникает вопрос, нарушают ли права артистов песни, созданные с помощью инструментов ИИ, имитирующих голоса певцов без их согласия. Стефани Сан пока никак публично не отреагировала на десятки песен, клонированных ИИ с использованием её голоса. А генеративный ИИ нашёл себе ещё одно применение, помогая заполнить эмоциональную пустоту людей.


window-new
Soft
Hard
Тренды 🔥
ЕС оштрафует TikTok на €500 млн за передачу данных европейцев в Китай 49 мин.
40 кадров/с и «местами даже хорошая» графика за $70: первые подробности Cyberpunk 2077 для Nintendo Switch 2 2 ч.
Представлена ранняя ПК-версия российской ОС «Аврора» — на ней уже запускается Telegram и не только 3 ч.
«РТК ИТ Плюс» пополнила ИТ-экосистему «Лукоморье» тремя новыми продуктами 3 ч.
Microsoft подтвердила дату выхода GTA V в PC Game Pass — подписчики получат доступ к GTA V Enhanced 3 ч.
Новый контент в Elden Ring: Tarnished Edition для Nintendo Switch 2 появится и на других платформах 4 ч.
Лавкрафтианский хоррор Stygian: Outer Gods готовится к старту открытой «беты» — новый геймплейный трейлер 5 ч.
Nintendo создала гибридный эмулятор Switch, но работать он будет только на Switch 2 6 ч.
Новая статья: Обзор системы резервного копирования и восстановления данных «Кибер Бэкап Малый Бизнес» 9 ч.
Годовая выручка «Группы Астра» взлетела на 80 %, а прибыль — на 66 % 9 ч.
Большой адронный коллайдер собрал базу для выхода за пределы известной физики 57 мин.
Восьмиядерные CPU стали самыми популярными в мире по статистике CPU-Z — AMD стремительно отбирает рынок у Intel и Nvidia 2 ч.
Apple потеряла $250 млрд стоимости за день — пошлины Трампа обвалили акции техногигантов 3 ч.
Nintendo Switch 2 получила поддержку трассировки лучей и DLSS, но их появление в играх зависит от разработчиков 3 ч.
Nikon представила полнокадровую камеру Z5 II с улучшенным автофокусом и повышенной скоростью съёмки за $1700 4 ч.
«Акустическое совершенство»: Bang & Olufsen представила каменную колонку Beosound Balance Natura 4 ч.
У россиян вырос интерес к планшетам — продажи подскочили на 15 % в первом квартале 5 ч.
«Идеальный снимок. Скоро» — Nothing намекнула на скорый выход CMF Phone 2 5 ч.
Samsung выпустила 20-метровые телевизоры для кинотеатров Onyx 5 ч.
Intel переосмыслила свой главный слоган и обновила фирменный стиль, чтобы вернуть пользователей 5 ч.