Нейросеть Suno угрожает музыкантам: как AI врывается в музыкальный бизнес

24 янв 2024

В начале 2024 года российский инди-музыкант и блогер Сизор выпустил на YouTube видео под названием «Нейросеть написала мне трек, и никто не заметил». Речь идет о песне «Обезьяны летают в космос», официально изданной на всех основных стриминговых площадках.

У Сизора была очень короткая текстовая заготовка: «Обезьяны летают в космос — им хочется к звездам». Он попросил дописать текст ChatGPT. Сервис несильно помог, но заставил музыканта самостоятельно закончить куплеты и припев.

Затем он пошел с ними в молодой онлайн-сервис Suno. Это публично доступная нейросеть, бесплатно создающая музыкальные треки (песни) на нескольких языках на основе предоставленной лирики и промпта, описывающего музыкальный стиль.

После нескольких попыток и к своему большому изумлению Сизор услышал, что Suno выдала ему потенциально хитовый хук (припев) с интересным решением в ритм-секции. Музыкант в своей DAW практически полностью повторил аранжировку припева, насколько ее можно было расслышать в AI-исходнике.

Куплеты Suno тоже предложила очень убедительные, и Сизор воспользовался ими. На всякий случай он купил подписку на Suno, разрешающую коммерческое использование сгенерированного контента. И выпустил трек под своим артистическим именем.


Вот что говорит о результате сам музыкант:

«Не так мы представляли будущее. Мне всегда казалось, что машины будут делать всю механическую, неинтересную работу. А люди как раз займутся творчеством. Но теперь я в этом не уверен… Трек попал в 3 плейлиста «Яндекс.Музыки», и никто ничего не заметил.

Можно ли сказать, что песню написала нейросеть? Мне кажется, что нет. Написал ли ее я сам? Тоже нет. По сути, я «фитанул» с нейросетью. Это звучит настолько же странно, насколько и ощущается…

Нейросети уже сейчас могут писать песни, которые будут слушать люди. Возможно скоро мы услышим про популярные нейрогруппы, выпускающие по альбому в секунду».

Что за нейросеть Suno, и почему она сносит башню всем

Ее «построили» инженеры и музыканты — выходцы из таких технологических компаний, как TikTok и Kensho. Штаб квартира сервиса базируется в Кембридже, штат Массачусетс (США). Проект поддерживают венчурные инвесторы, но стоило ему выйти из тени в паблик, как Microsoft интегрировала Suno в свой AI продукт Copilot (правда денег в музыкальный сервис IT-гигант пока не вкладывает). Вокруг нейросети прямо сейчас разгорается большой ажиотаж.

В отличие от многих более ранних AI-проектов, связанных с музыкой, Suno фокусируется не на имитации голосов известных артистов и не на воссоздании их музыкального стиля, а на производстве оригинального контента.

Генеральный директор сервиса Майки Шульман заявил, что хотя людям кажется очень крутым и интересным создавать новые песни в стиле конкретного исполнителя, Suno не думает, что этот опыт окажется приятным для потребителей в долгосрочной перспективе:

«Мы хотим, чтобы каждый испытал радость от создания музыки. Большинство людей не играют на музыкальных инструментах и ​​не знают сложного программного обеспечения, что до сих пор было препятствием для создания красивой музыки.

Музыка с вокалом также является действительно важным компонентом в этом деле, и то, что Suno умеет ее создавать — это одно из отличий проекта»…

Главная же черта новой нейросети, которую отмечают в музыкальном и блогерском мире, — удивительно хорошее качество музыки, которую она способна «писать». Речь идет, само собой, о качестве «музыкального текста», а не о битрейте фонограмм, который пока составляет 128 к/c.

Конечно, не с первой попытки, конечно, с глюками (Suno нередко «забывает» добавить вокал), конечно при достаточном усердии автора промпта этот AI-монстр способен выдавать чрезвычайно убедительные песни в широком спектре популярных жанров.

 

Если человек прописывает для нейросети подробнейший запрос, и при этом он искушен в музыкальном деле хотя бы на уровне любителя, она рождает треки, звучащие в стиле, скажем, Эда Ширана и других мировых звезд. И эта музыка не представляет собой симуляцию вокала конкретных людей и аранжировку конкретных песен. Suno действительно способна «писать» относительно оригинальные вещи.

Какие алгоритмы при этом работают и на каком принципе, создатели проекта не раскрывают. Майки Шульман, его друг Георг Куско и еще двое соучредителей — Мартин Камачо и Кинан Фрейберг — работали над приложением около 18 месяцев. Всего в команде проекта 10 человек, и по утверждению гендира, он «хорошо финансируется».

Несмотря на то, что Suno неидеальна и довольно часто в ответ на запрос выдает вещи нежизнеспособные и даже никакущие, при достаточном терпении и сноровке из нее можно «добыть» новый потенциальный хит. Этот AI-стартап уже на голову выше всех, ранее замеченных в околомузыкальном бизнесе. И он несет значительны угрозы сообществу музыкантов-людей.

Сервис Boomy и засорение нейросетевыми треками музыкальных стриминговых платформ

Стартап Suno пока не включился собственно в издание треков на Spotify и других площадках. Он просто позволяет платным подписчикам использовать для собственных релизов сгенерированный материал.

А вот музыкальный AI-сервис Boomy уже предложил своим подписчикам бизнес модель с изданием. Он не только позволяет издавать сгенерированные пользователями треки на основных стриминговых платформах, но и собирает для них отчисления за стримы.

У Boomy уже появились «артисты», которые абсолютно далеки от музыки даже как любители. То есть, вообще в ней ничего не понимают. Тем не менее, эти люди генерируют при помощи AI треки и релизят их. Среди них художники, блогеры и представители других творческих профессий, которые вот таким образом самовыражаются и пытаются что-то заработать.

Boomy ведет о наиболее заметных своих «артистах» блог. В нем можно узнать например о «музыканте» GoofyX из Техаса (США). Он сначала просто развлекался с сервисом, а затем начал подходить к делу в духе художников современного искусства.

В частности GoofyX расписывает в текстовом виде историю своих альбомов, для каждого трека выдвигает концепцию, долго работает с промптами. Тщательно занимается обложками.

Например, серия «Heartbeat Radio» повествуют о путешествии молодой девушки, которая переживает любовь, потерю и преследование существ из загробного мира.

GoofyX рассказывает, что ранее он хоть и «баловался с музыкальными инструментами», никакого опыта музыкального продакшна у него не было. Знания и умения в этом области ему заменил Boomy. И теперь «артист» нимало не смущаясь заявляет: «Мне нравится создавать атмосферную звучащую музыку, это позволяет мне замедлиться и отдохнуть от реальной жизни»…

Блог Boomy полон подобных историй, и пользователи сервиса воспринимают их всерьез. Мало того, все больше людей используют этот стартап для того, чтобы стать издающимся музыкантом, не будучи музыкантом.


На главной странице сервиса указано, что пользователи с его помощью сделали уже более 18 миллионов треков. Конечно, большая часть из них не издана на стриминговых площадках. Однако, по некоторым данным, около 2 миллионов (!) туда все же попали. И это при том, что Boomy производит только инструментальные треки, без вокала.

Честно говоря, мало какие из них имеют реальную ценность, в чем можно легко убедиться, послушав, скажем, раздел «Электроника». Однако время от времени Boomy способен производить более-менее структурированные треки в жанрах «ambient» и «meditation».

Некоторые их «авторы» публично заявляют, что получили на стриминговых сервисах десятки тысяч прослушиваний. На этом фоне в 2023 году разгорелся конфликт между Spotify и Boomy. Администрация потокового сервиса выпилила со своей площадки тысячи генеративных треков и заявила, что создавшие их люди накручивали прослушивания при помощи ботов.

Также в адрес Boomy прозвучало сообщение о том, что сервис заполняет каталог Spotify «мусором». Тем не менее, сотрудничество с ним платформа не остановила — треки Boomy по-прежнему появляются в Spotify и на некоторых других стриминговых сервисах.

Почему музыкальные нейросети угрожают будущему музыкантов (финансовому в том числе)

В отличие от Boomy и других музыкальных AI-сервисов, в основном предлагающих поделки «в стиле Дрейка» и «голосом Дрейка» или, скажем, Фредди Меркьюри, Suno, едва появившись, совершил качественный прорыв. Его нейросети действительно способны выдать что-то, если не новое и полностью оригинальное, то очень убедительное и имеющее рыночные перспективы.

Как продемонстрировал российский музыкант Сизор, уже сейчас может появиться подкласс инди-авторов, которые будут «читерить» — то есть, с помощью ChatGPT и других создавать тексты, а с помощью Suno — музыкальный материал. А затем записывать его самостоятельно и вполне юридически правомерно издавать.

Недалек тот день, когда нейросеть Suno (и, возможно, ее конкуренты, появление которых, видимо, не за горами) сумеет выдавать качество звука в 16 бит/44,1 кГц, а то и выше, а также более отчетливо и богато звучащие аранжировки с пристойным сведением. Достаточно будет «прикрутить» к Suno бизнес-модель Boomy, и начнется сущий кошмар.

И вот на каком фоне это будет происходить. С одной стороны, к настоящему моменту появилась прослойка студийных музыкантов и bedroom-продюсеров, живущих на доходы от стримов.

Их называют «музыканты в тапочках», они не дают концертов и делают только виртуальную карьеру — как блогеры и инди-авторы. Некоторые из них даже получают серьезные контракты от крупных лейблов. Это стало возможным благодаря Spotify и другим платформам, сильно потеснившим музыкальных пиратов и построившим цивилизованный рынок.

С другой стороны, в 2023 году было издано около 184 миллионов музыкальных треков. 86,2% (158,6 миллионов) получили менее 1000 прослушиваний. И в их числе целых 45 миллионов треков, которые никто не послушал ни разу. Это примерно 24,8% всего объема каталогов стриминговых площадок.

Сегодня каждый день в потоковые сервисы загружается около 120 000 новых треков. Конкуренция за слушателя происходит ошеломляющая. Звездные музыканты уже чувствуют себя неуютно перед лицом этой волны. Большие лейблы тоже не в восторге.

А теперь вспомним, что как минимум 2 миллиона треков на стримингах имеют искусственное происхождение, благодаря AI и музыкальным «читерам». На самом деле их может насчитываться в разы больше.

И если учитывать «эмбиент»-проекты, которые наводняют музыкальный мир мусорными треками со звуком костра, ветра и прочими достаточно простыми в производстве фонограммами, то картина складывается еще более тревожная.

Ну и наконец такие сервисы, как Suno, угрожают в ближайшие годы завалить музыкальные платформы быстро создаваемой поп-музыкой вполне сносного качества. А значит «читеры» и псевдомузыканты непременно и легально откусят свой кусок рынка и доходов.

Авторам-людям придется конкурировать с искусственным интеллектом и хитрецами, кое-что смыслящими в музыкальном продакшне. Возможно, мы стоим на старте изматывающей гонки, в которую будут против своей воли вовлечены действительно талантливые и умелые музыканты на очень несправедливых для них условиях.

Вероятно, через несколько лет нас ожидает зрелище крупных судебных баталий, в которых музыканты-люди станут настаивать на запрещении публикации нейросетевой музыки на стриминговых платформах, равно как и треков, созданных «читерами» при помощи AI.

Чем все это кончится, предсказать не возьмется ни один рациональный представитель музыкального бизнеса.

Владимир Лакодин