AIVA — нейросеть  для создания музыки

AIVA — нейросеть для создания музыки

AIVA — это ИИ-сервис для создания музыки. Он изучает тонны треков, а потом сам пишет уникальные композиции — классика, поп, электроника — что угодно.

Бесплатная версия дает 3 скачивания в месяц с треками до 3 минут (генерировать можно столько, сколько захочется). Авторские права остаются за AIVA, а использование ограничено некоммерческими целями.

 

Регистрация

Заходим на сайт сервиса и нажимаем «Create a free account». В дальнейшем для входа используем кнопку «Log In».

Доступна авторизация через Google-аккаунт. Если нужно зарегистрироваться с помощью электронной почты, вписываем её адрес и нажимаем «Continue».

На указанный адрес придет ссылка для активации аккаунта. Нажимаем на кнопку «Confirm Email Address».

Придумываем пароль, соглашаемся с условиями сервиса и нажимаем «Create account».

Генерируем музыку по стилю

Открывается новая страница. Чтобы начать создание музыки, нажимаем на кнопку «Create a track». Далее выбираем «From a Style»

Открывается библиотека стилей, выбираем подходящий и нажимаем «Create». Для ускорения поиска нужного стиля есть поисковая строка.

Перед генерацией можно установить тональность мелодии, продолжительность трека и количество файлов, которые будут генерироваться. Нажимаем «Create track».

Некоторое время сервис создает композицию. А затем ее можно прослушать и скачать. Для этого нажимаем на значок со стрелкой.

Выбираем формат MP3.

Генерация по стилю — по сути лотерея. Иногда для создания подходящего варианта надо запустить несколько генераций.

Вот такую эпичную музыку мне предложила нейросеть.

Эпичная музыка

AIVA

Генерация на основе аудио

Бесплатно можно попробовать создать свой трек на основе загруженного с Пк музыкального файла.

Для этого нажимаем на кнопку «Create track» и выбираем вариант «From an influence».

Дальше с ПК нужно загрузить аудиофайл. Для этого жмём на «Drag&Drop».

Выбираем файл на ПК и загружаем внутрь сервиса. Нажимаем «Done».

За образец можно взять весь трек целиком, можно только его часть. Образаем аудифайл, используя маркеры слева и справа.

А потом нажимаем «Trim and upload».

После этого трек появится в нашем личном кабинете.

Теперь снова нажимаем «Create»«From an influence».

А потом выбираем «Use an existing influence».

В личном кабинете выбираем ранее загруженный файл-образец. 

Выбираем стиль (из выпадающего списка), настроение композиции, её продолжительность и количество треков.

Запускаем генерацию (Create tracks).

Скачиваем музыкальный файл так же, как и в предыдущем случае.

После нескольких попыток генерации выбрала все-таки вот такой вариант.

Соло фортепиано

AIVA

Нейросеть MusicGPT для создания музыки

Нейросеть MusicGPT для создания музыки

MusicGPT — это онлайн-сервис на основе искусственного интеллекта, позиционируемый как мощный генератор музыки.

Он позволяет создавать музыку с помощью ИИ по текстовому описанию (промпту), причем не только инструментальные треки, но и вокальные треки. Русский язык поддерживается.

Бесплатно на месяц предоставляется 500 кредитов для генерации. Одна генерация стоит 100 кредитов, при этом создаются два варианта одной композиции. 

Регистрация

Заходим на сайт сервиса и нажимаем на кнопку «Sign up». В дальнейшем для входа на сайт можно использовать кнопку «Log In».

Авторизироваться можно с помощью аккаунта Google. Если нужна регистрация с помощью электронной почты, вписываем в предложенное поле свой адрес и нажимаем «Continue».

На почту приходит код для верификации. Вставляем его в открывшееся поле и снова нажимаем «Continue».

Дальше придется ответить на несколько вопросов от создателей сервиса. Сначала представиться — назвать своё имя.

Дальше выбираем сферу деятельности. Все предложенные варианты связаны с музыкой, я выбрала вариант с хобби.

Следующий вопрос — «Откуда Вы узнали о нас?». Выбираем подходящий сервис.

Последний вопрос: «Как Вы будете использовать сервис?». Я выбрала самый первый вариант.

Нажимаем «Continue» и завершаем регистрацию.

Генерация инструментальной музыки

Можно приступать к творчеству. В центре экрана — поле для того, чтобы добавить в него промпт — текстовое описание будущей песни. Лучше писать на английском языке.

Для того, чтобы промпт получился более подробным, а результат — наилучшим, я попросила промпт за меня написать диалоговую нейросеть Qwen. Она предложила создать рок-балладу с таким промптом:

«An epic instrumental rock ballad in the style of symphonic rock, blending elements of post-rock and progressive rock. The piece should begin with a soft, melancholic melody on clean electric guitar with subtle reverb, gradually building through layers of atmospheric synthesizers and strings, then escalating into a powerful climax featuring distorted guitars, a driving rhythm section, and grand orchestral accents. The mood should be majestic and tragic, yet infused with glimmers of hope».

Чтобы запустить генерацию, нажимаем на значок со стрелкой.

Ждём какое-то время — и получаем два варианта музыкальной композиции.

Чтобы скачать трек на ПК, нажимаем справа от него на кнопку с тремя точками, выбираем «Download», а дальше — «Full Song».

И вот моя эпичная композиция. Мне понравилось.

Эпичная рок-баллада

MusicGPT

Генерируем песню на русском языке

Попробуем сгенерировать песню на русском языке. За основу я взяла стихотворение Вероники Тушновой «Не отрекаются любя». 

Для начала во вкладке «Instrumental» записываем промпт, описывающий будущую песню (стиль, инструменты и т.д.). Я выбрала стиль инди фолк-баллады с женским вокалом. Для этого с помощью нейросети сгенерировала вот такой промпт:

«A melancholic indie folk ballad in Russian, slow tempo (60–70 BPM), sparse arrangement: soft piano, distant ambient pads, subtle cello, and delicate acoustic guitar. Female vocal, intimate and breathy, with emotional restraint — like Agnes Obel meets Novo Amor. Atmosphere: winter night, snowstorm outside, quiet apartment, longing and hope intertwined. Minimalist, clean, cinematic».

Дальше переходим во вкладку «Lyrics». Сюда надо вставить текст стихотворения. Только лучше предварительно разбить его на куплеты и припевы. Если этого не сделать, сервис тут же пропоет весь текст как один куплет за 10 секунд, а дальше запоет на английском. 

Нам этого не надо, поэтому разбиваем текст такими словами:

Куплет — Verse
Припев — Chorus
Финал — Outro

Чтобы запустить генерацию, снова нажимаем на значок со стрелкой.

Получаем два варианта песни. Скачиваем так же, как и в предыдущем случае.

И вот моя песня.

Генерация на основе другого файла

Дополнительно можно загрузить внутрь сервиса совй файл с ПК и на его основе что-то создать. Для этого нажимаем на значок со скрепкой.

Можно загрузить файл с ПК или YouTube и напеть песню (Record). Также можно взять за основу свои прошлые генерации (Creations).

В поле для промпта описываем будущий результат и запускаем генерацию.

Я добавила с ПК файл с медленной композицией на фортепиано и попросила преобразовать её в рок-балладу. 

И вот что получилось. Необычно.

Рок-баллада о свободе

MusicGPT

Нейросеть Stable Audio для создания музыки

Нейросеть Stable Audio для создания музыки

Stability AI, известная, в основном, по нейросети для генерации картинок Stable Diffusion, в 2023 году выпустила новую нейросеть Stable Audio. Как и следует из названия, она генерирует аудиоклипы.

За основу взяли ту же модель, что и в Stable Diffusion, но обучили её на музыкальных композициях вместо изображений. Всего ей скормили около 800 тысяч композиций с сайта стоковой музыки AudioSparx — или около 19 500 часов различных звуков.

Бесплатно с помощью нейросети можно создавать по 10 музыкальных композиций в месяц длиной до 3 минут.

Регистрация

Заходим на сайт сервиса и нажимаем на кнопку «Sign up» вверху справа. В дальнейшем для входа на сайт можно использовать кнопку «Log in».

Авторизироваться можно с помощью аккаунта Google. А если нужно зарегистрироваться с помощью электронной почты, указываем её адрес, придумываем пароль и нажимаем «Continue».

Дальше соглашаемся с условиями сервиса и нажимаем «Next».

Генерация музыки

Самое время приступить к созданию первого трека. 

В предложенное окно вставляем промпт для генерации — на английском языке. В «Библиотеке стилей» (Prompt Library) можно выбрать подходящий стиль. Для выбора есть такие варианты:

Progressive Trance — прогрессивный транс;
Upbeat — бодрый;
Synthpop — синти-поп;
Epic Rock — эпичный рок;
Ambient — эмбиент;
Warm — тёплый;
Chill Hop — чил-хоп;
Drum Solo — соло на барабанах;
Disco — диско;
Modern — современный;
Calm — спокойный;
House — хаус;
Classic Rock — классический рок;
Trip Hop — трип-хоп;
New-Age — нью-эйдж;
Pop — поп;
Techno — техно;
Surprise me — удиви меня.

Дальше устанавливаем продолжительность звучания трека ( до 3 минут).

Дополнительно внутрь сервиса можно загрузить с Пк фрагмент своего музыкального файла, чтобы создать на его основе что-то похожее. Бесплатно можно загружать до 3 минут аудио в месяц. Правда, при этом итоговая генерация будет длиной не более 30 секунд.

Запускаем процесс, нажав на кнопку «Generate».

Готовый трек можно прослушать и скачать на ПК. Чтобы опубликовать музыкальный шедевр и поделиться ссылкой на него, нажимаем на кнопку «Share track».

Файл сохраняется в формате MP3.

А это окошко для публикации и распространения аудио. Сначала нажимаем на кнопку «Generate link».

А потом — «Copi link».

Во вкладке «Embed» можно взять код для встраивания трека на страницу сайта или блога.

Вот мой трек, созданный с помощью сервиса.

А промпт был вот такой: «upbeat, energetic, and optimistic rock-pop track with a driving rhythm, catchy melodies, and a vibrant atmosphere. The music should feature punchy drums, rhythmic electric guitar riffs, warm basslines, and bright piano or synth accents. Aim for a tempo around 100120 BPM, with a clear verse-chorus structure and a dynamic, radio-friendly sound. The mood should be joyful, confident, and upliftingperfect for a feel-good montage, commercial, or opening sequence. Keep the instrumentation tight and modern, with clean production and a touch of reverb for depth, but maintain clarity and forward momentum throughout the track».

А это ещё один пример генерации — уже на основе загруженного аудио. 

Это промпт: «Upbeat, cheerful pop track with a catchy melody, driving beat, and bright synths. Features bouncy bassline, crisp handclaps, sparkling vocal harmonies, and an infectious chorus. Tempo around 120 BPM, in a major key, evoking feelings of joy, summer days, and carefree dancing. Clean production, modern radio-friendly sound, suitable for a feel-good playlist».

Как создавать промпты

Промпты я писала не сама — мне помогала нейросеть Qwen. Сначала я попросила оптимистичную ритмичную музыку в стиле поп-рок, а потом — энергичную танцевальную музыку в стиле поп. И в итоге получила неплохие такие промпты, которые помогли создать первые нетленки.

Создатели сервиса предлагают при создании промпта прописывать такие позиции: 

1. Формат : Solo, Band, Orchestra, Chorus, Duet  (соло-инструмент, группа, оркестр, хор, дуэт).

2. Жанр музыки: Rock, Pop, Hip Hop, Indie, RnB и др. (рок, поп, хип-хоп, инди, ар-н-би и др.).

3. Поджанры: Drum loops, Electric guitar, Pop Music, Chillout, Ambient, Techno (барабанная петля, электрогитара, поп-музыка, чилаут, эмбиент, техно).

4. Инструменты: Piano, Drum machine, Synthesizer, Snare drum, Organ, Strings, Percussion, Ukelele и т.д. (пианино, драм-машина, синтезатор, малый барабан, орган, перкуссия, укулеле и т.д.).

5.  Настроение: Dramatic, Inspiring, Magical, Uplifting,  Driving,  Atmospheric, Happy и т.д. (драматичное, вдохновляющее, волшебное, воодушевляющее, побуждающее, атмосферное, счастливое и т.д.).

6. Стили: Film Instrumental, 2000s, 1960s, Dance, Video Games, High Tech,
Sci-Fi (инструментал из фильма, музыка 2000-х, 1960-х, танцевальная музыка, видеоигры, высокие технологии, научная фантастика).

7. Темп: Medium, Slow, Fast, Very Fast (средний, медленный, быстрый, очень быстрый).

AudoStudio. Улучшаем аудиозапись с помощью нейросети

AudoStudio. Улучшаем аудиозапись с помощью нейросети

С помощью онлайн-сервиса Audo Studio можно автоматически улучшить практически любую аудиозапись. Эта нейросеть удаляет фоновый шум и улучшает звучание речи, выравнивая громкость.

Бесплатно в Audo Studio разрешается обрабатывать до 20 минут записей в месяц.

Для работы с сервисом надо зайти на сайт сервиса и зарегистрироваться. Для этого нажимаем «Sign Up». Зарегистрированнеы пользователи могут попасть внутрь сервиса с помощью кнопки «Login».

Зарегистрироваться можно, используя аккаунт Google или адрес электронной почты.

Во втором случае вписываем в форму регистрации адрес электронной почты, придумываем пароль. Нажимаем «Submit».

На указанный адрес электронной почты придёт письмо для подтвержения аккаунта. Нажимаем на кнопку «Confirm Email».

А дальше осталось только зайти на сайт — нажимаем «Login».

И ещё придётся ответить на пару вопросов от создателей сервиса: как мы узнали о них и как собираемся использовать сервис. Выбираем нужные варианты ответов и нажимаем «Get Started».

Мы наконец попадаем в личный кабинет. Здесь уже можно загрузить исходный файл с шумами и дефектами, который мы хотим улучшить.

Допускаются файлы практически всех известных аудио- и даже видеоформатов. Для загрузки нажимаем на зелёный значок в центре экрана.

Справа отмечаем, какие улучшения мы хотим приметь к файлу: автоматическая громкость (Auto Volume) или удаление фонового шума — Reduce Background Noise (во втором случае устанавливаем интенсивность удаления). Чтобы запустить нейросеть, нажимаем «Apply».

Обработанную запись можно прослушать и скачать на ПК. Чтобы загрузить для обработки новый файл, нажимаем на кнопку «New File».

Давайте теперь сравнивать. Это запись до обработки. 

Раиса Троянкер "Самому родному"

А это — после. 

Раиса Троянкер "Самому родному"

Audo Studio

Как улучшить запись голоса с помощью Adobe Podcast?

Как улучшить запись голоса с помощью Adobe Podcast?

Сервис Adobe Podcast с функцией Enhance speech — это нейросеть от Adobe, которая может улучшить запись с диктофона и  приблизить ее по звучанию к дикторской версии, записанной в студии.

Нам при этом ничего делать не нужно, нейросеть всё сделает сама. 

Для обработки лучше выбирать записи, сделанные на микрофон, с небольшими помехами («белый шум», треск, шорох и т.д.), которые нужно удалить.

Для работы с сервисом надо зайти в аккаунт Adobe или зарегистрироваться, если его пока нет. Для этого нажимаем «Sign up». Вход для зарегистрированных — «Sign in».

Вписываем в форму регистрации адрес электронной почты, придумываем сложный пароль с цифрами и буквами — строчными и прописными. Нажимаем «Продолжить».

Можно зарегистрироваться с помощью аккаунтов Google, Microsoft или Apple.

Дальше указываем имя, фамилию и дату рождения (месяц и год). Нажимаем «Создать учетную запись».

Дальше придётся подтверждать, что мы не робот. Нажимаем «Start puzzle».

В качестве доказательства нужно было выстроить две фигуры в одинаковом направлении. Собираем этот пазл, «перебирая» карточки справа с помощью стрелок. Если пара собрана верно. Нажимаем «Submit».

Если все решено верно, нас допустят в личный кабинет. Здесь уже можно загрузить исходный файл с шумами и дефектами, который мы хотим улучшить.

Допускаются файлы в форматах МР3 или WAV, весом не более 500 Mb, продолжительностью до 30 минут. Для загрузки нажимаем «Choose files».

Ждём, когда нейросеть закончит обработку… Это может занять до 10 минут.

После обработки можно скачать полученный файл на ПК, нажав на кнопку  «Download».

В день с помощью нейросети можно обрабатывать не более одного часа звукозаписи.

Давайте теперь сравнивать. Это запись до обработки.

Юлия Друнина "Два вечера"

А это — после.

Юлия Друнина "Два вечера"

Adobe Podcast

Сервис AI Books для озвучивания текстов

Сервис AI Books для озвучивания текстов

AI Books – это новый проект компании «Директ-Медиа», который предлагает набор инструментов для копирования голосов и озвучивания текстов, а также доступ к GPT чату от OpenAI в России.

О возможностях ChatGPT я уже писала в одном из прошлых постов. Сегодня расскажу об озвучивании текстов с помощью сервиса.

Доступ к сервису платный. Пополнить баланс можно с помощью российской карты, минимальный платёж — 10 рублей. 

Напомню, как можно зарегистрироваться внутри сервиса и приступить к работе.

Регистрация

Заходим на сайт сервиса, нажимаем на кнопку «Регистрация»

Указываем своё имя, адрес электронной почты и придумываем пароль. Нажимаем на кнопку «Создать аккаунт».

На указанный номер придёт SMS с кодом. Код вписываем в открывшееся окно, нажимаем «Отправить» — и попадаем внутрь сервиса.

Для начала нужно пополнить баланс. Для этого переходим во вкладку  «Баланс» . Выбираем способ пополнения счёта, например, банковской картой, указываем любую сумму от 10 рублей и нажимаем «Пополнить».

Откроется окошко для оплаты. После завершения платежа сумма поступает на счёт, а мы возвращается на сайт сервиса.

И для работы открываем вкладку «Озвучить».

Как озвучивать текст?

Чтобы начать озвучку, в предложенное окно вставляем текст (до 5 тысяч символов), выбираем язык и голос для озвучивания.

Голос можно настроить, выбрав интонацию (нейиральная, строгая или добрая), скорость речи и высоту тона.

Чтобы результат получился качественным, можно проставить ударения в сложных словах (значок + перед ударной гласной), написать слова не так, как они пишутся, а так, как произносятся.

Сервис предлагает опцию «Подготовка текста». С ее помощью можно расшифровать числительные и аббревиатуры.

Закончив с настройками, нажимаем на кнопку «Озвучить».

Готовый результат можно скачать на ПК.

А это то, что у меня получилось. По-моему, очень достойно. 

Кольский мост

AI Books

Озвучивание «своим голосом»

Можно озвучить текст, используя другие голоса. Для этого у сервиса есть фунция «Мои голоса».

Как она работает? Для начала нам нужен небольшой аудиофайл с записью того голоса, который мы хотим использовать в озвучке.

Дальше вставляем в поле текст для озвучки и нажимаем на кнопку «Мои голоса» и выбираем «Создать».

Даём голосу название и загружаем аудиофайл с ПК. Нажимаем «Создать».

Теперь снова возвращаемся к нашему тексту. В разделе «Мои голоса» выбираем тот голос, который только что создали.

Справа открываются настройки.

Здесь можно определить скорость речи и уровень похожести голоса. Чтобы запустить озвучку, нажимаем на кнопку «Озвучить».

Готовый результат можно скачать. Вот так звучит мой Шерлок Холмс. Голос звучит, правда, более молодо, но хрипотца передается. И интонация интересная.

Шерлок Холмс

AI Books

А это Николай Дроздов рассказывает об услугах библиотеки. 

Никлолай Дроздов

AI Books