Звукограм — это российский сервис для озвучивания текста с помощью искусственного интеллекта.

Чтобы протестировать сервис, можно воспользоваться бесплатным тарифным планом. С его помощью можно озвучить 2000 символов обычным голосом и 10000 — премиальным.

Платные тарифы стартуют от 150 рублей.

Кроме того, среди большой звуковой базы сервиса можно найти и материалы для многих библиотечных аудио- и видеопроектов. Например, для создания презентации о животных Кольского Севера могут пригодиться звуки голосов полярной гагары, глухаря, белого медведя, тюленя и т.д.

Регистрация

Заходим на сайт сервиса и нажимаем на кнопку «Вход» (справа вверху).

Для регистрации надо указать адрес электронной почты и придумать пароль. После этого нажимаем на кнопку «Зарегистрироваться».

На указанную почту придет письмо со ссылкой для активации. Переходим по ней.

Осталось пройти капчу, решив небольшой пример. Вписываем нужное число и нажимаем «Активировать».

Как озвучивать текст?

Переходим во вкладку «Озвучка текста». Перед нами — поле для того, чтобы вписать текстовый фрагмант для озвучки.

По умолчанию в поле стоит примерный текст. Удаляем его нажатием на иконку метлы или вы на клавиатуре. Вставляем свой текст из буфера обмена или печатаем.

Вверху, над текстом, — несколько кнопок для подготовки его к озвучке.

1 — вставка одиночной паузы. По умолчанию это будет небольшая одиночная пауза. Но можно удлинить её. Для этого в месте планируемой паузы вставляем <break time=″1000ms″/> и указываем необходимое время. Значение 1000ms равно одной секунде. Соответственно каждая прибавленная тысяча будет равна ещё одной секунде.

2 — очистка. В один клик убираем введённый текс, чтобы вставить новый.

3 — шаг назад. Так можно вернуться к старому тексту. Если вводили текст вручную в окне, то будет удаляться по одной букве.

4 — шаг вперёд. Если удалили введённый ранее текст, то можно получить его обратно. Если вводили текст вручную, то текст будет появляться по одной букве.

5 — управление интонацией. Выбираем слово или фрагмент тексты, выделяем его «мышкой» и нажимаем на эту кнопку. Откроется окно, в котором вручную можно изменить интонацию.

6 — акцент, логическое ударение. Полезная штука для привлечение внимания к слову. Чтобы поставить логическое ударение, выделяем слово и нажимаем на эту кнопку. При это появляется служебная надпись: <prosody volume=″+20″>выделенное слово</prosody>. Акцент достигается за счёт усиления голоса. И появляющиеся данные усиления +20 можно изменить в в большую или меньшую сторону.

7 — экспертная опция для разметки текста. На первых порах пользоваться ей необязательно.

8 — выбор диктора. Пригодится, если текст нужно озвучить разными голосами. Выделяем фрагмент текста, выбираем диктора и нажимаем на кнопку «Обернуть».

9 — обрезка. Звукограм создает из текста цельный аудиофайл в форматах MP3, WAV и OGG. Но для монтажа роликов или подкастов часто нужны отдельные фрагменты — система умеет автоматически разрезать озвученный текст на куски.

Ставим курсор в нужное место и нажимаем кнопку разделения на панели меню. Кнопка вставляет специальный тег <obrezka/>. Можно копировать его и расставлять по тексту вручную — где поставите тег, там аудио и разрежется.

После добавления хотя бы одного тега в озвученном файле появится кнопка «скачать отрезки». Так можно не заниматься самостоятельно разрезкой аудиофайла на фрагменты, а поручить это сервису.

10 — позволяет добавлять звуки внутрь текста из базы сервиса.

Еще несколько полезных советов для подготовки текста.

Чаще всего дикторы правильно расставляют ударения. Но в русском языке встречается много слов, где ударение на другую гласную полностью меняет смысл слова. Самый простой способ установки ударения — поставить знак + перед ударной буквой.

В редких случаях с географическими названиями, фамилиями это не всегда помогает. Тогда можно воспользоваться опцией SSML. Ставим знак + перед ударной буквой, выделяем слово и нажимаем на «SSML», дальше нажимаем на «phoneme». Система сгенерируют фонетический разбор слова, каждую букву можно изменить.

Можно написать сложные слова не так, как они пишутся, а так, как произносятся, например: проект, шоссе и т.д.

Если в процессе разметки мы еще не выбрали диктора, это можно сделать в верхнем меню. Рядом кнопки для изменения высоты тона и скорости речи.

Чтобы запустить процесс создания озвучки, нажимаем внизу на кнопку «Озвучить текст».

Готовый аудиофайл можно скачать.

С первой попытки получилось не безупречно, но все-таки неплохо.

Одного жаль: к сожалению, токены не пополняются. И как только они закончатся, придется либо переходить на платный тариф, либо заводить новый аккаунт.

Рассказ о музее Есенина

Звукограм

База звуков

У сервиса есть хорошая библиотека звуковых файлов, которые можно использовать в своих проектах.

Чтобы открыть коллекцию, переходим в раздел «Звуки». Все файлы рассортированы по категориям. Для быстроты работает поиск.

Любой понравившийся звук можно скачать на ПК.