Звукограм — это российский сервис для озвучивания текста с помощью искусственного интеллекта.
Чтобы протестировать сервис, можно воспользоваться бесплатным тарифным планом. С его помощью можно озвучить 2000 символов обычным голосом и 10000 — премиальным.
Платные тарифы стартуют от 150 рублей.
Кроме того, среди большой звуковой базы сервиса можно найти и материалы для многих библиотечных аудио- и видеопроектов. Например, для создания презентации о животных Кольского Севера могут пригодиться звуки голосов полярной гагары, глухаря, белого медведя, тюленя и т.д.
Регистрация
Заходим на сайт сервиса и нажимаем на кнопку «Вход» (справа вверху).
Для регистрации надо указать адрес электронной почты и придумать пароль. После этого нажимаем на кнопку «Зарегистрироваться».
На указанную почту придет письмо со ссылкой для активации. Переходим по ней.
Осталось пройти капчу, решив небольшой пример. Вписываем нужное число и нажимаем «Активировать».
Как озвучивать текст?
Переходим во вкладку «Озвучка текста». Перед нами — поле для того, чтобы вписать текстовый фрагмант для озвучки.
По умолчанию в поле стоит примерный текст. Удаляем его нажатием на иконку метлы или вы на клавиатуре. Вставляем свой текст из буфера обмена или печатаем.
Вверху, над текстом, — несколько кнопок для подготовки его к озвучке.
1 — вставка одиночной паузы. По умолчанию это будет небольшая одиночная пауза. Но можно удлинить её. Для этого в месте планируемой паузы вставляем <break time=″1000ms″/> и указываем необходимое время. Значение 1000ms равно одной секунде. Соответственно каждая прибавленная тысяча будет равна ещё одной секунде.
2 — очистка. В один клик убираем введённый текс, чтобы вставить новый.
3 — шаг назад. Так можно вернуться к старому тексту. Если вводили текст вручную в окне, то будет удаляться по одной букве.
4 — шаг вперёд. Если удалили введённый ранее текст, то можно получить его обратно. Если вводили текст вручную, то текст будет появляться по одной букве.
5 — управление интонацией. Выбираем слово или фрагмент тексты, выделяем его «мышкой» и нажимаем на эту кнопку. Откроется окно, в котором вручную можно изменить интонацию.
6 — акцент, логическое ударение. Полезная штука для привлечение внимания к слову. Чтобы поставить логическое ударение, выделяем слово и нажимаем на эту кнопку. При это появляется служебная надпись: <prosody volume=″+20″>выделенное слово</prosody>. Акцент достигается за счёт усиления голоса. И появляющиеся данные усиления +20 можно изменить в в большую или меньшую сторону.
7 — экспертная опция для разметки текста. На первых порах пользоваться ей необязательно.
8 — выбор диктора. Пригодится, если текст нужно озвучить разными голосами. Выделяем фрагмент текста, выбираем диктора и нажимаем на кнопку «Обернуть».
9 — обрезка. Звукограм создает из текста цельный аудиофайл в форматах MP3, WAV и OGG. Но для монтажа роликов или подкастов часто нужны отдельные фрагменты — система умеет автоматически разрезать озвученный текст на куски.
Ставим курсор в нужное место и нажимаем кнопку разделения на панели меню. Кнопка вставляет специальный тег <obrezka/>. Можно копировать его и расставлять по тексту вручную — где поставите тег, там аудио и разрежется.
После добавления хотя бы одного тега в озвученном файле появится кнопка «скачать отрезки». Так можно не заниматься самостоятельно разрезкой аудиофайла на фрагменты, а поручить это сервису.
10 — позволяет добавлять звуки внутрь текста из базы сервиса.
Еще несколько полезных советов для подготовки текста.
Чаще всего дикторы правильно расставляют ударения. Но в русском языке встречается много слов, где ударение на другую гласную полностью меняет смысл слова. Самый простой способ установки ударения — поставить знак + перед ударной буквой.
В редких случаях с географическими названиями, фамилиями это не всегда помогает. Тогда можно воспользоваться опцией SSML. Ставим знак + перед ударной буквой, выделяем слово и нажимаем на «SSML», дальше нажимаем на «phoneme». Система сгенерируют фонетический разбор слова, каждую букву можно изменить.
Можно написать сложные слова не так, как они пишутся, а так, как произносятся, например: проект, шоссе и т.д.
Если в процессе разметки мы еще не выбрали диктора, это можно сделать в верхнем меню. Рядом кнопки для изменения высоты тона и скорости речи.
Чтобы запустить процесс создания озвучки, нажимаем внизу на кнопку «Озвучить текст».
Готовый аудиофайл можно скачать.
С первой попытки получилось не безупречно, но все-таки неплохо.
Одного жаль: к сожалению, токены не пополняются. И как только они закончатся, придется либо переходить на платный тариф, либо заводить новый аккаунт.
Рассказ о музее Есенина
База звуков
У сервиса есть хорошая библиотека звуковых файлов, которые можно использовать в своих проектах.
Чтобы открыть коллекцию, переходим в раздел «Звуки». Все файлы рассортированы по категориям. Для быстроты работает поиск.
Любой понравившийся звук можно скачать на ПК.











