Синтез речи на базе Yandex SpeechKit Cloud
Содержание
Введение
Yandex SpeechKit Cloud — это облачный сервис, открывающий разработчикам доступ к речевым технологиям Яндекса. В этой статье мы поговорим про синтез речи.
Технология синтеза речи позволяет переводить текст в речь (звуковой файл). Задача актуальна для озвучивания динамически обновляемой информации или быстро меняющихся данных, таких как остаток товаров на складе, репертуар кинотеатров и так далее. Технология синтеза речи Яндекса построена на базе скрытых марковских моделей (HMM). За счет применения статистического подхода в акустическом моделировании удается достичь естественных плавных интонаций. Технология позволяет достаточно быстро создавать новые голоса и синтезировать различные эмоции.
Синтез речи Яндекса позволяет выбрать:
- мужской или женский голос для озвучивания;
- эмоции: добрый, злой, нейтральный голос.
Документация по API синтеза речи Yandex SpeechKit доступна на сайте https://tech.yandex.ru/speechkit/cloud/doc/dg/concepts/speechkit-dg-tts-docpage/
Быстрый старт
Для использования системы синтеза речи Yandex SpeechKit Cloud выполните следующие действия:
Шаг 1. Скачайте и импортируйте следующий сценарий. Сценарий позволяет преобразовывать текст в звуковой файл, и воспроизводить его абоненту.
Скачать сценарий: Синтез речи Yandex SpeechKit Cloud.oscr
После импорта сценария сохраните его.
Шаг 2. Получите API-ключ на использование сервиса в кабинете разработчика. После получения присвойте этот ключ переменной key (строковая) в компоненте SpeechKit Key установленного сценария.
Шаг 3. Для использования сервиса используйте компонент "Запуск сценария" в IVR сценарии. В свойствах компонента выберите
Тип запуска - Вложенный Сценарий - выберите сценарий "Синтез речи Google" Параметр запуска - введите ваш текст для воспроизведения. В примере, строка "Здравствуйте! Вас приветствует компания Телефонные Системы!" Возврат управления - Да