Распознавание речи с помощью Yandex SpeechKit Сloud — различия между версиями

Версия 12:07, 2 июля 2014

Yandex ASR Сloud – сервис для распознавания голосовых запросов на русском языке. Это платный модуль, для использования которого необходимо заключить договор с Яндексом. Стоимость зависит от количества запросов в сутки.

Скачать шаблон договора (.doc) - шаблон договора в приложении
Отправить заявку на подключение модуля: sheechkit@yandex-team.ru

Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда управление с помощью тонального набора неудобно. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор из большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:

Система: Здравствуйте. Куда вы хотите лететь?
Абонент: Казань
Система: Откуда вы хотите лететь?
Абонент: Москва
Система: Назовите дату вылета
Абонент: 10 апреля

Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.

Распознавание голосовых запросов применяется во многих системах, например, для:

Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
Распознавания адреса для доставки
Автоматической голосовой аутентификации пользователей при запросе персонализированной или конфиденциальной информации по телефону или через интернет
Справочной системы информационного обслуживания
Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)

Система распознавания речи:

Автоматизирует определенные задачи по обработке входящих звонков
Упростит взаимодействие клиента с системой
Сократит суммарное время ожидания клиента на линии
Высвободит ресурсы операторов

Система распознавания речи, как правило, состоит из следующих частей:

Запись сообщения от абонента
Распознавание речи и прием текстовых данных от сервиса
Анализ полученной информации и выполнение необходимых действий

Для использования Yandex ASR Cloud в вашей системе выполните следующие действия:

Шаг 1. Для получения API-ключа отправьте e-mail на адрес speechkit@yandex-team.ru, с кратким описанием задачи, которую Вы собираетесь решать с помощью Yandex ASR Cloud.

Тестовый период (бесплатный) – 2 недели с момента получения ключа.

Шаг 2. Скачайте и импортируйте сценарии в вашу систему Oktell.

Скачать сценарий: Yandex_SpeechKit_Recognition_IVR.zip (для версий Oktell старше 2.10)

В архиве располагаются два сценария:

Yandex_SpeechKit_Recognition_main - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
Yandex_SpeechKit_Recognition_IVR - сценарий для отправки записи на сервис Яндекса и приема распознанного сообщения.

После импорта сценариев в Oktell, сохраните их "На сервер"

Шаг 3. В сценарии Yandex_SpeechKit_Recognition_IVR в компоненте "Required params" определите следующие параметры:

uuid - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки.
key - API-ключ для подключения к сервису Yandex ASR Cloud.
topic - тема голосового сообщения, параметр влияет на качество распознавания. Возможны 4 варианта:
- freeform - диктовка текста, СМС, email, заметки
- general - распознавание поисковых запросов и коротких фраз на различные тематики
- maps - распознавание адресов, названий организаций и различных географических объектов
- music - распознавание названий песен, исполнителей, групп

По умолчанию, в компоненте используются тестовые данные от разработчиков. После изменения данных, сохраните сценарий "На сервер".

Шаг.4. В модуле "Администрирование" - "Внутренние номера" добавьте внутренний номер с типом "Запуск IVR". Выберите IVR-сценарий Yandex_SpeechKit_Recognition_main.

Нажмите "Сохранить". Затем "Применить".

Шаг 5. При звонке на заданный номер, проговорите сообщение. В конце нажмите "*". Через несколько секунд появятся уведомления с распознанным текстом.

Полученный текст передается в переменной parse_bestText, которую затем можно проанализировать и выполнить необходимые действия. Используйте пример Yandex_SpeechKit_Recognition_main для использования сервиса распознавания в главном сценарии.

Шаг 6. Если Вас устраивает тест, Вы заключаете договор с Яндексом. Отчетный период начинается с даты подписания договора. Оплата происходит по окончанию отчетного периода на основании подписанного акта.

Дополнение: Также вы можете скачать служебный сценарий интеграции с системой Yandex SpeechKit. Сценарий может использоваться для off-line распознавания голосовых файлов. На вход сценария необходимо передать путь к файлу с записью.

Скачать сценарии: Yandex_SpeechKit_Recognition.zip (для версий Oktell старше 2.10)

@@ Строка 1: / Строка 1: @@
 [[Практики|Наверх]]
-'''Yandex SpeechKit''' - система для распознавания голосовых запросов на русском языке.
-Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда <u>не применимо управление с помощью тонального набора</u>. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
+[[Файл:Yandex_ASR_Cloud.png|500px]]
+'''Yandex ASR Сloud''' – сервис для распознавания голосовых запросов на русском языке. Это платный модуль, для использования которого необходимо заключить договор с Яндексом. Стоимость зависит от количества запросов в сутки.
+ Скачать шаблон договора (.doc) - шаблон договора в приложении
+ Отправить заявку на подключение модуля: sheechkit@yandex-team.ru
+Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда <u>управление с помощью тонального набора неудобно</u>. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор из большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
   <span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь?
@@ Строка 14: / Строка 21: @@
 Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.
-Система распознавания голосовых запросов применяется во многих системах, например, для:
+Распознавание голосовых запросов применяется во многих системах, например, для:
 * Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
 * Распознавания адреса для доставки
@@ Строка 21: / Строка 28: @@
 * Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)
+Система распознавания речи:
+*Автоматизирует определенные задачи по обработке входящих звонков
+*Упростит взаимодействие клиента с  системой
+*Сократит суммарное время ожидания клиента на линии
+*Высвободит ресурсы операторов
 Система распознавания речи, как правило, состоит из следующих частей:
 * Запись сообщения от абонента
-* Распознавание голоса и прием текстовых данных от сервиса
+* Распознавание речи и прием текстовых данных от сервиса
 * Анализ полученной информации и выполнение необходимых действий
-Для использования '''Yandex SpeechKit''' в вашей системе выполните следующие действия:
+Для использования '''Yandex ASR Cloud''' в вашей системе выполните следующие действия:
-'''Шаг 1.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''.
+'''Шаг 1.''' Для получения API-ключа отправьте e-mail на адрес speechkit@yandex-team.ru, с кратким описанием задачи, которую Вы собираетесь решать с помощью Yandex ASR Cloud.
+Тестовый период (бесплатный) – 2 недели с момента получения ключа.
+'''Шаг 2.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''.
 '''Скачать сценарий:''' [http://wiki.oktell.ru/images/f/f1/Yandex_SpeechKit_Recognition_IVR.zip Yandex_SpeechKit_Recognition_IVR.zip] (для версий '''Oktell''' старше 2.10)
@@ Строка 42: / Строка 59: @@
-'''Шаг 2.''' В сценарии '''Yandex_SpeechKit_Recognition_IVR''' в компоненте "'''Required params'''" определите следующие параметры:
+'''Шаг 3.''' В сценарии '''Yandex_SpeechKit_Recognition_IVR''' в компоненте "'''Required params'''" определите следующие параметры:
 *'''uuid''' - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки.
-*'''key''' - специальный ключ для подключения к сервису '''Yandex SpeechKit'''. Запросить ключ можно по почте '''speechkit@yandex‐team.ru''' или на сайте разработчиков.
+*'''key''' - API-ключ для подключения к сервису '''Yandex ASR Cloud'''.
 *'''topic''' - тема голосового сообщения, параметр влияет на качество распознавания. Возможны 4 варианта:
-**'''freeform''' - свободная форма (SMS, заметка и др.)
+**'''freeform''' - диктовка текста, СМС, email, заметки
-**'''general''' - запросы для поиска в Интернете
+**'''general''' - распознавание поисковых запросов и коротких фраз на различные тематики
-**'''maps''' - географические названия (адрес, место, названия ресторанов и др.)
+**'''maps''' - распознавание адресов, названий организаций и различных географических объектов
-**'''music''' - музыкальные названия (музыкальные группы, названия песен, певцы и др.)
+**'''music''' - распознавание названий песен, исполнителей, групп
 По умолчанию, в компоненте используются тестовые данные от разработчиков. После изменения данных, сохраните сценарий "'''На сервер'''".
@@ Строка 58: / Строка 75: @@
-'''Шаг 3.''' В модуле "'''Администрирование'''" - "'''Внутренние номера'''" добавьте внутренний номер с типом "'''Запуск IVR'''". Выберите IVR-сценарий '''Yandex_SpeechKit_Recognition_main'''.
+'''Шаг.4.''' В модуле "'''Администрирование'''" - "'''Внутренние номера'''" добавьте внутренний номер с типом "'''Запуск IVR'''". Выберите IVR-сценарий '''Yandex_SpeechKit_Recognition_main'''.
@@ Строка 67: / Строка 84: @@
-'''Шаг 4.''' При звонке на заданный номер, проговорите сообщение. В конце нажмите "'''*'''". Через несколько секунд появятся уведомления с распознанным текстом.
+'''Шаг 5.''' При звонке на заданный номер, проговорите сообщение. В конце нажмите "'''*'''". Через несколько секунд появятся уведомления с распознанным текстом.
@@ Строка 74: / Строка 91: @@
 Полученный текст передается в переменной '''parse_bestText''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример '''Yandex_SpeechKit_Recognition_main''' для использования сервиса распознавания в главном сценарии.
+'''Шаг 6.'''  Если Вас устраивает тест, Вы заключаете договор с Яндексом. Отчетный период начинается с даты подписания договора. Оплата происходит по окончанию отчетного периода на основании подписанного акта.

Распознавание речи с помощью Yandex SpeechKit Сloud — различия между версиями

Версия 12:07, 2 июля 2014

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

IP-платформа Oktell

Примеры использования

Настройка

Инструменты