Распознавание речи с помощью Yandex SpeechKit Сloud — различия между версиями

Материал из Oktell
Перейти к: навигация, поиск
Строка 1: Строка 1:
 
[[Практики|Наверх]]
 
[[Практики|Наверх]]
  
'''Yandex SpeechKit''' - система для распознавания голосовых запросов на русском языке.
 
  
Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда <u>не применимо управление с помощью тонального набора</u>. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор их большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
+
[[Файл:Yandex_ASR_Cloud.png|500px]]
 +
 
 +
 
 +
'''Yandex ASR Сloud''' – сервис для распознавания голосовых запросов на русском языке. Это платный модуль, для использования которого необходимо заключить договор с Яндексом. Стоимость зависит от количества запросов в сутки.
 +
 
 +
Скачать шаблон договора (.doc) - шаблон договора в приложении
 +
Отправить заявку на подключение модуля: sheechkit@yandex-team.ru
 +
 
 +
Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда <u>управление с помощью тонального набора неудобно</u>. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор из большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:
  
 
  <span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь?
 
  <span style="color:darkred">Система:</span> Здравствуйте. Куда вы хотите лететь?
Строка 14: Строка 21:
 
Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.  
 
Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.  
  
Система распознавания голосовых запросов применяется во многих системах, например, для:
+
Распознавание голосовых запросов применяется во многих системах, например, для:
 
* Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
 
* Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
 
* Распознавания адреса для доставки
 
* Распознавания адреса для доставки
Строка 21: Строка 28:
 
* Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)
 
* Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)
  
 +
Система распознавания речи:
 +
*Автоматизирует определенные задачи по обработке входящих звонков
 +
*Упростит взаимодействие клиента с  системой
 +
*Сократит суммарное время ожидания клиента на линии
 +
*Высвободит ресурсы операторов
  
 
Система распознавания речи, как правило, состоит из следующих частей:
 
Система распознавания речи, как правило, состоит из следующих частей:
 
* Запись сообщения от абонента  
 
* Запись сообщения от абонента  
* Распознавание голоса и прием текстовых данных от сервиса
+
* Распознавание речи и прием текстовых данных от сервиса
 
* Анализ полученной информации и выполнение необходимых действий
 
* Анализ полученной информации и выполнение необходимых действий
  
  
Для использования '''Yandex SpeechKit''' в вашей системе выполните следующие действия:
+
Для использования '''Yandex ASR Cloud''' в вашей системе выполните следующие действия:
  
  
'''Шаг 1.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''.  
+
'''Шаг 1.''' Для получения API-ключа отправьте e-mail на адрес speechkit@yandex-team.ru, с кратким описанием задачи, которую Вы собираетесь решать с помощью Yandex ASR Cloud.
 +
 
 +
Тестовый период (бесплатный) – 2 недели с момента получения ключа.
 +
 
 +
 
 +
'''Шаг 2.''' Скачайте и импортируйте сценарии в вашу систему '''Oktell'''.  
  
 
'''Скачать сценарий:''' [http://wiki.oktell.ru/images/f/f1/Yandex_SpeechKit_Recognition_IVR.zip Yandex_SpeechKit_Recognition_IVR.zip] (для версий '''Oktell''' старше 2.10)
 
'''Скачать сценарий:''' [http://wiki.oktell.ru/images/f/f1/Yandex_SpeechKit_Recognition_IVR.zip Yandex_SpeechKit_Recognition_IVR.zip] (для версий '''Oktell''' старше 2.10)
Строка 42: Строка 59:
  
  
'''Шаг 2.''' В сценарии '''Yandex_SpeechKit_Recognition_IVR''' в компоненте "'''Required params'''" определите следующие параметры:
+
'''Шаг 3.''' В сценарии '''Yandex_SpeechKit_Recognition_IVR''' в компоненте "'''Required params'''" определите следующие параметры:
 
*'''uuid''' - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки.
 
*'''uuid''' - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки.
*'''key''' - специальный ключ для подключения к сервису '''Yandex SpeechKit'''. Запросить ключ можно по почте '''speechkit@yandex‐team.ru''' или на сайте разработчиков.  
+
*'''key''' - API-ключ для подключения к сервису '''Yandex ASR Cloud'''.  
 
*'''topic''' - тема голосового сообщения, параметр влияет на качество распознавания. Возможны 4 варианта:
 
*'''topic''' - тема голосового сообщения, параметр влияет на качество распознавания. Возможны 4 варианта:
**'''freeform''' - свободная форма (SMS, заметка и др.)
+
**'''freeform''' - диктовка текста, СМС, email, заметки
**'''general''' - запросы для поиска в Интернете
+
**'''general''' - распознавание поисковых запросов и коротких фраз на различные тематики
**'''maps''' - географические названия (адрес, место, названия ресторанов и др.)
+
**'''maps''' - распознавание адресов, названий организаций и различных географических объектов
**'''music''' - музыкальные названия (музыкальные группы, названия песен, певцы и др.)
+
**'''music''' - распознавание названий песен, исполнителей, групп
  
 
По умолчанию, в компоненте используются тестовые данные от разработчиков. После изменения данных, сохраните сценарий "'''На сервер'''".
 
По умолчанию, в компоненте используются тестовые данные от разработчиков. После изменения данных, сохраните сценарий "'''На сервер'''".
Строка 58: Строка 75:
  
  
'''Шаг 3.''' В модуле "'''Администрирование'''" - "'''Внутренние номера'''" добавьте внутренний номер с типом "'''Запуск IVR'''". Выберите IVR-сценарий '''Yandex_SpeechKit_Recognition_main'''.  
+
'''Шаг.4.''' В модуле "'''Администрирование'''" - "'''Внутренние номера'''" добавьте внутренний номер с типом "'''Запуск IVR'''". Выберите IVR-сценарий '''Yandex_SpeechKit_Recognition_main'''.  
  
  
Строка 67: Строка 84:
  
  
'''Шаг 4.''' При звонке на заданный номер, проговорите сообщение. В конце нажмите "'''*'''". Через несколько секунд появятся уведомления с распознанным текстом.  
+
'''Шаг 5.''' При звонке на заданный номер, проговорите сообщение. В конце нажмите "'''*'''". Через несколько секунд появятся уведомления с распознанным текстом.  
  
  
Строка 74: Строка 91:
  
 
Полученный текст передается в переменной '''parse_bestText''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример '''Yandex_SpeechKit_Recognition_main''' для использования сервиса распознавания в главном сценарии.
 
Полученный текст передается в переменной '''parse_bestText''', которую затем можно проанализировать и выполнить необходимые действия. Используйте пример '''Yandex_SpeechKit_Recognition_main''' для использования сервиса распознавания в главном сценарии.
 +
 +
 +
'''Шаг 6.'''  Если Вас устраивает тест, Вы заключаете договор с Яндексом. Отчетный период начинается с даты подписания договора. Оплата происходит по окончанию отчетного периода на основании подписанного акта.
  
  

Версия 12:07, 2 июля 2014

Наверх


Yandex ASR Cloud.png


Yandex ASR Сloud – сервис для распознавания голосовых запросов на русском языке. Это платный модуль, для использования которого необходимо заключить договор с Яндексом. Стоимость зависит от количества запросов в сутки.

Скачать шаблон договора (.doc) - шаблон договора в приложении
Отправить заявку на подключение модуля: sheechkit@yandex-team.ru 

Распознавание речи позволяет создавать системы автоматического обслуживания клиентов в тех случаях, когда управление с помощью тонального набора неудобно. В качестве примера можно рассмотреть сервис бронирования авиабилетов, который подразумевает выбор из большого числа городов. Тональное меню в таком сервисе не удобно, поэтому голосовое управление будет самым эффективным. Диалог между системой и абонентом может выглядеть следующим образом:

Система: Здравствуйте. Куда вы хотите лететь?
Абонент: Казань
Система: Откуда вы хотите лететь?
Абонент: Москва
Система: Назовите дату вылета
Абонент: 10 апреля

Общение с таким голосовым порталом становится приближенным к обслуживанию оператором.

Распознавание голосовых запросов применяется во многих системах, например, для:

  • Голосовой навигации в многоуровневых меню IVR и автоматического соединения с нужным сотрудником
  • Распознавания адреса для доставки
  • Автоматической голосовой аутентификации пользователей при запросе персонализированной или конфиденциальной информации по телефону или через интернет
  • Справочной системы информационного обслуживания
  • Корпоративной системы голосового самообслуживания клиентов (запрос баланса, проверка лицевого счета, бронирование билетов)

Система распознавания речи:

  • Автоматизирует определенные задачи по обработке входящих звонков
  • Упростит взаимодействие клиента с системой
  • Сократит суммарное время ожидания клиента на линии
  • Высвободит ресурсы операторов

Система распознавания речи, как правило, состоит из следующих частей:

  • Запись сообщения от абонента
  • Распознавание речи и прием текстовых данных от сервиса
  • Анализ полученной информации и выполнение необходимых действий


Для использования Yandex ASR Cloud в вашей системе выполните следующие действия:


Шаг 1. Для получения API-ключа отправьте e-mail на адрес speechkit@yandex-team.ru, с кратким описанием задачи, которую Вы собираетесь решать с помощью Yandex ASR Cloud.

Тестовый период (бесплатный) – 2 недели с момента получения ключа.


Шаг 2. Скачайте и импортируйте сценарии в вашу систему Oktell.

Скачать сценарий: Yandex_SpeechKit_Recognition_IVR.zip (для версий Oktell старше 2.10)

В архиве располагаются два сценария:

  • Yandex_SpeechKit_Recognition_main - сценарий для записи голосового сообщения, является примером правильного использования сервиса распознавания в главном сценарии.
  • Yandex_SpeechKit_Recognition_IVR - сценарий для отправки записи на сервис Яндекса и приема распознанного сообщения.

После импорта сценариев в Oktell, сохраните их "На сервер"


Шаг 3. В сценарии Yandex_SpeechKit_Recognition_IVR в компоненте "Required params" определите следующие параметры:

  • uuid - уникальная строка для подключения. Поле позволяет идентифицировать пользователя для вашего аккаунта, который выполняет запрос. Вы можете использовать любые неповторяющиеся строки.
  • key - API-ключ для подключения к сервису Yandex ASR Cloud.
  • topic - тема голосового сообщения, параметр влияет на качество распознавания. Возможны 4 варианта:
    • freeform - диктовка текста, СМС, email, заметки
    • general - распознавание поисковых запросов и коротких фраз на различные тематики
    • maps - распознавание адресов, названий организаций и различных географических объектов
    • music - распознавание названий песен, исполнителей, групп

По умолчанию, в компоненте используются тестовые данные от разработчиков. После изменения данных, сохраните сценарий "На сервер".


Yandex SpeechKit Recognition -001.png


Шаг.4. В модуле "Администрирование" - "Внутренние номера" добавьте внутренний номер с типом "Запуск IVR". Выберите IVR-сценарий Yandex_SpeechKit_Recognition_main.


Yandex SpeechKit Recognition -002.png


Нажмите "Сохранить". Затем "Применить".


Шаг 5. При звонке на заданный номер, проговорите сообщение. В конце нажмите "*". Через несколько секунд появятся уведомления с распознанным текстом.


Yandex SpeechKit Recognition -003.png


Полученный текст передается в переменной parse_bestText, которую затем можно проанализировать и выполнить необходимые действия. Используйте пример Yandex_SpeechKit_Recognition_main для использования сервиса распознавания в главном сценарии.


Шаг 6. Если Вас устраивает тест, Вы заключаете договор с Яндексом. Отчетный период начинается с даты подписания договора. Оплата происходит по окончанию отчетного периода на основании подписанного акта.


Дополнение: Также вы можете скачать служебный сценарий интеграции с системой Yandex SpeechKit. Сценарий может использоваться для off-line распознавания голосовых файлов. На вход сценария необходимо передать путь к файлу с записью.

Скачать сценарии: Yandex_SpeechKit_Recognition.zip (для версий Oktell старше 2.10)