Распознавание речиТехнология распознавания речи позволяет строить максимально дружественные телефонные IVR приложения. Во время диалога с роботом абонент осуществляет выбор в меню не только тональным набором но и а произнося голосовые команды. Естественный для человека стиль общения помогает максимально быстро предоставить доступ к желаемой информации или выполнить необходимую операцию. Благодаря распознаванию речи появилась возможность создавать такие системы, которые было практически невозможно реализовать, имея в качестве интерфейса только тональный набор. Например, система автоматического бронирования авиабилетов по телефону подразумевает выбор из большого числа городов, и тональное меню здесь практически нереализуемо. При использовании же распознавания речи, диалог системы с пользователем может выглядеть примерно так: Система: Назовите город вылета Абонент: Москва Система: Назовите город прилета Абонент: Хабаровск Система: Назовите дату Абонент: 15 июля т.е. максимально естественно и приближенно к обслуживанию оператором. Один из ведущих производителей систем распознавания речи в телефонии, компания Vocative разработала продуктLOGOS, специально предназначенный для распознавания произвольного набора слов и фраз с заранее определенным набором возможных контекстов в телекоммуникационных приложениях: - Навигация по информационно-развлекательным IVR-меню (информация о счете, заказ билетов, гороскопы, результаты матчей и т.п)
- Голосовое управление VAS-услугами (голосовая почта, навигация по контенту)
В настояший момент компания Vocative концентрирует усилия на подготовке лучшей технологии распознавания русской речи для использования в многопользовательских приложениях в телекоммуникационном и корпоративном сегментах рынка. Основные характеристики: - Дикторонезависимость
- Шумоустойчивость
- Уровень уверенности (Confidence level)
- Неограниченный словарь
- Интеллектуальные алгоритмы выделения речи из звукового потока (Voice Activity Detection)
- Лингвистические алгоритмы, учитывающие особенности русского языка: фонетика, морфология, правила произношения, вариативность
- Кэширование грамматик
- Распознавание DTMF
Основные технические характеристики LOGOS: - Поддерживаемые платформы: Windows 2000, Windows XP
- API: MRCP
- Формат звукового сигнала: 8 kHz
- Формат описания грамматик: SRGS 1.0, SISR
Распознавание речи используется в Smartphone в готовом коробочном решении- Smartphone Speech Attandant . Для решений класса Speech Attendant (Автосекретарь) компания Vocative разработала специальный продукт - Smart LOGOS . |