Verbio ASR

Verbio ASR es el motor de reconocimiento de voz de VERBIO tanto en entornos de atención telefónica como en entornos multimedia. 


El reconocimiento de voz Verbio ASR ( Automatic Speech Recognition) es la tecnología que convierte, de forma automática, una locución de habla en texto. Basicamente permite al sistema que dispone de dicho motor "entender" o interpretar el contenido de una locución con independencia de la voz de locutor.

Verbio ASR, orientado inicialmente a entornos telefónicos, dispone en la actualidad de una amplia gama de aplicaciones, tanto telefónicas, como multimedia en donde el reconocimiento de voz es el canal de interacción principal por voz. El sistema reconoce las palabras o conjunto de palabras dichas entre un grupo de opciones, siendo su evolución hacia el reconocimiento de lenguaje natural Verbio Vox Populi.

Las altas tasas de reconocimiento de voz de Verbio ASR se basa en su capacidad de adaptación en todos los entornos, no solo de las gramáticas u opciones, sino también de la adaptación a gran cantidad de modelos acústicos existentes. Siendo además un ASR independiente del locutor

Ya sea en entornos embebidos, centralizados, o en local,  Verbio ASR es una herramienta imprescindible en aplicaciones interactivas entre usuarios y sistemas automáticos o de control por voz, ya sean IVR, Portales de voz,  sistemas domóticos, call centers, seguridad, aplicaciones industriales, navegación por voz o dispositivos móviles en general.Saber más.


Descripción

  • Motor de reconocimiento de voz independiente de locutor.
  • No requiere entreno alguno.
  • Multilingüe (permite varios idiomas).
  • Robusto frente a ruidos, especialmente para telefonía móvil.
  • Gramáticas básicas built-in incorporadas.
  • Reconocimiento mediante vocabularios definido por el usuario (SRGS) o bien mediante modelos estadísticos (SLM).
  • Posibilidad de ajustes a medida del motor para ciertos entornos o palabras.
  • Un sistema capaz de entender a cualquier persona con gran exactitud gracias a un diseño creado a partir de bases de datos de voz de miles de personas por idioma, seleccionadas acorde a estrictos criterios geográficos y demográficos. De ahí que sea independiente del locutor o locutora a reconocer.
  • Idiomas soportados: castellano, catalán, euskera, gallego, inglés, francés, portugués europeo y brasileño, mexicano, argentino, chileno, venezolano.
  • Sistema multilingüe que permite el uso simultáneo en varios idiomas.
  • Modelado acústico con prestaciones especiales para voz telefónica y, en especial, para telefonía móvil GSM (que prácticamente tiene más uso que la propia telefonía fija), donde destaca por su robustez frente al ruido.
  • Verbio ASR ofrece también un sistema con interpretación semántica del resultado, por lo que las tasas de error son muy bajas y permiten parametrizar el desarrollo de las aplicaciones o diálogos de voz ampliando las posibilidades del desarrollo de diálogos naturales.
  • Gramáticas específicas básicas más habituales de reconocimiento ya incorporadas como: cadenas de dígitos, deletreos, sí/no, fechas, horas, DNI, tarjetas de crédito y números telefónicos.
  • Posibilidad de integración directa con un sistema de verificación de locutor, con Verbio ASV.

Aplicaciones

Está especialmente indicado para permitir la interacción hombre-máquina y comunicaciones personales mediante la voz en ámbitos como:

  • Telefonía: Call centers, IVR’s, mensajería unificada, operadoras automáticas, portales de voz, etc.
  • Multimedia: Realización de prototipos, CD’s de información genérica y cambiante, temas de formación interactiva.
  • Internet: Mediante las tecnologías asociadas a la VoIP el hecho de realizar aplicaciones con reconocimiento a través de la Red abre un ilimitado mundo de aplicaciones.
  • Domótica: Órdenes a los sistemas domóticos.
  • Discapacitación: Aplicaciones de ayuda y soporte a distintos niveles de discapacitación, verificación de información o comandos.
  • Industrial: Automatización industrial de procesos mediante la voz (logística, maquinaria, etc.)
  • Terminales multimodales (móviles, PDA, etc.): Control del flujo de información y comandos en móviles a través de manos libres.


  

Estrategias de Uso

De menos a más intervencionismo humano:

  • Autónomo. Toda la interacción hombre-máquina recae en las tecnologías del habla. Es la estrategia más crítica, puesto que nunca se recurre a una persona, por lo que el diseño, la puesta en marcha y el seguimiento son procesos clave para obtener unos resultados satisfactorios.
  • Asistida. En momentos puntuales, una persona actúa en el sistema, aunque el usuario del mismo no percibe su intervención en ningún momento.
  • Mixta. En situaciones comprometidas, una persona toma el mando de la interacción y pasa a comunicarse directamente con el usuario.
  • Complementaria. Las tecnologías del habla se destinan únicamente a un conjunto de gestiones con el usuario, siendo la conversación dirigida principalmente por una persona. A diferencia de las anteriores, esta estrategia requiere siempre la intervención de una persona.


¿Cómo debe utilizarse?

A continuación se especifican algunos aspectos que deberían tenerse en cuenta a la hora de diseñar aplicaciones que hagan uso de la tecnología de reconocimiento del habla:

  • Es imprescindible realizar un estudio previo por especialistas para evaluar la viabilidad de introducir las tecnologías del habla en un sistema. No todos los sistemas pueden aprovechar las ventajas de estas tecnologías, al menos en su totalidad. Es aconsejable introducirlas progresivamente para no crear un rechazo inicial si su rendimiento no es el esperado.
  • Es imprescindible adaptar el sistema a los condicionantes de las tecnologías del habla: la automatización directa no garantiza resultados inmediatos.
  • Es muy aconsejable realizar un seguimiento del sistema una vez puesto en producción para detectar errores de funcionamiento y poder corregirlos paulatinamente (etapa de tuning).




Especificaciones Técnicas

   

Arquitecturas  
Monopuesto
Cliente-Servidor
Requerimientos de memoria
Motor de reconocimiento (Vox Server): >10 MB
Configuración de reconocimiento monolingüe: 16 MB
Configuración de reconocimiento bilingüe: 29 MB

El consumo de memoria depende, principalmente, del vocabulario o gramática, por lo que la estimación de consumos debe hacerse en función de la gramática más compleja de la aplicación.
Tasa de muestreo
8 Khz (ley A, ley Mu o PCM lineal)
CPU

Req. Mínimos recomendables Pentium 4 - 3 Ghz
>= 512 MB RAM

La carga computacional depende, principalmente, del vocabulario o gramática, por lo que la estimación de consumos debe hacerse en función de la gramática más compleja de la aplicación.
Plataforma
Windows NT, 2000, XP, 2003, Vista, 7, 2008
Linux (Distribuciones más frecuentes)
Pocket PC, Windows Mobile, Linux Embedded
Interfaces

MRCPv1 y MRCPv2
Verbio API
Asterisk

SDK
Diferentes SDK según entorno (Dialogic, Eicon, CTADE, AvayaIR, genérico, etc.)
Características destacadas
Gramáticas List-of-words, W3C SRGS (ABNF y XML)
Reconocimiento independiente del locutor, optimizado para entornos telefónicos (fijo y móvil) y ruidosos.
Posibilidad de desarrollo de nuevos idiomas "on-demand".
Herramientas de "tuning" .
Configuraciones de reconocimiento multilingües.
Múltiples hipótesis de reconocimiento.
Gramáticas básicas (built-in) incorporadas.
Retorno de resultados en formato NLSML.
Integración con ASV (verificación del locutor).


Idiomas

 

  • Reconocimiento de voz Verbio ASR Castellano / ASR Español
  • Reconocimiento de voz Verbio ASR Portugués
  • Reconocimiento de voz Verbio ASR Brasileño
  • Reconocimiento de voz Verbio ASR Inglés US
  • Reconocimiento de voz Verbio ASR Francés
  • Reconocimiento de voz Verbio ASR Mexicano
  • Reconocimiento de voz Verbio ASR Argentino / ASR Uruguayo
  • Reconocimiento de voz Verbio ASR Paraguayo
  • Reconocimiento de voz Verbio ASR Colombiano
  • Reconocimiento de voz Verbio ASR Chileno
  • Reconocimiento de voz Verbio ASR Venezolano / ASR Caribeño
  • Reconocimiento de voz Verbio ASR Portorriqueño
  • Reconocimiento de voz Verbio ASR cubano
  • Reconocimiento de voz Verbio ASR Dominicano
  • Reconocimiento de voz Verbio ASR Catalán
  • Reconocimiento de voz Verbio ASR Gallego
  • Reconocimiento de voz Verbio ASR Valenciano
  • Reconocimiento de voz Verbio ASR Euskara / ASR Vasco
















Joomla 1.6 template
araç kiralama bilgi http://www.cronstudio.co kredi karti taksitlendirme kredi kartı taksitlendirme kredi kartı borcu taksitlendirme http://www.kredikartitaksitlendir.com.tr