Verbio TTS

Verbio TTS es el motor de síntesis de voz o conversión de texto en voz de VERBIO. Sistema de síntesis de alta calidad y naturalidad e inteligibilidad.


La conversión de texto en audio o síntesis de voz (TTS - Text-to-Speech) es la tecnología que permite convertir, de forma automática, un texto escrito en una locución de voz natural, con la mejor naturalidad e inteligibilidad. Permite al sistema que dispone de dicho motor "leer en voz alta" un texto escrito. 

El TTS, ampliamente empleado en el ámbito del contact center, elearning y emisión de mensajes o megafonía, pone al disposición de los sistemas una herramienta imprescindible en aplicaciones donde la comunicación se produce por voz. En especial aquellos textos desconocidos o muy cambiantes a locutar.

La gran calidad de los mensajes y audios generados por Verbio TTS rompe con los motores de síntesis de voz anteriores y presenta nuevos horizontes en las interacciones automáticas por voz, así como en los entornos de aplicación de TTS para mensajería en todos sus idiomas.

Verbio TTS es una tecnología flexible, estable y de gran calidad que además produce importantes ahorros de coste respecto a los sistemas tradicionales de generación de mensajes por voz.  Saber más.


Descripción


Las voces incorporadas dentro del motor de Verbio TTS se caracterizan por:

  • Voces con gran naturalidad de hombre y mujer.
  • Entorno multilingüe.
  • Entonación dinámica y adaptativa.
  • Algoritmo de ritmos y pausas del habla basado en la propia sintaxis y en métodos estadísticos.
  • Locutor corporativo: disponer de una voz sintética a su medida o a la de su cliente.
  • Voces de hombre y mujer de gran calidad, basadas en locutores profesionales.
  • Entorno multilingüe.
  • Entonación dinámica y adaptativa: selección de la curva de entonación original del locutor que mejor se adapta a cada contexto, superando la monotonía de los patrones estáticos .
  • Algoritmo de ritmos y pausas del habla basado en la propia sintaxis y en métodos estadísticos.
  • Locutor corporativo: su empresa podrá disponer de la voz corporativa que Ud. desee y que complemente sus servicios de atención al cliente de forma natural. Además, conseguirá una calidad de servicio superior ya que se desarrollará específicamente para las particularidades de su sector en cuanto a entorno gramático, lingüístico y de vocabulario. (Véase apartado Locutor corporativo para más detalles).


Apliaciones


El motor de síntesis de voz Verbio TTS está especialmente indicado para emitir mensajes en la interacción hombre-máquina y comunicaciones personales en ámbitos como:

  • Telefonía y CTI: Call centers, IVR’s, Mensajería unificada, Operadoras automáticas, Portales de voz, etc.
  • Multimedia: Realización de prototipos, CD’s de información genérica y cambiante, catálogos, presentaciones, etc.
  • Internet: Mensajes personalizados en páginas web, con mensajes de voz de información de última hora, recordatorios, locución de instrucciones de ayuda, lectura de correo electrónico o noticias, etc.
  • Domótica: Confirmación de información o lectura de datos del sistema.
  • Accesibilidad: Aplicaciones de ayuda y soporte a colectivos discapacitados.
  • Industrial: Ayuda a la automatización industrial de procesos mediante la voz (logística, maquinaria, etc).
  • Terminales multimedia (móviles, PDA, etc.): Escucha de información en móviles a través de manos libres, escucha de información o confirmación de datos.

 

Estrategias de uso

 

  • Autónomos. Toda la información se reproduce mediante voz sintética.

  • Mixta. Los mensajes fijos son locutados por una persona o bien están pregrabados, usándose la voz sintética únicamente para la información variable.

  • Mixta corporativa. Los mensajes fijos son locutados o pregrabados por el mismo locutor utilizado para generar la voz sintética. En estos casos, la calidad global obtenida es muy satisfactoria, porque reúne uniformidad (no hay cambio de voces), flexibilidad (la voz sintética permite reproducir cualquier texto) y bajo coste (no es necesario pregrabar la información volátil).


Especificaciones técnicas


Arquitecturas  
Monopuesto
Cliente-Servidor
Requerimientos de memoria
Motor de síntesis (Vox Server): >10 MB
Módulo de voz 8khz: +/- 80 MB
Módulo de voz 16khz: +/- 160 MB
30MB en RAM como mínimo por locutor. El resto puede ir en HD

La memoria RAM tiene un consumo inicial elevado durante la puesta en marcha, pero posteriormente se mantiene estable en el tiempo.
Tasa de muestreo
8 o 16Khz
16 bits (PCM  lineal), ley A, ley Mu
CPU

Req. Mínimos recomendables Pentium 4 - 3 Ghz
>= 512 MB RAM

La carga de CPU es muy elevada al realizar una petición de síntesis, pero prácticamente imperceptible durante el proceso de reproducción de las muestras.
Plataforma

Windows NT, 2000, XP, 2003, Vista, 7, 2008
Linux (Distribuciones más frecuentes)
Pocket PC, Windows Mobile, Linux Embedded


Interfaces
SAPI 4 y SAPI 5
MRCPv1 y MRCPv2
Verbio API
Asterisk
Idiomas Soportados



SDK
Diferentes SDK según entorno (Dialogic, Eicon, CTADE, AvayaIR, genérico, etc.)
Características destacadas
W3C SSML
SABLE
Diccionario de abreviaturas y acrónimos
Diccionario de excepciones
Locutor corporativo (motor TTS a medida de su empresa)


Idiomas



  • TTS Castellano/ TTS español de España
  • TTS Inglés
  • TTS Francés
  • TTS Portugués europeo
  • TTS Portugués Brasileño
  • TTS Español Mexicano
  • TTS Español Argentino
  • TTS Catalán
  • TTS Valenciano,
  • TTS Euskara / TTS Vasco
  • TTS Gallego



Joomla 1.6 template
araç kiralama bilgi http://www.cronstudio.co kredi karti taksitlendirme kredi kartı taksitlendirme kredi kartı borcu taksitlendirme http://www.kredikartitaksitlendir.com.tr