|
|
| |
|
|
 |
| |
Verbio TTS es el motor de síntesis de voz o conversión de texto en habla de VERBIO. Sistema de síntesis de alta calidad de voz y elevada naturalidad e inteligibilidad. Disponible en los distintos idiomas utilizados en la península ibérica y en algunos países latinoamericanos.
|
|
|
¿Qué es la Conversión de texto en habla?
|
|
La conversión de texto en habla o síntesis de voz (TTS - Text-to-Speech) es la tecnología que permite convertir, de forma automática, un texto escrito en una locución de voz natural, con la mejor naturalidad e inteligibilidad. Permite al sistema que dispone de dicho motor "leer en voz alta" un texto escrito.
(para saber más: http://en.wikipedia.org/wiki/Speech_synthesis)
|
|
Descripción
|
|
Las voces incorporadas dentro del motor de Verbio TTS se caracterizan por:
- Voces con gran naturalidad de hombre y mujer.
- Entorno multilingüe.
- Entonación dinámica y adaptativa.
- Algoritmo de ritmos y pausas del habla basado en la propia sintaxis y en métodos estadísticos.
- Locutor corporativo: disponer de una voz sintética a su medida o a la de su cliente.
|
¿Cuándo es indicado utilizarlo?
|
|
- Es una herramienta imprescindible en aplicaciones cuyo texto a locutar, a priori, es desconocido o muy cambiante y por lo tanto hay que comunicar información dinámica.
- La síntesis no pretende sustituir nunca a la calidad de una grabación profesional hecha en un estudio de grabación, pero sí que se dispone de calidad suficiente como para sustituir temporalmente cuando se necesitan de forma inmediata mensajes o locuciones estáticas o definitivamente cuando lo que se pretende es un ahorro directo de costes.
- Cuando se persigue mayor calidad que lo que representa la simple concatenación directa de ficheros wav de pequeñas locuciones grabadas en estudio, ya que con ella se perdería la entonación dinámica necesaria en un idioma concreto. Un ejemplo típico de ello es la locución de cantidades numéricas.
- Con la utilización de Verbio TTS en un sistema de información se evita la grabación constante en estudio de nuevos mensajes (a veces imposible de llevar a cabo) y se consigue por lo tanto un ahorro elevado en costes y tiempo, disponiendo de una flexibilidad total y disponibilidad inmediata.
|
¿Dónde es aplicable?
|
|
|
El motor de síntesis de voz Verbio TTS está especialmente indicado para emitir mensajes en la interacción hombre-máquina y comunicaciones personales en ámbitos como:
- Telefonía y CTI: Call centers, IVR’s, Mensajería unificada, Operadoras automáticas, Portales de voz, etc.
- Multimedia: Realización de prototipos, CD’s de información genérica y cambiante, catálogos, presentaciones, etc.
- Internet: Mensajes personalizados en páginas web, con mensajes de voz de información de última hora, recordatorios, locución de instrucciones de ayuda, lectura de correo electrónico o noticias, etc.
- Domótica: Confirmación de información o lectura de datos del sistema.
- Discapacitación: Aplicaciones de ayuda y soporte a distintos niveles de discapacitación, verificación de información o comandos.
- Industrial: Ayuda a la automatización industrial de procesos mediante la voz (logística, maquinaria, etc).
- Terminales multimedia (móviles, PDA, etc.): Escucha de información en móviles a través de manos libres, escucha de información o confirmación de datos.
|
¿Qué estrategias de uso existen?
|
|
- Autónomos. Toda la información se reproduce mediante voz sintética.
- Mixta. Los mensajes fijos son locutados por una persona o bien están pregrabados, usándose la voz sintética únicamente para la información variable.
- Mixta corporativa. Los mensajes fijos son locutados o pregrabados por el mismo locutor utilizado para generar la voz sintética. En estos casos, la calidad global obtenida es muy satisfactoria, porque reúne uniformidad (no hay cambio de voces), flexibilidad (la voz sintética permite reproducir cualquier texto) y bajo coste (no es necesario pregrabar la información volátil).
|
Características principales
|
|
- Voces de hombre y mujer de gran calidad, basadas en locutores profesionales.
- Entorno multilingüe con el que podrá sintetizar voces en español, catalán, euskera, gallego y otras lenguas francas internacionales como inglés, francés, portugués europeo y brasileño o mexicano.
- Entonación dinámica y adaptativa: selección de la curva de entonación original del locutor que mejor se adapta a cada contexto, superando la monotonía de los patrones estáticos .
- Algoritmo de ritmos y pausas del habla basado en la propia sintaxis y en métodos estadísticos.
- Locutor corporativo: su empresa podrá disponer de la voz corporativa que Ud. desee y que complemente sus servicios de atención al cliente de forma natural. Además, conseguirá una calidad de servicio superior ya que se desarrollará específicamente para las particularidades de su sector en cuanto a entorno gramático, lingüístico y de vocabulario. (Véase apartado Locutor corporativo para más detalles).
|
Especificaciones técnicas
|
|
|
Especificaciones Generales Verbio TTS
| Arquitecturas | | Monopuesto Cliente-Servidor |
| Requerimientos de memoria | | Motor de síntesis (Vox Server): >10 MB
Módulo de voz 8khz: +/- 80 MB
Módulo de voz 16khz: +/- 160 MB
30MB en RAM como mínimo por locutor. El resto puede ir en HD
La memoria RAM tiene un consumo inicial elevado durante la puesta en marcha, pero posteriormente se mantiene estable en el tiempo. |
| Tasa de muestreo | | 8 o 16Khz
16 bits, ley A, ley Mu |
| CPU | | Req. Mínimos recomendables Pentium 4 - 3 Ghz
>= 512 MB RAM
La carga de CPU es muy elevada al realizar una petición de síntesis, pero prácticamente imperceptible durante el proceso de reproducción de las muestras.
|
| Plataforma | | Windows NT, 2000, XP, 2003, Vista
Linux |
| Interfaces | | SAPI 4.0, y 5.x
MRCP *
Verbio API
VoiceXML |
| Multi-idioma / voces | | Castellano, catalán, gallego, euskera, portugués, mexicano, argentino, inglés US y francés |
| SDK | | Diferentes SDK según entorno (Dialogic, Eicon, CTADE, AvayaIR, genérico, etc.) |
| Características destacadas | | W3C SSML
SABLE
Diccionario de abreviaturas y acrónimos
Diccionario de excepciones
Locutor corporativo (motor TTS a medida de su empresa) |
(* Consultar - precomercial)
|
|
| Demos relacionadas |
|
|
|
|
| Documentos relacionados |
|
- Verbio Software Reference: Guía del Usuario para Windows · pdf · html
- Verbio TTS - Folleto comercial · pdf
- Verbio Software Reference: Manual de referencia de Verbio VoiceWeb · pdf
- Verbio Software Reference: Guía de instalación para Linux · pdf
- Verbio Software Reference: Guía de inicio para Verbio-Asterisk · pdf
|
|
|