Verbio TTS

A evolução para a voz natural

O Verbio TTS é o motor de síntese de voz ou conversão de texto em voz da VERBIO. Sistema de síntese de alta qualidade e naturalidade e inteligibilidade.


O que é a Conversão de texto em fala?

A conversão de texto em fala oi síntese de voz (TTS - Text-to-Speech) é a tecnologia que permite converter, de forma automática, um texto escrito em uma locução de voz natural, com a melhor naturalidade e inteligibilidade. Permite ao sistema que dispõe de dito motor "ler em voz alta" um texto escrito.


Descrição.

As vozes incorporadas dentro do motor da Verbio TTS se caracterizam por:

  • Vozes com grande naturalidade de homem e mulher.
  • Ambiente multilíngüe.
  • Entonação dinâmica e adaptativa.
  • Algoritmo de ritmos e pausas da fala baseado na própria sintaxe e em métodos estatísticos.
  • Locutor corporativo: dispor de uma voz sintética à sua medida ou à do seu cliente.


Quando é indicado utiliza-lo?

  • É uma ferramenta imprescindível em aplicações cujo texto a ser falado, a priori, é desconhecido ou que mude constantemente e portanto tem que comunicar informação dinâmica.
  • A síntese não pretende substituir nunca a qualidade de uma gravação profissional feita em um estúdio de gravação, mas sim que se dispõe de qualidade suficiente como para substituir temporariamente quando se necessitam de forma imediata mensagens ou locuções estáticas ou definitivamente quando o que se pretende é uma economia direta de custos.
  • Quando se persegue maior qualidade que o que representa a simples concatenação direta de arquivos wav de pequenas locuções gravadas em estúdio, já que com ela se perderia a entonação dinâmica necessária em um idioma concreto. Um exemplo típico dele é a locução de quantidades numéricas.
  • Com a utilização da Verbio TTS em um sistema de informação evita-se a gravação constante em estúdio de novas mensagens (as vezes impossível de levar adiante) e se consegue por tanto uma economia elevada em custos e tempo, dispondo de uma flexibilidade total e disponibilidade imediata.   


Onde é aplicável?

O motor de síntese de voz Verbio TTS está especialmente indicado para emitir mensagens na interação homem-máquina e comunicações pessoais em áreas como:

  • Telefonia e CTI: Call centers, IVR’s, Mensagens unificada, Operadoras automáticas, Portais de voz, etc.
  • Multimídia: Realização de protótipos, CD’s de informação genérica e cambiante, catálogos, apresentações, etc.
  • Internet: Mensagens personalizadas em páginas web, com mensagens de voz de informação de última hora, lembretes, locução de instruções de ajuda, leitura de e-mails ou noticias, etc.
  • Automação: Confirmação de informação ou leitura de dados do sistema.
  • Acessibilidade: Aplicações de ajuda e suporte a ônibus de deficientes.
  • Industrial: Ajuda à automação industrial de processos através da voz (logística, maquinaria, etc).
  • Terminais multimídia (celulares, PDA, etc.): Escuta de informação em celulares através do viva voz, escuta da informação ou confirmação de dados.

 

Que estratégias de uso existem?   

  • Autônomos. Toda a informação se reproduz através de voz sintética.
  • Mista. As mensagens fixas são faladas por uma pessoa ou bem estão pré-gravadas, usando-se a voz sintética unicamente para a informação variável.
  • Mista corporativa. As mensagens fixas são locutadas ou pré-gravadas pelo mesmo locutor utilizado para gerar a voz sintética. Nestes casos, a qualidade global obtida é muito satisfatória, porque reúne uniformidade (não ha mudança de vozes), flexibilidade (a voz sintética permite reproduzir qualquer texto) e baixo custo (não é necessário pré-gravar a informação volátil).


Características principais   

  • Vozes de homem e mulher de grande qualidade, baseadas em locutores profissionais.
  • Ambiente multilíngüe.
  • Entonação dinâmica e adaptativa: seleção da curva de entonação original do locutor que melhor se adapta a cada contexto, superando a monotonia dos padrões estáticos .
  • Algoritmo de ritmos e pausas da fala baseado na própria sintaxe e em métodos estatísticos.
  • Locutor corporativo: sua empresa poderá dispor da voz corporativa que você deseje e que complemente seus serviços de atendimento ao cliente de forma natural. Além, conseguirá uma qualidade de serviço superior já que se desenvolverá especificamente para as particularidades de seu setor em quanto ao ambiente gramático, lingüístico e de vocabulário. (Veja no parágrafo Locutor corporativo para mais detalhes).


Especificações técnicas   

Arquiteturas  
Autônomo
Cliente-Servidor
Requisitos de memoria
Motor de síntese (Vox Server): >10 MB
Módulo de voz 8khz: +/- 80 MB
Módulo de voz 16khz: +/- 160 MB
30MB em RAM como mínimo por locutor. O resto pode ir em HD

A memória RAM tem um consumo inicial elevado durante o começo, mas posteriormente se mantêm estável no tempo.
Taxa de amostra
8 ou 16Khz
16 bits (PCM  linear), lei A, lei Mu
CPU

Req. Mínimos recomendáveis Pentium 4 - 3 Ghz
>= 512 MB RAM

A carga de CPU é muito elevada ao realizar uma solicitação de síntese, mas praticamente imperceptível durante o processo de reprodução das amostras.
Plataforma

Windows NT, 2000, XP, 2003, Vista, 7, 2008
Linux (Distribuições mais frequentes)
Pocket PC, Windows Mobile, Linux Embedded


Interfaces
SAPI 4 e SAPI 5
MRCPv1 e MRCPv2
Verbio API
Asterisk
Idiomas Suportados

Castelhano, catalã, valenciano, euskara, galego, inglês, francês, português europeu e brasileiro, mexicano, argentino.


SDK
Diferentes SDK segundo entorno (Dialogic, Eicon, CTADE, AvayaIR, genérico, etc.)
Características destacadas
W3C SSML
SABLE
Dicionário de abreviações e siglas
Dicionário de exceções
Locutor corporativo (motor TTS a medida de sua empresa)




Joomla 1.6 template
araç kiralama bilgi http://www.cronstudio.co kredi karti taksitlendirme kredi kartı taksitlendirme kredi kartı borcu taksitlendirme http://www.kredikartitaksitlendir.com.tr