Google Cloud lança solução para converter texto em voz em 12 idiomas

02/04/2018 13:35

Text-to-Speech foi desenvolvido a pedido de desenvolvedores, que queriam uma ferramenta parecida com as utilizadas no Google Assistant, Search e Maps.

Google Cloud expandiu seu portfólio de produtos em inteligência artificial e lançou o Text-to-Speech, nova ferramenta que permite aos clientes a conversão de fala em texto em mais de 32 vozes em 12 idiomas diferentes, inclusive português. É a primeira vez que a empresa disponibiliza o WaveNet para o público.

MIT reduz custos de pesquisas científicas com Google Cloud

A tecnologia será disponibilizada para o Google Cloud Platform e foi desenvolvida a pedido de desenvolvedores que queriam adicionar texto para voz a seus próprios aplicativos, a exemplo de como funciona no Google Assistant, Search e Maps. O Text-to-Speech terá vozes construídas com base no WaveNet, um modelo generativo para áudio bruto criado pela DeepMind.

Além de permitir que os usuários escolham entre 32 vozes diferentes de 12 idiomas, o Cloud Text-to-Speech também traz pronúncias mais assertivas em textos complexos, como nomes, datas, horários e endereços. O produto, já utilizado por empresas como Cisco e Dolphin ONE, permite a personalização do tom, a taxa de fala e o ganho de volume da voz, além de oferecer suporte a diversos formatos de áudio, incluindo MP3 e WAV.

 

Fonte:ipnews