Baidu представила систему синтеза речи, которая учится разговаривать за несколько часов и с минимальным вмешательством человека

Baidu используют технологию глубинного обучения для перевода текста на маленькие отдельные единицы звука — феномы.

deep-voice

 

А после сеть синтеза речи репродуцирует эти звуки и составляет в речь, которую трудно отличить от человеческой.

Благодаря использованию глубинного обучения, система учится сама и не нуждается в постоянной поддержке человека. В этом ее преимущество перед похожей программой компании Google — WaveNet.

Источник: https://www.technologyreview.com/s/603811/baidus-artificial-intelligence-lab-unveils-synthetic-speech-system/