Baidu представила систему синтеза речи, которая учится разговаривать за несколько часов и с минимальным вмешательством человека
Baidu используют технологию глубинного обучения для перевода текста на маленькие отдельные единицы звука - феномы.

А после сеть синтеза речи репродуцирует эти звуки и составляет в речь, которую трудно отличить от человеческой.
Благодаря использованию глубинного обучения, система учится сама и не нуждается в постоянной поддержке человека. В этом ее преимущество перед похожей программой компании Google - WaveNet.
Источник:
https://www.technologyreview.com/s/603811/baidus-artificial-intelligence-lab-unveils-synthetic-speech-system/