Baidu представила систему синтеза речи, которая учится разговаривать за несколько часов и с минимальным вмешательством человека

Baidu используют технологию глубинного обучения для перевода текста на маленькие отдельные единицы звука - феномы. deep-voice   А после сеть синтеза речи репродуцирует эти звуки и составляет в речь, которую трудно отличить от человеческой. Благодаря использованию глубинного обучения, система учится сама и не нуждается в постоянной поддержке человека. В этом ее преимущество перед похожей программой компании Google - WaveNet. Источник: https://www.technologyreview.com/s/603811/baidus-artificial-intelligence-lab-unveils-synthetic-speech-system/