Распознавание и синтез речи. Классические методы распознавания речи – М. Ф. Аль-Шедиват
Автор: Yandex for ML
Загружено: 11 янв. 2017 г.
Просмотров: 11 791 просмотр
В данной лекции вы узнаете про классические методы распознавания и параметрического синтеза речи.
Распознавание речи можно разделить на две фазы: акустическое моделирование и декодирование. На лекции были разобраны как генеративные (основанные на смесях Гауссиан [GMM]), так и дискриминативные (основанные на глубоких нейронных сетях [DNN] со стандартной кросс-энтропийной [CE] функцией потерь) подходы к акустическому моделированию, а также упрощенно показано, как выглядит построение HCLG-графа, и как происходит декодирование с его помощью.
В области синтеза речи лектор вкратце затрагивает лишь один из множества подходов к решению данной задачи, основанный на рекуррентных нейронных сетях [RNN].

Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: