WaveNet от Google DeepMind | Двухминутные доклады №93
Автор: Two Minute Papers
Загружено: 2016-09-12
Просмотров: 133107
Давайте поговорим о Wavenet от Google DeepMind! Эта работа посвящена генерации аудиосигналов для преобразования текста в речь и других задач. Преобразование текста в речь, по сути, означает, что мы слышим голос, читающий написанное. Однако отличие этой работы заключается в том, что она может синтезировать эти сэмплы голоса человека, если у нас есть обучающие образцы речи этого человека.
__________________________
Статья «WaveNet: генеративная модель для необработанного аудио» доступна здесь:
https://arxiv.org/abs/1609.03499
Публикация в блоге об этом с примерами звука доступна здесь:
https://deepmind.com/blog/wavenet-gen...
Тема Reddit, посвящённая машинному обучению, доступна здесь:
https://www.reddit.com/r/MachineLearn...
Рекомендуем:
Выпуск Every Two Minute Papers о глубоком обучении: • AI and Deep Learning - Two Minute Papers
БЛАГОДАРИМ НАШИ ЩЕДРЫЕ СПОНСОРЫ PATREON, КОТОРЫЕ ДЕЛАЮТ ДВУХМИНУТНЫЕ СТАТЬИ ВОЗМОЖНЫМИ:
Сунил Ким, Джулиан Джозефс, Дэниел Джон Бентон, Дэйв Раштон-Смит, Бенджамин Канг.
/ twominutepapers
Мы также благодарим Experiment за спонсорскую поддержку нашей серии. - https://experiment.com/
Большое спасибо JulioC EA за субтитры на испанском языке! :)
Подпишитесь, если хотите видеть больше таких статей! – http://www.youtube.com/subscription_c...
Музыка: Dat Groove от Audionautix распространяется по лицензии Creative Commons Attribution (https://creativecommons.org/licenses/....
Исполнитель: http://audionautix.com/
Миниатюрное фоновое изображение было найдено на Pixabay - https://pixabay.com/hu/spektrum-hangs...
Дизайн заставки/миниатюр: Фелисия Фехер - http://felicia.hu
Ссылки Кароя Жолнаи-Фехера:
Facebook → / twominutepapers
Твиттер → / karoly_zsolnai
Веб → https://cg.tuwien.ac.at/~zsolnai/
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: