Chatterbox TTS Multilingual | Аудиопримеры (23 языка) и клонирование голоса
Автор: Thorsten-Voice
Загружено: 2025-12-17
Просмотров: 2829
В этом видео я подробно рассматриваю Chatterbox TTS, многоязычную систему преобразования текста в речь от Resemble AI, которая работает с учетом конфиденциальности на вашем локальном компьютере. Все 23 модели TTS, предоставляемые на международном уровне, распространяются под лицензией MIT.
Вы услышите аудиопримеры на 23 разных языках, получите обзор доступных моделей и увидите, как Chatterbox работает в реальных условиях. Я также протестирую клонирование голоса без предварительного обучения, чтобы оценить, насколько хорошо система может воспроизводить голос из ограниченного эталонного материала.
Видео охватывает:
Обзор Chatterbox TTS
Аудиопримеры на 23 языках
Локальная установка и использование через Gradio
Тест клонирования голоса без предварительного обучения
Практические выводы и извлеченные уроки
00:00 Вступление
02:25 Первый взгляд
05:45 Командная строка | Тестирование Python 3.12
07:38 Установка с использованием Python 3.11
09:45 Запуск gradio local (синтез звука)
15:18 Тестирование клонирования голоса с нулевым количеством попыток
17:57 Начало аудиосэмплов с арабским языком
18:05 Датский
18:13 Немецкий
18:23 Греческий
18:32 Английский
18:41 Испанский
18:51 Финский
19:01 Французский
19:09 Иврит
19:19 Хинди
19:27 Итальянский
19:36 Японский
19:45 Корейский
19:54 Малайский
20:04 Голландский
20:14 Норвежский
20:22 Польский
20:29 Португальский
20:42 Русский
20:50 Шведский
21:00 Суахили
21:12 Турецкий
21:23 Китайский
О проблемах с использованием виртуальной машины:
echo 'export' DNNL_MAX_CPU_ISA=AVX2' 2xLARGER_THEN_CHAR ~/.bashrc
source ~/.bashrc
Или добавьте следующую строку в скрипт Python при импорте torch:
torch.backends.mkldnn.enabled = False
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: