VibeVoice (генерация речи/клонирование голоса) на Framework Desktop с Strix Halo (AMD AI Ryzen MAX+)

Автор: Donato Capitella

Загружено: 2025-09-21

Просмотров: 5022

Описание:

В этом видео я покажу, как генерировать естественно звучащую речь локально на Framework Desktop с помощью AMD Ryzen AI Max «Strix Halo», включая клонирование голоса из короткого фрагмента и создание диалогов с несколькими говорящими. Вступительный фрагмент, который вы слышите в начале, был полностью сгенерирован VibeVoice и клонирован с моего собственного голоса.

VibeVoice — это модель Microsoft с открытым исходным кодом для длинной речи с несколькими говорящими (выпущена в конце августа 2025 года). Я расскажу вам о настройке Strix Halo с помощью набора инструментов Fedora и пользовательского интерфейса Gradio, затем продемонстрирую клипы с одним и несколькими говорящими, а также клонирование голоса с нулевого кадра. Я также расскажу об исправлениях стабильности, связанных со сбоями ROCm.

Временные метки:
00:00 — Вступление, сгенерированное ИИ (VibeVoice)
01:47 — Настройка на Strix Halo (Toolbox + Gradio)
03:28 — Первая демонстрация: Один динамик
05:18 — Разговоры с несколькими динамиками
05:42 — Клонирование собственного голоса (Zero-Shot)
06:23 — Исправления стабильности (librosa / numba / LLVM / ROCm)
08:26 — Создание полного подкаста
09:33 — Подкаст, сгенерированный ИИ: Как работает VibeVoice

— — —

Ссылки и ресурсы:

Репозиторий GitHub (инструменты, скрипты, исправления стабильности):
https://github.com/kyuz0/amd-strix-ha...

Framework Desktop (Strix Halo):
https://frame.work/

Руководство Strix Halo Homelab + Discord (от deseven):
https://strixhalo-homelab.d7.wtf/

VibeVoice (проект):
https://github.com/microsoft/VibeVoice
https://microsoft.github.io/VibeVoice/

Модели VibeVoice (Hugging Face):
https://huggingface.co/microsoft/Vibe...
(Пример для больших весов в сообществе):
https://huggingface.co/aoi-ot/VibeVoi...

Gradio (фреймворк пользовательского интерфейса):
https://github.com/gradio-app/gradio

Librosa (аудио-функции):
https://github.com/librosa/librosa

Numba (JIT; отключено в этом наборе инструментов) исправление):
https://github.com/numba/numba

LLVM (бэкенд компилятора):
https://llvm.org/

VibeVoice (генерация речи/клонирование голоса) на Framework Desktop с Strix Halo (AMD AI Ryzen MAX+)

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Тестируем 10 народных SSD из DNS | Выбрали лучшие NVMe на 512 ГБ

Тестируем 10 народных SSD из DNS | Выбрали лучшие NVMe на 512 ГБ

Тонкая настройка LLM на Strix Halo – Full, LoRA и QLoRA на Gemma-3, Qwen-3 и GPT-OSS-20B

Тонкая настройка LLM на Strix Halo – Full, LoRA и QLoRA на Gemma-3, Qwen-3 и GPT-OSS-20B

I built a private AI mini-cluster with Framework Desktop

I built a private AI mini-cluster with Framework Desktop

Run Qwen Image and WAN 2.2 on Framework Desktop with Strix Halo (AMD AI Ryzen MAX+ 395) - Full Guide

Run Qwen Image and WAN 2.2 on Framework Desktop with Strix Halo (AMD AI Ryzen MAX+ 395) - Full Guide

Vibevoice 1.5B Text To Speech & Voice Cloning Model by Microsoft

Vibevoice 1.5B Text To Speech & Voice Cloning Model by Microsoft

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Крах Jaguar: Как “повестка” в рекламе добила легенду британского автопрома

Крах Jaguar: Как “повестка” в рекламе добила легенду британского автопрома

Local AI just leveled up... Llama.cpp vs Ollama

Local AI just leveled up... Llama.cpp vs Ollama

Двухпроцессорная система AMD Radeon 9700 AI PRO: создание 64-гигабайтного сервера LLM/AI с помощь...

Двухпроцессорная система AMD Radeon 9700 AI PRO: создание 64-гигабайтного сервера LLM/AI с помощь...

GLM 4.5-Air-106B and Qwen3-235B on AMD

GLM 4.5-Air-106B and Qwen3-235B on AMD "Strix Halo" AI Ryzen MAX+ 395 (HP Z2 G1a Mini Workstation)

Is Radeon Instinct Mi50 32gb the ULTIMATE cheap gpu for a home ai server / LLM?

Is Radeon Instinct Mi50 32gb the ULTIMATE cheap gpu for a home ai server / LLM?

DGX Spark... First Mini PC That Feels Like a Data Center

DGX Spark... First Mini PC That Feels Like a Data Center

Высокая неопределенность решений // Впереди очень тяжелый год. Ответы на

Высокая неопределенность решений // Впереди очень тяжелый год. Ответы на "горячие" вопросы. Вып.128

Лучшие самостоятельные инструменты искусственного интеллекта, которые вы можете запустить в своей...

Лучшие самостоятельные инструменты искусственного интеллекта, которые вы можете запустить в своей...

Контейнерные LLM делают тестирование простым и надежным — Strix Halo Toolboxes

Контейнерные LLM делают тестирование простым и надежным — Strix Halo Toolboxes

Понимание рассуждений LLM (o1/o3, DeepSeek-R1, Gemini Thinking, Grok 3, Claude 3.7)

Понимание рассуждений LLM (o1/o3, DeepSeek-R1, Gemini Thinking, Grok 3, Claude 3.7)

Dev Workloads and LLMs… under $1000

Dev Workloads and LLMs… under $1000

Radeon R9700 Dual GPU First Look — AI/vLLM plus creative tests with Nuke & the Adobe Suite

Radeon R9700 Dual GPU First Look — AI/vLLM plus creative tests with Nuke & the Adobe Suite

Удары по экономике! Наша баржа не затонет? .. Обвал нефтегазовых доходов || Дмитрий Потапенко*.

Удары по экономике! Наша баржа не затонет? .. Обвал нефтегазовых доходов || Дмитрий Потапенко*.

How Does Strix Halo Stack Up on Linux? Feat. GMK Tec

How Does Strix Halo Stack Up on Linux? Feat. GMK Tec