Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

VibeVoice (генерация речи/клонирование голоса) на Framework Desktop с Strix Halo (AMD AI Ryzen MAX+)

Автор: Donato Capitella

Загружено: 2025-09-21

Просмотров: 5022

Описание:

В этом видео я покажу, как генерировать естественно звучащую речь локально на Framework Desktop с помощью AMD Ryzen AI Max «Strix Halo», включая клонирование голоса из короткого фрагмента и создание диалогов с несколькими говорящими. Вступительный фрагмент, который вы слышите в начале, был полностью сгенерирован VibeVoice и клонирован с моего собственного голоса.

VibeVoice — это модель Microsoft с открытым исходным кодом для длинной речи с несколькими говорящими (выпущена в конце августа 2025 года). Я расскажу вам о настройке Strix Halo с помощью набора инструментов Fedora и пользовательского интерфейса Gradio, затем продемонстрирую клипы с одним и несколькими говорящими, а также клонирование голоса с нулевого кадра. Я также расскажу об исправлениях стабильности, связанных со сбоями ROCm.

Временные метки:
00:00 — Вступление, сгенерированное ИИ (VibeVoice)
01:47 — Настройка на Strix Halo (Toolbox + Gradio)
03:28 — Первая демонстрация: Один динамик
05:18 — Разговоры с несколькими динамиками
05:42 — Клонирование собственного голоса (Zero-Shot)
06:23 — Исправления стабильности (librosa / numba / LLVM / ROCm)
08:26 — Создание полного подкаста
09:33 — Подкаст, сгенерированный ИИ: Как работает VibeVoice

— — —

Ссылки и ресурсы:

Репозиторий GitHub (инструменты, скрипты, исправления стабильности):
https://github.com/kyuz0/amd-strix-ha...

Framework Desktop (Strix Halo):
https://frame.work/

Руководство Strix Halo Homelab + Discord (от deseven):
https://strixhalo-homelab.d7.wtf/

VibeVoice (проект):
https://github.com/microsoft/VibeVoice
https://microsoft.github.io/VibeVoice/

Модели VibeVoice (Hugging Face):
https://huggingface.co/microsoft/Vibe...
(Пример для больших весов в сообществе):
https://huggingface.co/aoi-ot/VibeVoi...

Gradio (фреймворк пользовательского интерфейса):
https://github.com/gradio-app/gradio

Librosa (аудио-функции):
https://github.com/librosa/librosa

Numba (JIT; отключено в этом наборе инструментов) исправление):
https://github.com/numba/numba

LLVM (бэкенд компилятора):
https://llvm.org/

VibeVoice (генерация речи/клонирование голоса) на Framework Desktop с Strix Halo (AMD AI Ryzen MAX+)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Тестируем 10 народных SSD из DNS | Выбрали лучшие NVMe на 512 ГБ

Тестируем 10 народных SSD из DNS | Выбрали лучшие NVMe на 512 ГБ

Тонкая настройка LLM на Strix Halo – Full, LoRA и QLoRA на Gemma-3, Qwen-3 и GPT-OSS-20B

Тонкая настройка LLM на Strix Halo – Full, LoRA и QLoRA на Gemma-3, Qwen-3 и GPT-OSS-20B

I built a private AI mini-cluster with Framework Desktop

I built a private AI mini-cluster with Framework Desktop

Run Qwen Image and WAN 2.2 on Framework Desktop with Strix Halo (AMD AI Ryzen MAX+ 395) - Full Guide

Run Qwen Image and WAN 2.2 on Framework Desktop with Strix Halo (AMD AI Ryzen MAX+ 395) - Full Guide

Vibevoice 1.5B Text To Speech & Voice Cloning Model by Microsoft

Vibevoice 1.5B Text To Speech & Voice Cloning Model by Microsoft

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Создание двухузлового кластера AMD Strix Halo для LLM с RPC llama.cpp (MiniMax-M2 и GLM 4.6)

Крах Jaguar: Как “повестка” в рекламе добила легенду британского автопрома

Крах Jaguar: Как “повестка” в рекламе добила легенду британского автопрома

Local AI just leveled up... Llama.cpp vs Ollama

Local AI just leveled up... Llama.cpp vs Ollama

Двухпроцессорная система AMD Radeon 9700 AI PRO: создание 64-гигабайтного сервера LLM/AI с помощь...

Двухпроцессорная система AMD Radeon 9700 AI PRO: создание 64-гигабайтного сервера LLM/AI с помощь...

GLM 4.5-Air-106B and Qwen3-235B on AMD

GLM 4.5-Air-106B and Qwen3-235B on AMD "Strix Halo" AI Ryzen MAX+ 395 (HP Z2 G1a Mini Workstation)

Is Radeon Instinct Mi50 32gb the ULTIMATE cheap gpu for a home ai server / LLM?

Is Radeon Instinct Mi50 32gb the ULTIMATE cheap gpu for a home ai server / LLM?

DGX Spark... First Mini PC That Feels Like a Data Center

DGX Spark... First Mini PC That Feels Like a Data Center

Высокая неопределенность решений // Впереди очень тяжелый год. Ответы на

Высокая неопределенность решений // Впереди очень тяжелый год. Ответы на "горячие" вопросы. Вып.128

Лучшие самостоятельные инструменты искусственного интеллекта, которые вы можете запустить в своей...

Лучшие самостоятельные инструменты искусственного интеллекта, которые вы можете запустить в своей...

Контейнерные LLM делают тестирование простым и надежным — Strix Halo Toolboxes

Контейнерные LLM делают тестирование простым и надежным — Strix Halo Toolboxes

Понимание рассуждений LLM (o1/o3, DeepSeek-R1, Gemini Thinking, Grok 3, Claude 3.7)

Понимание рассуждений LLM (o1/o3, DeepSeek-R1, Gemini Thinking, Grok 3, Claude 3.7)

Dev Workloads and LLMs… under $1000

Dev Workloads and LLMs… under $1000

Radeon R9700 Dual GPU First Look — AI/vLLM plus creative tests with Nuke & the Adobe Suite

Radeon R9700 Dual GPU First Look — AI/vLLM plus creative tests with Nuke & the Adobe Suite

Удары по экономике! Наша баржа не затонет? .. Обвал нефтегазовых доходов || Дмитрий Потапенко*.

Удары по экономике! Наша баржа не затонет? .. Обвал нефтегазовых доходов || Дмитрий Потапенко*.

How Does Strix Halo Stack Up on Linux? Feat. GMK Tec

How Does Strix Halo Stack Up on Linux? Feat. GMK Tec

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]