Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Tricks Learned from Training Large Open-Source Models | FOSDEM 2025

Автор: Collabora

Загружено: 2025-05-23

Просмотров: 115

Описание:

Tricks learned from training large open-source models on the example of WhisperSpeech, an open-source text-to-speech model.

WhisperSpeech is a new open-source text-to-speech model created by Collabora. It is based on recent research from the biggest AI labs (Google, Meta, Microsoft, OpenAI). It delivers high-quality speech that it learned from tens of thousands of hours of human speech recordings.

To deliver state-of-the-art quality, we scaled our models and training pipelines from hundreds to tens of thousands of hours of speech, and we share the lessons learned along the way. Nearly every component of your initial training process had to be replaced or tweaked heavily.

Challenges we'll briefly cover: - Gone in 16 minutes: the importance of small-scale experiments. - Full throttle: is 100% GPU utilization enough? - Do you need a fancy framework? From single- to multi-GPU training. - Are SSDs fast enough? WebDataset brings a 10x improvement. - Does bigger always mean better? How to effortlessly scale AI models. - Clouds, enthusiasts, or clusters? How to hunt down GPUs. - Defending moats. How is a gaming 4090 different from an H100?

Presented by Marcus Edel.

#FOSDEM #WhisperSpeech #OpenSource #ML #AI

Tricks Learned from Training Large Open-Source Models | FOSDEM 2025

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

KernelCI - Upgrading Linux development and integration workflows | FOSDEM 2025

KernelCI - Upgrading Linux development and integration workflows | FOSDEM 2025

Computer Science Students - Listen Up...

Computer Science Students - Listen Up...

Practical introduction to OpenTelemetry tracing | Nicolas Frankel at PTH Conf 2025

Practical introduction to OpenTelemetry tracing | Nicolas Frankel at PTH Conf 2025

Adopting BlueZ in production: challenges and caveats | FOSDEM 2025

Adopting BlueZ in production: challenges and caveats | FOSDEM 2025

Bringing Terminal Aesthetics to the Web With Rust (and Vice Versa) - FOSDEM 2025

Bringing Terminal Aesthetics to the Web With Rust (and Vice Versa) - FOSDEM 2025

Typst: Современная замена Word и LaTeX, которую ждали 40 лет

Typst: Современная замена Word и LaTeX, которую ждали 40 лет

Whisper AI Tutorial: Real-Time Speech-to-Text in Python

Whisper AI Tutorial: Real-Time Speech-to-Text in Python

Tyr: Open Source Rust driver for Arm Mali GPUs

Tyr: Open Source Rust driver for Arm Mali GPUs

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

FOSDEM 2025 tightening every bolt - with Daniel Stenberg

FOSDEM 2025 tightening every bolt - with Daniel Stenberg

All the open source software i use in 2025!

All the open source software i use in 2025!

GStreamer: State of the Union 2025 | FOSDEM 2025

GStreamer: State of the Union 2025 | FOSDEM 2025

СРОЧНО отключи это в Telegram! Защити себя ПРОСТЫМ и ЗАКОННЫМ способом

СРОЧНО отключи это в Telegram! Защити себя ПРОСТЫМ и ЗАКОННЫМ способом

Можно ли использовать Whisper для потоковой передачи ASR в реальном времени?

Можно ли использовать Whisper для потоковой передачи ASR в реальном времени?

From GL to your Encoder, Zero-Copy Made Possible | GStreamer Conference 2024

From GL to your Encoder, Zero-Copy Made Possible | GStreamer Conference 2024

20 концепций искусственного интеллекта, объясненных за 40 минут

20 концепций искусственного интеллекта, объясненных за 40 минут

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

GStreamer Nervous System for AI Brain : Introducing Python Analytics | GStreamer Conference 2024

GStreamer Nervous System for AI Brain : Introducing Python Analytics | GStreamer Conference 2024

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com