Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Train Your Own Reasoning Model (DeepSeek Clone) Fast & With Only 7Gb Of VRAM

Автор: Machine Learning With Hamza

Загружено: 2025-02-17

Просмотров: 10898

Описание:

Hello everyone, I hope you're doing well!
In this video, I show you how to fine-tune LLMs locally for the task of reasoning, using the reinforcement learning algorithm called GRPO. You can perform the fine tuning with a GPU of at least 7Gb of VRAM using the Unsloth fast fine-tuning python library.

Used material links:
Github Repo: https://github.com/Hmzbo/Fine-tune-LL...
Hugging face post: https://huggingface.co/learn/cookbook...
Unsloth notebooks: https://docs.unsloth.ai/get-started/u...

Let's connect:
LinkedIn: https://bit.ly/3roXgQ2
GitHub: https://bit.ly/3CrfRRP
Kaggle: https://bit.ly/3C1mqZD
Twitter: https://bit.ly/3UR06e3
--------------------------------------------------------------
♪ Song: Memories
Artist: Owl Nest
Music by: CreatorMix.com
Video:    • Free Lofi Music For YouTube Videos No Copy...  
--------------------------------------------------------------

If you have any question, suggestion, or remark. Feel free to leave it in a comment below!
Until next time, stay safe!
#mlwh

00:00 Intro
01:02 Explaining GRPO
08:03 Environment Setup guidelines
10:20 Data , Model & Reward functions
17:57 Training
21:24 Training results
23:47 Testing

Train Your Own Reasoning Model (DeepSeek Clone) Fast & With Only 7Gb Of VRAM

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

How to Train LLMs to

How to Train LLMs to "Think" (o1 & DeepSeek-R1)

Момент, когда мы перестали понимать ИИ [AlexNet]

Момент, когда мы перестали понимать ИИ [AlexNet]

Куда исчезает ёмкость MLCC? Эффект DC-Bias и старение керамики X7R

Куда исчезает ёмкость MLCC? Эффект DC-Bias и старение керамики X7R

USB-C ИЛИ THUNDERBOLT | А ЕСТЬ ЛИ РАЗНИЦА?

USB-C ИЛИ THUNDERBOLT | А ЕСТЬ ЛИ РАЗНИЦА?

Important Python Coding Tips For Machine Learning Coding

Important Python Coding Tips For Machine Learning Coding

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Пожалуй, главное заблуждение об электричестве [Veritasium]

Пожалуй, главное заблуждение об электричестве [Veritasium]

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

EASIEST Way to Fine-Tune a LLM and Use It With Ollama

EASIEST Way to Fine-Tune a LLM and Use It With Ollama

RAG vs. CAG: Solving Knowledge Gaps in AI Models

RAG vs. CAG: Solving Knowledge Gaps in AI Models

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Вы думали, что допинг — это плохо? Подождите, пока не услышите об электромагнитных велосипедах.

Вы думали, что допинг — это плохо? Подождите, пока не услышите об электромагнитных велосипедах.

Корень из двух – первая математическая трагедия // Vital Math

Корень из двух – первая математическая трагедия // Vital Math

Самый важный алгоритм в машинном обучении

Самый важный алгоритм в машинном обучении

How DeepSeek Rewrote the Transformer [MLA]

How DeepSeek Rewrote the Transformer [MLA]

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

Путешествие в заквантовый мир. Визуализация субатомных частиц, вирусов, и молекул

Путешествие в заквантовый мир. Визуализация субатомных частиц, вирусов, и молекул

Линус Торвальдс рассказывает о шумихе вокруг искусственного интеллекта, мощности графических проц...

Линус Торвальдс рассказывает о шумихе вокруг искусственного интеллекта, мощности графических проц...

The Evolution Of Conv Nets - Highlights & Main Breakthroughs

The Evolution Of Conv Nets - Highlights & Main Breakthroughs

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]