Train Your Own Reasoning Model (DeepSeek Clone) Fast & With Only 7Gb Of VRAM

Автор: Machine Learning With Hamza

Загружено: 2025-02-17

Просмотров: 10898

Описание:

Hello everyone, I hope you're doing well!
In this video, I show you how to fine-tune LLMs locally for the task of reasoning, using the reinforcement learning algorithm called GRPO. You can perform the fine tuning with a GPU of at least 7Gb of VRAM using the Unsloth fast fine-tuning python library.

Used material links:
Github Repo: https://github.com/Hmzbo/Fine-tune-LL...
Hugging face post: https://huggingface.co/learn/cookbook...
Unsloth notebooks: https://docs.unsloth.ai/get-started/u...

Let's connect:
LinkedIn: https://bit.ly/3roXgQ2
GitHub: https://bit.ly/3CrfRRP
Kaggle: https://bit.ly/3C1mqZD
Twitter: https://bit.ly/3UR06e3
--------------------------------------------------------------
♪ Song: Memories
Artist: Owl Nest
Music by: CreatorMix.com
Video: • Free Lofi Music For YouTube Videos No Copy...
--------------------------------------------------------------

If you have any question, suggestion, or remark. Feel free to leave it in a comment below!
Until next time, stay safe!
#mlwh

00:00 Intro
01:02 Explaining GRPO
08:03 Environment Setup guidelines
10:20 Data , Model & Reward functions
17:57 Training
21:24 Training results
23:47 Testing

Train Your Own Reasoning Model (DeepSeek Clone) Fast & With Only 7Gb Of VRAM

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

How to Train LLMs to

How to Train LLMs to "Think" (o1 & DeepSeek-R1)

Момент, когда мы перестали понимать ИИ [AlexNet]

Момент, когда мы перестали понимать ИИ [AlexNet]

Куда исчезает ёмкость MLCC? Эффект DC-Bias и старение керамики X7R

Куда исчезает ёмкость MLCC? Эффект DC-Bias и старение керамики X7R

USB-C ИЛИ THUNDERBOLT | А ЕСТЬ ЛИ РАЗНИЦА?

USB-C ИЛИ THUNDERBOLT | А ЕСТЬ ЛИ РАЗНИЦА?

Important Python Coding Tips For Machine Learning Coding

Important Python Coding Tips For Machine Learning Coding

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Пожалуй, главное заблуждение об электричестве [Veritasium]

Пожалуй, главное заблуждение об электричестве [Veritasium]

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

EASIEST Way to Fine-Tune a LLM and Use It With Ollama

EASIEST Way to Fine-Tune a LLM and Use It With Ollama

RAG vs. CAG: Solving Knowledge Gaps in AI Models

RAG vs. CAG: Solving Knowledge Gaps in AI Models

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Вы думали, что допинг — это плохо? Подождите, пока не услышите об электромагнитных велосипедах.

Вы думали, что допинг — это плохо? Подождите, пока не услышите об электромагнитных велосипедах.

Корень из двух – первая математическая трагедия // Vital Math

Корень из двух – первая математическая трагедия // Vital Math

Самый важный алгоритм в машинном обучении

Самый важный алгоритм в машинном обучении

How DeepSeek Rewrote the Transformer [MLA]

How DeepSeek Rewrote the Transformer [MLA]

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

Путешествие в заквантовый мир. Визуализация субатомных частиц, вирусов, и молекул

Путешествие в заквантовый мир. Визуализация субатомных частиц, вирусов, и молекул

Линус Торвальдс рассказывает о шумихе вокруг искусственного интеллекта, мощности графических проц...

Линус Торвальдс рассказывает о шумихе вокруг искусственного интеллекта, мощности графических проц...

The Evolution Of Conv Nets - Highlights & Main Breakthroughs

The Evolution Of Conv Nets - Highlights & Main Breakthroughs