Pre-Train LLMs from scratch (Python)

Автор: NikolAI Skripko

Загружено: 2025-03-10

Просмотров: 1431

Описание:

Learn how LLMs work, how to train them, and how to speed up the training process in Python using the llm_trainer library. This library allows you to train any LLM model in just a few lines of code.

The first step of training is called Pre-Training. In this stage, you expose a language model to a vast amount of internet data. The goal is for the model to develop a general understanding of the world. The second step is Post-Training, where you fine-tune your model on a smaller dataset formatted as dialogues (to create an assistant capable of answering questions).

Additionally, there is a stage called Reinforcement Learning from Human Feedback (RLHF), which is used to train reasoning models.

Useful Links:
🤖 LLM Trainer library: https://github.com/Skripkon/llm_trainer
🔑 Play around with tokenizers: https://tiktokenizer.vercel.app/
🎭 Read about Masked Language Modeling (MLM): https://arxiv.org/pdf/1810.04805
🌐 Article about the FineWeb Dataset: https://huggingface.co/spaces/Hugging...

Timecodes:
00:00 - Intro
00:30 - llm_trainer overview
02:00 - Preparing a dataset
04:40 - How tokenizers work
08:18 - llm_trainer library structure
08:55 - create_dataset function
13:27 - DataLoader
18:20 - LLMTrainer class
28:15 - GPT-2 example
30:45 - xLSTM example
33:58 - Base & Chat models, SFT
34:59 - Outro

#ai #llm #nlp #LLMTraining #MachineLearning #PythonLibrary #llm_trainer
#AITraining #ModelTraining #Tokenizers #PreTraining #PostTraining #GPT2 #xLSTM #FineTuning #LanguageModeling #ArtificialIntelligence #TechTutorial #DeepLearning #MLM #AIResearch #DataScience #AIExplained

Pre-Train LLMs from scratch (Python)

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

LSTM для начинающих — Учебник по Python (Tensorflow, Keras)

LSTM для начинающих — Учебник по Python (Tensorflow, Keras)

Feed Your OWN Documents to a Local Large Language Model!

Feed Your OWN Documents to a Local Large Language Model!

The Architecture Behind Billion-Dollar AI Apps (APIs & LLMs)

The Architecture Behind Billion-Dollar AI Apps (APIs & LLMs)

Ralph Loop — x100 продуктивности Claude Code

Ralph Loop — x100 продуктивности Claude Code

How to Create a Chess Engine with PyTorch (Python)

How to Create a Chess Engine with PyTorch (Python)

Machine Learning - LSTM multiple input and multiple out for equipment failure prediction

Machine Learning - LSTM multiple input and multiple out for equipment failure prediction

Create a Large Language Model from Scratch with Python – Tutorial

Create a Large Language Model from Scratch with Python – Tutorial

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Почему ваш код не соответствует Python (и как это исправить)

Почему ваш код не соответствует Python (и как это исправить)

Синьор 1С: 10 привычек, без которых ты не вырастешь

Синьор 1С: 10 привычек, без которых ты не вырастешь

Let's build GPT: from scratch, in code, spelled out.

Let's build GPT: from scratch, in code, spelled out.

DeepSeek R1 Coldstart: How to TRAIN a 1.5B Model to REASON

DeepSeek R1 Coldstart: How to TRAIN a 1.5B Model to REASON

Все библиотеки и модули Python объясняются за 13 минут

Все библиотеки и модули Python объясняются за 13 минут

Cursor AI: полный гайд по вайб-кодингу (настройки, фишки, rules, MCP)

Cursor AI: полный гайд по вайб-кодингу (настройки, фишки, rules, MCP)

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

How to Create a Chess Engine with TensorFlow (Python)

How to Create a Chess Engine with TensorFlow (Python)

Тонкая настройка DeepSeek R1 | Создание медицинского чат-бота

Тонкая настройка DeepSeek R1 | Создание медицинского чат-бота

Делаю нейросеть с нуля

Делаю нейросеть с нуля

Neovim 0.12: новый менеджер плагинов и минимальный IDE-конфиг

Neovim 0.12: новый менеджер плагинов и минимальный IDE-конфиг

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Вся IT-база в ОДНОМ видео: Память, Процессор, Код