Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Pre-Train LLMs from scratch (Python)

Автор: NikolAI Skripko

Загружено: 2025-03-10

Просмотров: 1431

Описание:

Learn how LLMs work, how to train them, and how to speed up the training process in Python using the llm_trainer library. This library allows you to train any LLM model in just a few lines of code.

The first step of training is called Pre-Training. In this stage, you expose a language model to a vast amount of internet data. The goal is for the model to develop a general understanding of the world. The second step is Post-Training, where you fine-tune your model on a smaller dataset formatted as dialogues (to create an assistant capable of answering questions).

Additionally, there is a stage called Reinforcement Learning from Human Feedback (RLHF), which is used to train reasoning models.

Useful Links:
🤖 LLM Trainer library: https://github.com/Skripkon/llm_trainer
🔑 Play around with tokenizers: https://tiktokenizer.vercel.app/
🎭 Read about Masked Language Modeling (MLM): https://arxiv.org/pdf/1810.04805
🌐 Article about the FineWeb Dataset: https://huggingface.co/spaces/Hugging...

Timecodes:
00:00 - Intro
00:30 - llm_trainer overview
02:00 - Preparing a dataset
04:40 - How tokenizers work
08:18 - llm_trainer library structure
08:55 - create_dataset function
13:27 - DataLoader
18:20 - LLMTrainer class
28:15 - GPT-2 example
30:45 - xLSTM example
33:58 - Base & Chat models, SFT
34:59 - Outro


#ai #llm #nlp #LLMTraining #MachineLearning #PythonLibrary #llm_trainer
#AITraining #ModelTraining #Tokenizers #PreTraining #PostTraining #GPT2 #xLSTM #FineTuning #LanguageModeling #ArtificialIntelligence #TechTutorial #DeepLearning #MLM #AIResearch #DataScience #AIExplained

Pre-Train LLMs from scratch (Python)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

LSTM для начинающих — Учебник по Python (Tensorflow, Keras)

LSTM для начинающих — Учебник по Python (Tensorflow, Keras)

Feed Your OWN Documents to a Local Large Language Model!

Feed Your OWN Documents to a Local Large Language Model!

The Architecture Behind Billion-Dollar AI Apps (APIs & LLMs)

The Architecture Behind Billion-Dollar AI Apps (APIs & LLMs)

Ralph Loop — x100 продуктивности Claude Code

Ralph Loop — x100 продуктивности Claude Code

How to Create a Chess Engine with PyTorch (Python)

How to Create a Chess Engine with PyTorch (Python)

Machine Learning - LSTM multiple input and multiple out for equipment failure prediction

Machine Learning - LSTM multiple input and multiple out for equipment failure prediction

Create a Large Language Model from Scratch with Python – Tutorial

Create a Large Language Model from Scratch with Python – Tutorial

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Почему ваш код не соответствует Python (и как это исправить)

Почему ваш код не соответствует Python (и как это исправить)

Синьор 1С: 10 привычек, без которых ты не вырастешь

Синьор 1С: 10 привычек, без которых ты не вырастешь

Let's build GPT: from scratch, in code, spelled out.

Let's build GPT: from scratch, in code, spelled out.

DeepSeek R1 Coldstart: How to TRAIN a 1.5B Model to REASON

DeepSeek R1 Coldstart: How to TRAIN a 1.5B Model to REASON

Все библиотеки и модули Python объясняются за 13 минут

Все библиотеки и модули Python объясняются за 13 минут

Cursor AI: полный гайд по вайб-кодингу (настройки, фишки, rules, MCP)

Cursor AI: полный гайд по вайб-кодингу (настройки, фишки, rules, MCP)

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

How to Create a Chess Engine with TensorFlow (Python)

How to Create a Chess Engine with TensorFlow (Python)

Тонкая настройка DeepSeek R1 | Создание медицинского чат-бота

Тонкая настройка DeepSeek R1 | Создание медицинского чат-бота

Делаю нейросеть с нуля

Делаю нейросеть с нуля

Neovim 0.12: новый менеджер плагинов и минимальный IDE-конфиг

Neovim 0.12: новый менеджер плагинов и минимальный IDE-конфиг

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com