Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

How ChatGPT Turns the Internet Into Tokens (LLM Training Explained)

Автор: Lecture Distilled

Загружено: 2026-01-13

Просмотров: 20

Описание:

---
Ever wondered how ChatGPT was trained on "the internet" but its dataset fits on a $200 hard drive?

In this video, we break down the first stage of LLM training:
How 2.7 billion web pages get filtered down to 44 terabytes
Why tokenization matters (and why capitalization breaks things)
The design decisions that determine what your AI can and can't do

Key concepts covered:
00:00 - The paradox: Internet-scale training on a hard drive
00:30 - Data filtering pipeline (URL filtering, text extraction, deduplication)
02:30 - Why neural networks need tokens, not text
04:00 - Byte Pair Encoding explained
05:30 - Tokenization gotchas ("hello" vs "Hello")
06:30 - Practical takeaways

---

📚 ORIGINAL SOURCE
This video distills concepts from Andrej Karpathy's excellent deep dive:
"Deep Dive into LLMs like ChatGPT"
   • Deep Dive into LLMs like ChatGPT  

All credit for the original content goes to Andrej Karpathy. This is an educational summary designed to make key concepts more accessible.

---

🎓 About Lecture Distilled
We transform long-form educational content into focused, digestible videos. Subscribe for more distilled knowledge!

#LLM #ChatGPT #MachineLearning #AI #Tokenization #DeepLearning #ArtificialIntelligence #AndrejKarpathy
```

How ChatGPT Turns the Internet Into Tokens (LLM Training Explained)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Deep Dive into LLMs like ChatGPT

Deep Dive into LLMs like ChatGPT

Восстановление работы ВСЕГО ОДНОЙ МЫШЦЫ - может улучшить Ваше зрение!

Восстановление работы ВСЕГО ОДНОЙ МЫШЦЫ - может улучшить Ваше зрение!

Jacqueline Leake  The 5 Minute AI Audit

Jacqueline Leake The 5 Minute AI Audit

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Может ли у ИИ появиться сознание? — Семихатов, Анохин

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Top 30 Machine Learning Interview Questions 2025 | ML Interview Questions And Answers | Intellipaat

Top 30 Machine Learning Interview Questions 2025 | ML Interview Questions And Answers | Intellipaat

Получение степени магистра права: создание, обучение, доработка

Получение степени магистра права: создание, обучение, доработка

Я в опасности

Я в опасности

Как вылечить БЕЗ операций Близорукость,Дальнозоркость,Астигматизм,Косоглазие.Упражнения проф.Жданова

Как вылечить БЕЗ операций Близорукость,Дальнозоркость,Астигматизм,Косоглазие.Упражнения проф.Жданова

Recurrent Neural Networks (RNNs), Clearly Explained!!!

Recurrent Neural Networks (RNNs), Clearly Explained!!!

[1hr Talk] Intro to Large Language Models

[1hr Talk] Intro to Large Language Models

То, что они только что построили, — нереально

То, что они только что построили, — нереально

Lec-10: Decision Tree 🌲 ID3 Algorithm with Example & Calculations 🧮

Lec-10: Decision Tree 🌲 ID3 Algorithm with Example & Calculations 🧮

Уоррен Баффет: Если вы хотите разбогатеть, перестаньте покупать эти 5 вещей.

Уоррен Баффет: Если вы хотите разбогатеть, перестаньте покупать эти 5 вещей.

Как работает ChatGPT технически | Архитектура ChatGPT

Как работает ChatGPT технически | Архитектура ChatGPT

How To Train Deep Learning Models In Google Colab- Must For Everyone

How To Train Deep Learning Models In Google Colab- Must For Everyone

Создайте свою первую модель машинного обучения на Python

Создайте свою первую модель машинного обучения на Python

The Man Behind Google's AI Machine | Demis Hassabis Interview

The Man Behind Google's AI Machine | Demis Hassabis Interview

Глава DeepMind: миллионы ИИ-агентов выйдут в интернет - и это меняет всё

Глава DeepMind: миллионы ИИ-агентов выйдут в интернет - и это меняет всё

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com