Why LLMs Shouldn’t Follow Instructions (But Do)

Автор: ML Guy

Загружено: 2026-01-11

Просмотров: 40

Описание:

A pretrained language model can predict text, but it doesn’t know how to help you.

In this video, we break down how raw LLMs are transformed into instruction-following assistants like ChatGPT. You’ll learn how fine-tuning, human preference data, and reinforcement learning from human feedback (RLHF) reshape a model’s behavior — without changing its architecture.

We cover:

Why next-token prediction alone is not enough
Supervised fine-tuning with instruction–response pairs
How human rankings become a reward model
What RLHF actually optimizes (and what it doesn’t)
How safety, refusals, and “helpfulness” emerge statistically
Common misconceptions about alignment and hard-coded rules

This episode connects training objectives to real-world behavior — and explains why alignment is one of the hardest unsolved problems in modern AI.

Why LLMs Shouldn’t Follow Instructions (But Do)

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Очередное ПОТРЯСЕНИЕ ИИ! Google Снова Разгромил Big Tech! Google Видео Потрясло Всех! xAI в Пентагон

Очередное ПОТРЯСЕНИЕ ИИ! Google Снова Разгромил Big Tech! Google Видео Потрясло Всех! xAI в Пентагон

What is NotebookLM and Why do you need it?

What is NotebookLM and Why do you need it?

What's going on at OpenAI?!

What's going on at OpenAI?!

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Why Scaling to 64 Cores Makes Your Code Cry (NUMA Explained)

Why Scaling to 64 Cores Makes Your Code Cry (NUMA Explained)

The Equation That Changed AI: Self-Attention SIMPLY Explained

The Equation That Changed AI: Self-Attention SIMPLY Explained

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

How LLMs Turn Text Into Numbers: Tokenization & Embeddings Explained

How LLMs Turn Text Into Numbers: Tokenization & Embeddings Explained

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Скрытая функция Gmail сводит пользователей с ума

Скрытая функция Gmail сводит пользователей с ума

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Your GPT Model Has No Sense of Order Without This Trick

Your GPT Model Has No Sense of Order Without This Trick

Почему нейросети постоянно врут? (и почему этого уже не исправить)

Почему нейросети постоянно врут? (и почему этого уже не исправить)

Ученые ЦЕРН обнаружили скрытый слой под поверхностью реальности (и он не исчезнет).

Ученые ЦЕРН обнаружили скрытый слой под поверхностью реальности (и он не исчезнет).

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

Компания Salesforce признала свою ошибку.

Компания Salesforce признала свою ошибку.

Я в опасности