Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Why LLMs Shouldn’t Follow Instructions (But Do)

Автор: ML Guy

Загружено: 2026-01-11

Просмотров: 40

Описание:

A pretrained language model can predict text, but it doesn’t know how to help you.

In this video, we break down how raw LLMs are transformed into instruction-following assistants like ChatGPT. You’ll learn how fine-tuning, human preference data, and reinforcement learning from human feedback (RLHF) reshape a model’s behavior — without changing its architecture.

We cover:

Why next-token prediction alone is not enough
Supervised fine-tuning with instruction–response pairs
How human rankings become a reward model
What RLHF actually optimizes (and what it doesn’t)
How safety, refusals, and “helpfulness” emerge statistically
Common misconceptions about alignment and hard-coded rules

This episode connects training objectives to real-world behavior — and explains why alignment is one of the hardest unsolved problems in modern AI.

Why LLMs Shouldn’t Follow Instructions (But Do)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Очередное ПОТРЯСЕНИЕ ИИ! Google Снова Разгромил Big Tech! Google Видео Потрясло Всех! xAI в Пентагон

Очередное ПОТРЯСЕНИЕ ИИ! Google Снова Разгромил Big Tech! Google Видео Потрясло Всех! xAI в Пентагон

What is NotebookLM and Why do you need it?

What is NotebookLM and Why do you need it?

What's going on at OpenAI?!

What's going on at OpenAI?!

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Why Scaling to 64 Cores Makes Your Code Cry (NUMA Explained)

Why Scaling to 64 Cores Makes Your Code Cry (NUMA Explained)

The Equation That Changed AI: Self-Attention SIMPLY Explained

The Equation That Changed AI: Self-Attention SIMPLY Explained

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

How LLMs Turn Text Into Numbers: Tokenization & Embeddings Explained

How LLMs Turn Text Into Numbers: Tokenization & Embeddings Explained

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Скрытая функция Gmail сводит пользователей с ума

Скрытая функция Gmail сводит пользователей с ума

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Your GPT Model Has No Sense of Order Without This Trick

Your GPT Model Has No Sense of Order Without This Trick

Почему нейросети постоянно врут? (и почему этого уже не исправить)

Почему нейросети постоянно врут? (и почему этого уже не исправить)

Ученые ЦЕРН обнаружили скрытый слой под поверхностью реальности (и он не исчезнет).

Ученые ЦЕРН обнаружили скрытый слой под поверхностью реальности (и он не исчезнет).

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

Компания Salesforce признала свою ошибку.

Компания Salesforce признала свою ошибку.

Я в опасности

Я в опасности

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com