Realtime Research Walkthrough: Parenthesis Balancing in 1L Toy Language Model (Part 2)

Автор: Neel Nanda

Загружено: 2023-08-22

Просмотров: 815

Описание:

A research walkthrough of reverse-engineering how a 1L language model (trained on code + internet text) can balance parentheses, and trying to understand its neurons. Done for my MATS Scholars, but hopefully of broader interest!

Part 1: • Realtime Research Walkthrough: Parenthesis...

Realtime Research Walkthrough: Parenthesis Balancing in 1L Toy Language Model (Part 2)

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Databricks Data Engineer Professional Practice Test Questions - Part 17

Databricks Data Engineer Professional Practice Test Questions - Part 17

Neel Does Research (Vibe Coding Edition)

Neel Does Research (Vibe Coding Edition)

Causal Mechanistic Interpretability (Stanford lecture 1) - Atticus Geiger

Causal Mechanistic Interpretability (Stanford lecture 1) - Atticus Geiger

Why Benchmarks Aren't Enough: Eve Fleisig on Sociolinguistics & AI Evaluation | NeurIPS 2025

Why Benchmarks Aren't Enough: Eve Fleisig on Sociolinguistics & AI Evaluation | NeurIPS 2025

Understanding the Discrete Fourier Transform and the FFT

Understanding the Discrete Fourier Transform and the FFT

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Why are prompt optimizers still so underrated?

Why are prompt optimizers still so underrated?

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Что такое квантовая теория

Что такое квантовая теория

Как работала машина

Как работала машина "Энигма"?

Почему "вероятность 0" не означает "невозможно"

How Reasoning Models Break Mechanistic Interpretability Techniques

How Reasoning Models Break Mechanistic Interpretability Techniques

Зачем добавлять этот диод параллельно обмотке реле? Вот для чего он нужен!

Зачем добавлять этот диод параллельно обмотке реле? Вот для чего он нужен!

Серебро по $71 — это ГЛУБОКИЙ НАРКОЗ, который уничтожит ваш КАПИТАЛ | Уоррен Баффет

Серебро по $71 — это ГЛУБОКИЙ НАРКОЗ, который уничтожит ваш КАПИТАЛ | Уоррен Баффет

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

A Walkthrough of Copy Suppression w/ Callum McDougall, Arthur Conmy & Cody Rushing Part 1/3

A Walkthrough of Copy Suppression w/ Callum McDougall, Arthur Conmy & Cody Rushing Part 1/3