앤트로픽: LLM의 생각을 추적하다

Автор: 스테이지5

Загружено: 29 мар. 2025 г.

Просмотров: 316 просмотров

Описание:

AI 모델은 프로그래밍된 것이 아니라 학습을 통해 만들어지기 때문에, 실제로 어떻게 대부분의 기능을 수행하는지 아직 명확히 알지 못합니다. 하지만 우리가 새롭게 개발한 해석 가능성(interpretability) 기법을 통해 이들의 사고 과정을, 종종 복잡하고 놀라운 방식으로나마 추적할 수 있게 되었습니다.

앤트로픽 연구진은 최근 발표한 두 편의 논문을 통해, AI 모델이 내부적으로 어떠한 ‘회로’를 통해 생각하는지를 이해하는 데 있어 큰 진전을 이루었습니다. 한 논문 사례에서는, Claude가 훨씬 앞서 발생할 단어들을 미리 계획하고, 그 계획에 맞춰 문장을 완성해 나간다는 증거를 발견했습니다. 예컨대 시(詩)를 쓸 때 Claude는 미리 운(rhyme)을 맞출 단어들을 생각한 뒤, 각 줄을 해당 목표에 맞춰 작성한다는 것입니다. 이는 모델이 통상 한 단어씩 예측하도록 학습되었음에도 불구하고, 실제로는 훨씬 긴 구간에 걸쳐 사고하고 있음을 시사하는 강력한 증거입니다.

출처: • Tracing the thoughts of a large langu...

앤트로픽: LLM의 생각을 추적하다

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Страшная правда об искусственном интеллекте о которой никто не говорит

Страшная правда об искусственном интеллекте о которой никто не говорит

Американский профессор предупреждает о катастрофе! Искусственный интеллект опаснее, чем мы думаем

Американский профессор предупреждает о катастрофе! Искусственный интеллект опаснее, чем мы думаем

Удар ВМС США по российским морякам / Москва в ярости

Удар ВМС США по российским морякам / Москва в ярости

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Теория всего? Принцип наименьшего действия [Veritasium]

Теория всего? Принцип наименьшего действия [Veritasium]

Этот РОБОТ начинает РЕВОЛЮЦИЮ | РАЗБОР Figure

Этот РОБОТ начинает РЕВОЛЮЦИЮ | РАЗБОР Figure

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Что на самом деле происходит в Курской области. Руслан Левиев

Что на самом деле происходит в Курской области. Руслан Левиев

Кассовые бомбы