앤트로픽: LLM의 생각을 추적하다
Автор: 스테이지5
Загружено: 29 мар. 2025 г.
Просмотров: 316 просмотров
AI 모델은 프로그래밍된 것이 아니라 학습을 통해 만들어지기 때문에, 실제로 어떻게 대부분의 기능을 수행하는지 아직 명확히 알지 못합니다. 하지만 우리가 새롭게 개발한 해석 가능성(interpretability) 기법을 통해 이들의 사고 과정을, 종종 복잡하고 놀라운 방식으로나마 추적할 수 있게 되었습니다.
앤트로픽 연구진은 최근 발표한 두 편의 논문을 통해, AI 모델이 내부적으로 어떠한 ‘회로’를 통해 생각하는지를 이해하는 데 있어 큰 진전을 이루었습니다. 한 논문 사례에서는, Claude가 훨씬 앞서 발생할 단어들을 미리 계획하고, 그 계획에 맞춰 문장을 완성해 나간다는 증거를 발견했습니다. 예컨대 시(詩)를 쓸 때 Claude는 미리 운(rhyme)을 맞출 단어들을 생각한 뒤, 각 줄을 해당 목표에 맞춰 작성한다는 것입니다. 이는 모델이 통상 한 단어씩 예측하도록 학습되었음에도 불구하고, 실제로는 훨씬 긴 구간에 걸쳐 사고하고 있음을 시사하는 강력한 증거입니다.
출처: • Tracing the thoughts of a large langu...

Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: