Проверка цепочки рассуждений с помощью ее вычислительного графа

Автор: AI Papers Podcast Daily

Загружено: 2025-11-01

Просмотров: 55

Описание:

В этом исследовании представлен новый метод «белого ящика», называемый *Проверка рассуждений на основе цепочек (CRV)**, предназначенный для анализа и диагностики причин сбоев больших языковых моделей (LLM) при использовании рассуждений на основе цепочки мыслей (Chain-of-Thought, CoT). В отличие от предыдущих методов, которые рассматривали только конечные результаты (черный ящик) или исходные внутренние состояния (серый ящик), CRV работает, тщательно исследуя внутренний вычислительный процесс модели. Основная идея заключается в том, что правильные и неправильные шаги рассуждения оставляют уникальные «структурные отпечатки» на вычислительном графе модели, который служит трассировкой выполнения её базовых цепочек. Для проведения такого анализа исследователи сначала создают интерпретируемую суррогатную модель, заменяя её внутренние модули «транскодерами», а затем строят графы атрибуции, фиксирующие причинно-следственные связи информации для каждого шага рассуждения. Обучая диагностический классификатор на структурных свойствах этих графов, исследование показывает, что CRV стабильно превосходит традиционные базовые модели «черного ящика» и «серого ящика» в выявлении ошибок рассуждений. Более того, CRV позволил получить новые знания: сигнатуры ошибок обладают высокой предсказательной силой, но при этом **специфичны для предметной области**, что означает, что различные задачи рассуждения приводят к сбоям структурно разными способами, и анализ позволяет направлять целенаправленные вмешательства на отдельные признаки для **причинно-следственной коррекции* ошибочных рассуждений, смещая фокус с простого обнаружения ошибок на более глубокое, механистическое понимание сбоев в LLM.

https://arxiv.org/pdf/2510.09312

Проверка цепочки рассуждений с помощью ее вычислительного графа

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Удар по Темрюку, Трамп в Давосе, Адам идет на поправку. Галлямов, Касьянов, Филиппенко

Удар по Темрюку, Трамп в Давосе, Адам идет на поправку. Галлямов, Касьянов, Филиппенко

Do Explanations Generalize Across Large Reasoning Models?

Do Explanations Generalize Across Large Reasoning Models?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

⚡️ Кремль экстренно созвал Совбез || Путин принимает условия США

⚡️ Кремль экстренно созвал Совбез || Путин принимает условия США

Literature Meets Data: A Synergistic Approach to Hypothesis Generation

Literature Meets Data: A Synergistic Approach to Hypothesis Generation

Президент выводит войска? / Спецборт срочно вылетел в Москву

Президент выводит войска? / Спецборт срочно вылетел в Москву

The Electron-Compute Nexus: Alphabet’s $4.75 Billion Energy Integration

The Electron-Compute Nexus: Alphabet’s $4.75 Billion Energy Integration

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Генеративный ИИ в двух словах: как выжить и преуспеть в эпоху ИИ

Генеративный ИИ в двух словах: как выжить и преуспеть в эпоху ИИ

How to Say Numbers EVEN FASTER

How to Say Numbers EVEN FASTER

Bloomberg Surveillance 1/21/2026

Bloomberg Surveillance 1/21/2026

Травматолог №1: Суставы в 40, будут как в 20! Главное внедрите эти простые привычки

Травматолог №1: Суставы в 40, будут как в 20! Главное внедрите эти простые привычки

Учебник по monday.com для начинающих

Учебник по monday.com для начинающих

Что такое генеративный ИИ и как он работает? – Лекции Тьюринга с Миреллой Лапатой

Что такое генеративный ИИ и как он работает? – Лекции Тьюринга с Миреллой Лапатой

ЛИПСИЦ: Кризис ТОТАЛЬНЫЙ. Минфин горит. Нефть Путина никому не нужна. Цены растут. Трамп. Банки

ЛИПСИЦ: Кризис ТОТАЛЬНЫЙ. Минфин горит. Нефть Путина никому не нужна. Цены растут. Трамп. Банки

Компания Salesforce признала свою ошибку.

Компания Salesforce признала свою ошибку.

Reasoning Models Generate Societies of Thought

Reasoning Models Generate Societies of Thought

Why reinforcement learning plateaus without representation depth (key takeaways from NeurIPS 2025)

Why reinforcement learning plateaus without representation depth (key takeaways from NeurIPS 2025)

Почему зарядка после 60 ускоряет потерю мышц? Парадокс сардинских долгожителей | ЗДОРОВЬЕ ДАРОМ

Почему зарядка после 60 ускоряет потерю мышц? Парадокс сардинских долгожителей | ЗДОРОВЬЕ ДАРОМ

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем