CEDA: Кросс-модальная оценка с помощью агентов для дебатов для надежного обнаружения галлюцинаций
Автор: LuxaK
Загружено: 2025-12-25
Просмотров: 8
В документе представлена CEDA, новая мультимодальная структура, разработанная для надежного обнаружения галлюцинаций в выходных данных больших языковых моделей (LLM). Она решает критическую проблему генерации LLM фактически неверного или необоснованного контента, особенно остро стоящую в мультимодальных и ответственных приложениях. CEDA использует уникальный трехкомпонентный подход: многоагентную систему обсуждения, в которой агенты критически анализируют и спорят о подлинности сгенерированного контента в разных модальностях; легковесный классификатор, интегрированный с LLM в качестве судьи для калиброванного обнаружения; и механизм оценки достоверности для количественной оценки неопределенности. Эта архитектура, основанная на обсуждении, позволяет проводить более тонкую и контекстуальную оценку, обеспечивая улучшенную обобщаемость, интерпретируемость и надежность по сравнению с существующими методами. В отличие от предыдущих работ, CEDA использует динамические подсказки и перекрестные ссылки на информацию из различных модальностей, включая изображения и текст, для расширения контекста. Обширные эксперименты на пяти эталонных наборах данных демонстрируют значительные улучшения CEDA по сравнению с базовыми методами обнаружения галлюцинаций. Данная структура также предоставляет интерпретируемые следы дебатов, улучшая понимание ее рассуждений.
#CEDA #ОбнаружениеГаллюцинаций #МногоагентныеДебаты #МультимодальныйИИ #LLMs #КоличественнаяОценкаНеопределенности #AIResearch #amazon
статья - https://www.amazon.science/publicatio...
подписка - https://t.me/arxivpaper
пожертвования:
USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr
ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e
создано с помощью NotebookLM
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: