Аналогия с мишенью для дартса: оптимизация поиска в условиях неопределенности в RAG
Автор: LLMs Explained - Aggregate Intellect - AI.SCIENCE
Загружено: 2025-11-28
Просмотров: 39
В этом видео показано, как на практике извлекать разнообразные и ценные факты для конвейеров RAG. Мы рассмотрим классический подход MMR (лямбда-регулятор), который балансирует между релевантностью и разнообразием, его ограничения (дубликаты, проблемы с настройкой) и более принципиальный подход, основанный на приросте информации и неопределенности. Используя аналогию с мишенью для игры в дартс, мы объясним, почему метод K-ближайших соседей может создавать избыточные массивы данных, как моделирование с учетом неопределенности встраивания (сигма) меняет стратегию выбора и почему небольшая комбинаторная оптимизация может выбрать набор, который максимизирует вероятность того, что LLM действительно найдет нужный факт в контексте.
Идеально подходит для инженеров машинного обучения и инженеров-справочников, создающих системы поиска данных в производственных системах. Оставьте комментарий, рассказав о своих проблемах, связанных с RAG.
#RAG #MMR #RetrievalAugmentedGeneration #Embeddings #CrossEncoder #LLM #InformationRetrieval #NLP #PromptEngineering #MachineLearning #DataScience
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: