RAG-System mit PDFs, Tabellen & Bildern (n8n KI Chatbot)

Автор: Philip Thomas

Загружено: 2026-01-16

Просмотров: 438

Описание:

PRO-Community: https://philipthomas.de/pro

Supabase Langchain Doku: https://supabase.com/docs/guides/ai/l...

In diesem Video schauen wir uns an, wie man ein multimodales und hybrides RAG-System in n8n baut, das unterschiedliche Dokumenttypen in eine durchsuchbare Wissensdatenbank überführt. Das System kann nicht nur klassische Textdokumente verarbeiten, sondern auch gescannte PDFs, Bilder und strukturierte Daten in Form von Tabellen. Es entscheidet darüber hinaus selbst, welcher Zugriffstyp (z.B. semantische Suche oder SQL-Abfrage) für eine Anfrage am besten geeignet ist.

Um auch nicht maschinenlesbare Dokumente nutzbar zu machen, kommt Mistral OCR (Optical Character Recognition) zum Einsatz. Damit können Texte und Tabellen in einem LLM-freundlichen Format aus Scans extrahiert werden. Diese werden anschließend in einer Vektordatenbank gespeichert und stehen dort für semantische Suche zur Verfügung. So kann das System erklärende und kontextuelle Fragen auf Basis inhaltlicher Ähnlichkeit beantworten.

Zusätzlich lassen sich auch eingebundene Bilder mittels Mistral OCR extrahieren. Dadurch kann der RAG-Agent bei seinen Antworten nicht nur Text, sondern auch relevante Bilder direkt mit ausgeben.

Strukturierte Daten in Form von CSV-Dateien oder Google Sheets eignen sich dagegen nicht für eine Vektordatenbank. Durch das Aufteilen in Chunks gehen Zusammenhänge verloren, und Auswertungen wie Summen, Filter oder Vergleiche lassen sich so nicht zuverlässig durchführen. Solche Daten werden deshalb stattdessen in einer relationalen Datenbank gespeichert (Supabase / PostgreSQL).

Auf Basis der jeweiligen Anfrage entscheidet der RAG-Agent anschließend selbst, welche Retrieval-Strategie sinnvoll ist: Für erklärende oder kontextuelle Fragen nutzt er eine semantische Suche über eine Vektordatenbank, für Anfragen zu strukturierten Daten greift er auf SQL-Abfragen zurück, und wenn eine Anfrage eine vollständige Übersicht oder Zusammenfassung erfordert, lädt er den gesamten Inhalt eines Dokuments.

#rag #ragsystem #mistralocr #kichatbot

00:00 Intro
01:11 Demo
04:46 Architektur des RAG-Systems
06:49 Überblick & Datenbank Initialisierung (Supabase)
17:42 Google Drive Trigger
20:26 Daten aus Textdatei extrahieren
22:20 Daten aus PDF extrahieren (Mistral OCR)
38:23 Tabellarische Daten extrahieren
41:21 Daten in der Datenbank speichern
57:19 Daten löschen
1:00:03 Aufbau des RAG-Agents

RAG-System mit PDFs, Tabellen & Bildern (n8n KI Chatbot)

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Твой RAG Это Шерлок С Гибридным Поиском (Hybrid Search)

Твой RAG Это Шерлок С Гибридным Поиском (Hybrid Search)

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Удалил Notion: Как ИИ наводит порядок в делах (n8n + NotebookLM + Gemini)

Удалил Notion: Как ИИ наводит порядок в делах (n8n + NotebookLM + Gemini)

Claude Code is Better at n8n than I am (Beginner's Guide)

Claude Code is Better at n8n than I am (Beginner's Guide)

NotebookLM на максималках: 4 расширения, которые экономят дни!

NotebookLM на максималках: 4 расширения, которые экономят дни!

Почему огонь ГОРИТ. Ответ Фейнмана переворачивает реальность

Почему огонь ГОРИТ. Ответ Фейнмана переворачивает реальность

Сардарян вместо Урганта, Дугин против Чебурашки, Царь-Сугроб, Соловьева обрезали. Перемотка№22

Сардарян вместо Урганта, Дугин против Чебурашки, Царь-Сугроб, Соловьева обрезали. Перемотка№22

Комментарий к текущим событиям от 15 января 2026 года. Михаил Хазин

Комментарий к текущим событиям от 15 января 2026 года. Михаил Хазин

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Я Обманул Экспертов Элитной Парфюмерии Спреем с Пердежом

Я Обманул Экспертов Элитной Парфюмерии Спреем с Пердежом

Зимние испытания 2025/2026 электромобилей и гибридов.

Зимние испытания 2025/2026 электромобилей и гибридов.

Автоматически извлекайте данные из PDF-файлов и изображений с помощью ИИ! (N8N + Mistral OCR)

Автоматически извлекайте данные из PDF-файлов и изображений с помощью ИИ! (N8N + Mistral OCR)

Рисорджименто: как родилась Италия

Рисорджименто: как родилась Италия

⚡️ Путин предложил Западу сделку || НАТО поставили перед условием

⚡️ Путин предложил Западу сделку || НАТО поставили перед условием

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

КУСТО УВИДЕЛ ЧТО СКРЫВАЛИ НА ДНЕ БАЙКАЛА! О ЧЕМ МОЛЧАЛ СССР?

КУСТО УВИДЕЛ ЧТО СКРЫВАЛИ НА ДНЕ БАЙКАЛА! О ЧЕМ МОЛЧАЛ СССР?

Всё что есть — это свет на разных скоростях. Как энергия становится сознанием

Всё что есть — это свет на разных скоростях. Как энергия становится сознанием