What is RAG? The Complete Tutorial - From Scratch to Deployed API on Production | LangChain & Ollama

Автор: Venelin Valkov

Загружено: 2025-07-19

Просмотров: 1407

Описание:

Ever wondered how to make an LLM an expert on YOUR private documents? The answer is Retrieval-Augmented Generation (RAG). While stuffing context works for small files, it's slow, expensive, and fails at scale. RAG is the industry-standard solution.

In this complete, step-by-step tutorial, you will learn the fundamentals of RAG by building a system from the ground up. We'll start with first principles using Python and Scikit-learn, refactor our system with LangChain, wrap it in a streaming FastAPI, and finally deploy it as a production-ready Docker container.

PDF from the video: https://cdn.prod.website-files.com/60...

AI Bootcamp: https://www.mlexpert.io/
LinkedIn:   / venelin-valkov
Follow me on X:   / venelin_valkov
Discord:   / discord
Subscribe: http://bit.ly/venelin-subscribe
GitHub repository: https://github.com/curiousily/AI-Boot...

👍 Don't Forget to Like, Comment, and Subscribe for More Tutorials!

00:00 - What is RAG?
05:58 - Project setup and dependencies
07:04 - Build a retriever
10:52 - Simple RAG
13:25 - Chat with PDF file
15:31 - Tracing and observability with MLflow
19:00 - RAG Rest API with FastAPI
24:02 - Docker container and compose
25:56 - Deploy to production
28:36 - Conclusion

Join this channel to get access to the perks and support my work:
   / @venelin_valkov

What is RAG? The Complete Tutorial - From Scratch to Deployed API on Production | LangChain & Ollama

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Why Your RAG Gives Wrong Answers (And 4 Chunking Strategies to Fix It) | LangChain Text Splitters

Why Your RAG Gives Wrong Answers (And 4 Chunking Strategies to Fix It) | LangChain Text Splitters

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Simulating Strongly-Correlated Material Models | Cohen-Stead | JuliaCon Global 2025

Simulating Strongly-Correlated Material Models | Cohen-Stead | JuliaCon Global 2025

LangChain Quickstart with Local LLM | Ollama, Pydantic Structured Output, Tool Use, MLflow Tracing

LangChain Quickstart with Local LLM | Ollama, Pydantic Structured Output, Tool Use, MLflow Tracing

How RAG Finds Answers in Millions of Documents | Embeddings, Vector Databases, LangChain & Supabase

How RAG Finds Answers in Millions of Documents | Embeddings, Vector Databases, LangChain & Supabase

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

Build Production-Ready Retrieval RAG Pipeline in LangChain | Hybrid Search (BM25), Re-ranking & HyDE

Build Production-Ready Retrieval RAG Pipeline in LangChain | Hybrid Search (BM25), Re-ranking & HyDE

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

КАК НЕЛЬЗЯ ХРАНИТЬ ПАРОЛИ (и как нужно) за 11 минут

КАК НЕЛЬЗЯ ХРАНИТЬ ПАРОЛИ (и как нужно) за 11 минут

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

Ex-OpenAI Scientist WARNS:

Ex-OpenAI Scientist WARNS: "You Have No Idea What's Coming"

Интеграция Claude + Power BI 🧠 ОГРОМНЫЙ прорыв благодаря MCP 💥 (обновление за ноябрь 2025 г.)

Интеграция Claude + Power BI 🧠 ОГРОМНЫЙ прорыв благодаря MCP 💥 (обновление за ноябрь 2025 г.)

Большинство разработчиков не понимают, как работают контекстные окна.

Большинство разработчиков не понимают, как работают контекстные окна.

Все стратегии RAG объясняются за 13 минут (без лишних слов)

Все стратегии RAG объясняются за 13 минут (без лишних слов)

Сложность пароля — это ложь. Вот что на самом деле защищает вас

Сложность пароля — это ложь. Вот что на самом деле защищает вас

Getting Started with LangGraph | Build Local Agentic Workflows and AI Agents with Ollama

Getting Started with LangGraph | Build Local Agentic Workflows and AI Agents with Ollama

Java + RAG: создайте финансового консультанта на базе ИИ с помощью Spring AI 💡

Java + RAG: создайте финансового консультанта на базе ИИ с помощью Spring AI 💡

Почему MCP действительно важен | Модель контекстного протокола с Тимом Берглундом

Почему MCP действительно важен | Модель контекстного протокола с Тимом Берглундом