CAG - ПОНЯТНОЕ ОБЪЯСНЕНИЕ + СРАВНЕНИЕ С RAG!

Автор: AI RANEZ

Загружено: 2025-06-12

Просмотров: 7368

Описание:

В этом видео разбираем Cache Augmented Generation (CAG)

Присоединяйтесь в тг коммьюнити AI RANEZ - https://t.me/+ExiaDZ5sN1k0NWEy

Видео о RAG - • RAG | САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!

альтернативный способ обогащения больших языковых моделей без векторных баз и сложных ретриверов. Показываю, как работает KV cache, на каких этапах формируются и подаются past_key_values, а также чем CAG отличается от привычного Retrieval Augmented Generation (RAG).

Вы увидите практическую имплементацию на Python: как заранее прокешировать документы, как подхватывать готовый буфер при генерации, какие настройки модели обязательны и как измерить прирост скорости и экономию токенов. Разбираем плюсы (меньше инфраструктуры, быстрое время ответа) и минусы (рост памяти, ограничения по объёму контекста).

Дам чёткие рекомендации, когда CAG выигрывает у RAG, когда оба подхода можно сочетать и какие задачи лучше продолжать решать через поиск по внешнему индексу. Если вы внедряете Augmented Generation или просто хотите снабдить LLM собственными знаниями, это видео поможет оценить целесообразность CAG в ваших проектах.

#ии #ai #CacheAugmentedGeneration #CAG #KVCache #AugmentedGeneration #RAG #LLM #MachineLearning

CAG - ПОНЯТНОЕ ОБЪЯСНЕНИЕ + СРАВНЕНИЕ С RAG!

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(20) { ["w9td6rX-6lo"]=> object(stdClass)#6097 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "w9td6rX-6lo" ["related_video_title"]=> string(60) "GraphRAG | САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!" ["posted_time"]=> string(25) "4 месяца назад" ["channelName"]=> NULL } ["9UQJxSMZzjU"]=> object(stdClass)#6102 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "9UQJxSMZzjU" ["related_video_title"]=> string(74) "Построил РАБОЧИЙ RAG в 5 строк | LlamaIndex гайд!" ["posted_time"]=> string(23) "6 часов назад" ["channelName"]=> NULL } ["5P001o1NDig"]=> object(stdClass)#6095 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "5P001o1NDig" ["related_video_title"]=> string(83) "RAG и CAG — чем отличаются, что выбрать и почему?" ["posted_time"]=> string(27) "7 месяцев назад" ["channelName"]=> NULL } ["H1EyiGPZwwc"]=> object(stdClass)#6100 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "H1EyiGPZwwc" ["related_video_title"]=> string(92) "ВЕКТОРНЫЕ БАЗЫ ДАННЫХ - САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!" ["posted_time"]=> string(25) "4 месяца назад" ["channelName"]=> NULL } ["OohxhcfcTtU"]=> object(stdClass)#6089 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "OohxhcfcTtU" ["related_video_title"]=> string(70) "Как пишет НОВЫЙ chatGPT-5? Тест и сравнение" ["posted_time"]=> string(25) "3 месяца назад" ["channelName"]=> NULL } ["WznbPurmrAA"]=> object(stdClass)#6104 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "WznbPurmrAA" ["related_video_title"]=> string(112) "Айдар Булатов | Как научить LLM работать с огромным контекстом?" ["posted_time"]=> string(25) "3 месяца назад" ["channelName"]=> NULL } ["_CZEDMz5lkQ"]=> object(stdClass)#6093 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "_CZEDMz5lkQ" ["related_video_title"]=> string(84) "RAG для чайников: делаем модель умнее за 15 минут" ["posted_time"]=> string(27) "7 месяцев назад" ["channelName"]=> NULL } ["sr2iWz133eg"]=> object(stdClass)#6107 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "sr2iWz133eg" ["related_video_title"]=> string(92) "Что такое RAG в LLM и причём тут векторные базы данных" ["posted_time"]=> string(27) "5 месяцев назад" ["channelName"]=> NULL } ["NPSAyl8F1N8"]=> object(stdClass)#6083 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "NPSAyl8F1N8" ["related_video_title"]=> string(101) "Воркшоп по работе с LangChain, LangSmith и LangGraph / Михаил Савченко" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["cipmw7XCdmE"]=> object(stdClass)#6105 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "cipmw7XCdmE" ["related_video_title"]=> string(157) "Блокировка банковских карт 💳 Что происходит? || Дмитрий Потапенко* и Дмитрий Дёмушкин" ["posted_time"]=> string(21) "1 день назад" ["channelName"]=> NULL } ["KFgwXXWT7sQ"]=> object(stdClass)#6096 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "KFgwXXWT7sQ" ["related_video_title"]=> string(162) "ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat" ["posted_time"]=> string(27) "5 месяцев назад" ["channelName"]=> NULL } ["cMR2c3vQRAc"]=> object(stdClass)#6101 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "cMR2c3vQRAc" ["related_video_title"]=> string(143) "Мои ОТКРЫТИЯ! Потратил $600 на 4000 НОВЕЙШИХ исследований GPT по промпт-инжинирингу" ["posted_time"]=> string(27) "6 месяцев назад" ["channelName"]=> NULL } ["CA_FIkqPa7o"]=> object(stdClass)#6090 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "CA_FIkqPa7o" ["related_video_title"]=> string(105) "RAG: Как поделиться знаниями с ИИ (практические наблюдения)" ["posted_time"]=> string(25) "4 месяца назад" ["channelName"]=> NULL } ["puGdDB0Qle4"]=> object(stdClass)#6088 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "puGdDB0Qle4" ["related_video_title"]=> string(100) "Agentic RAG - ПОЛНОЕ ОБЪЯСНЕНИЕ! Где он лучше, чем обычный RAG?!" ["posted_time"]=> string(25) "2 месяца назад" ["channelName"]=> NULL } ["wNsp1ZH-pyk"]=> object(stdClass)#6086 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "wNsp1ZH-pyk" ["related_video_title"]=> string(103) "Как реально работает GPT. Разрушаем мифы блогеров. Часть 1." ["posted_time"]=> string(25) "4 месяца назад" ["channelName"]=> NULL } ["bv_It-GH-yA"]=> object(stdClass)#6087 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "bv_It-GH-yA" ["related_video_title"]=> string(88) "Алерон Миленкин | RAG и как его правильно готовить" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["PLCOVhI5G_bjhIUUwVyK_uGoTKZ43_2yQA"]=> object(stdClass)#6084 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(34) "PLCOVhI5G_bjhIUUwVyK_uGoTKZ43_2yQA" ["related_video_title"]=> string(43) "Полная автоматизация n8n" ["posted_time"]=> string(0) "" ["channelName"]=> NULL } ["VI_OaK8s0kw"]=> object(stdClass)#6085 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "VI_OaK8s0kw" ["related_video_title"]=> string(81) "Fine Tuning | ДООБУЧЕНИЕ AI МОДЕЛЕЙ + СРАВНЕНИЕ С RAG!" ["posted_time"]=> string(25) "4 месяца назад" ["channelName"]=> NULL } ["sbMzUOXcyWw"]=> object(stdClass)#6073 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "sbMzUOXcyWw" ["related_video_title"]=> string(96) "Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["BuBjHitBdB4"]=> object(stdClass)#6074 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "BuBjHitBdB4" ["related_video_title"]=> string(0) "" ["posted_time"]=> string(25) "3 месяца назад" ["channelName"]=> NULL } }

GraphRAG | САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!

GraphRAG | САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!

Построил РАБОЧИЙ RAG в 5 строк | LlamaIndex гайд!

Построил РАБОЧИЙ RAG в 5 строк | LlamaIndex гайд!

RAG и CAG — чем отличаются, что выбрать и почему?

RAG и CAG — чем отличаются, что выбрать и почему?

ВЕКТОРНЫЕ БАЗЫ ДАННЫХ - САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!

ВЕКТОРНЫЕ БАЗЫ ДАННЫХ - САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!

Как пишет НОВЫЙ chatGPT-5? Тест и сравнение

Как пишет НОВЫЙ chatGPT-5? Тест и сравнение

Айдар Булатов | Как научить LLM работать с огромным контекстом?

Айдар Булатов | Как научить LLM работать с огромным контекстом?

RAG для чайников: делаем модель умнее за 15 минут

RAG для чайников: делаем модель умнее за 15 минут

Что такое RAG в LLM и причём тут векторные базы данных

Что такое RAG в LLM и причём тут векторные базы данных

Воркшоп по работе с LangChain, LangSmith и LangGraph / Михаил Савченко

Воркшоп по работе с LangChain, LangSmith и LangGraph / Михаил Савченко

Блокировка банковских карт 💳 Что происходит? || Дмитрий Потапенко* и Дмитрий Дёмушкин

Блокировка банковских карт 💳 Что происходит? || Дмитрий Потапенко* и Дмитрий Дёмушкин

ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat

ИИ-агенты — вот что действительно изменит разработку. Пишем ИИ-агент на Python, LangChain и GigaChat

Мои ОТКРЫТИЯ! Потратил $600 на 4000 НОВЕЙШИХ исследований GPT по промпт-инжинирингу

Мои ОТКРЫТИЯ! Потратил $600 на 4000 НОВЕЙШИХ исследований GPT по промпт-инжинирингу

RAG: Как поделиться знаниями с ИИ (практические наблюдения)

RAG: Как поделиться знаниями с ИИ (практические наблюдения)

Agentic RAG - ПОЛНОЕ ОБЪЯСНЕНИЕ! Где он лучше, чем обычный RAG?!

Agentic RAG - ПОЛНОЕ ОБЪЯСНЕНИЕ! Где он лучше, чем обычный RAG?!

Как реально работает GPT. Разрушаем мифы блогеров. Часть 1.

Как реально работает GPT. Разрушаем мифы блогеров. Часть 1.

Алерон Миленкин | RAG и как его правильно готовить

Алерон Миленкин | RAG и как его правильно готовить

Полная автоматизация n8n

Полная автоматизация n8n

Fine Tuning | ДООБУЧЕНИЕ AI МОДЕЛЕЙ + СРАВНЕНИЕ С RAG!

Fine Tuning | ДООБУЧЕНИЕ AI МОДЕЛЕЙ + СРАВНЕНИЕ С RAG!

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM