How DeepSeek made Transformers 95% more efficient

Автор: Prompt Engineering

Загружено: 2026-01-19

Просмотров: 597

Описание:

In this video, I delve into a groundbreaking paper by DeepSeek called Engram that addresses the inefficiencies of transformer-based large language models (LLMs). Traditional LLMs use deep computation for both complex reasoning and simple recall, leading to wasted computational resources. Engram introduces a conditional memory mechanism that uses scalable lookup tables, effectively distinguishing between tasks that need deep computation and those that require simple memory recall. This approach has shown significant improvements in both knowledge and reasoning tasks, optimizing the efficiency and performance of LLMs. I also discuss the hardware implications and potential limitations of this new method.

LINKS:
https://github.com/deepseek-ai/Engram...
https://github.com/deepseek-ai/Engram...

My voice to text App: whryte.com
Website: https://engineerprompt.ai/
RAG Beyond Basics Course:
https://prompt-s-site.thinkific.com/c...
Signup for Newsletter, localgpt:
https://tally.so/r/3y9bb0

Let's Connect:
🦾 Discord: / discord
☕ Buy me a Coffee: https://ko-fi.com/promptengineering
|🔴 Patreon: / promptengineering
💼Consulting: https://calendly.com/engineerprompt/c...
📧 Business Contact: engineerprompt@gmail.com
Become Member: http://tinyurl.com/y5h28s6h

💻 Pre-configured localGPT VM: https://bit.ly/localGPT (use Code: PromptEngineering for 50% off).

Signup for Newsletter, localgpt:
https://tally.so/r/3y9bb0

00:00 Memory problem with LLMs
00:25 Complex Reasoning vs. Simple Recall
00:56 The Inefficiency of Transformer-Based Architectures
01:22 DeepSeek's Engram: A New Approach
04:36 How Engram Works
07:30 Performance and Limitations of Engram

How DeepSeek made Transformers 95% more efficient

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

MIT Researchers DESTROY the Context Window Limit

MIT Researchers DESTROY the Context Window Limit

Why Use This Special Capacitor? Why So Important?

Why Use This Special Capacitor? Why So Important?

Real Ninjutsu Is TERRIFYING

Real Ninjutsu Is TERRIFYING

Why I Left Quantum Computing Research

Why I Left Quantum Computing Research

This New Technology Could Kill TSMC and ASML

This New Technology Could Kill TSMC and ASML

STEM-проект «Падающий конус» — отличное исследование для учеников.

STEM-проект «Падающий конус» — отличное исследование для учеников.

Механизмы, которые должен знать КАЖДЫЙ инженер-механик

Механизмы, которые должен знать КАЖДЫЙ инженер-механик

Объяснение mHC: как DeepSeek перестраивает программы магистратуры в области прикладных наук (LLM)...

Объяснение mHC: как DeepSeek перестраивает программы магистратуры в области прикладных наук (LLM)...

Почему RAG терпит неудачу — как CLaRa устраняет свой главный недостаток

Почему RAG терпит неудачу — как CLaRa устраняет свой главный недостаток

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Best Hydraulic Press Moments of 2024

Best Hydraulic Press Moments of 2024

Когда заканчивается и таблица Менделеева, и частицы, начинается ЭТО

Когда заканчивается и таблица Менделеева, и частицы, начинается ЭТО

Большинство разработчиков не понимают, как работают токены LLM.

Большинство разработчиков не понимают, как работают токены LLM.

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Вот почему вы по-прежнему работаете медленно, даже с использованием ИИ (узкое место устранено — в...

Компания CATL опубликовала официальный график внедрения ионных систем натрий-ионного аккумулятора.

Компания CATL опубликовала официальный график внедрения ионных систем натрий-ионного аккумулятора.

ChatGPT will be 100x Faster... (CEREBRAS DEAL)

ChatGPT will be 100x Faster... (CEREBRAS DEAL)

AI and You Against the Machine: Guide so you can own Big AI and Run Local

AI and You Against the Machine: Guide so you can own Big AI and Run Local

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Раскрытие подробностей о твердотельной батарее компании Donut Lab.

Раскрытие подробностей о твердотельной батарее компании Donut Lab.