[SKKU AI Colloquium2025] 심규홍 교수-Context Compression for Efficient Multimodal LLMs

Автор: 성균관대학교AI대학원

Загружено: 2026-01-11

Просмотров: 56

Описание:

강연제목: Context Compression for Efficient Multimodal LLMs
강연자: 심규홍 교수(성균관대학교)
강연요약: As multimodal large language models (MLLMs) continue to extend their context length, a single model can now integrate information from text, audio, video, and embodied signals. Despite this progress, deploying ultra-long-context models in real systems remains difficult because of practical memory constraints and strict latency requirements. In this talk, I will outline recent approaches designed to address these challenges, with particular attention to techniques that compress the key–value (KV) cache. I will close by highlighting open research directions and practical considerations for building scalable and efficient multimodal LLM inference pipelines.

[SKKU AI Colloquium2025] 심규홍 교수-Context Compression for Efficient Multimodal LLMs

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

[SKKU AI Colloquium 2025] 이성길 교수-Directional Consistency-Driven Adaptive Density Control for 3D

[SKKU AI Colloquium 2025] 이성길 교수-Directional Consistency-Driven Adaptive Density Control for 3D

[SKKU AI Colloquium 2025] 최윤석 교수-Large Language Models for Code Intelligence

[SKKU AI Colloquium 2025] 최윤석 교수-Large Language Models for Code Intelligence

[SKKU AI Colloquium 2025] 우홍욱 교수-Pathways to AGI : agentic, embodied, physical AI

[SKKU AI Colloquium 2025] 우홍욱 교수-Pathways to AGI : agentic, embodied, physical AI

[SKKU AI Colloquium 2025] 민동문 교수-Quantum Machine Learning: System Architect’s Perspective

[SKKU AI Colloquium 2025] 민동문 교수-Quantum Machine Learning: System Architect’s Perspective

[SKKU AI Colloquium 2025] 이선재 교수-GUI Agent: Practical Solutions to automating all digital tasks

[SKKU AI Colloquium 2025] 이선재 교수-GUI Agent: Practical Solutions to automating all digital tasks

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

그린란드 긴장감 완화•경제지표 호조에 뉴욕증시 웃었다…다음주 빅이벤트도 견뎌낼까? | 박병창 이사 [마켓 인사이드]

그린란드 긴장감 완화•경제지표 호조에 뉴욕증시 웃었다…다음주 빅이벤트도 견뎌낼까? | 박병창 이사 [마켓 인사이드]

Понимание GD&T

ЛЕКЦИЯ ПРО НАДЁЖНЫЕ ШИФРЫ НА КОНФЕРЕНЦИИ БАЗОВЫХ ШКОЛ РАН В ТРОИЦКЕ

ЛЕКЦИЯ ПРО НАДЁЖНЫЕ ШИФРЫ НА КОНФЕРЕНЦИИ БАЗОВЫХ ШКОЛ РАН В ТРОИЦКЕ

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

오천피!! 수익률 세계 1위에도 ‘아직 싸다’, 아틀라스 입사에 반대하는 현대차 노조 “합의 없이 1대도 안돼” | 삼프로TV 권순우 취재팀장 [뉴스3]

오천피!! 수익률 세계 1위에도 ‘아직 싸다’, 아틀라스 입사에 반대하는 현대차 노조 “합의 없이 1대도 안돼” | 삼프로TV 권순우 취재팀장 [뉴스3]

Древний Рим за 20 минут

Древний Рим за 20 минут

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Trump Launches Board of Peace Amid Discord; Tech Leads Stock Rally | Bloomberg Brief 1/22/2026

Trump Launches Board of Peace Amid Discord; Tech Leads Stock Rally | Bloomberg Brief 1/22/2026

ЗАНИМАТЕЛЬНАЯ ВЕРОЯТНОСТЬ. ЛЕКЦИЯ 21.11.2025 В РАМКАХ ЛЕКТОРИЯ ВДНХ

ЗАНИМАТЕЛЬНАЯ ВЕРОЯТНОСТЬ. ЛЕКЦИЯ 21.11.2025 В РАМКАХ ЛЕКТОРИЯ ВДНХ

Что происходит с нейросетью во время обучения?

Что происходит с нейросетью во время обучения?

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory

Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory

[김현석의 월스트리트나우-1월21일] 재발한 관세 위협, 폭발한 일본 금리..미국 매도?

[김현석의 월스트리트나우-1월21일] 재발한 관세 위협, 폭발한 일본 금리..미국 매도? "또 다른 기회"