Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Yes you can run LLMs on Kubernetes | Cloud Native Denmark 2025 Aarhus

Автор: Cloud Native Nordics

Загружено: 2025-12-31

Просмотров: 47

Описание:

As LLMs become increasingly powerful and ubiquitous, the need to deploy and scale these models in production environments grows. However, the complexity of LLMs can make them challenging to run reliably and efficiently. In this talk, we'll explore how Kubernetes can be leveraged to run LLMs at scale. We'll cover the key considerations and best practices for packaging LLM inference services as containerized applications using popular OSS inference servers like TGI, vLLM and Ollama, and deploying them on Kubernetes. This includes managing model weights, handling dynamic batching and scaling, implementing advanced traffic routing, and ensuring high availability and fault tolerance. Additionally, we'll discuss accelerators management and serving models on multiple hosts. By the end of this talk, attendees will have a comprehensive understanding of how to successfully run their LLMs on Kubernetes, unlocking the benefits of scalability, resilience, and DevOps-friendly deployments.

Cloud Native Denmark is a premier tech conference where Kubernetes and Cloud Native community comes together for an experience packed with inspiring talks, hands-on workshops, and great opportunities to build professional networks.

🚀 CND Website: https://cloudnativedenmark.dk/
🚀 CND 2025 Conference Archive: https://2025.cloudnativedenmark.dk/

Yes you can run LLMs on Kubernetes | Cloud Native Denmark 2025 Aarhus

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Driving Platform Adoption with Embedded SREs | Cloud Native Denmark 2025 Aarhus

Driving Platform Adoption with Embedded SREs | Cloud Native Denmark 2025 Aarhus

vLLM: простое, быстрое и недорогое обучение LLM для всех — Саймон Мо, vLLM

vLLM: простое, быстрое и недорогое обучение LLM для всех — Саймон Мо, vLLM

Kubernetes — Простым Языком на Понятном Примере

Kubernetes — Простым Языком на Понятном Примере

Kubernetes Zero to Hero: The Complete Beginner’s Guide (2025 Edition)

Kubernetes Zero to Hero: The Complete Beginner’s Guide (2025 Edition)

The Hitchhikers Practical Guide to MLOps | Cloud Native Denmark 2025 Aarhus

The Hitchhikers Practical Guide to MLOps | Cloud Native Denmark 2025 Aarhus

AWS re:Invent 2025 - Move beyond reactive: Transform cloud ops with AWS DevOps Agent (COP362)

AWS re:Invent 2025 - Move beyond reactive: Transform cloud ops with AWS DevOps Agent (COP362)

vLLM on Kubernetes in Production

vLLM on Kubernetes in Production

Not Forking Around: Leveraging NRI to extend Kubernetes at scale | Cloud Native Denmark 2025 Aarhus

Not Forking Around: Leveraging NRI to extend Kubernetes at scale | Cloud Native Denmark 2025 Aarhus

Глава DeepMind: миллионы ИИ-агентов выйдут в интернет - и это меняет всё

Глава DeepMind: миллионы ИИ-агентов выйдут в интернет - и это меняет всё

Развертывание LLM с поддержкой графического процессора в Cloud Run

Развертывание LLM с поддержкой графического процессора в Cloud Run

AI, DevOps, and Kubernetes: Kelsey Hightower on What’s Next

AI, DevOps, and Kubernetes: Kelsey Hightower on What’s Next

KRO-nicles of Kubernetes: Taming Resources the Open Source Way | Cloud Native Denmark 2025 Aarhus

KRO-nicles of Kubernetes: Taming Resources the Open Source Way | Cloud Native Denmark 2025 Aarhus

Домашняя лаборатория Kubernetes, которая печатает предложения о работе (простая и проверенная)

Домашняя лаборатория Kubernetes, которая печатает предложения о работе (простая и проверенная)

Как установить vLLM-Omni локально | Полное руководство

Как установить vLLM-Omni локально | Полное руководство

Kubernetes: объяснение за 15 минут | Практическое занятие

Kubernetes: объяснение за 15 минут | Практическое занятие

Инструменты для разработки платформ, которые вам НУЖНО знать в 2026 году

Инструменты для разработки платформ, которые вам НУЖНО знать в 2026 году

Multi-Site CSI for k8s | Cloud Native Denmark 2025 Aarhus

Multi-Site CSI for k8s | Cloud Native Denmark 2025 Aarhus

Установка и локальный запуск LLM с использованием библиотеки vLLM в Windows

Установка и локальный запуск LLM с использованием библиотеки vLLM в Windows

Kubernetes: объяснение за 6 минут | Архитектура k8s

Kubernetes: объяснение за 6 минут | Архитектура k8s

Новое расширение Claude для Chrome: секретное оружие, которое должен использовать каждый

Новое расширение Claude для Chrome: секретное оружие, которое должен использовать каждый

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com