vLLM for Intel xpu on Dual Intel Arc B580 - Setup and Demo for VERY FAST LLM Performance!

Автор: YourAvgDev

Загружено: 2025-12-28

Просмотров: 3

Описание:

Write up and instructions here: https://www.roger.lol/blog/accessible...

Let's go through the process in setting up vLLM for xpu for our Dual Intel Arc B580 system. We'll compare the speed of token generation using gpt-oss-20b at full context window (128K) against llama.cpp. Spoiler alert: vLLM for xpu is FAST. VERY FAST.

Also for fun you get to see some fun demos that we can create with this type of model and token generation speed on these GPUs. :)

vLLM for Intel xpu on Dual Intel Arc B580 - Setup and Demo for VERY FAST LLM Performance!

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Запуск нейросетей локально. Генерируем - ВСЁ

Запуск нейросетей локально. Генерируем - ВСЁ

СРОЧНО! КУЧЕР: "Это просто позор". Что случилось на пресс-конференции Трампа и Зеленского

К чему готовиться? Останемся без денег? Что делать, когда заблокируют всё? || Дмитрий Потапенко*

К чему готовиться? Останемся без денег? Что делать, когда заблокируют всё? || Дмитрий Потапенко*

Они унизили уборщика — и поплатились за это | Розыгрыш в спортзале от Анатолия № 57

Они унизили уборщика — и поплатились за это | Розыгрыш в спортзале от Анатолия № 57

ESP32 + MLX90640: тепловизор с искусственным интеллектом (TensorFlow Lite)

ESP32 + MLX90640: тепловизор с искусственным интеллектом (TensorFlow Lite)

Gen AI on Intel Arc GPUs - Building a Dual Arc B580 LLM Inference Server! (24 GB VRAM!)

Gen AI on Intel Arc GPUs - Building a Dual Arc B580 LLM Inference Server! (24 GB VRAM!)

НОВОСТИ ИИ: Qwen 2511 - огонь, Китайцы Обходят Claude 4,5, Nvidia паокупает Groq

НОВОСТИ ИИ: Qwen 2511 - огонь, Китайцы Обходят Claude 4,5, Nvidia паокупает Groq

Этот аккумулятор TPCELL 8/10Ah PD100W должен быть у каждого владельца инструмента Makita

Этот аккумулятор TPCELL 8/10Ah PD100W должен быть у каждого владельца инструмента Makita

Ваш браузер знает о вас все и сливает данные: как защититься?

Ваш браузер знает о вас все и сливает данные: как защититься?

После Купянска Путину не верят даже свои. Руслан Левиев

После Купянска Путину не верят даже свои. Руслан Левиев

Телескоп Джеймс Уэбб нашел, КУДА нас засасывает. Это НЕ Черная Дыра

Телескоп Джеймс Уэбб нашел, КУДА нас засасывает. Это НЕ Черная Дыра

НЕ ПОКУПАЙ, MacBook M5 ПОКА НЕ ПОСМОТРИШЬ ЭТО ВИДЕО

НЕ ПОКУПАЙ, MacBook M5 ПОКА НЕ ПОСМОТРИШЬ ЭТО ВИДЕО

История POCO: бренд одного идеального момента?

История POCO: бренд одного идеального момента?

Тренды в ИИ 2026. К чему готовиться каждому.

Тренды в ИИ 2026. К чему готовиться каждому.

Екатерина Шульман: как изменилось отношение россиян к войне в 2025 году

Екатерина Шульман: как изменилось отношение россиян к войне в 2025 году

Боитесь программировать? Бойтесь. Но программируйте. Показываю, где и что • Offtopic • Live Stream

Боитесь программировать? Бойтесь. Но программируйте. Показываю, где и что • Offtopic • Live Stream

Теперь ЭТО СПРАШИВАЮТ! РОАДМАП Golang 2026

Теперь ЭТО СПРАШИВАЮТ! РОАДМАП Golang 2026

ДРУГИЕ ЦИВИЛИЗАЦИИ ЗАМЕТНЫ В МОМЕНТ ГИБЕЛИ / 3I/ATLAS ВЫПУСТИЛ СТРУЮ. Владимир Сурдин

ДРУГИЕ ЦИВИЛИЗАЦИИ ЗАМЕТНЫ В МОМЕНТ ГИБЕЛИ / 3I/ATLAS ВЫПУСТИЛ СТРУЮ. Владимир Сурдин

Давайте читать — Глубокое обучение для программистов с Fastai и PyTorch — 01

Давайте читать — Глубокое обучение для программистов с Fastai и PyTorch — 01

Как устроен PHP 🐘: фундаментальное знание для инженеров

Как устроен PHP 🐘: фундаментальное знание для инженеров