Local AI Speed Test: Qwen3, Llama, GPT-OSS and Deepseek model tested

Автор: InfraSec

Загружено: 2026-01-05

Просмотров: 34

Описание:

Today, I'm gonna compare the speeds of different local LLMs models.
I'm using Ollama with OpenWebUI as interface on my X99 server.
ATTENTION: Nothing the LLMs said in the video was checked, it's just a speed comparison, accuracy wasn't counted.
The specs for my server are:
CPU: Intel Xeon E5 2680 V4
RAM: 32 GB DDR4 2133 MHz
GPU: Nvidia Tesla P100 PCIE (16 GB HBM2) Power limited at 125W for cooling purposes (10-20% performance loss in those tests)
Motherboard: chinese x99 from Aliexpress (Mougol X99 bundle CPU + RAM)
Storage: 4x 1 TB HDDs, 1 256 GB SATA Samsung SSD, 1 NvMe PCIE 3.0 4x Patriot 512 GB.
Timestamps:

0:00 GPT OSS
2:20 Llama3.1 8b Q8
4:00 Llama2 Uncensored 7b Q4
5:00 Llama3.2 3b Q5
6:00 Qwen3 1.7b Q8
7:00 Qwen3 4b Q4
8:20 Qwen3 4b FP16
10:00 Qwen3 8b Q4
11:30 Qwen3 8b FP16
13:45 Qwen3 14b Q4
16:35 Qwen3 14b Q8
19:30 Qwen3coder 30b Q4
24:00 DeepseekR1 1.5b Q4
24:40 DeepseekR1 7b Q4
26:05 DeepseekR1 14b Q4
27:45 DeepseekR1 32b Q4
29:15 DeepseekCoder 33b Q4
31:35 DeepseekCoderV2 16b Q4
33:15 Summary

Local AI Speed Test: Qwen3, Llama, GPT-OSS and Deepseek model tested

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Вот Что "ВСЕГДА" Происходит Перед Обвалом Рынка!

Понимание GD&T

Как подключить YandexGPT в n8n: Пошаговый гайд. Импортозамещенный ИИ. 152-ФЗ

Как подключить YandexGPT в n8n: Пошаговый гайд. Импортозамещенный ИИ. 152-ФЗ

Новый курс обучения DeepSeek LLM - Гиперсоединения с ограничениями многообразия (mHC)

Новый курс обучения DeepSeek LLM - Гиперсоединения с ограничениями многообразия (mHC)

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Эти ИДЕИ ВЗОРВУТ РЫНОК в 2026

Эти ИДЕИ ВЗОРВУТ РЫНОК в 2026

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Структура файлов и каталогов в Linux

Структура файлов и каталогов в Linux

Hysteria2 — рабочий VPN при «блокировках» VLESS

Hysteria2 — рабочий VPN при «блокировках» VLESS

Запуск нейросетей локально. Генерируем - ВСЁ

Запуск нейросетей локально. Генерируем - ВСЁ

Учебник Base44 для начинающих — пошагово

Учебник Base44 для начинающих — пошагово

Давайте запустим DeepSeek V3.2 — ЛОКАЛЬНЫЙ ИИ «гениальнее», чем GPT-5 и Gemini 3

Давайте запустим DeepSeek V3.2 — ЛОКАЛЬНЫЙ ИИ «гениальнее», чем GPT-5 и Gemini 3

Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory

Разработка с помощью Gemini 3, AI Studio, Antigravity и Nano Banana | Подкаст Agent Factory

От нуля до вашего первого ИИ-агента за 25 минут (без кодирования)

От нуля до вашего первого ИИ-агента за 25 минут (без кодирования)

18 крутых способов использовать ChatGPT, которые могут ЗАПРЕТИТЬ!

18 крутых способов использовать ChatGPT, которые могут ЗАПРЕТИТЬ!

Создаю AI-бизнес на инструментах Google: 6 сервисов, которые работают как фабрика!

Создаю AI-бизнес на инструментах Google: 6 сервисов, которые работают как фабрика!

Новости ИИ – Ультразвуковой ChatGPT, Apple снова облажался, ИИ-агенты для всех Claude Cowork

Новости ИИ – Ультразвуковой ChatGPT, Apple снова облажался, ИИ-агенты для всех Claude Cowork

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем