Запуск Llama 405b на своем сервере. vLLM, docker.

Автор: Виталий Кулиев

Загружено: 2024-08-27

Просмотров: 26065

Описание:

Детально показываю, как запустить самую мощную открытую нейросеть Llama 405b на своем сервере.

Описание модели Llama 405b на сайте Meta*
https://llama.meta.com/

Сервер покупал тут:
https://immers.cloud/signup/r/2024052...

Прикладная конференция по Data Science AI conf 2024:
https://aiconf.ru/2024

Описание модели Llama 3.5 405b instruct AWQ на huggingface:
https://huggingface.co/hugging-quants...

Доступ ко всем сайтам получаю тут:
https://t.me/hour_vpn_bot

vllm - проект по инференсу нейросетей:
https://github.com/vllm-project/vllm

Рейтинг нейросетей:
https://chat.lmsys.org/?leaderboard

Мой телеграм канал:
https://t.me/vitaly_kuliev_it

В rutube дублирую видео. Подписывайтесь на случай замедления ютуба:
https://rutube.ru/channel/23479346/

Команда для запуска vLLM в докере:
sudo docker run --ipc=host --log-opt max-size=10m --log-opt max-file=1 --rm -it --gpus '"device=0,1,2,3"' -p 8000:8000 --mount type=bind,source=/home/ubuntu/.cache,target=/root/.cache vllm/vllm-openai:v0.5.4 --model hugging-quants/Meta-Llama-3.1-405B-Instruct-AWQ-INT4 --tensor-parallel-size 4 --gpu-memory-utilization 0.94 --dtype half -q awq --disable-log-requests

Таймкоды:
0:00 Llama 405b
0:55 Файлы нейросети
1:40 Покупка сервера с 4 gpu A100
4:12 Установка docker
5:18 Запуск сервера vllm
7:15 Первые ответы
9:20 бенчмарк- тест скорости сервера
11:15 стоимость запуска
12:50 еще один тест
15:30 выводы

Признана экстремистской организацией в РФ.
Реклама. ООО «ДТЛ». ИНН 9717073792. erid: LjN8K1LTF

Запуск Llama 405b на своем сервере. vLLM, docker.

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Компьютер для нейросетей. 5x3090ti, 48cpu, 512gb ram.

Компьютер для нейросетей. 5x3090ti, 48cpu, 512gb ram.

Локальный запуск LLM (Qwen2) на vLLM и llama.cpp (Docker)

Локальный запуск LLM (Qwen2) на vLLM и llama.cpp (Docker)

Запуск Deepseek-v3 671b на своем сервере

Запуск Deepseek-v3 671b на своем сервере

Локальный запуск LLM в 2025: полный гайд по инструментам (Ollama, LM Studio, Docker Model Runner)

Локальный запуск LLM в 2025: полный гайд по инструментам (Ollama, LM Studio, Docker Model Runner)

ПЕРЕСТАНЬ ПЛАТИТЬ за Cursor AI. Используй эту БЕСПЛАТНУЮ и ЛОКАЛЬНУЮ альтернативу | VSCode+Roo Code

ПЕРЕСТАНЬ ПЛАТИТЬ за Cursor AI. Используй эту БЕСПЛАТНУЮ и ЛОКАЛЬНУЮ альтернативу | VSCode+Roo Code

Мощь N8N в связке с MCP. База + продвинутый уровень (3 шаблона)

Мощь N8N в связке с MCP. База + продвинутый уровень (3 шаблона)

Серебро по $71 — это ГЛУБОКИЙ НАРКОЗ, который уничтожит ваш КАПИТАЛ | Уоррен Баффет

Серебро по $71 — это ГЛУБОКИЙ НАРКОЗ, который уничтожит ваш КАПИТАЛ | Уоррен Баффет

Мичил Егоров — Вашей компании LLM не нужен? Построение инфраструктуры с нуля

Мичил Егоров — Вашей компании LLM не нужен? Построение инфраструктуры с нуля

Инструкция по запуску нейросети на своем сервере vLLM

Инструкция по запуску нейросети на своем сервере vLLM

САМЫЙ ПРОСТОЙ СПОСОБ ЗАПУСТИТЬ ДОМАШНИЙ СЕРВЕР

САМЫЙ ПРОСТОЙ СПОСОБ ЗАПУСТИТЬ ДОМАШНИЙ СЕРВЕР

Llama 3.1 - лучшая открытая нейросеть. Обзор и сравнение с gpt4o.

Llama 3.1 - лучшая открытая нейросеть. Обзор и сравнение с gpt4o.

Как собрать мощный домашний сервер

Как собрать мощный домашний сервер

Как локально запустить бесплатную Нейросеть? (2025)

Как локально запустить бесплатную Нейросеть? (2025)

Как Я Превращаю Любые Документы в Идеальные Промпты для ИИ! Узнай Секрет

Как Я Превращаю Любые Документы в Идеальные Промпты для ИИ! Узнай Секрет

Всё, что нужно знать о Docker | Уроки Docker

Всё, что нужно знать о Docker | Уроки Docker

Марк Цукерберг. Большое интервью (на русском). Часть 1: Llama 3, путь к AGI, будущее ИИ?

Марк Цукерберг. Большое интервью (на русском). Часть 1: Llama 3, путь к AGI, будущее ИИ?

Запускаю DeepSeek на домашнем сервере с видеокартой. Подписка на Chat GPT больше не нужна.

Запускаю DeepSeek на домашнем сервере с видеокартой. Подписка на Chat GPT больше не нужна.

Локальная Нейросеть на ПК бесплатно – Gemma vs Deepseek vs Mistral

Локальная Нейросеть на ПК бесплатно – Gemma vs Deepseek vs Mistral

Заставь Perplexity работать на тебя: Создай умного ИИ-ассистента для сайта и Telegram!

Заставь Perplexity работать на тебя: Создай умного ИИ-ассистента для сайта и Telegram!

Карина Романова - LLAMA, 100500 вариантов её файнтюнинга

Карина Романова - LLAMA, 100500 вариантов её файнтюнинга