Run DeepSeek locally at home on

Автор: Ulas Dikme

Загружено: 2025-02-08

Просмотров: 1639

Описание:

How to run Deepseek model locally using Jetson orin nx board

Because of memory constraints, Q4_K_S run on orin nx
https://huggingface.co/TheBloke/deeps...

$ jetson_release -v
Software part of jetson-stats 4.3.1 - (c) 2024, Raffaello Bonghi
Model: NVIDIA Jetson Orin NX Engineering Reference Developer Kit - Jetpack 6.2 [L4T 36.4.3]
NV Power Mode[2]: 15W
Serial Number: [XXX Show with: jetson_release -s XXX]
Hardware:
699-level Part Number: 699-13767-0001-300 R.1
P-Number: p3767-0001
Module: NVIDIA Jetson Orin NX (8GB ram)
SoC: tegra234
CUDA Arch BIN: 8.7
Platform:
Machine: aarch64
System: Linux
Distribution: Ubuntu 22.04 Jammy Jellyfish
Release: 5.15.148-tegra
Python: 3.10.12
jtop:
Version: 4.3.1
Service: Active
Libraries:
CUDA: 12.6.68
cuDNN: 9.3.0.75
TensorRT: 10.3.0.30
VPI: 3.2.4
Vulkan: 1.3.204
OpenCV: 4.8.0 - with CUDA: NO

sudo apt install python3-pip git cmake
pip install huggingface-hub

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
mkdir build
cd build
cmake .. DLLAMA_CUDA=1
make

cd ..
mkdir models
cd models
huggingface-cli download TheBloke/deepseek-llm-7B-chat-GGUF deepseek-llm-7b-chat.Q4_K_M.gguf --local-dir . --local-dir-use-symlinks False

cd ../build
./bin/llama-cli -m ../models/deepseek-llm-7b-chat.Q4_K_M.gguf --interactive --gpu-layers 999 -c 2048

Run DeepSeek locally at home on

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

NVIDIA's $249 Secret Weapon for Edge AI - Jetson Orin Nano Super: Driveway Monitor

NVIDIA's $249 Secret Weapon for Edge AI - Jetson Orin Nano Super: Driveway Monitor

Private & Uncensored Local LLMs in 5 minutes (DeepSeek and Dolphin)

Private & Uncensored Local LLMs in 5 minutes (DeepSeek and Dolphin)

Hotel Monitoring System QML introduction on #raspberrypi #jetsonnano PostgreSQL C++ Qt Part I

Hotel Monitoring System QML introduction on #raspberrypi #jetsonnano PostgreSQL C++ Qt Part I

Real-Time AI Object Detection Testing (Pi5 AI Kit vs. NVIDIA Jetson)

Real-Time AI Object Detection Testing (Pi5 AI Kit vs. NVIDIA Jetson)

Программируем с ИИ в VS Code - БЕСПЛАТНО! Сможет каждый!

Программируем с ИИ в VS Code - БЕСПЛАТНО! Сможет каждый!

NVIDIA just announced the ULTIMATE desktop AI PC

NVIDIA just announced the ULTIMATE desktop AI PC

Руководство по ESP32 2024 | Выбор и использование платы ESP32

Руководство по ESP32 2024 | Выбор и использование платы ESP32

Лазер и Фрезер 2 в 1 - Идеальный ЧПУ по цене телефона!

Лазер и Фрезер 2 в 1 - Идеальный ЧПУ по цене телефона!

This mini GPU runs LLM that controls this robot

This mini GPU runs LLM that controls this robot

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

I want efficiency AND speed 🙏 Mini or Nano?

I want efficiency AND speed 🙏 Mini or Nano?

Qt6 for Raspberry pi 4 Cross Compilation with Cmake QML module installation Part II

Qt6 for Raspberry pi 4 Cross Compilation with Cmake QML module installation Part II

Docker за 20 минут

Docker за 20 минут

Как обучать модели обнаружения объектов YOLO в Google Colab (YOLO11, YOLOv8, YOLOv5)

Как обучать модели обнаружения объектов YOLO в Google Colab (YOLO11, YOLOv8, YOLOv5)

Как писать код с ИИ: советы от разработчика с 25-летним стажем

Как писать код с ИИ: советы от разработчика с 25-летним стажем

Маска подсети — пояснения

Маска подсети — пояснения

NVIDIA Jetson Orin Nano SUPER Unleashed: Build an AI Super Cluster

NVIDIA Jetson Orin Nano SUPER Unleashed: Build an AI Super Cluster

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

#opencv for #raspberrypi with Qt #docker isolation - compile opencv 4.9.0 from source

#opencv for #raspberrypi with Qt #docker isolation - compile opencv 4.9.0 from source

DeepSeek R1 Distill On NVIDIA Jetson Nano (WebUI Test and Tutorial)

DeepSeek R1 Distill On NVIDIA Jetson Nano (WebUI Test and Tutorial)