Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Mi az az 1-bites LLM és mire jó? A Microsoft BitNet b1.58 2B4T és a BitNet keretrendszer bemutatása

Автор: Zsolt Pinter

Загружено: 2025-04-22

Просмотров: 1189

Описание:

A BitNet 1-bites súlyokat használ a hagyományosabb lebegőpontos (pl. FP16) vagy alacsonyabb bites (pl. 8-bites) kvantálással szemben, jelentősen csökkentve a memóriaigényt és az energiafogyasztást. A BitNet b1.58 ezt továbbfejleszti ternáris súlyokkal (-1, 0, 1), ami tovább javítja a hatékonyságot és a modellezési képességeket.

Legyél Te is Tagja az Mp3Pintyo csatornának
   / @mp3pintyo  

DISCORD
Mp3Pintyo szerver:   / discord  

Támogatás
Patreon:   / mp3pintyo  

Linkek
BitNet: Scaling 1-bit Transformers for Large Language Models: https://arxiv.org/pdf/2310.11453
The Era of 1-bit LLMs All Large Language Models are in 1.58 Bits: https://arxiv.org/pdf/2402.17764
The-Era-of-1-bit-LLMs__Training_Tips_Code_FAQ: https://github.com/microsoft/unilm/bl...
1-bit AI Infra: Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs: https://arxiv.org/pdf/2410.16144
BitNet b1.58 2B4T Technical Report: https://arxiv.org/pdf/2504.12285
Hugging Face BitNet b1.58 2B4T - Scaling Native 1-bit LLM: https://huggingface.co/microsoft/bitn...
GitHub Bitnet.cpp: https://github.com/microsoft/BitNet
BitNet Demo: https://bitnet-demo.azurewebsites.net/
unsloth/DeepSeek-R1-GGUF: https://huggingface.co/unsloth/DeepSe...
Run DeepSeek R1 Dynamic 1.58-bit: https://unsloth.ai/blog/deepseekr1-dy...
Fine-tuning LLMs to 1.58bit: extreme quantization made easy: https://huggingface.co/blog/1_58_llm_...

Telepítés
wsl
git clone --recursive https://github.com/microsoft/BitNet.git
cd BitNet

(Recommended) Create a new conda environment
conda create -n bitnet-cpp python=3.9
conda activate bitnet-cpp
pip install -r requirements.txt
sudo apt update
sudo apt install -y build-essential cmake
sudo apt install -y clang

Modell előkészítése és letöltése:
huggingface-cli download microsoft/BitNet-b1.58-2B-4T-gguf --local-dir models/BitNet-b1.58-2B-4T
python setup_env.py -md models/BitNet-b1.58-2B-4T -q i2_s

Futtatás
python run_inference.py -m models/BitNet-b1.58-2B-4T/ggml-model-i2_s.gguf -p "You are a helpful assistant" -cnv -n 256

Mi az az 1 bites LLM?
A hagyományos nagyméretű nyelvi modellek (LLM-ek), mint például a GPT vagy a LLaMA, a paramétereiket (súlyaikat) nagy pontossággal, általában 16 vagy 32 biten tárolják
Ezek a súlyok határozzák meg a neurális hálózatban a neuronok közötti kapcsolatok erősségét, és közvetlenül befolyásolják a modell előrejelzéseit.
Az 1 bites LLM-ek ezzel szemben egy extrém módszert alkalmaznak, az úgynevezett kvantálást
Ez azt jelenti, hogy a modell paramétereit (súlyait) nagyon kevés, mindössze két vagy három különböző értékre korlátozzák.
Ha a súlyok csak két értéket vehetnek fel (például -1 és +1), akkor bináris, vagyis 1 bites modellről beszélünk.
Ha a súlyok három értéket vehetnek fel (általában -1, 0 és +1), akkor ternáris modellről beszélünk, ami körülbelül 1.58 bitet jelent ($\log_2(3) \approx 1.58$). A BitNet b1.58 egy ilyen ternáris modell.

Miért jók az 1 bites LLM-ek?
Az extrém kvantálás számos előnnyel jár

Jelentősen csökkentett memóriaigény: Mivel a súlyok tárolásához sokkal kevesebb bitre van szükség, a modell teljes memória lábnyoma drasztikusan lecsökken
Ez lehetővé teszi, hogy nagyobb modelleket futtassunk olyan eszközökön, amelyek korábban nem lettek volna képesek rá. Például a BitNet b1.58 2B paraméteres modell mindössze 0.4 GB memóriát igényel a nem beágyazott rétegekhez, míg a hasonló méretű hagyományos modellek ennek többszörösét

Alacsonyabb energiafogyasztás: Kevesebb memória és egyszerűbb számítások miatt az 1 bites modellek kevesebb energiát fogyasztanak
A BitNet b1.58 például a mátrixszorzásoknál akár 71.4-szeres energia megtakarítást is elérhet a hagyományos FP16 modellekhez képest

Gyorsabb következtetés (inference): Az alacsonyabb bitmélység és a kevesebb szorzási művelet miatt az 1 bites modellek gyorsabban tudnak szöveget generálni (inference)
A bitnet.cpp keretrendszer például jelentős sebességnövekedést tesz lehetővé CPU-kon. A BitNet b1.58 2B CPU-n történő dekódolási késleltetése például jelentősen alacsonyabb, mint a hasonló méretű FP16 modelleké

Potenciál a hardveroptimalizálásra: Az 1 bites modellek új számítási paradigmát jelentenek, ami lehetőséget teremt a speciálisan erre a célra optimalizált hardverek tervezésére


** BUYING MY ARTS **
► https://www.etsy.com/shop/mp3pintyo
► https://stock.adobe.com/contributor/2...
** STAY ACTIVE FOR A FOLLOW **
►TWITTER:   / mp3pintyo  
►INSTAGRAM:   / mp3pintyo  
►PINTEREST:   / mp3pintyo  
►SOUNDCLOUD:   / mp3pintyo  

Ez a videó bemutatja a mesterséges intelligencia alkalmazását. Az AI (mesterséges intelligencia) rengeteg területen könnyíti és segíti az életünket.

#ai #mesterségesintelligencia #mi #mp3pintyo

Mi az az 1-bites LLM és mire jó? A Microsoft BitNet b1.58 2B4T és a BitNet keretrendszer bemutatása

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(10) { [0]=> object(stdClass)#5911 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "vkQJ2lJzjKY" ["related_video_title"]=> string(52) "BitNet b1.58 LOCAL Test & Install (A 1-Bit LLM!)" ["posted_time"]=> string(25) "2 месяца назад" ["channelName"]=> string(11) "Bijan Bowen" } [1]=> object(stdClass)#5884 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "NXU2Qo096e8" ["related_video_title"]=> string(97) "Hogyan működik az internet? - A világháló egyszerű magyarázata" ["posted_time"]=> string(25) "2 месяца назад" ["channelName"]=> string(38) "Hogyan működik? Röviden - Tömören" } [2]=> object(stdClass)#5909 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "I5OmqGPNu-U" ["related_video_title"]=> string(108) "США заявили о победе Украины / Президент резко изменил план" ["posted_time"]=> string(23) "7 часов назад" ["channelName"]=> string(10) "NEXTA Live" } [3]=> object(stdClass)#5916 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "jGO6QtWOPJQ" ["related_video_title"]=> string(174) "КАСЬЯНОВ: "Я видел это своими глазами. Это не публиковалось": что показали Путину, чего он боится" ["posted_time"]=> string(23) "7 часов назад" ["channelName"]=> string(24) "И Грянул Грэм" } [4]=> object(stdClass)#5895 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "KApbyS09Rp8" ["related_video_title"]=> string(150) "Google Imagen 4: Van esélye utolérni az OpenAI GPT image 1 képgeneráló modellt? Nézzük meg együtt!" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> string(12) "Zsolt Pinter" } [5]=> object(stdClass)#5913 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "TObHbtmFVDo" ["related_video_title"]=> string(168) "БЫКОВ заплакал в эфире. Самый личный выпуск: о войнах, ошибках прошлого, шансах выжить и доме" ["posted_time"]=> string(23) "8 часов назад" ["channelName"]=> string(29) "Ходорковский LIVE" } [6]=> object(stdClass)#5908 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "JstcTHp-IKM" ["related_video_title"]=> string(108) "Лампа накаливания — возможно, лучшее изобретение [Veritasium]" ["posted_time"]=> string(21) "2 года назад" ["channelName"]=> string(10) "Vert Dider" } [7]=> object(stdClass)#5918 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "HkpO4reQKMg" ["related_video_title"]=> string(122) "ByteDance BAGEL AI bemutató – Mit lehet kihozni az eredeti kódból egy kis fejlesztéssel?" ["posted_time"]=> string(25) "2 недели назад" ["channelName"]=> string(12) "Zsolt Pinter" } [8]=> object(stdClass)#5894 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "xfOT2elC2Ok" ["related_video_title"]=> string(86) "Пассивный доход: Как я начал дропшиппинг с нуля" ["posted_time"]=> string(27) "6 месяцев назад" ["channelName"]=> string(12) "Mark Tilbury" } [9]=> object(stdClass)#5912 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "FZ3P1y6K3OE" ["related_video_title"]=> string(101) "ЭТО ПРОСТО ПУШКА! JARVIS КОТОРОГО МЫ ЖДАЛИ! 11ai Нейросети 2025" ["posted_time"]=> string(21) "1 день назад" ["channelName"]=> string(31) "NEUROMANIA - Нейросети" } }
BitNet b1.58 LOCAL Test & Install (A 1-Bit LLM!)

BitNet b1.58 LOCAL Test & Install (A 1-Bit LLM!)

Hogyan működik az internet? - A világháló egyszerű magyarázata

Hogyan működik az internet? - A világháló egyszerű magyarázata

США заявили о победе Украины / Президент резко изменил план

США заявили о победе Украины / Президент резко изменил план

КАСЬЯНОВ:

КАСЬЯНОВ: "Я видел это своими глазами. Это не публиковалось": что показали Путину, чего он боится

Google Imagen 4: Van esélye utolérni az OpenAI GPT image 1 képgeneráló modellt? Nézzük meg együtt!

Google Imagen 4: Van esélye utolérni az OpenAI GPT image 1 képgeneráló modellt? Nézzük meg együtt!

БЫКОВ заплакал в эфире. Самый личный выпуск: о войнах, ошибках прошлого, шансах выжить и доме

БЫКОВ заплакал в эфире. Самый личный выпуск: о войнах, ошибках прошлого, шансах выжить и доме

Лампа накаливания — возможно, лучшее изобретение [Veritasium]

Лампа накаливания — возможно, лучшее изобретение [Veritasium]

ByteDance BAGEL AI bemutató – Mit lehet kihozni az eredeti kódból egy kis fejlesztéssel?

ByteDance BAGEL AI bemutató – Mit lehet kihozni az eredeti kódból egy kis fejlesztéssel?

Пассивный доход: Как я начал дропшиппинг с нуля

Пассивный доход: Как я начал дропшиппинг с нуля

ЭТО ПРОСТО ПУШКА! JARVIS КОТОРОГО МЫ ЖДАЛИ! 11ai Нейросети 2025

ЭТО ПРОСТО ПУШКА! JARVIS КОТОРОГО МЫ ЖДАЛИ! 11ai Нейросети 2025

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]