Spiking Brain-inspired Large Models

Автор: LuxaK

Загружено: 2025-09-09

Просмотров: 654

Описание:

This document introduces SpikingBrain, a family of brain-inspired large language models (LLMs) designed to address the efficiency bottlenecks of Transformer-based LLMs. The models focus on efficient long-context training and inference, leveraging the MetaX1GPU cluster. SpikingBrain utilizes linear and hybrid-linear attention architectures with adaptive spiking neurons, along with algorithmic optimizations such as conversion-based training and a dedicated spike coding framework. System engineering includes customized training frameworks, operator libraries, and parallelism strategies tailored to the MetaX hardware. The paper presents SpikingBrain-7B and SpikingBrain-76B, demonstrating the feasibility of large-scale LLM development on non-NVIDIA platforms. These models achieve comparable performance to Transformer baselines with significantly reduced data resources and improved long-sequence training efficiency. The research explores the potential of brain-inspired mechanisms to drive the next generation of efficient and scalable large model design.
#LargeLanguageModels #BrainInspired #SpikingNeuralNetworks #Efficiency #MetaX

paper - http://arxiv.org/pdf/2509.05276v1
subscribe - https://t.me/arxivpaper
donations:
USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr
ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e
created with NotebookLM

Spiking Brain-inspired Large Models

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Spiking Neural Networks for More Efficient AI Algorithms

Spiking Neural Networks for More Efficient AI Algorithms

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

MATH 2400 UPenn Session 1

MATH 2400 UPenn Session 1

The World's Most Important Machine

The World's Most Important Machine

Intro to Binarized Neural Networks

Intro to Binarized Neural Networks

MIT’s PaTH Attention: Smarter Long-Context Transformers

MIT’s PaTH Attention: Smarter Long-Context Transformers

AI Trends 2026: Quantum, Agentic AI & Smarter Automation

AI Trends 2026: Quantum, Agentic AI & Smarter Automation

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Ни NASA, ни китайцы до этого не додумались! Превратите свой велосипед в мотоцикл с бесцепным приводо

Ни NASA, ни китайцы до этого не додумались! Превратите свой велосипед в мотоцикл с бесцепным приводо

Сварщик изобрел замок без ключа! Это простое изобретение может изменить всё.

Сварщик изобрел замок без ключа! Это простое изобретение может изменить всё.

Continuous Thought Machine Deep Dive | Temporal Processing + Neural Synchronisation

Continuous Thought Machine Deep Dive | Temporal Processing + Neural Synchronisation

The Strange Math That Predicts (Almost) Anything

The Strange Math That Predicts (Almost) Anything

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

AlphaFold - The Most Useful Thing AI Has Ever Done

AlphaFold - The Most Useful Thing AI Has Ever Done

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Они убили китайскую электронику! Как США и Нидерланды сломали Китай за один ход

Они убили китайскую электронику! Как США и Нидерланды сломали Китай за один ход