Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

⚡️Mercury: Ultra-Fast Diffusion LLMs — Estefano Ermon, CEO Inception Labs

Автор: Latent Space

Загружено: 2025-08-04

Просмотров: 2588

Описание:

https://arxiv.org/abs/2506.17298

We present Mercury, a new generation of commercial-scale large language models (LLMs) based on diffusion. These models are parameterized via the Transformer architecture and trained to predict multiple tokens in parallel. In this report, we detail Mercury Coder, our first set of diffusion LLMs designed for coding applications. Currently, Mercury Coder comes in two sizes: Mini and Small. These models set a new state-of-the-art on the speed-quality fron- tier. Based on independent evaluations conducted by Artificial Analysis, Mercury Coder Mini and Mercury Coder Small achieve state-of-the-art throughputs of 1109 tokens/sec and 737 to- kens/sec, respectively, on NVIDIA H100 GPUs and outperform speed-optimized frontier models by up to 10x on average while maintaining comparable quality. We discuss additional results on a variety of code benchmarks spanning multiple languages and use-cases as well as real-world validation by developers on Copilot Arena, where the model currently ranks second on quality and is the fastest model overall. We also release a public API at platform. inceptionlabs. ai and free playground at chat.inceptionlabs.ai.

⚡️Mercury: Ultra-Fast Diffusion LLMs — Estefano Ermon, CEO Inception Labs

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Artificial Analysis: The Independent LLM Analysis House — with George Cameron and Micah Hill-Smith

Artificial Analysis: The Independent LLM Analysis House — with George Cameron and Micah Hill-Smith

[State of Post-Training] From GPT-4.1 to 5.1: RLVR, Agent & Token Efficiency — Josh McGrath, OpenAI

[State of Post-Training] From GPT-4.1 to 5.1: RLVR, Agent & Token Efficiency — Josh McGrath, OpenAI

Joint Custody - Episode 9: Dave Sedacca, Lead of Polkadot Capital Group

Joint Custody - Episode 9: Dave Sedacca, Lead of Polkadot Capital Group

Diffusion Language Models - Turning ModernBERT into an instruct-tuned Diffusion LLM

Diffusion Language Models - Turning ModernBERT into an instruct-tuned Diffusion LLM

[State of AI Papers 2025] Fixing Research with Social Signals, OCR & Implementation — Team AlphaXiv

[State of AI Papers 2025] Fixing Research with Social Signals, OCR & Implementation — Team AlphaXiv

The Surprising Performance Drivers of HRM

The Surprising Performance Drivers of HRM

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy: Software Is Changing (Again)

Why People Are Freaking Out About Clawdbot

Why People Are Freaking Out About Clawdbot

Controlling Language Models–Lisa Li (Stanford)

Controlling Language Models–Lisa Li (Stanford)

Как я автоматизировал NotebookLM с помощью Claude Code и Telegram

Как я автоматизировал NotebookLM с помощью Claude Code и Telegram

[State of Code Evals] After SWE-bench, Code Clash & SOTA Coding Benchmarks recap — John Yang

[State of Code Evals] After SWE-bench, Code Clash & SOTA Coding Benchmarks recap — John Yang

Профессор Ю.Н. Харари: угрозы и риски ИИ в будущем (Давос 2026)

Профессор Ю.Н. Харари: угрозы и риски ИИ в будущем (Давос 2026)

Opencode – Самый Удобный ИИ-агент для кодинга и автоматизаций

Opencode – Самый Удобный ИИ-агент для кодинга и автоматизаций

В этом году будет совсем плохо? 😧 Есть ли лучик надежды? || Дмитрий Потапенко*

В этом году будет совсем плохо? 😧 Есть ли лучик надежды? || Дмитрий Потапенко*

Diffusion Language Models: The Next Big Shift in GenAI

Diffusion Language Models: The Next Big Shift in GenAI

18 команд ChatGPT, о которых молчат в офисах (№12 — гениальна!)

18 команд ChatGPT, о которых молчат в офисах (№12 — гениальна!)

РЕАЛЬНОСТЬ НЕ СУЩЕСТВУЕТ | Пока вы на неё не посмотрите

РЕАЛЬНОСТЬ НЕ СУЩЕСТВУЕТ | Пока вы на неё не посмотрите

[State of Context Engineering] Agentic RAG, Context Rot, MCP, Subagents — Nina Lopatina, Contextual

[State of Context Engineering] Agentic RAG, Context Rot, MCP, Subagents — Nina Lopatina, Contextual

Этот новый робот с искусственным интеллектом поразительно похож на человека… Ведет себя как насто...

Этот новый робот с искусственным интеллектом поразительно похож на человека… Ведет себя как насто...

Зачем власти РФ хотят контролировать уехавших?

Зачем власти РФ хотят контролировать уехавших?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com