Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Автор: Stanford MLSys Seminars

Загружено: 2023-12-04

Просмотров: 4849

Описание:

Episode 86 of the Stanford MLSys Seminar Series!

Monarch Mixer: Making Foundation Models More Efficient
Speaker: Dan Fu

Abstract:
Machine learning models are increasingly being scaled in both sequence length and model dimension to reach longer contexts and better performance. However, existing architectures like Transformers scale quadratically along both these axes. In this talk I'll discuss Monarch Mixer (M2), a new architecture that uses the same sub-quadratic primitive along both sequence length and model dimension. M2 mixes information along the sequence and model dimensions using Monarch matrices, a simple class of expressive structured matrices that captures many linear transforms, achieves high hardware efficiency on GPUs, and scales sub-quadratically.

Bio:
Dan Fu is a PhD student in the Computer Science Department at Stanford University, where he is co-advised by Christopher Ré and Kayvon Fatahalian. His research is at the intersection of systems and machine learning and focuses on developing algorithms and architectures to make machine learning more efficient.

Monarch Mixer arXiv: https://arxiv.org/abs/2310.12109
FlashFFTConv arXiv: https://arxiv.org/abs/2311.05908

--

Stanford MLSys Seminar hosts: Simran Arora, Dan Fu

Twitter:
  / simran_s_arora  
  / realdanfu​  

--

Check out our website for the schedule: http://mlsys.stanford.edu
Join our mailing list to get weekly updates: https://groups.google.com/forum/#!for...

#machinelearning #ai #artificialintelligence #systems #mlsys #computerscience #stanford

Monarch Mixer: Making Foundation Models More Efficient - Dan Fu | Stanford MLSys #86

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Notes on AI Hardware - Benjamin Spector | Stanford MLSys #88

Democratizing Foundation Models via k-bit Quantization - Tim Dettmers | Stanford MLSys #82

Democratizing Foundation Models via k-bit Quantization - Tim Dettmers | Stanford MLSys #82

EVO: DNA Foundation Models - Eric Nguyen | Stanford MLSys #96

EVO: DNA Foundation Models - Eric Nguyen | Stanford MLSys #96

System Design Concepts Course and Interview Prep

System Design Concepts Course and Interview Prep

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 2 - Transformer-Based Models & Tricks

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 2 - Transformer-Based Models & Tricks

Text2SQL: The Dream versus Reality - Laurel Orr | Stanford MLSys #89

Text2SQL: The Dream versus Reality - Laurel Orr | Stanford MLSys #89

Pixelated Butterfly: Fast Machine Learning with Sparsity - Beidi Chen | Stanford MLSys #49

Pixelated Butterfly: Fast Machine Learning with Sparsity - Beidi Chen | Stanford MLSys #49

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

Следующий 100x — Гэвин Уберти | Stanford MLSys #92

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

EI Seminar - Danny Driess  - Have Large Models Changed Robotics?

EI Seminar - Danny Driess - Have Large Models Changed Robotics?

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

Как тонкая настройка программ LLM с открытым исходным кодом решает проблему внедрения GenAI в про...

Teaching LLMs to Use Tools at Scale - Shishir Patil | Stanford MLSys #98

Teaching LLMs to Use Tools at Scale - Shishir Patil | Stanford MLSys #98

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Мультимодальное мышление: PaLM-E и Близнецы - Ааканша Чоудери | Стэнфордский MLSys # 90

Мультимодальное мышление: PaLM-E и Близнецы - Ааканша Чоудери | Стэнфордский MLSys # 90

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Causal Mechanistic Interpretability (Stanford lecture 1) - Atticus Geiger

Causal Mechanistic Interpretability (Stanford lecture 1) - Atticus Geiger

Stanford AI Club: Jeff Dean on Important AI Trends

Stanford AI Club: Jeff Dean on Important AI Trends

Важные открытия XXI века: почему рак победил и что не так с клонированием? Что скрывают нобелевки?

Важные открытия XXI века: почему рак победил и что не так с клонированием? Что скрывают нобелевки?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com