Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

The Serial Scaling Hypothesis - Yuxi Liu & Konpat Preechakul | ASAP 47

Автор: ASAP Seminar Series

Загружено: 2025-11-07

Просмотров: 211

Описание:

Paper: https://arxiv.org/abs/2507.12549
Speaker 1: https://yuxi.ml/
Speaker 2: https://konpat.notion.site/
Slides: https://asap-seminar.github.io/assets...

The Serial Scaling Hypothesis - Yuxi Liu & Konpat Preechakul | ASAP 47

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(20) { ["3CuHzRKdfB0"]=> object(stdClass)#6125 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "3CuHzRKdfB0" ["related_video_title"]=> string(109) "Рассуждение о скрытом пространстве: взгляд на исследование" ["posted_time"]=> string(25) "3 месяца назад" ["channelName"]=> NULL } ["MlFu6v3qolg"]=> object(stdClass)#6134 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "MlFu6v3qolg" ["related_video_title"]=> string(90) "Cartridges: lightweight and general-purpose language model memory via self-study | ASAP 39" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } ["-8zrQggsVJU"]=> object(stdClass)#6126 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "-8zrQggsVJU" ["related_video_title"]=> string(180) "«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап" ["posted_time"]=> string(25) "2 недели назад" ["channelName"]=> NULL } ["Ye-N92ObhU4"]=> object(stdClass)#6141 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "Ye-N92ObhU4" ["related_video_title"]=> string(122) "Comedy Club: Голосовые от друга | Батрутдинов, Карибидис, Шкуро @ComedyClubRussia" ["posted_time"]=> string(21) "1 день назад" ["channelName"]=> NULL } ["u8JZ9gU5o4g"]=> object(stdClass)#6127 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "u8JZ9gU5o4g" ["related_video_title"]=> string(98) "L-1.1: Introduction to Algorithm & Syllabus Discussion for GATE/NET & Placements Preparation | DAA" ["posted_time"]=> string(19) "5 лет назад" ["channelName"]=> NULL } ["zYGDpG-pTho"]=> object(stdClass)#6148 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "zYGDpG-pTho" ["related_video_title"]=> string(62) "RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models" ["posted_time"]=> string(27) "7 месяцев назад" ["channelName"]=> NULL } ["sdzW2vvlv5Y"]=> object(stdClass)#6133 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "sdzW2vvlv5Y" ["related_video_title"]=> string(75) "Pre-training under infinite compute - Konwoo Kim & Suhas Kotha | ASAP 42" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } ["5eqRuVp65eY"]=> object(stdClass)#6135 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "5eqRuVp65eY" ["related_video_title"]=> string(47) "AI can't cross this line and we don't know why." ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["79otWC2FQlE"]=> object(stdClass)#6130 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "79otWC2FQlE" ["related_video_title"]=> string(59) "AI Safety (CS 2881) Lecture 10: Mechanistic Intepretability" ["posted_time"]=> string(19) "4 дня назад" ["channelName"]=> NULL } ["N4Vn2l1JX5c"]=> object(stdClass)#6146 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "N4Vn2l1JX5c" ["related_video_title"]=> string(63) "Helion: A high-level DSL for ML kernels - Jason Ansel | ASAP 32" ["posted_time"]=> string(25) "3 месяца назад" ["channelName"]=> NULL } ["8BTOoc0yDVA"]=> object(stdClass)#6132 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "8BTOoc0yDVA" ["related_video_title"]=> string(54) "Diffusion Language Models: The Next Big Shift in GenAI" ["posted_time"]=> string(25) "3 месяца назад" ["channelName"]=> NULL } ["y1zXWPftazk"]=> object(stdClass)#6142 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "y1zXWPftazk" ["related_video_title"]=> string(80) "Игорь Липсиц: Отъем денег только начинается" ["posted_time"]=> string(21) "3 часа назад" ["channelName"]=> NULL } ["eJlyPy_Q0h0"]=> object(stdClass)#6128 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "eJlyPy_Q0h0" ["related_video_title"]=> string(37) "3. How do Large Language Models work?" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["ebnX5Ur1hBk"]=> object(stdClass)#6116 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "ebnX5Ur1hBk" ["related_video_title"]=> string(81) "Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind" ["posted_time"]=> string(27) "5 месяцев назад" ["channelName"]=> NULL } ["OAGAYOOz3A8"]=> object(stdClass)#6117 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "OAGAYOOz3A8" ["related_video_title"]=> string(136) "Пирамида ОФЗ | Правительство занимает триллионы у россиян (English subtitles) @Max_Katz" ["posted_time"]=> string(24) "20 часов назад" ["channelName"]=> NULL } ["onMLLZTnja8"]=> object(stdClass)#6123 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "onMLLZTnja8" ["related_video_title"]=> string(168) "Хоронят на свалках и зарабатывают на этом. Что происходит с погибшими «свошниками» в России" ["posted_time"]=> string(23) "5 часов назад" ["channelName"]=> NULL } ["qNjGh9jopHE"]=> object(stdClass)#6124 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "qNjGh9jopHE" ["related_video_title"]=> string(175) "Рост цен на технику, продукты и машины. «Роснефть» и «Лукойл»: чем заменить нефтегазовые доходы?" ["posted_time"]=> string(22) "23 часа назад" ["channelName"]=> NULL } ["C9AqgW51-B4"]=> object(stdClass)#6122 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "C9AqgW51-B4" ["related_video_title"]=> string(101) "Parallelizing "Inherently Sequential" Processes: Parallel Newton methods for nonlinear SSMs|ASAP 40" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } ["mhKC3Avqy2E"]=> object(stdClass)#6120 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "mhKC3Avqy2E" ["related_video_title"]=> string(97) "Training large language models to reason in a continuous latent space – COCONUT Paper explained" ["posted_time"]=> string(27) "9 месяцев назад" ["channelName"]=> NULL } ["uQIRnxemdMs"]=> object(stdClass)#6121 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "uQIRnxemdMs" ["related_video_title"]=> string(0) "" ["posted_time"]=> string(21) "1 день назад" ["channelName"]=> NULL } }
Рассуждение о скрытом пространстве: взгляд на исследование

Рассуждение о скрытом пространстве: взгляд на исследование

Cartridges: lightweight and general-purpose language model memory via self-study | ASAP 39

Cartridges: lightweight and general-purpose language model memory via self-study | ASAP 39

«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап

«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап

Comedy Club: Голосовые от друга | Батрутдинов, Карибидис, Шкуро @ComedyClubRussia

Comedy Club: Голосовые от друга | Батрутдинов, Карибидис, Шкуро @ComedyClubRussia

L-1.1: Introduction to Algorithm & Syllabus Discussion for GATE/NET & Placements Preparation | DAA

L-1.1: Introduction to Algorithm & Syllabus Discussion for GATE/NET & Placements Preparation | DAA

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

Pre-training under infinite compute - Konwoo Kim  & Suhas Kotha | ASAP 42

Pre-training under infinite compute - Konwoo Kim & Suhas Kotha | ASAP 42

AI can't cross this line and we don't know why.

AI can't cross this line and we don't know why.

AI Safety (CS 2881) Lecture 10: Mechanistic Intepretability

AI Safety (CS 2881) Lecture 10: Mechanistic Intepretability

Helion: A high-level DSL for ML kernels - Jason Ansel | ASAP 32

Helion: A high-level DSL for ML kernels - Jason Ansel | ASAP 32

Diffusion Language Models: The Next Big Shift in GenAI

Diffusion Language Models: The Next Big Shift in GenAI

Игорь Липсиц: Отъем денег только начинается

Игорь Липсиц: Отъем денег только начинается

3. How do Large Language Models work?

3. How do Large Language Models work?

Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind

Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind

Пирамида ОФЗ | Правительство занимает триллионы у россиян (English subtitles) @Max_Katz

Пирамида ОФЗ | Правительство занимает триллионы у россиян (English subtitles) @Max_Katz

Хоронят на свалках и зарабатывают на этом. Что происходит с погибшими «свошниками» в России

Хоронят на свалках и зарабатывают на этом. Что происходит с погибшими «свошниками» в России

Рост цен на технику, продукты и машины. «Роснефть» и «Лукойл»: чем заменить нефтегазовые доходы?

Рост цен на технику, продукты и машины. «Роснефть» и «Лукойл»: чем заменить нефтегазовые доходы?

Parallelizing

Parallelizing "Inherently Sequential" Processes: Parallel Newton methods for nonlinear SSMs|ASAP 40

Training large language models to reason in a continuous latent space – COCONUT Paper explained

Training large language models to reason in a continuous latent space – COCONUT Paper explained

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]