Скачать
The Serial Scaling Hypothesis - Yuxi Liu & Konpat Preechakul | ASAP 47
Автор: ASAP Seminar Series
Загружено: 2025-11-07
Просмотров: 211
Описание:
Paper: https://arxiv.org/abs/2507.12549
Speaker 1: https://yuxi.ml/
Speaker 2: https://konpat.notion.site/
Slides: https://asap-seminar.github.io/assets...
Доступные форматы для скачивания:
Похожие видео
array(20) {
["3CuHzRKdfB0"]=>
object(stdClass)#6125 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "3CuHzRKdfB0"
["related_video_title"]=>
string(109) "Рассуждение о скрытом пространстве: взгляд на исследование"
["posted_time"]=>
string(25) "3 месяца назад"
["channelName"]=>
NULL
}
["MlFu6v3qolg"]=>
object(stdClass)#6134 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "MlFu6v3qolg"
["related_video_title"]=>
string(90) "Cartridges: lightweight and general-purpose language model memory via self-study | ASAP 39"
["posted_time"]=>
string(23) "1 месяц назад"
["channelName"]=>
NULL
}
["-8zrQggsVJU"]=>
object(stdClass)#6126 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "-8zrQggsVJU"
["related_video_title"]=>
string(180) "«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап"
["posted_time"]=>
string(25) "2 недели назад"
["channelName"]=>
NULL
}
["Ye-N92ObhU4"]=>
object(stdClass)#6141 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "Ye-N92ObhU4"
["related_video_title"]=>
string(122) "Comedy Club: Голосовые от друга | Батрутдинов, Карибидис, Шкуро @ComedyClubRussia"
["posted_time"]=>
string(21) "1 день назад"
["channelName"]=>
NULL
}
["u8JZ9gU5o4g"]=>
object(stdClass)#6127 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "u8JZ9gU5o4g"
["related_video_title"]=>
string(98) "L-1.1: Introduction to Algorithm & Syllabus Discussion for GATE/NET & Placements Preparation | DAA"
["posted_time"]=>
string(19) "5 лет назад"
["channelName"]=>
NULL
}
["zYGDpG-pTho"]=>
object(stdClass)#6148 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "zYGDpG-pTho"
["related_video_title"]=>
string(62) "RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models"
["posted_time"]=>
string(27) "7 месяцев назад"
["channelName"]=>
NULL
}
["sdzW2vvlv5Y"]=>
object(stdClass)#6133 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "sdzW2vvlv5Y"
["related_video_title"]=>
string(75) "Pre-training under infinite compute - Konwoo Kim & Suhas Kotha | ASAP 42"
["posted_time"]=>
string(23) "1 месяц назад"
["channelName"]=>
NULL
}
["5eqRuVp65eY"]=>
object(stdClass)#6135 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "5eqRuVp65eY"
["related_video_title"]=>
string(47) "AI can't cross this line and we don't know why."
["posted_time"]=>
string(19) "1 год назад"
["channelName"]=>
NULL
}
["79otWC2FQlE"]=>
object(stdClass)#6130 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "79otWC2FQlE"
["related_video_title"]=>
string(59) "AI Safety (CS 2881) Lecture 10: Mechanistic Intepretability"
["posted_time"]=>
string(19) "4 дня назад"
["channelName"]=>
NULL
}
["N4Vn2l1JX5c"]=>
object(stdClass)#6146 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "N4Vn2l1JX5c"
["related_video_title"]=>
string(63) "Helion: A high-level DSL for ML kernels - Jason Ansel | ASAP 32"
["posted_time"]=>
string(25) "3 месяца назад"
["channelName"]=>
NULL
}
["8BTOoc0yDVA"]=>
object(stdClass)#6132 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "8BTOoc0yDVA"
["related_video_title"]=>
string(54) "Diffusion Language Models: The Next Big Shift in GenAI"
["posted_time"]=>
string(25) "3 месяца назад"
["channelName"]=>
NULL
}
["y1zXWPftazk"]=>
object(stdClass)#6142 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "y1zXWPftazk"
["related_video_title"]=>
string(80) "Игорь Липсиц: Отъем денег только начинается"
["posted_time"]=>
string(21) "3 часа назад"
["channelName"]=>
NULL
}
["eJlyPy_Q0h0"]=>
object(stdClass)#6128 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "eJlyPy_Q0h0"
["related_video_title"]=>
string(37) "3. How do Large Language Models work?"
["posted_time"]=>
string(19) "1 год назад"
["channelName"]=>
NULL
}
["ebnX5Ur1hBk"]=>
object(stdClass)#6116 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "ebnX5Ur1hBk"
["related_video_title"]=>
string(81) "Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind"
["posted_time"]=>
string(27) "5 месяцев назад"
["channelName"]=>
NULL
}
["OAGAYOOz3A8"]=>
object(stdClass)#6117 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "OAGAYOOz3A8"
["related_video_title"]=>
string(136) "Пирамида ОФЗ | Правительство занимает триллионы у россиян (English subtitles) @Max_Katz"
["posted_time"]=>
string(24) "20 часов назад"
["channelName"]=>
NULL
}
["onMLLZTnja8"]=>
object(stdClass)#6123 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "onMLLZTnja8"
["related_video_title"]=>
string(168) "Хоронят на свалках и зарабатывают на этом. Что происходит с погибшими «свошниками» в России"
["posted_time"]=>
string(23) "5 часов назад"
["channelName"]=>
NULL
}
["qNjGh9jopHE"]=>
object(stdClass)#6124 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "qNjGh9jopHE"
["related_video_title"]=>
string(175) "Рост цен на технику, продукты и машины. «Роснефть» и «Лукойл»: чем заменить нефтегазовые доходы?"
["posted_time"]=>
string(22) "23 часа назад"
["channelName"]=>
NULL
}
["C9AqgW51-B4"]=>
object(stdClass)#6122 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "C9AqgW51-B4"
["related_video_title"]=>
string(101) "Parallelizing "Inherently Sequential" Processes: Parallel Newton methods for nonlinear SSMs|ASAP 40"
["posted_time"]=>
string(23) "1 месяц назад"
["channelName"]=>
NULL
}
["mhKC3Avqy2E"]=>
object(stdClass)#6120 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "mhKC3Avqy2E"
["related_video_title"]=>
string(97) "Training large language models to reason in a continuous latent space – COCONUT Paper explained"
["posted_time"]=>
string(27) "9 месяцев назад"
["channelName"]=>
NULL
}
["uQIRnxemdMs"]=>
object(stdClass)#6121 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "uQIRnxemdMs"
["related_video_title"]=>
string(0) ""
["posted_time"]=>
string(21) "1 день назад"
["channelName"]=>
NULL
}
}
Рассуждение о скрытом пространстве: взгляд на исследование
Cartridges: lightweight and general-purpose language model memory via self-study | ASAP 39
«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап
Comedy Club: Голосовые от друга | Батрутдинов, Карибидис, Шкуро @ComedyClubRussia
L-1.1: Introduction to Algorithm & Syllabus Discussion for GATE/NET & Placements Preparation | DAA
RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models
Pre-training under infinite compute - Konwoo Kim & Suhas Kotha | ASAP 42
AI can't cross this line and we don't know why.
AI Safety (CS 2881) Lecture 10: Mechanistic Intepretability
Helion: A high-level DSL for ML kernels - Jason Ansel | ASAP 32
Diffusion Language Models: The Next Big Shift in GenAI
Игорь Липсиц: Отъем денег только начинается
3. How do Large Language Models work?
Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind
Пирамида ОФЗ | Правительство занимает триллионы у россиян (English subtitles) @Max_Katz
Хоронят на свалках и зарабатывают на этом. Что происходит с погибшими «свошниками» в России
Рост цен на технику, продукты и машины. «Роснефть» и «Лукойл»: чем заменить нефтегазовые доходы?
Parallelizing "Inherently Sequential" Processes: Parallel Newton methods for nonlinear SSMs|ASAP 40
Training large language models to reason in a continuous latent space – COCONUT Paper explained