ROLL: 高效且用户友好的大模型RL训练框架
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке:
从 π_0 到 π_RL:面向流匹配 VLA 的强化学习后训练框架 | 青稞Talk95期
RLite: 用20行代码从头写RL
单智能体已死?多智能体协作才是未来?
RISC-V Day Tokyo 2025 Spring: Linux on RISC-V SW / HW Ecosystem Status by Wei Fu Redhat (Beijing)
鄭傑仁:咖啡傳統處理法中的微生物:揭開背後的微生態系統
微影報告3
RLinf:面向具身智能的“渲训推一体化”开源强化训练框架|青稞Talk 92期
Розница на ГРАНИ КРАХА -- что будет с продажами оффлайн.
老梁:共和国无法抹平的伤疤
巴刻|《巴刻谈清教徒》:为何清教徒能让今日的基督徒重新经历神?走进被遗忘的属灵宝藏!
SimpleVLA-RL:简单可拓展的VLA强化学习训练 |青稞talk84期
Niesamowita moc silnika napędzającego największe statki świata
Chiny wezmą Tajwan? Xî Jinping chce decydować o pokoju na Ukrainie? — Bogdan Góralczyk i Zychowicz
从 LLM-RL 到 Agentic RL:如何让语言模型成为自主智能体|青稞Talk 78期
Top 50 Christmas Songs of All Time 🎄 Best Christmas Music Playlist
曾仕強:你身邊90%的人,其實都喜歡看你「遭殃」!做人最高明的智慧,就是「裝窮和閉嘴」!連「神明都不要講」! #曾仕強 #正能量 #易经 #人生智慧 #人生感悟 #人際關係
通过量化与稀疏性实现高效注意力机制|青稞Talk 93期
The Modern Job Crisis Is Here
OpenCUA:用于构建 Computer-Use Agent 的开源框架|青稞Talk 82期
ShotBench: 面向增强MLLM摄影语言理解能力的训练与评估体系|青稞Talk 90期