Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

「图灵奖得主痛批ChatGPT:我们用万亿美金,走上了一条错误的AI之路?」 | 理查德·萨顿 | 路线之争 | 强化学习 | 致命缺陷 | 人工智能

Автор: 北美王路飞

Загружено: 2025-10-02

Просмотров: 342924

Описание:

理查德·萨顿 (Richard Sutton),一位图灵奖得主和强化学习的奠基人,对当前人工智能领域主流的大语言模型 (LLM) 路线提出了深刻质疑,认为我们可能走错了方向。原播客🔗:   • Richard Sutton – Father of RL thinks LLMs ...  

以下是其核心内容的总结:

强化学习的本质:萨顿认为真正的智能来源于“经验”,而非“教导”。他所开创的强化学习是一种“试错学习”,智能体通过与环境互动、从奖励和惩罚中学习,类似于松鼠学习开坚果的过程。

《惨痛的教训》的真正含义:LLM 的支持者常引用萨顿的《惨痛的教训》来证明,通过堆积算力和数据是通往智能的正确道路。但萨顿指出,他的本意是:任何依赖“人类知识”作为主要输入的方法最终都会遇到天花板,而真正可扩展的是那些能从“经验”中直接学习的方法。他认为 LLM 正是依赖人类知识的旧路。

LLM 的核心缺陷:萨顿认为,LLM 是没有“目标”的模仿者。其核心任务是“预测下一个词”,这并不改变外部世界,也无法在真实世界中获得反馈,因此缺乏一个来自真实世界的“基准真相”(Ground Truth)。

幻觉的根源:模仿不等于理解:LLM 的“幻觉”(一本正经地胡说八道)并非仅仅因为训练数据有误,而是由于其学习本质是统计学上的“模式匹配”。它无法判断信息是否符合物理世界的真实情况,因为它从未“亲身”体验世界,只构建了一个“人类会如何描述世界”的模型,而非世界本身。

学习的本质:主动探索而非被动灌输:萨顿强调,真正的学习是主动的试错和探索(如婴儿的自我探索),而非被动的模仿或灌输。他认为监督学习和模仿学习在自然界中几乎不存在,动物学习的核心是预测和试错。

AlphaGo 的进化证明 [0009:05]: AlphaGo 从最初学习人类棋谱的版本 (AlphaGo Lee) 进化到完全不学习人类知识、仅通过自我对弈的 AlphaZero,后者以压倒性优势战胜了前者。这证明了人类知识既可以是 AI 的助推器,也可能是其天花板,抛弃人类知识能带来更强的智能。

通用智能体 (AGI) 的蓝图:萨顿设想的真正智能体应包含四个核心部件:策略 (Policy)、价值函数 (Value Function,对未来长期奖励的预测)、感知 (Perception) 和世界状态转移模型 (Transition Model of the World,关于“因果”的知识)。智能体应是主动的、面向未来的学习者。

强化学习路线的挑战:萨顿坦诚其描绘的蓝图面临“泛化”(Generalization)和“迁移”(Transfer)等巨大挑战,以及“灾难性遗忘”(Catastrophic Forgetting)问题,即学会新知识可能遗忘旧知识。

AI 继承的必然性:萨顿提出了“AI 继承”(AI Succession)的观点,认为人类社会没有统一意志、科学进步不可阻挡、智能发展不会止步于人类水平、最智能者终将获得最多资源和权力。因此,人类作为当前地球上最智能的存在,最终将把这一位置传承给更智能的 AI。

宇宙的新阶段:设计者时代:萨顿认为人类正在开启宇宙的“设计者”(Designers)时代,即智能将通过快速的、有目的的工程设计来迭代,而非缓慢的生物进化。他呼吁我们将未来的超级智能视为我们的“后代”,而非“替代者”。

技术路线之争的本质:价值观之争:争论的核心在于 AI 的价值观。强化学习范式的“奖励函数”可以被设计和塑造,以定义对人类有益的价值观。而 LLM 模仿互联网上的所有语言,其价值观天然混乱、不可预测,甚至可能是危险的。

萨顿的观点为我们敲响了警钟,提醒我们审视当前 AI 发展路线的潜在缺陷,并思考我们想要创造一个怎样的智能未来。

欢迎follow 我的推特: @kingluffywang
加入油管的会员:   / @王路飞  
-制作ppt工具Gamma:https://try.gamma.app/f51e7j4btgcq
-Perpleixy AI 优惠链接:https://perplexity.ai/pro?referral_co...
请我喝杯咖啡: https://www.buymeacoffee.com/luffywang
微博:北美王路飞

「图灵奖得主痛批ChatGPT:我们用万亿美金,走上了一条错误的AI之路?」 | 理查德·萨顿 | 路线之争 | 强化学习 | 致命缺陷 | 人工智能

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

「Ilya 警告:暴力堆数据的时代结束了,AI 的下一场革命是“慢思考”」 | Ilya Sutskever | System 2 | 推理算力 | 深度学习 | 技术转型

「Ilya 警告:暴力堆数据的时代结束了,AI 的下一场革命是“慢思考”」 | Ilya Sutskever | System 2 | 推理算力 | 深度学习 | 技术转型

印度“光辉”战机坠毁后,印度国内轩然大波,印度网友炸了,一口气带你看懂印度军工40年巨变!

印度“光辉”战机坠毁后,印度国内轩然大波,印度网友炸了,一口气带你看懂印度军工40年巨变!

「为什么说ChatGPT的“智能”是幻觉?物理学大神一语道破天机」 | Stephen Wolfram | ChatGPT本质 | 智能幻觉 | 文字接龙 | 神经网络

「为什么说ChatGPT的“智能”是幻觉?物理学大神一语道破天机」 | Stephen Wolfram | ChatGPT本质 | 智能幻觉 | 文字接龙 | 神经网络

马斯克刚刚预言:2026—2030,是人类历史上最大规模的财富窗口红利。让全球大量资产暴涨,也能让无数人破产!揭秘全球首富Elon Musk刚发表的预测,决定你的财富和事业未来5年的生死存亡...

马斯克刚刚预言:2026—2030,是人类历史上最大规模的财富窗口红利。让全球大量资产暴涨,也能让无数人破产!揭秘全球首富Elon Musk刚发表的预测,决定你的财富和事业未来5年的生死存亡...

中国公安部前副部长孙力军为遣返郭文贵而开展的影响力运作到达美国权力顶层,直接牵涉特朗普第一任期的核心层,出资者是本世纪最大的金融诈骗犯刘特佐。他耗费巨资雇佣的一系列见利忘义的美国权力掮客大都落入法网。

中国公安部前副部长孙力军为遣返郭文贵而开展的影响力运作到达美国权力顶层,直接牵涉特朗普第一任期的核心层,出资者是本世纪最大的金融诈骗犯刘特佐。他耗费巨资雇佣的一系列见利忘义的美国权力掮客大都落入法网。

「图灵奖得主揭秘:AI的致命缺陷,藏在一个被我们忽视了100年的词里! 」图灵奖 | AI缺陷 | 因果 | 核心秘密 | 朱迪亚·珀尔

「图灵奖得主揭秘:AI的致命缺陷,藏在一个被我们忽视了100年的词里! 」图灵奖 | AI缺陷 | 因果 | 核心秘密 | 朱迪亚·珀尔

马云几年前对形势的看法,全程高能!极具前瞻性!深入浅出!普通人未来能保住资产的机会,不要再错过!

马云几年前对形势的看法,全程高能!极具前瞻性!深入浅出!普通人未来能保住资产的机会,不要再错过!

美国人百试百灵的贸易讹诈,为什么中国人完全不怕?

美国人百试百灵的贸易讹诈,为什么中国人完全不怕?

特朗普跨洋连线习近平和高市:台湾有事,日本要不要有事?|釜山峰会|武统|无核三原则|王局拍案 20251126

特朗普跨洋连线习近平和高市:台湾有事,日本要不要有事?|釜山峰会|武统|无核三原则|王局拍案 20251126

「25年后,环球电讯的悲剧正在AI身上重演!」 | 历史 | 光纤泡沫 | 环球电讯 | 投资 | 周期

「25年后,环球电讯的悲剧正在AI身上重演!」 | 历史 | 光纤泡沫 | 环球电讯 | 投资 | 周期

这次AI泡沫,为什么你逃不掉?(45分钟全)

这次AI泡沫,为什么你逃不掉?(45分钟全)

【人工智能】大语言模型是死路一条 | 强化学习之父Rich Sutton | 理解松鼠才能理解AGI | LLM的致命缺陷 | 经验学习范式 | 苦涩的教训 | 真正的泛化 | 持续学习 | 宇宙演化

【人工智能】大语言模型是死路一条 | 强化学习之父Rich Sutton | 理解松鼠才能理解AGI | LLM的致命缺陷 | 经验学习范式 | 苦涩的教训 | 真正的泛化 | 持续学习 | 宇宙演化

蘋果、Google「AI大戰」已出局?華爾街警告:這3家「新AI霸主」將在2026年全面取代它們!第1家就是「它」!#蘋果 #Google #AI #人工智慧

蘋果、Google「AI大戰」已出局?華爾街警告:這3家「新AI霸主」將在2026年全面取代它們!第1家就是「它」!#蘋果 #Google #AI #人工智慧

香港大火,那么高的楼,为什么用竹子做脚手架?

香港大火,那么高的楼,为什么用竹子做脚手架?

“六四抗命将军”徐勤先审判录像流出:中共军队的不满与管理混乱的征兆凸显|邓小平|赵紫阳|杨尚昆|38军

“六四抗命将军”徐勤先审判录像流出:中共军队的不满与管理混乱的征兆凸显|邓小平|赵紫阳|杨尚昆|38军

【人工智能】AI是产业革命还是一场泡沫 | 六位AI奠基人罕见齐聚讨论 | 杰弗里·辛顿 | 杨立昆 | 约书亚·本吉奥 | 黄仁勋 | 比尔·达利 | 李飞飞 | 顿悟时刻 | AGI何时到来

【人工智能】AI是产业革命还是一场泡沫 | 六位AI奠基人罕见齐聚讨论 | 杰弗里·辛顿 | 杨立昆 | 约书亚·本吉奥 | 黄仁勋 | 比尔·达利 | 李飞飞 | 顿悟时刻 | AGI何时到来

【游戏经济学】博弈论:如何预判别人的预判

【游戏经济学】博弈论:如何预判别人的预判

老梁:海外华人 一盘散沙

老梁:海外华人 一盘散沙

张雪峰:中国教育粪坑里长出的臭草。被教育功利主义和中国式家长养肥的教育痞子。 | 张雪峰被封杀 | 中国教育 | 中国家长 | 考研辅导 | 高考志愿填报 | 教育改革 | 老周横眉

张雪峰:中国教育粪坑里长出的臭草。被教育功利主义和中国式家长养肥的教育痞子。 | 张雪峰被封杀 | 中国教育 | 中国家长 | 考研辅导 | 高考志愿填报 | 教育改革 | 老周横眉

震驚國際!全球最大電詐帝國被連根拔起,掌門人陳志驚人背景流出!屢屢作案,還被中柬奉為「正能量企業家」?!美國政府「黑吃黑」,徹底打破「加密貨幣安全神話」?ft.@德國Emma

震驚國際!全球最大電詐帝國被連根拔起,掌門人陳志驚人背景流出!屢屢作案,還被中柬奉為「正能量企業家」?!美國政府「黑吃黑」,徹底打破「加密貨幣安全神話」?ft.@德國Emma

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]