

我们人类从出生就在学习——婴儿会爬、会走、会说话,每天都在进步。但AI呢?一旦部署,就停滞不前,每次更新都需要工程师团队重新调教!
最近,Meta、纽约大学和伯克利的三位顶尖科学家发表了一篇重磅论文,直接点破了AI学习的致命缺陷!
高质量文本数据快被AI吃光了!就像一个人只吃别人喂的饭,永远不知道自己去厨房找食材。AI现在就是这种状态——被动接受,不会主动探索。
AI被困在语言的世界里!它没有手、没有脚、没有眼睛,无法真正感知物理空间。就像一个人只看地图,却从未真正走过那条路!
最可怕的是,AI一旦部署就停止学习!我们人类终身都在成长,但AI却像个被定格的标本。每次进步都需要人类重新编程、重新训练!
AI的学习能力其实被外包给了人类工程师!数据筛选、训练方案、性能监控——全部依赖人工流水线。这根本不是真正的自主学习!
就像婴儿观察世界!6个月大的婴儿能同时辨别人类和猴子面孔,9个月就专精于人类面孔。这就是观察学习的魔力!
System A对应自监督学习,能从海量数据中提取抽象特征。但它有个致命弱点:被动!只能看,不能动,无法主动选择学什么!
孩子学走路不是模仿,而是通过翻滚、爬行、试错!这就是行动学习的精髓——在实践中成长!
System B对应强化学习,能通过交互直接学习。但问题也很明显:效率极低!学个简单任务都需要海量尝试!
这才是真正的智能调度中心!就像大脑的前额叶皮层,决定什么时候观察、什么时候行动、什么时候切换模式!
System M监控预测误差、不确定性、新奇度,动态连接或断开学习通路。它让AI能够像人类一样,在不同学习模式间自由切换!
System A为System B提供三类关键帮助:
System B通过主动行为,为System A提供两个方向的支持:
System M让高阶学习成为可能!
通过交流学习:识别社会信号,调节学习权重
通过想象学习:用记忆回放巩固知识
A依赖B的数据,B依赖A的感知,M依赖两者的信号——三者相互依赖,学习如何开始?
研究团队借鉴生物学,提出双层优化框架:
内层:发育尺度,智能体在环境中交互学习
外层:进化尺度,优化系统初始元参数
整个系统中,唯一需要人工设计的只有适应度函数和训练环境!其他全部自动化!
需要足够真实又足够快速的环境!引入社会性Agent或实现师生交互尤其困难!
当AI趋于通用,传统基准失去价值!需要转向以人类儿童学习速度为参照的新体系!
自主学习在灵活性、安全性与社会监管之间引入了全新权衡:
A与B的深度整合已在受限领域取得成功!MuZero、Dreamer等系统实现了超人类游戏性能,VLA模型也在引导机器人运动执行!
但这些系统的学习方案依然由人类固定设定,远不及生物体中自主、流动的协作方式!
研究团队认为,距离完全自主、广域学习系统的实现,可能还有数十年时间!但这不是放弃的理由——自主学习不是AI的加分项,而是其在真实世界可靠运行的必要前提!
金句:真正的智能不是学会所有答案,而是学会如何学习!
互动问题:你觉得AI什么时候才能真正像人类一样自主学习?
如果这篇文章让你对AI学习有了新认识,请点赞支持!分享给更多朋友,一起探讨AI的未来!