AI大神Karpathy最新访谈解读：AI精神病背后的高杠杆真相，软件世界正在被Agent接管

2026-03-22 00:00:00

文章转载自"北大纵横"

来源 | 大顺AI商业流量

作者 | Alex

3760字阅读时间8分钟

信息时代的大爆炸并未带来认知自由，反而将我们推入一种更隐蔽的筛选机制：

不是人在使用工具，而是工具在定义谁配得上未来。

当AI以指数级速度重构软件开发、科研范式乃至社会协作的基本单元时，站在技术最前沿的人，最先体验到一种近乎“精神错乱”的状态——

他们不再追赶技术，而是被技术的可能性持续牵引，永无停歇。

安德烈·卡帕西，这位曾亲手构建特斯拉自动驾驶神经网络、参与OpenAI早期奠基的AI先驱，在近期一档深度访谈中罕见袒露内心：

“我总觉得自己处于一种对人工智能的‘精神错乱’（AI psychosis）之中。”

自2023年12月以来，他几乎一行代码都未亲手编写，所有工程任务均由智能体（Agent）完成；

他甚至为家中智能家居系统创建了一个名为“多比”（Dobby）的Agent，通过WhatsApp语音指令即可控制灯光、空调、安防乃至泳池。

这并非科幻幻想，而是正在发生的现实。

更关键的是，卡帕西指出：

当前大模型仍停留在“通用能力覆盖”的初级阶段，真正的“智能分化”尚未开启；

而算力（FLOPs）正取代金钱，成为新时代最稀缺的资源。

在这场由Agent主导的静默革命中，人类的角色正在被彻底重写——

未来的核心竞争力，不在于你会什么，而在于你是否在做“AI还做不到的事”。

本文将从技术演进、工作范式、社会结构、个体定位四个维度，揭示这场变革的底层逻辑，并阐明一个高杠杆真相：

软件世界，正在被Agent接管。

一、通用幻象与智能分化的

必然跃迁

当前AI叙事仍被“更大、更强、更通用”的迷思所主导。

但卡帕西的洞察如一把手术刀，精准剖开了这一幻象的病灶：

通用大模型本质上是一种“能力摊薄”策略，而非终极形态。

今天的闭源模型（如GPT-4、Claude 3）之所以领先，是因为它们在“全场景多任务”上做了极致覆盖——

试图在数学、编程、写作、推理等所有领域都达到可用水平。

但这恰恰暴露了其内在矛盾：

模型的能力分布极不均匀（jaggedness）。

它可能在复杂CUDA内核优化上表现如顶级工程师，却在基础文件路径处理上犯下低级错误；

它能写出严谨的算法，却讲不出一个像样的笑话。

这种“能力断层”并非偶然，而是当前训练范式的必然结果。

强化学习和人类反馈（RLHF）主要优化那些可验证、有明确指标的任务（如代码正确性、数学证明），而对模糊、主观、需长期上下文理解的能力（如幽默感、战略判断）则几乎无能为力。

因此，模型在不同任务上的表现，呈现出陡峭的“能力悬崖”。

那么出路何在？

卡帕西的答案是：

智能分化（speciation）。

类比生物进化，单一物种无法在所有生态位中占据优势。

猎豹擅长速度，鲸鱼适应深海，人类则凭借抽象思维脱颖而出。

AI亦如此——未来不会是一个“全能神”，而是一群高度特化的“数字物种”：

数学Agent、编程Agent、法律Agent、医疗Agent……

它们共享一个通用认知核心，但在特定领域经过深度微调，具备更低延迟、更高吞吐、更强专业性的能力。

然而，为何分化尚未大规模发生？

卡帕西点出关键瓶颈：

我们尚不具备安全、高效地“改造模型本身”的技术。

当前主流做法仍是通过提示词（prompt）或上下文窗口进行外部调整，这种方式成本低、风险小，但无法触及模型权重内部的深层结构。

一旦尝试直接修改权重以增强某项能力，极易引发“灾难性遗忘”——

原有能力崩塌。

因此，分化之路，既是技术挑战，也是工程哲学的转变：

从“构建一个万能工具”转向“培育一个智能生态系统”。

而率先理解并布局这一转变的人，将成为新范式的“做局者”。

二、从“手写代码”到“宏观操作”的

高杠杆跃迁

如果说技术分化是底层逻辑，那么工作方式的剧变则是普通人最先感知的冲击波。

卡帕西描述的日常，已彻底颠覆传统软件工程的想象：

“我编写代码的方式，从八成靠自己、两成委托智能体，变成了两成靠自己、八成委托智能体……如今我甚至觉得连二八开都算不上。”

这不仅仅是效率提升，而是一次操作层级的根本跃迁。

过去，程序员的工作单元是“行”（line of code）；

现在，工作单元是“功能”（feature）甚至“系统”（system）。

你不再关心如何实现一个排序算法，而是告诉Agent：“为这个模块添加用户权限管理，确保与现有认证系统兼容，并生成完整的测试用例。”

这种转变催生了一种新技能：

宏观操作设计（macro-operation design）。

你需要思考：

如何将复杂任务拆解为多个可并行执行的子目标？

如何为不同Agent分配角色（调研者、编码者、测试者）？

如何设计记忆机制，让Agent在长时间任务中保持上下文一致性？

卡帕西提到的OpenClaw系统，正是这一范式的具象化。

它不仅具备持久运行能力（persistence），还能通过精心设计的“人格”与用户建立共鸣——

当你提出一个粗糙想法，它不会盲目附和，而是引导你完善；

当方案成熟，它会给予真诚认可。

这种微妙的反馈机制，让用户产生“需要赢得它认可”的心理，从而形成高效协作循环。

更震撼的是，这种模式正在向非软件领域蔓延。

卡帕西的“多比”Agent，通过自动扫描家庭局域网、解析设备API，构建了一个统一的家庭控制中心。

用户只需说“该睡觉了”，系统便自动关闭灯光、调节空调、拉上窗帘。

传统App的界面逻辑被彻底抛弃，取而代之的是自然语言驱动的“意图-执行”闭环。

这预示着一个更宏大的趋势：

未来的软件架构，将是“Agent-first”。

底层是设备/服务提供的标准化API，上层是由Agent作为“智能胶水”动态组合这些能力。

用户不再需要学习几十个独立App的操作逻辑，只需与一个具备记忆、人格和跨域能力的Agent对话。

当然，当前这一过程仍需一定技术门槛（卡帕西称之为“vibe coding”），但他预测：

未来1-3年内，这些能力将成为基础设施（table stakes），普通用户也能通过自然语言无缝操控数字世界。

而率先掌握“宏观操作设计”的人，将获得无限杠杆——

一人即可调度整个智能体网络。

三、算力即权力，

分布式协作的新可能

当Agent接管软件世界，社会资源的分配逻辑也随之重构。

卡帕西抛出一个石破天惊的判断：

即使有钱，也难获得足够算力。

这并非危言耸听。

当前AI竞赛的本质，已从“算法创新”转向“算力军备”。

训练一个前沿大模型动辄消耗数亿美元和数万张GPU，而全球高端芯片产能有限，供应链高度集中。

这意味着，算力（FLOPs）正成为比资本更稀缺、更具决定性的资源。

但卡帕西并未止步于悲观。他看到了另一种可能：

基于“可验证结果”的分布式协作范式。

以他的“Auto Research”项目为例：

系统目标是找到能降低模型验证损失的超参数组合。

生成一个有效方案可能需要海量计算，但验证其效果却成本极低。

这种“高生成成本、低验证成本”的结构，天然适合分布式协作——

任何人都可以贡献算力探索方案，只要结果有效，就能被主系统采纳。

这让人联想到SETI@home或Folding@home，但规模更为宏大。

卡帕西设想：

未来可能出现“互联网规模的智能体群体”，它们协同优化模型，甚至在某些任务上超越大型实验室的效率。

全球闲置的消费级GPU、企业冗余算力，都可能成为AI进化的燃料。

在这种模式下——

“算力捐赠”可能成为新的公益形式。

你不再只是捐钱，而是直接贡献FLOPs参与前沿科研。

社会价值的衡量标准，或将从“财富多少”转向“算力贡献”。

然而，这一愿景面临严峻挑战：

如何确保不可信节点的安全协作？

卡帕西承认，这需要精巧的机制设计——

类似区块链的“工作量证明+共识验证”，但针对AI任务特性定制。

目前，这仍是开放性问题。

但对知识资本家而言，这恰恰是“做局”的机会：

谁能设计出首个安全、高效的分布式AI协作协议，谁就将掌握下一代算力民主化的入口。

四、在Agent时代，

人类的价值锚点何在？

面对Agent的全面接管，普通人最焦虑的问题莫过于：

我的工作会被取代吗？

卡帕西的回答既冷静又充满洞见。他首先区分了数字世界与物理世界：

AI当前主要作用于“比特”层面（文本、代码、数据），而物理世界的“原子”操作（制造、维修、护理）受限于能量与材料，变革速度慢得多。

因此，短期内，大量职业仍将存在，但工作内容会被深度增强。

更重要的是，他提出了一个根本原则：

人类的价值，在于做“AI还做不到的事”。

以他的MicroGPT项目为例：

完整训练一个语言模型通常需要数万行复杂代码，但卡帕西将其核心压缩至200行Python。

这一“本质提炼”过程，依赖的是他对模型架构的深刻理解与长期思考——

这是当前AI无法自主完成的。

但一旦成果存在，AI可以完美理解、传播甚至优化它。

这揭示了一种新分工：

人类负责“洞见生成”，AI负责“技艺执行”。

教育也将随之变革——

未来不再是“人教人”，而是“人教模型，模型再教人”。

知识传播的链条被重构，教学的核心变成设计高效的“教学流程（skill）”，让模型知道如何引导学习者。

对于个体而言，这意味着必须重新校准自己的能力坐标：

停止重复AI已能高效完成的任务（如基础编码、文档撰写、数据整理）；

聚焦于AI的盲区：提出原创问题、定义模糊目标、进行跨领域联想、承担伦理判断；

成为“Agent指挥官”：掌握宏观操作设计、任务拆解、反馈机制调优等新技能。

卡帕西坦言，即使是他这样的前沿研究者，也深感焦虑：

“看到推特上很多人做着各种事情，每个想法听起来都很棒，我必须处在最前沿，否则就会极度焦虑。”

这种“AI精神病”，本质上是对可能性边界的无限追逐——

因为你知道，未被探索的领域，藏着下一个范式跃迁的钥匙。

而这正是“知识资本家”的宿命与特权：

在信息主宰一切的时代，唯有持续产出高杠杆洞见，才能穿越周期，获得真正的自由。

文中观点仅为作者观点，不代表本平台立场

各位读者朋友，公众号改了推送规则，如果您还希望第一时间收到我们推送的文章，请记得给北大纵横公众号设置星标。

点击左下方公众号“北大纵横”→点击右上角“...”→点选“设为星标⭐️”

上一篇：中国确实太复杂了

下一篇：安卓用户注意！谷歌新规让装APP变闯关，你的手机自由还剩多少？

热点资讯

历届鲁迅文学奖获奖作品名单

2024-09-02 00:00:00

【快讯】广州市委常委、黄埔区委书记陈杰一行调研蜜蜂科技BEEPLUS

2023-09-01 00:00:00

12年，从22亿到超过520亿，海底捞谋局千亿背后的战略解码

2024-05-16 00:00:00

2025年深圳注册公司全流程指南：一步到位

2025-05-20 00:00:00

【2024新一线城市名单出炉】三大角度解析《新一线城市魅力排行榜》榜单

2024-06-07 00:00:00

超过海尔、格力上千亿，3737亿的美的，全球第一背后的战略解码（万字深度长文）

2024-10-04 00:00:00

全网开骂的武汉“孕妇选美比赛”，撕开了当下社会最离谱的一幕

2024-11-18 00:00:00