找工位
空间入驻
小程序

Claude Code之父YC访谈深度解析:“软件工程师”头衔要没了,多Agent开始自己组队干活

2026-02-20
文章转载自"北大纵横"

图片
来源 | 大顺AI商业流量
作者 | Alex
2627字 阅读时间6分钟
旧金山湾区的某个深夜,Anthropic工程师Boris Cherny在终端里敲下一行代码,启动了一个原本仅用于测试API的小型聊天程序。
彼时,他并不确定这个工具是否有价值——因为当时的模型“几乎不会写代码”。
然而,连续三个月无休的工作后,他意识到:“天啊,这东西可能会变成一个真正的产品。”  
作为Claude Code的核心推动者,Boris在Y Combinator(YC)的一场闭门圆桌中向四位高管坦承:
编程正在被“解决”。
在Anthropic内部,70%–100%的代码由Claude生成,传统IDE的存在感正在急剧下降。
更令人震撼的是,自Claude Code推出后,公司人均工程产出提升了150%——这一数字在传统软件工程中“闻所未闻”。  
但这场对话的核心并非又一个AI编程工具的崛起,而是揭示了一个更深层的趋势:
Agent的能力边界正在以月为单位重写,而人类的角色正从“写代码者”转向“愿景构建者”与“协作协调者”。  
今天,咱们这篇文章重点和大家聊一个核心问题,那就是:
当多Agent能够自主组队、规划、执行甚至直接与用户沟通时,软件工程的本质、企业研发范式乃至人才结构将发生怎样的结构性变迁?

一、从CLI到Agent Topologies的

演化路径

1.1 终端为何成为终点?极简形态下的能力爆发  
Claude Code的成功始于一个反直觉的选择:
坚持使用命令行界面(CLI)。
在Cursor、Windsurf等IDE插件风起云涌之际,Boris却选择了一个“成本最低”的终端原型。
这一决策背后,是对模型演进速度的深刻认知: 
“我们觉得没有任何UI能保证六个月后仍然相关,因为模型进步太快了。”  
终端作为一种设计约束,反而催生了极致的用户体验:
无需学习复杂快捷键(如Vim),无需配置环境,打开即用。
更重要的是,它天然支持Unix哲学——组合、管道、脚本化。
Claude Code可被pipe输入、输出,成为自动化流水线的一部分。  
这一选择印证了YC的经典信条:
做人们本来就在做的事,只是让它更容易。
内部数据显示,Claude Code上线后并未强制推行,仅靠口碑传播,使用曲线便“近乎竖直”。 
1.2 功能从用户行为中“长”出来:latent demand的力量  
Claude Code的三大核心功能——plan mode、CLAUDE.md、co-work——均非预先规划,而是从用户行为中自然涌现:  
Plan mode:源于用户频繁在聊天窗口中要求“先别写代码,帮我规划一下”。Boris仅用30分钟实现,当晚发布。
CLAUDE.md:用户自发创建Markdown文件指导模型行为,团队将其产品化为共享上下文。
Co-work:非技术用户(如设计师、财务)强行在终端使用Claude Code,倒逼出GUI版本。  
这种“观察—抽象—产品化”的路径,体现了对潜在需求(latent demand)的极致尊重。
Boris强调:“不要教育用户改变行为,而是顺着他们已经发生的行为去放大它。”

二、Agent能力演进的三大拐点  
2.1 拐点一:从“babysit”到“自治”——Plan Mode的生命周期  
Plan mode的本质极其简单:
在prompt中加入“请先不要写代码”。
然而,其存在意义随模型能力提升而迅速衰减。  
2024年初:模型即使开启plan mode,仍需人工全程监控(babysit),防止跑偏。 
Opus 4.5时代(2024年中):80%的会话从plan mode起手,计划一旦正确,执行几乎无误。
未来(预计1个月内):模型将自动判断何时进入规划状态,plan mode作为显式功能或将消失。 
 “也许一个月后就不用了。”——Boris的判断揭示了一个残酷现实:
所有围绕当前模型能力构建的交互范式,都具有极短的保质期。 
2.2 拐点二:多Agent协作——Test-Time Compute的规模化  
Boris提出“Agent Topologies”概念:
通过配置多个拥有独立上下文窗口(uncorrelated context windows)的Agent,并行处理子任务,本质是测试时计算(test-time compute)的扩展。 
典型案例:Anthropic的plugins功能由一个“swarm”在周末自动生成。
主Agent在Asana创建任务,spawn多个子Agent认领并执行,全程几乎无人干预。  
这种模式的优势在于:
上下文隔离:避免历史污染,提升任务专注度;
并行探索:对复杂bug,可同时派Agent查日志、读代码、复现路径;
动态协作:Agent可主动在Slack上联系相关工程师获取澄清。  
Harj Taggar已将此写入个人CLAUDE.md:“下次修bug,就让多个agent并行分工。”  
2.3 拐点三:代码保质期缩短至数月——技术债的新定义  
Claude Code的代码库处于持续重构中:“六个月前的代码几乎全部消失”。
Boris直言:“所有非模型能力最终都会变成技术债。”  
这一现象源于两大原则: 
1. 为六个月后的模型构建:不围绕当前模型做PMF,否则易被下一代能力抹平; 
2. Never bet against the model:加脚手架或可提升10%–20%性能,但新模型可能“白送”该能力。  
因此,团队采取激进策略:
每几周unship旧工具,重写核心逻辑。
当前代码库80%以上为近几个月新增——代码的shelf life已缩短至季度级别。

三、从现象到产业范式迁移
3.1 人才结构的双峰分布:专家 vs. 通才
Boris观察到高效工程师呈现“双峰”: 
极端专家:如bun团队成员,对JS runtime理解极深;
超强通才:跨产品、设计、用户研究甚至业务,能用Agent完成端到端闭环。  
后者正成为主流。
Anthropic内部,PM、设计师、财务均开始写代码。
Boris预言:“软件工程师头衔将逐渐消失,变为builder或product manager”——因为工作内容已远超编码。 
3.2 招聘范式的颠覆:从算法题到Agent协作记录  
YC与Anthropic已开始基于Claude Code transcript评估候选人: 
能否在Agent跑偏时拉回? 
是否使用plan mode进行系统性思考?
是否补全测试、考虑安全边界?  
Garry Tan设想构建“能力蛛网图”,量化候选人的Agent协作水平。
这标志着工程能力评估从“个人编码”转向“人机协同”。  
3.3 企业研发效率的指数跃迁  
Anthropic的人均工程产出提升150%,而Meta时期2%的提升需数百人年投入。
Steve Yegge称其工程师生产力达Google巅峰时期的“1000倍”。  
这一跃迁的核心在于:
Agent不仅替代编码,更重构了研发流程。
团队用Claude Agents SDK自动化了code review、security review、issue打标、生产部署等环节,形成“新型自动化”范式。

四、“简单-复杂-简单”的认知路径  
4.1 简单起点:终端里的小聊天程序  
一切始于一个调用API的终端脚本——极简、无UI、无规划。  
4.2 复杂展开:多维能力叠加  
工具调用(tool use):读文件、控播放器、操作K8s; 
上下文管理:CLAUDE.md、共享知识库;
协作拓扑:多Agent swarm、Slack集成;
安全机制:VM沙箱、权限guardrails。  
4.3 简单回归:一发prompt完成闭环  
未来愿景:用户只需描述需求,Agent自动规划、组队、执行、验证,甚至直接与用户沟通。
复杂性被封装,交互回归自然语言。
Boris的终极判断是:
编程将对每个人“被解决”。
当Agent能自主组队、直接对话用户、递归自我改进时,人类的核心价值将回归到定义问题、设定边界、注入价值观——这恰是Anthropic使命“确保AI安全发展”的底层逻辑。  
正如《The Bitter Lesson》所言:
通用方法终将胜出。
在AI洪流中,唯有承认认知局限、保持新手心态、敬畏模型进化,方能在范式迁移中抓住长期价值。  
图片


文中观点仅为作者观点,不代表本平台立场


各位读者朋友,公众号改了推送规则,如果您还希望第一时间收到我们推送的文章,请记得给北大纵横公众号设置星标。图片

点击左下方公众号“北大纵横”→点击右上角“...”→点选“设为星标⭐️”。