找工位
空间入驻
小程序

OpenAI内部实验曝光:零人工写百万行代码,每天不用10亿token算失职

2026-04-14 05:08:32

OpenAI内部揭秘:零人工写代码的百万行系统

最近,OpenAI的Ryan Lopopolo发表了一篇震撼行业的文章《Harness engineering》,直接引爆了整个AI编程圈!

这篇文章首次系统性地揭开了OpenAI Frontier团队的神秘面纱:这个团队已经成为OpenAI内部对Codex使用最重度的团队,维护着超过一百万行代码的代码库,而且——整套系统里,没有一行代码是人工手写的!

更颠覆认知的是:在代码合并之前,也没有人工参与代码审查!

💡 每天不用10亿token就是“失职”?

Ryan对这套方法几乎可以说是“传教士般的热情”!他甚至直言不讳地说:如果你现在每天还不用超过十亿tokens,那几乎都快算得上“失职”了!

按照当前市场价格和缓存假设来估算,这大概意味着每天要花掉两三千美元的token成本!

这是什么概念?普通开发者可能一个月都用不到这么多token,而OpenAI内部团队已经把它当成了日常标配!

⚠️ 模型失败时,别再换提示词了!

在过去几个月里,他们做了一场极其极端的实验:从零开始构建并交付一个内部测试产品,整个过程里,没有任何一行代码是人工写出来的!

在这个实验中,他们逐渐形成了一种完全不同的工程工作方式:当agent失败时,团队不再想着“换个提示词试试”,或者让它“再努力一点”!

而是反过来追问:到底缺的是哪一种能力、哪一类上下文,或者哪一层结构?

这种思维转变太关键了!我们很多人还在纠结提示词怎么写,而OpenAI团队已经在思考系统的架构缺陷了!

这个实验最终产出了Symphony——被Ryan形容为一个“幽灵库”,同时也是一个参考性的Elixir实现。它的作用是搭建一整套庞大的Codex agent系统!

每个agent都会被喂入极其细致的提示信息,精细程度接近一份真正的产品需求文档,但又不会直接给出完整实现!

🔧 一分钟构建:AI时代的工程铁律

OpenAI内部有一个铁律:构建时间必须控制在一分钟以内!

为什么是一分钟?因为他们想把inner loop(内部循环)压到尽可能快!一分钟只是一个很圆整、也确实能达到的目标!

如果一分钟没跑完怎么办?不会直接kill掉,而是把它当作一个信号,说明现在得停下来,重新梳理任务,把构建图谱拆解得更细,直到把复杂度降到阈值以下,好让Agent继续高效运行!

这感觉像一种棘轮机制!用一种非常强硬的方式,逼自己死守构建速度这条底线!因为你不这么做,时间就会越来越长!

Ryan自己都承认:他现在自己在做的软件,构建时间已经十二分钟了,那体验特别差!

🤖 人成了最大瓶颈,代码变得可抛弃

文章里有一句特别扎眼的话:人变成了瓶颈!

他们一开始只是三个人,结果做出了一个一百万行代码、上千个PR的系统!这里面的思路到底是什么?

文章里一直在反复强调:要把所有东西都重新表述成prompting,也就是agent看不见的东西,基本就等于垃圾!

更颠覆的是:他们现在连代码review这件事,都不再主要靠人了!现在大部分人工review,其实都发生在代码合并之后!

你没听错——合并前根本不review!只是为了让大家心理上舒服一点!

为什么?因为根本没有办法再沿用旧思路了!模型本质上是可以被极其容易地并行化的!只要愿意多砸GPU、多花token,它就能在代码库上持续干活!

真正稀缺的东西,反而变成了团队里那种必须实时在线的“人类注意力”!

🌟 幽灵库Symphony:AI选的语言

Symphony的起源特别有意思:它居然选了Elixir语言!

但这并不是人类工程师的选择——这是模型自己选的!

它之所以选择Elixir,是因为它的进程监督和GenServer机制,简直是为进程编排量身定制的!在这套架构下,你本质上是为每一个执行中的任务都开启了一个“小型守护进程”,并一路护送它直到任务完成!

也正因如此,基于ElixirBEAM虚拟机,模型几乎能白嫖到一大堆现成的能力!

到去年年底,他们每个工程师每天大概能产出3.5个PR!等到年初新模型上线,产出一下子猛增到人均每天5到10个PR

那种不停切换上下文的感觉真的很耗神!每天收工时,整个人基本已经彻底被榨干了!

所以他们就思考:人到底把时间花在哪儿了?其实全是耗在那些活跃的tmux窗格之间来回切、不停地盯着Agent往前走!

于是就有了Symphony——找到一种办法,不再需要人坐在终端前面盯着!

🚀 所有公司都该学的AI工程模式

我觉得这里面其实还有一个更大的结论:不只是OpenAI在做这件事,而是外面每一家公司都应该采用这种模式!

这是一个好几百亿美元的机会!

真正让我一下子想通的,是这些东西是一个个放出来的:先是这个,再是Harness engineering,再是Symphony!然后我突然意识到,原来这才是真正交付出去、用来完成那整套事情的东西!

这里其实有一组building blocks,先把它们组装成这些智能体,而这些基础构件本身,也就是产品的一部分!

比如,能够给模型“指方向”、在模型开始失准时撤销授权,这些东西全都可以通过平台来访问!

而且公司里会有很多不同的利益相关方,他们各自都需要在这个平台里看到自己该看到的东西!

这才是好玩的部分!

未来已经清晰可见:coding agent不再只是坐在你旁边的副驾驶,而是在逐渐变成任何人都可以真正调用的“队友”!

Ryan一直在推动一件事:如果你不再围绕人的使用习惯来优化代码库、工作流和组织,而是转向围绕agent的可读性来优化,最后会发生什么?

答案是:生产力会爆炸式增长!

金句分享: “英文正在成为最热门的新编程语言,而代码正在变得可抛弃!”

互动问题: 你觉得AI编程会彻底取代程序员吗?还是说程序员会变成AI的“教练”?

如果这篇文章对你有启发,记得点赞+分享! 让更多人看到AI编程的未来趋势!

关注我们,获取更多AI前沿技术和实践案例!