OpenAI内部实验曝光：零人工写百万行代码，每天不用10亿token算失职

2026-04-14 05:08:32

OpenAI内部揭秘：零人工写代码的百万行系统

最近，OpenAI的Ryan Lopopolo发表了一篇震撼行业的文章《Harness engineering》，直接引爆了整个AI编程圈！

这篇文章首次系统性地揭开了OpenAI Frontier团队的神秘面纱：这个团队已经成为OpenAI内部对Codex使用最重度的团队，维护着超过一百万行代码的代码库，而且——整套系统里，没有一行代码是人工手写的！

更颠覆认知的是：在代码合并之前，也没有人工参与代码审查！

💡 每天不用10亿token就是“失职”？

Ryan对这套方法几乎可以说是“传教士般的热情”！他甚至直言不讳地说：如果你现在每天还不用超过十亿tokens，那几乎都快算得上“失职”了！

按照当前市场价格和缓存假设来估算，这大概意味着每天要花掉两三千美元的token成本！

这是什么概念？普通开发者可能一个月都用不到这么多token，而OpenAI内部团队已经把它当成了日常标配！

⚠️ 模型失败时，别再换提示词了！

在过去几个月里，他们做了一场极其极端的实验：从零开始构建并交付一个内部测试产品，整个过程里，没有任何一行代码是人工写出来的！

在这个实验中，他们逐渐形成了一种完全不同的工程工作方式：当agent失败时，团队不再想着“换个提示词试试”，或者让它“再努力一点”！

而是反过来追问：到底缺的是哪一种能力、哪一类上下文，或者哪一层结构？

这种思维转变太关键了！我们很多人还在纠结提示词怎么写，而OpenAI团队已经在思考系统的架构缺陷了！

这个实验最终产出了Symphony——被Ryan形容为一个“幽灵库”，同时也是一个参考性的Elixir实现。它的作用是搭建一整套庞大的Codex agent系统！

每个agent都会被喂入极其细致的提示信息，精细程度接近一份真正的产品需求文档，但又不会直接给出完整实现！

🔧 一分钟构建：AI时代的工程铁律

OpenAI内部有一个铁律：构建时间必须控制在一分钟以内！

为什么是一分钟？因为他们想把inner loop（内部循环）压到尽可能快！一分钟只是一个很圆整、也确实能达到的目标！

如果一分钟没跑完怎么办？不会直接kill掉，而是把它当作一个信号，说明现在得停下来，重新梳理任务，把构建图谱拆解得更细，直到把复杂度降到阈值以下，好让Agent继续高效运行！

这感觉像一种棘轮机制！用一种非常强硬的方式，逼自己死守构建速度这条底线！因为你不这么做，时间就会越来越长！

Ryan自己都承认：他现在自己在做的软件，构建时间已经十二分钟了，那体验特别差！

🤖 人成了最大瓶颈，代码变得可抛弃

文章里有一句特别扎眼的话：人变成了瓶颈！

他们一开始只是三个人，结果做出了一个一百万行代码、上千个PR的系统！这里面的思路到底是什么？

文章里一直在反复强调：要把所有东西都重新表述成prompting，也就是agent看不见的东西，基本就等于垃圾！

更颠覆的是：他们现在连代码review这件事，都不再主要靠人了！现在大部分人工review，其实都发生在代码合并之后！

你没听错——合并前根本不review！只是为了让大家心理上舒服一点！

为什么？因为根本没有办法再沿用旧思路了！模型本质上是可以被极其容易地并行化的！只要愿意多砸GPU、多花token，它就能在代码库上持续干活！

真正稀缺的东西，反而变成了团队里那种必须实时在线的“人类注意力”！

🌟 幽灵库Symphony：AI选的语言

Symphony的起源特别有意思：它居然选了Elixir语言！

但这并不是人类工程师的选择——这是模型自己选的！

它之所以选择Elixir，是因为它的进程监督和GenServer机制，简直是为进程编排量身定制的！在这套架构下，你本质上是为每一个执行中的任务都开启了一个“小型守护进程”，并一路护送它直到任务完成！

也正因如此，基于Elixir和BEAM虚拟机，模型几乎能白嫖到一大堆现成的能力！

到去年年底，他们每个工程师每天大概能产出3.5个PR！等到年初新模型上线，产出一下子猛增到人均每天5到10个PR！

那种不停切换上下文的感觉真的很耗神！每天收工时，整个人基本已经彻底被榨干了！

所以他们就思考：人到底把时间花在哪儿了？其实全是耗在那些活跃的tmux窗格之间来回切、不停地盯着Agent往前走！

于是就有了Symphony——找到一种办法，不再需要人坐在终端前面盯着！

🚀 所有公司都该学的AI工程模式

我觉得这里面其实还有一个更大的结论：不只是OpenAI在做这件事，而是外面每一家公司都应该采用这种模式！

这是一个好几百亿美元的机会！

真正让我一下子想通的，是这些东西是一个个放出来的：先是这个，再是Harness engineering，再是Symphony！然后我突然意识到，原来这才是真正交付出去、用来完成那整套事情的东西！

这里其实有一组building blocks，先把它们组装成这些智能体，而这些基础构件本身，也就是产品的一部分！

比如，能够给模型“指方向”、在模型开始失准时撤销授权，这些东西全都可以通过平台来访问！

而且公司里会有很多不同的利益相关方，他们各自都需要在这个平台里看到自己该看到的东西！

这才是好玩的部分！

未来已经清晰可见：coding agent不再只是坐在你旁边的副驾驶，而是在逐渐变成任何人都可以真正调用的“队友”！

Ryan一直在推动一件事：如果你不再围绕人的使用习惯来优化代码库、工作流和组织，而是转向围绕agent的可读性来优化，最后会发生什么？

答案是：生产力会爆炸式增长！

金句分享： “英文正在成为最热门的新编程语言，而代码正在变得可抛弃！”

互动问题： 你觉得AI编程会彻底取代程序员吗？还是说程序员会变成AI的“教练”？

如果这篇文章对你有启发，记得点赞+分享！ 让更多人看到AI编程的未来趋势！

关注我们，获取更多AI前沿技术和实践案例！

上一篇：光纤价格暴涨650%！背后真相令人震惊

下一篇： 2026年AI创作圈真相：96%人用后返工，平台红线已划定！

热点资讯

历届鲁迅文学奖获奖作品名单

2024-09-02 00:00:00

【快讯】广州市委常委、黄埔区委书记陈杰一行调研蜜蜂科技BEEPLUS

2023-09-01 00:00:00

12年，从22亿到超过520亿，海底捞谋局千亿背后的战略解码

2024-05-16 00:00:00

2025年深圳注册公司全流程指南：一步到位

2025-05-20 00:00:00

【2024新一线城市名单出炉】三大角度解析《新一线城市魅力排行榜》榜单

2024-06-07 00:00:00

超过海尔、格力上千亿，3737亿的美的，全球第一背后的战略解码（万字深度长文）

2024-10-04 00:00:00

全网开骂的武汉“孕妇选美比赛”，撕开了当下社会最离谱的一幕

2024-11-18 00:00:00