




一、现象背后:
AI Native团队的真实困境
表面看,AI Native团队风光无限:

开发者只需表达意图,Agent自动生成代码、修复漏洞、撰写测试。
Thomas描述其日常:
“我永远有人在线——代码审查Agent、编码Agent、研究Agent……”
上周末,他仅用三秒就通过Cursor Composer实现了React中的Cookie政策功能。
但这只是表象。深入观察其运营细节,悖论浮现:
工具层高度自动化,管理层却陷入原始状态。
创业两周内,Thomas收到数百封邮件——顶级工程师应聘、风投追加注资,却无一Agent能帮他起草一封得体的婉拒信。
他坦言:“我现在最想要的,是一个能处理HR系统、月结账务、董事责任险表格的Agent。”
这一矛盾揭示了当前AI应用的核心断层:

表演性能力(performative capability)远超事务性能力(transactional capability)。
市场充斥着能写Python函数的Agent,却极度缺乏能处理企业级复杂工作流的智能体。
原因在于:
编程语言只需20个关键词即可表达逻辑,而自然语言规格说明却要求在模糊意图中捕捉精确边界——
后者对上下文理解的要求呈指数级上升。
更严峻的是协作瓶颈。
Atlassian内部测试显示:
即便使用Claude Code,3000名工程师在纯Markdown文档上协作仍效率低下。
AI放大了个体生产力,却未解决群体协同的熵增问题。
当每个开发者都能瞬间生成Pull Request,人类审查能力成为新瓶颈——你根本审不过来。
二、结构性迁移:
软件生命周期的“左右移位”
要理解Agent管理的必要性,必须解剖软件开发生命周期(SDLC)的结构性位移。
Rajeev Rajan在Atlassian的实践提供了关键切片:

写代码的成本趋近于零,瓶颈正向“代码左侧”和“代码右侧”迁移。
左侧(规划与规格):
Atlassian将Confluence文档作为核心输入源。
Agent读取产品需求文档及评论后,自动进入执行循环。
产品经理不再仅写PRD,而是用Replit产出可运行原型。
右侧(部署与运维):
自研Agent RoboDev已能自动修复51%的安全漏洞,并处理CI/CD流水线异常。
这一迁移带来三重变革:
第一,责任重心转移。
工程师80%精力曾用于代码评审,如今转向验证:
如何设定Guardrails?
如何校验输入输出?如何确认AI生成代码的正确性?
验证取代实现,成为新核心能力。
第二,产物定义扩展。
代码不再是唯一交付物。
Confluence文档、Jira任务、Loom视频均成为Agent的输入源。
Atlassian构建的Teamwork Graph系统,记录“谁与谁合作、在哪个PR、对应哪个Jira issue”的关系网络——
正是这种结构化上下文,使RoboDev在基准测试中超越Claude Code。
第三,所有权重构。
软件工程从“代码为中心”转向“上下文为中心”。
Agent管理的本质,就是上下文管理。
没有高质量、结构化的上下文,再多的Agent也只是噪音制造机。
三、病灶诊断:
效率提升为何引发组织焦虑?
当生产力提升百倍,新病灶开始显现。
Thomas用“霍默·辛普森的车”比喻失控的AI开发:

所有想法都被堆砌进去,没有流程、没有产品思维,最终导致功能爆炸、体验混乱。
根源在于想法与执行能力的失衡。
过去,Backlog长度受限于团队编码速度;
现在,Agent能瞬间将所有想法转化为Pull Request。
人类审查能力成为新瓶颈——你根本审不过来。
这迫使角色发生“塌缩”:

产品经理 → 产品工程师(必须用Agent做原型)
设计师 → 设计工程师(直接生成可运行UI)
软件工程师 → 意图架构师(专注系统设计而非编码)
三者的维恩图高度重叠。
Atlassian已要求PM使用Replit产出接近最终形态的规格说明,而非仅写文档交接。
市场、传播、助理等岗位也在用Lovable、Replit自动化工作。
公司的本质挑战变为:
是成为“拦着不让上线的坏警察”,还是允许每个人成为Builder?
更深层的病灶在于成本结构颠覆。
Thomas警告:“你的开发者越高效,token消耗越大,成本越高。”
企业突然面临可变成本飙升——传统预算模型完全失效。
讽刺的是,没人会为此裁员,因为人力代价远高于token成本。
效率提升反而带来财务焦虑。
四、解决方案:
Agent操作系统的三大支柱
面对上述病灶,Entire的解决方案堪称精准手术。
其首个开源项目Checkpoints,直指AI代码的可审计性痛点。
传统版本控制系统只记录代码变更,但AI生成的代码背后有复杂的推理链和意图。
Checkpoints将这些元数据与代码绑定存储,使团队能追溯“为何这样改”。
它支持Claude Code、Gemini CLI,并计划扩展至主流Agent。
这仅仅是开始。
Thomas的愿景是构建“世界下一代开发者平台”,其核心逻辑是:
当机器成为代码主要生产者,我们需要全新的流水线——正如汽车工业用流水线取代手工生产。
Entire的差异化在于:
不造Agent,而造Agent的管理者。
现有工具如Cursor、Devin聚焦单点编码能力;
Entire则解决多Agent协同、上下文共享、决策追溯等系统性问题。
具体而言,一个成熟的Agent操作系统需具备三大支柱:

1. 可追溯的决策链
记录Agent的推理过程、上下文依赖、修改依据,确保每行代码均可审计。
这是合规性与安全性的基础。
2. 细粒度的护栏机制
防止“霍默·辛普森的车”式功能爆炸。
例如,限制Agent在核心支付模块的修改权限,或强制要求高风险变更需人工复核。
3. 结构化的上下文总线
打通Confluence、Jira、Slack等系统,构建统一的Teamwork Graph,使Agent能基于完整业务语境行动,而非孤立片段。
这恰是企业级应用的关键。
银行CTO晚上给Devin布置任务,早上检查进展——两周后意识到组织必须变革。
但若缺乏Entire这类平台,数百个Agent将各自为政,产生不可控的技术债。
五、边界条件:
何时可用?何时慎用?
尽管前景广阔,Agent管理的适用性存在明确边界。
Thomas强调:
当前技术仅适用于Greenfield(绿地)项目。
大型遗留系统因上下文复杂、依赖隐晦,尚不能完全放手。
Atlassian的实践印证了这一点:
新项目可100% AI First,但旧系统仍需人工维护。
原因有三:

第一,上下文完整性不足。
遗留系统往往缺乏文档,关键逻辑散落在注释、邮件甚至口头约定中,Agent无法重建完整语境。
第二,错误成本不对称。
新项目容错空间大,而核心交易系统的一个微小偏差可能导致百万损失。
第三,组织惯性阻力。
老员工习惯原有流程,对“黑箱式”Agent天然抵触,变革需时间。
因此,理性策略应是“双轨并行”:
新业务全面拥抱Agent管理,旧系统逐步重构。
技术激进,落地渐进。

技术服务于人性
这场变革的终极启示在于:
技术永远服务于人性。
Agent不是为了取代人类,而是将我们从机械劳动中解放,回归创造本质。
Thomas回忆儿子用Adobe Firefly生成小狗图片:
“学校里大家都在用。”AI Native世代已至——对他们而言,用Agent代替Google搜索再自然不过。
作为投资者或企业管理者,关键问题不是“如何用AI降本”,而是“借助AI能创造什么以前做不到的东西?”
Atlassian的答案是:
模糊角色边界,释放10倍创造力;
Entire的答案是:
构建Agent时代的操作系统。
未来已来,只是分布不均。
当别人还在争论Agent能否写代码时,先行者已在思考如何管理成百上千个Agent。
下一个十年的赢家,属于那些率先掌握“用Agent管公司”能力的组织。
而编程语言和IDE?
它们或许会像打字机一样,成为博物馆里的优雅遗物——
不是因为不够好,而是因为世界已不再需要它们。

文中观点仅为作者观点,不代表本平台立场
