少一点 Agent 焦虑,多一点系统判断

2026-06-03 00:00:00

文章转载自"北大纵横"

4616字 | 10分钟阅读

一篇来自咨询视角的 AI 应用落地观察

今天打开任何一个 AI 产品介绍,"Agent"(智能体)几乎都成了标配词。接入了大模型,叫 Agent;串联几个自动化步骤,叫 Agent;能自动回复客户、能生成报告,也都叫 Agent。

概念越热,焦虑越重——仿佛每家公司都需要自己的 Agent,每个岗位都要被 Agent 重构,每个业务流程都值得用 Agent 重新做一遍。

听多了之后,人很容易产生一种错觉:自己好像每天都在落后,但又说不清楚到底落后在哪里。但真正的问题往往不是"我们是不是落后了",而是:

我们有没有先判断清楚,自己要做的东西是什么、该不该做、以及怎么才算真正有价值?

这篇文章不是写给工程师的 Agent 技术定义文。它写给业务人——企业管理者、业务负责人、咨询从业者、创业者,以及所有已经动手试过工具、但还没有形成系统判断框架的人。

核心观点:不要先被 Agent 概念推着走。先判断边界,再谈工具。

一、为什么我们会陷入 Agent 焦虑

这一轮 AI 浪潮制造了一种新的认知压力:演示太顺,让人误以为已经做到了。很多业务人会从低代码平台、知识库工具、自动化工具或 AI 辅助编程开始——搭一个能对话的机器人、跑通一段自动化流程、接入一个知识库、生成一个 Demo 页面。这些尝试很有价值。

但问题也常常从这里开始:工具会说话、会解释、会追问,还能调用几个流程——这种"像人"的顺畅感很容易让人产生错觉:它好像已经真的能独立做事了。

于是焦虑就来了:

•刷短视频时看到别人演示的"AI 客服 Agent""AI 销售助手",看起来都做出来了,我们是不是落后了?

•自己拼了一个 Demo,演示挺顺,但放进真实业务就卡,是不是我们做错了什么?

•听完一场 Agent 分享会,回来想做、又不知道从哪入手,这件事到底该不该做、能不能做?

这些疑问背后,其实指向同一个常识:

Demo 能跑,不等于业务能用,更不等于能交付。

很多被概念推着走的 Agent 项目,最后不只卡在模型能力上,更会卡在真实业务边界上。所以减少 Agent 焦虑的第一步,不是学更多工具,也不是看更多分享——而是先把"Agent 到底是什么"想清楚。

二、先把 Agent 这件事看清楚

1. Agent 的核心:从"回答问题"到"自己决定下一步"

要看清 Agent 是什么,不要先看定义,要看它的行为。过去我们使用大模型,更多是问它一个问题、让它给一个回答;让它写一段文案、做一份总结、改一封邮件。这是 AI 在"回答和生成"。

Agent 型系统更进一步:围绕一个目标,拆解步骤、调用工具、根据反馈判断下一步,并推进任务。Anthropic 在《Building Effective Agents》中没有给 Agent 下唯一定义,而是从工程实践出发,把 agentic 系统分成两类:

•一种是沿预设路径运行的Workflow;

•一种是由模型在运行中动态决定路径和工具使用的Agent。

通俗说就是:Workflow 是人先画路线,系统按路线走;Agent 是系统在边界内边走边判断。两者不是替代关系,而是互补——很多生产级 agentic 系统并不是纯 Workflow,也不是纯 Agent,而是两者的组合:用 Workflow 保障确定性流程,用 Agent 处理动态判断环节。沿着"下一步动作由谁决定"这条主线,可以把 AI 应用切成四层——决策权从人逐步让渡给 AI:

图 1｜AI 应用四层判断尺:决策权逐步让渡

层级	决策权在哪里	一句话解释
L1 LLM 应用	人决定下一步	AI 在回答和生成
L2 Workflow	流程图决定下一步	人画流程,AI 做节点
L3 Agentic Workflow	部分节点交给 AI 判断	流程仍由人控制,AI 做局部判断
L4 Agent 形态	模型根据目标和反馈决定路径	AI 在边界内动态决定下一步

2. 用一个具体例子看四层差异

为了让这把尺子更有可比性,我们用同一个所有人都熟悉的场景作为对照——

用户想规划一份杭州 3 日游,预算 2000 元,喜欢小众地方。

L1 形态:你问"杭州 3 天怎么玩?预算 2000 块够吗?"AI 直接生成一份通用攻略。一次问答,回答完就停了。

L2 工作流:系统按固定流程跑——填表(目的地、日期、预算)→ 调天气 → 按预算筛酒店 → 按偏好筛景点 → 排路线 → 输出方案。每一步都是事前画好的,AI 只在"把数据写成游记"这类节点出现。

L3 智能节点:流程框架还在,但你只说一句"不想太累、别太贵"。系统在"判断信息是否完整"这个节点上让 AI 做局部判断:是追问预算区间,还是自动降低行程强度。

L4 Agent 形态:你只给一个目标和约束,系统在授权边界内继续推进。它会根据预算估算酒店档位,调用天气和地图信息,发现周日下雨后调整室内行程,结合景点距离重新排序;遇到预订、付款等动作时,再提醒用户确认。每一步做什么,是它读完上一步结果之后再决定的;越权动作必须交还给人。

这四种形态不是技术优劣排序,而是任务适配关系。规则清楚、容错率低的事,Workflow 更稳;路径难以穷尽、需要持续判断的任务，才更适合考虑 Agent。

Anthropic 在文章里也强调一个原则:

"找到能够解决问题的最简单方案,只在必要时再增加复杂度。"

理解了四层差异,还有两个最容易踩的认知误区需要破除。

3. 误区一:平台不决定层级

很多人会问:"Coze 是 L2 平台,Dify 是 L3 平台,LangChain 是 L4 平台,对吧?"

答案不是。一个应用处在哪一层,取决于系统如何设计,而不是平台名字。 低代码平台也可能在特定场景下做出具有 L4 特征的系统;工程框架也可能只搭出一个跑不通真实业务的 Demo。真正要看的,仍然是:下一步动作由谁决定,以及它能否在真实业务里稳定运行。

4. 误区二:能做 Demo 不等于能交付

这是业务人最容易跳过的一层判断。无论用什么工具,都能比较快地搭出一个能跑通的演示。但从"演示"到"真实可用",中间隔着几道工程状态的跨越。

图 2｜从 Demo 到真实可用的状态跨越

状态	含义
演示能跑	自己在固定的、优选的输入下让它勉强跑通
个人能持续用	换不同格式的输入也稳定,自己每天敢用、敢依赖
团队能用	别人不需要你在旁边解释也能顺利闭环;出错能监控、能定位、能回滚
组织能管理	权限、审计、合规、成本控制都有基本机制

从"演示能跑"到"个人能持续用""团队能用""组织能管理",每往前一步,工程复杂度、责任边界和运维要求都会明显增加。很多时候,卡住项目的不只是模型,而是从 Demo 到交付的工程链路被严重低估了。对 Agent 这种"会执行动作"的系统来说,这条路尤其长——因为它不仅要"能跑",还要"能控、能追溯、能兜底、能停下来"。所以下次有人说"我们做了一个 Agent",除了问"它是哪一层",还要追问一句:它现在只是演示能跑,还是已经能被团队稳定使用?

三、动手做 Agent 前,先问自己 5 个问题

判断已有 Agent 处在哪一层、停在哪个使用状态,是认知问题;判断自己要不要立项、怎么立项,才是决策问题。很多 AI 项目失败,不是因为模型不够强,而是开干前跳过了立项判断。看了几个演示觉得"我们也该做一个",团队就开始选平台、拖流程;几周后 Demo 跑通,再往真实场景里一放,业务方说"不太对",最后变成一次不了了之的低效试错。在动手写第一行提示词之前,先把下面 5 个问题答完。

图 3｜动手做 Agent 前的 5 个问题

序号	问什么	想清楚什么
问一	痛点到底在哪?	不做这件事,业务真实损耗有多大?
问二	传统 Workflow 是不是已经足够解题?	有没有更简单、更高确定性的非 Agent 方法能闭环?
问三	数据资产与知识底座,撑得住吗?	底层信息基础是否准确、及时、可授权?
问四	哪些动作给 AI,哪些必须留给人?	系统责任与风险边界划在哪里?
问五	验收和兜底想好了吗?	怎么判断做对了、出问题怎么发现、怎么停止和接管?

这 5 问看起来是 5 个独立检查项，实际上是一条递进判断链。前面的关键问题没想清楚，后面的工具选择和方案设计就容易失焦。

以最常见的"AI 客服 / 售后助手" 为例走一遍这 5 问:问一——客户等待是否已造成差评和流失?问二——查物流、发提醒用 Workflow 是不是就够?只有情绪升级、复杂退款判断才需要 Agent?问三——知识库是否最新?订单状态是否实时同步?政策版本是否统一?问四——哪些动作(查数据、识别情绪、起草回复)可以交给 AI?哪些动作(退款、赔偿承诺、关闭投诉)必须留给人?问五——验收标准定清楚了吗?接管机制设好了吗?如果关键问题答不上来，就不该急着动手写提示词。换成销售助手、知识中台、审核场景也一样——这套清单是通用的,只需要把每一问替换成你自己业务的语境。

但这 5 问还不是最难的。真正难的,往往是先把要做的事描述清楚。很多项目连"要做的事到底是什么"都没说清楚,就已经开始选工具、搭流程、写提示词了。比如"想做一个 AI 客服 Agent"这句话本身就模糊:是处理售前咨询?售后投诉?退款申请?还是辅助人工客服?是面向所有客户还是只面向 VIP?成功的标准是什么?这个问题不清楚,后面的工具选择、流程设计和提示词调试都会失去抓手。

如果说前 5 个问题是"立项判断清单",那么真正落地时,每一问都对应业务侧必须先想清楚的一项系统定义。

图 4｜从 5 个问题到业务系统定义

对应 5 问	核心对齐维度	业务侧要想清楚的事
问一	明确商业目标	这个 AI 到底要解决什么具体、高频的业务痛点?
问二	拆解流程边界	哪些步骤走刚性流程?哪些需要 AI 判断?哪些必须人工确认?
问三	转化信息资产	业务专家的经验,如何变成 AI 能用的规则、样本与参考标准?
问四	锁定动作边界	AI 能做什么、不能做什么、哪些必须交还给人?
问五	设置验收与接管机制	什么叫做对?出问题怎么感知?怎么停止和接管?

四、AI 落地真正考验的,是把业务问题变成系统的能力

很多时候,真正的卡点不是模型不够好,也不是平台不够强,而是没人能站在业务和技术中间,把模糊的业务问题定义到 AI 可以执行的清晰颗粒度。这是一种正在被低估的稀缺能力。

过去,这种能力沉淀在管理咨询、业务架构设计、流程梳理这类工作里。它们看起来一点都不"AI",不写代码也不调参数,但恰恰是 AI 落地最缺的那一层基础:把问题看清楚、把流程画清楚、把规则定清楚、把责任分清楚。在 Agent 时代,这套能力的形式正在改变。

图 5｜传统业务能力在 Agent 时代的新含义

传统能力	在 Agent 时代意味着什么
商业问题定义	判断哪些任务值得交给 AI,哪些不值得让渡决策权
业务流程拆解	精准拆分流程边界,区分哪些环节适合用 Workflow 锁定,哪些才需要引入 Agent
行业 Know-how 转化	把业务专家的经验,转化为模型能用的规则、样本与参考标准
风险合规识别	设计权限沙盒、人审、接管和退出机制
落地推进	把一次 Demo 原型,推进到组织可管理的真实业务系统