


4616字 | 10分钟阅读
一篇来自咨询视角的 AI 应用落地观察
今天打开任何一个 AI 产品介绍,"Agent"(智能体)几乎都成了标配词。接入了大模型,叫 Agent;串联几个自动化步骤,叫 Agent;能自动回复客户、能生成报告,也都叫 Agent。
概念越热,焦虑越重——仿佛每家公司都需要自己的 Agent,每个岗位都要被 Agent 重构,每个业务流程都值得用 Agent 重新做一遍。
听多了之后,人很容易产生一种错觉:自己好像每天都在落后,但又说不清楚到底落后在哪里。但真正的问题往往不是"我们是不是落后了",而是:
我们有没有先判断清楚,自己要做的东西是什么、该不该做、以及怎么才算真正有价值?
这篇文章不是写给工程师的 Agent 技术定义文。它写给业务人——企业管理者、业务负责人、咨询从业者、创业者,以及所有已经动手试过工具、但还没有形成系统判断框架的人。
核心观点:不要先被 Agent 概念推着走。先判断边界,再谈工具。
这一轮 AI 浪潮制造了一种新的认知压力:演示太顺,让人误以为已经做到了。很多业务人会从低代码平台、知识库工具、自动化工具或 AI 辅助编程开始——搭一个能对话的机器人、跑通一段自动化流程、接入一个知识库、生成一个 Demo 页面。这些尝试很有价值。
但问题也常常从这里开始:工具会说话、会解释、会追问,还能调用几个流程——这种"像人"的顺畅感很容易让人产生错觉:它好像已经真的能独立做事了。
于是焦虑就来了:
•刷短视频时看到别人演示的"AI 客服 Agent""AI 销售助手",看起来都做出来了,我们是不是落后了?
•自己拼了一个 Demo,演示挺顺,但放进真实业务就卡,是不是我们做错了什么?
•听完一场 Agent 分享会,回来想做、又不知道从哪入手,这件事到底该不该做、能不能做?
这些疑问背后,其实指向同一个常识:
Demo 能跑,不等于业务能用,更不等于能交付。
很多被概念推着走的 Agent 项目,最后不只卡在模型能力上,更会卡在真实业务边界上。所以减少 Agent 焦虑的第一步,不是学更多工具,也不是看更多分享——而是先把"Agent 到底是什么"想清楚。
要看清 Agent 是什么,不要先看定义,要看它的行为。过去我们使用大模型,更多是问它一个问题、让它给一个回答;让它写一段文案、做一份总结、改一封邮件。这是 AI 在"回答和生成"。
Agent 型系统更进一步:围绕一个目标,拆解步骤、调用工具、根据反馈判断下一步,并推进任务。Anthropic 在《Building Effective Agents》中没有给 Agent 下唯一定义,而是从工程实践出发,把 agentic 系统分成两类:
•一种是沿预设路径运行的Workflow;
•一种是由模型在运行中动态决定路径和工具使用的Agent。
通俗说就是:Workflow 是人先画路线,系统按路线走;Agent 是系统在边界内边走边判断。两者不是替代关系,而是互补——很多生产级 agentic 系统并不是纯 Workflow,也不是纯 Agent,而是两者的组合:用 Workflow 保障确定性流程,用 Agent 处理动态判断环节。沿着"下一步动作由谁决定"这条主线,可以把 AI 应用切成四层——决策权从人逐步让渡给 AI:
图 1|AI 应用四层判断尺:决策权逐步让渡
层级 | 决策权在哪里 | 一句话解释 |
L1 LLM 应用 | 人决定下一步 | AI 在回答和生成 |
L2 Workflow | 流程图决定下一步 | 人画流程,AI 做节点 |
L3 Agentic Workflow | 部分节点交给 AI 判断 | 流程仍由人控制,AI 做局部判断 |
L4 Agent 形态 | 模型根据目标和反馈决定路径 | AI 在边界内动态决定下一步 |
为了让这把尺子更有可比性,我们用同一个所有人都熟悉的场景作为对照——
用户想规划一份杭州 3 日游,预算 2000 元,喜欢小众地方。
L1 形态:你问"杭州 3 天怎么玩?预算 2000 块够吗?"AI 直接生成一份通用攻略。一次问答,回答完就停了。
L2 工作流:系统按固定流程跑——填表(目的地、日期、预算)→ 调天气 → 按预算筛酒店 → 按偏好筛景点 → 排路线 → 输出方案。每一步都是事前画好的,AI 只在"把数据写成游记"这类节点出现。
L3 智能节点:流程框架还在,但你只说一句"不想太累、别太贵"。系统在"判断信息是否完整"这个节点上让 AI 做局部判断:是追问预算区间,还是自动降低行程强度。
L4 Agent 形态:你只给一个目标和约束,系统在授权边界内继续推进。它会根据预算估算酒店档位,调用天气和地图信息,发现周日下雨后调整室内行程,结合景点距离重新排序;遇到预订、付款等动作时,再提醒用户确认。每一步做什么,是它读完上一步结果之后再决定的;越权动作必须交还给人。
这四种形态不是技术优劣排序,而是任务适配关系。规则清楚、容错率低的事,Workflow 更稳;路径难以穷尽、需要持续判断的任务,才更适合考虑 Agent。
Anthropic 在文章里也强调一个原则:
"找到能够解决问题的最简单方案,只在必要时再增加复杂度。"
理解了四层差异,还有两个最容易踩的认知误区需要破除。
很多人会问:"Coze 是 L2 平台,Dify 是 L3 平台,LangChain 是 L4 平台,对吧?"
答案不是。一个应用处在哪一层,取决于系统如何设计,而不是平台名字。 低代码平台也可能在特定场景下做出具有 L4 特征的系统;工程框架也可能只搭出一个跑不通真实业务的 Demo。真正要看的,仍然是:下一步动作由谁决定,以及它能否在真实业务里稳定运行。
这是业务人最容易跳过的一层判断。无论用什么工具,都能比较快地搭出一个能跑通的演示。但从"演示"到"真实可用",中间隔着几道工程状态的跨越。
图 2|从 Demo 到真实可用的状态跨越
状态 | 含义 |
演示能跑 | 自己在固定的、优选的输入下让它勉强跑通 |
个人能持续用 | 换不同格式的输入也稳定,自己每天敢用、敢依赖 |
团队能用 | 别人不需要你在旁边解释也能顺利闭环;出错能监控、能定位、能回滚 |
组织能管理 | 权限、审计、合规、成本控制都有基本机制 |
从"演示能跑"到"个人能持续用""团队能用""组织能管理",每往前一步,工程复杂度、责任边界和运维要求都会明显增加。很多时候,卡住项目的不只是模型,而是从 Demo 到交付的工程链路被严重低估了。对 Agent 这种"会执行动作"的系统来说,这条路尤其长——因为它不仅要"能跑",还要"能控、能追溯、能兜底、能停下来"。所以下次有人说"我们做了一个 Agent",除了问"它是哪一层",还要追问一句:它现在只是演示能跑,还是已经能被团队稳定使用?
判断已有 Agent 处在哪一层、停在哪个使用状态,是认知问题;判断自己要不要立项、怎么立项,才是决策问题。很多 AI 项目失败,不是因为模型不够强,而是开干前跳过了立项判断。看了几个演示觉得"我们也该做一个",团队就开始选平台、拖流程;几周后 Demo 跑通,再往真实场景里一放,业务方说"不太对",最后变成一次不了了之的低效试错。在动手写第一行提示词之前,先把下面 5 个问题答完。
图 3|动手做 Agent 前的 5 个问题
序号 | 问什么 | 想清楚什么 |
问一 | 痛点到底在哪? | 不做这件事,业务真实损耗有多大? |
问二 | 传统 Workflow 是不是已经足够解题? | 有没有更简单、更高确定性的非 Agent 方法能闭环? |
问三 | 数据资产与知识底座,撑得住吗? | 底层信息基础是否准确、及时、可授权? |
问四 | 哪些动作给 AI,哪些必须留给人? | 系统责任与风险边界划在哪里? |
问五 | 验收和兜底想好了吗? | 怎么判断做对了、出问题怎么发现、怎么停止和接管? |
这 5 问看起来是 5 个独立检查项,实际上是一条递进判断链。前面的关键问题没想清楚,后面的工具选择和方案设计就容易失焦。
以最常见的"AI 客服 / 售后助手" 为例走一遍这 5 问:问一——客户等待是否已造成差评和流失?问二——查物流、发提醒用 Workflow 是不是就够?只有情绪升级、复杂退款判断才需要 Agent?问三——知识库是否最新?订单状态是否实时同步?政策版本是否统一?问四——哪些动作(查数据、识别情绪、起草回复)可以交给 AI?哪些动作(退款、赔偿承诺、关闭投诉)必须留给人?问五——验收标准定清楚了吗?接管机制设好了吗?如果关键问题答不上来,就不该急着动手写提示词。换成销售助手、知识中台、审核场景也一样——这套清单是通用的,只需要把每一问替换成你自己业务的语境。
但这 5 问还不是最难的。真正难的,往往是先把要做的事描述清楚。很多项目连"要做的事到底是什么"都没说清楚,就已经开始选工具、搭流程、写提示词了。比如"想做一个 AI 客服 Agent"这句话本身就模糊:是处理售前咨询?售后投诉?退款申请?还是辅助人工客服?是面向所有客户还是只面向 VIP?成功的标准是什么?这个问题不清楚,后面的工具选择、流程设计和提示词调试都会失去抓手。
如果说前 5 个问题是"立项判断清单",那么真正落地时,每一问都对应业务侧必须先想清楚的一项系统定义。
图 4|从 5 个问题到业务系统定义
对应 5 问 | 核心对齐维度 | 业务侧要想清楚的事 |
问一 | 明确商业目标 | 这个 AI 到底要解决什么具体、高频的业务痛点? |
问二 | 拆解流程边界 | 哪些步骤走刚性流程?哪些需要 AI 判断?哪些必须人工确认? |
问三 | 转化信息资产 | 业务专家的经验,如何变成 AI 能用的规则、样本与参考标准? |
问四 | 锁定动作边界 | AI 能做什么、不能做什么、哪些必须交还给人? |
问五 | 设置验收与接管机制 | 什么叫做对?出问题怎么感知?怎么停止和接管? |
很多时候,真正的卡点不是模型不够好,也不是平台不够强,而是没人能站在业务和技术中间,把模糊的业务问题定义到 AI 可以执行的清晰颗粒度。这是一种正在被低估的稀缺能力。
过去,这种能力沉淀在管理咨询、业务架构设计、流程梳理这类工作里。它们看起来一点都不"AI",不写代码也不调参数,但恰恰是 AI 落地最缺的那一层基础:把问题看清楚、把流程画清楚、把规则定清楚、把责任分清楚。在 Agent 时代,这套能力的形式正在改变。
图 5|传统业务能力在 Agent 时代的新含义
传统能力 | 在 Agent 时代意味着什么 |
商业问题定义 | 判断哪些任务值得交给 AI,哪些不值得让渡决策权 |
业务流程拆解 | 精准拆分流程边界,区分哪些环节适合用 Workflow 锁定,哪些才需要引入 Agent |
行业 Know-how 转化 | 把业务专家的经验,转化为模型能用的规则、样本与参考标准 |
风险合规识别 | 设计权限沙盒、人审、接管和退出机制 |
落地推进 | 把一次 Demo 原型,推进到组织可管理的真实业务系统 |
换句话说,Agent 时代更稀缺的,不只是会搭工具的人,而是能把模糊业务问题翻译成 AI 可以执行、组织可以管理、结果可以验证的系统的人。工具会越来越好用,模型会越来越强。但这种把业务讲清楚、把责任划清楚的能力,不会因为工具变强就自动出现。
因此, 每个想推动 AI 在自己业务里真正落地的人,都需要这样一种新的系统判断力:
•知道什么可以交给 AI,什么必须留给人;
• 知道什么时候该用 Workflow 承接确定性,什么时候才需要 Agent 处理不确定性
•知道一个 Demo 跑通之后,距离真实可用、可管理、可验证还有多远。
也知道:真正的能力,不是被概念推着走,而是能把业务问题清清楚楚地定义成一个可执行、可管理、可验证的系统。
少一点 Agent 焦虑,多一点系统判断。
这可能是 AI 应用真正落地前,最值得补上的一层基础判断。
1.Anthropic, Building Effective Agents, 2024
2.OpenAI, A Practical Guide to Building Agents, 2025
3.LangChain, How to Think About Agent Frameworks, 2025
4.文中"决策权让渡"的表述,借鉴了 Parasuraman、Sheridan、Wickens 关于自动化类型与层级的研究;该研究将自动化作用环节区分为信息获取、信息分析、决策/行动选择和行动执行。
”查看所有原创作者 ↓↓↓