

朋友,你有没有发现一件事?最近,那些你天天白嫖的AI工具,一个个开始收起费来了。豆包上线付费订阅了,智谱半年涨价三次,Kimi最低档会员从9.9元一路涨到49元。别再幻想AI会永远是免费的午餐了。这背后藏着一个冷冰冰的数学题——用户越多,AI公司亏得越多。
你可能觉得奇怪,互联网不都是先免费圈地再收割吗?微信、抖音不都这么过来的?但AI偏偏是个异类。
传统互联网每新增一个用户,边际成本是递减的。多一个人用微信,腾讯几乎不花钱。AI呢?恰恰相反。用户量越大,调用频率越高,使用场景越复杂,算力消耗呈指数级攀升。这叫“逆边际成本结构”。简单说就是:你每多问一句,AI公司就得烧更多的钱。
豆包坐拥3.45亿月活——比国内其他AI应用加一起还多。这是什么概念?谷歌砸了千亿美元级资本、自研TPU、万卡集群,Gemini全球月活也才7.5亿。3.45亿用户,这是豆包的“甜蜜的烦恼”。
这其中大部分是“浅度用户”——查资料、写文案、问日常问题。但即便是浅需求,你也不能“降智”,否则口碑崩了。结果就是:有限的算力被浅度用户消耗了,变现不了;而那些需要复杂推理的专业用户,消耗的算力更多,却同样不用花钱。两头堵。从商业逻辑上,这事根本干不下去。
所以付费订阅是必然的选择:普通需求继续免费,复杂任务按需付费。既留住海量用户,又能遴选出真正愿意买单的人。这其实是全球AI通行的玩法。Claude、Gemini、GPT都是免费版+订阅,而且订阅费还在涨。Anthropic的企业级产品甚至开始按实际消耗的算力额外收费。国内呢?智谱2026年以来API定价上调83%,结果调用量反而涨了400%——“量价齐升”。Kimi会员从9.9元涨到699元/月,反而在专业用户里建立了“专业心智”。
🤔 一个残酷的真相是:还在免费硬扛的AI应用,迟早都得跟进。
就在豆包宣布收费前几天,DeepSeek干了一件让行业震惊的事——V4-Pro价格暴降75%。缓存命中价格直接打到0.025元/百万Tokens,几乎白送。对比一下:GPT-5.5是2.5美元/百万Tokens,Claude Opus 4.7是15美元/百万Tokens。DeepSeek把地板又凿穿了一层。但低价,真的是胜利吗?
2024年那场大模型价格战,阿里云主力模型直降97%,百度直接免费,行业陷入“谁比谁更便宜”的竞赛。当时就有人冷静指出:当所有玩家挤在同一个计量单位上互相压价,负毛利不是意外,而是结构性的终点。两年过去了,DeepSeek把价格打穿,但游戏规则没变。
腾讯科技前段时间发了一篇《Token经济学》,提供了重要的观察。不同任务类型的成本结构天差地别:一个轻量检索任务,搜索和grounding的费用可能是Token本身的四十倍;一个重度编程session,模型推理成本才是大头。根本不存在一张通用的“AI单位成本表”。
💡 换句话说:“谁的Token更便宜”这个问法,本身就已经过时了。《Token经济学》给出了一个五层结算栈的框架:底层是公用事业层——算力、Token、缓存、搜索,和水电煤没区别;往上走:协议与能力层 → 知识封装层 → 执行交付层;最顶层:结果与责任层——按outcome收费,“结果”本身就是合同化的结算对象。DeepSeek降价,本质上是把第一层的公用事业价格打到接近免费。但国内厂商的商业模式,几乎全压在这一层上。豆包的收费,说到底还是“只有价格可以打”的防御型策略。
当国内还在Token单价上缠斗时,大洋彼岸的AI商业已经走到了完全不同的阶段。三条轨道并行演进,各有各的逻辑。
Intercom的AI客服产品Fin,定价0.99美元/单次服务——只在AI真正解决问题时才收费。什么算“解决”?要么客户主动确认,要么客户没继续追问。全写进系统规则,不存在归因争议。Fin每周处理超100万次客服对话,Intercom的AI营收从几乎为零拉到过亿美元。Sierra AI更猛——由OpenAI董事长创办,完全按outcome定价,21个月做到1.5亿美元ARR,服务超40%的财富50强企业。
Salesforce的Agentforce推出Flex Credits体系:每个AI action消耗20 credits,折合0.1美元/action。同时保留按对话计费(2美元/次)和传统席位制。三种模式并存,企业按负载自由选择。
ServiceNow把AI能力打包进企业级License,形成“固定底座+用量超额”的混合结构。为什么能走通?客户深度绑定在它的ITSM生态里,替换成本极高。
三条轨道的差异,表面是计费方式不同,深层是计费单元不同。但共同前提是:无论计什么,这个东西必须在系统里有清晰定义、可被自动记录、双方对其含义没有争议。国外的AI商业模式,正在把计费单元从Token升级为Action,再从Action升级为Outcome——每一级台阶都有对应的系统能力做支撑。
🔥 用户在乎的是结果,不是消耗的Token。
有人会说:国外能这么玩,是因为B端用户预算充足、付费意愿强。这没错。2025年美国四大科技巨头AI资本开支约2.5万亿人民币,中国七家头部互联网大厂才投了6300亿。但更深层的原因是:中国的商业活动,效果太难定义,场景太碎。
Intercom敢按单次服务收费,是因为Zendesk们花了十几年,把“客户工单”硬化成一套完整的系统流程——开单、流转、升级、关单,每一步都有日志,每一步都可追溯。Salesforce敢按action收费,是因为它自己就是CRM系统——它清楚地知道“发一封邮件”“更新一条记录”“创建一个机会”是什么,系统有原子级的操作日志。这根本不是商业模式创新拍脑袋想出来的,这是在成熟业务基础设施上自然长出来的。
2025年,中国智能客服市场渗透率已突破85%。但背后是十几条互不打通的渠道各自为战:淘宝、京东、抖音、微信、小红书、小程序、电话、钉钉、企微……每个平台有自己的后台,信息完全无法互通。一个客户可能在抖音问“这件衣服有L码吗”,客服回了“有”;然后跑去微信私域问“能便宜点吗”,另一个客服接了;最后还小红书私信吐槽“发货太慢”。这三个对话,在系统里可能是三条完全独立的记录,甚至根本没记录——微信私域聊天很多就躺在销售个人手机上。没有数字化工单,就没有AI服务的计费单元。这不是AI技术本身能解决的问题,而是企业数字化转型深度的映射。
国内的“按效果付费”,目前更多是营销外包的效果对赌:GEO优化按排名收费,但排名能不能带来真实转化?没人打包票。蚂蚁数科按交易增长收费,但增长里多少是AI的功劳、多少是市场环境?归因扯不清。直播带货的GMV分润,更像销售对赌,而不是技术服务。
DeepSeek V4是开源的,任何人都可以下载部署,连API费用都可以省掉。但也意味着厂商和客户之间几乎没有绑定关系。做个比喻:现在国内AI卖的是裸电。客户拿到手,还得自己拉电线、装变压器、修配电房。V4把电价打到两分钱一度,确实很便宜。但商业客户真正需要的不是更便宜的电,而是一个插上插头就能用的完整供电系统。
当下,Token的成本在下沉,AI的价值在上移。这两条线的交叉点,就是基础设施。谁先到达那里,谁就能在Token成本归零的那一天,依然站着收钱。
AI的终局,不是卖得越便宜越好,而是值多少钱就收多少钱。
💬 你觉得AI按结果付费在中国能跑通吗?哪家最有可能先做到?评论区聊聊。如果觉得有启发,点个赞和在看,转发给关心AI商业的朋友。