

你有没有算过,这个月为了用AI花了多少钱?
是不是每次看到“Token限额即将用完”的提示,心里都咯噔一下?
曾经以为AI是解放生产力的神器,现在却发现它成了新的“吞金兽”——每问一个问题,都在烧钱!
还记得20年前拨号上网的日子吗?那时候流量按MB计费,一不小心就欠费停机。
现在,历史正在重演!只不过这次的主角换成了AI,计量单位变成了Token。
当年网站为了省带宽,图片压缩到模糊,视频根本不敢想。
现在呢?我们为了省Token,提示词精简再精简,连跟AI说句“谢谢”都觉得浪费!
Token经济学已经来了——黄仁勋说,Token就是AI时代的新大宗商品,标准化、可计量、可交易。从免费到顶级,每百万Token价格从0美元到150美元不等!
想象一下:AI产业链就像一条巨大的水管。
一头是爆炸式增长的需求——多模态、智能体让Token消耗量千倍增长!
另一头是供给瓶颈——GPU紧缺、电力不足、数据中心建设赶不上需求。
结果就是:水管堵了!虽然单个Token单价在降,但总花费却越来越高。
过去一个季度,发生了什么?
亚马逊云、谷歌云、百度云、阿里云...几乎所有云厂商都在上调AI服务价格!
模型厂商也结束补贴:腾讯混元大模型最高涨价463%,阿里、腾讯接连停止免费公测。
算力成本,正在以Token的形式,给每个普通人上课——就像当年流量费给我们上的课一样!
苏玉(化名)是某高校在读博士,最近在准备毕业大论文。
Claude是她的“学术外挂”——三年下来,ChatGPT、Gemini、Claude都成了她的忠实伙伴。
但今年2月开通Claude会员后,她第一次感受到了什么叫“AI断粮”。
那天,苏玉正在用Claude研究“扎根理论”。
突然弹窗提示:本周Token使用量已达限额90%!
“那一刻我真的懵了,”苏玉说,“研究到一半,AI突然不工作了,那种学术停滞的无力感太真实了。”
习惯了AI辅助,她很难回到原始的研究状态。尝试自己翻书查资料,效率极低,“最后还是要等Claude恢复后复核一遍。”
更崩溃的还在后面。
一个周二,苏玉发来后台截图:本周限额已用45%!
“这周才过去不到两天!我已经很节省了,一天只讨论一个论文选题!”
她养成了提一个问题就去看一眼后台的习惯,生怕“没米下锅”。想起以前还让AI帮忙做PPT、唠闲嗑,她直骂自己浪费。
现在,苏玉学会了资源调度:
“我更相信Claude给的指导性内容,但细节工作可以交给便宜模型。”
如果Claude不限额,她甚至想停用Gemini——好用的模型变得稀缺,只能用在最关键的地方!
按照Claude的计算方式:100 Tokens ≈ 75个英文单词 ≈ 50个汉字。
而且,输出的价格是输入的5倍!AI的每个回答——后台思考、查询、生成,甚至模型幻觉导致的错误消耗——都会被计费。
“除了给部分客户预留的备用机,其他基本都卖完了,一卡不剩。”优刻得架构技术中心副总经理刘华说。
高端GPU芯片决定了整个系统的上限,而现在这些芯片供不应求。
GPU只是起点,下面还要搭建数据中心、网络和存储系统。
刘华透露:仅网络和存储部分,成本就可能占整体算力成本的20%左右!
这些都不是“即插即用”的标准件,高速互联、低延迟传输都需要真金白银。
“以前AI大部分是ToB在付费,现在ToC端付费也越来越普及了。”智能纪元AGI创始人林志佳说。
模型被封装成API,入口简化,使用门槛降低——现在刷个社交平台,大家就知道怎么用了。
算力甚至出现零售化趋势:2024年前后,一些云厂商推出GPU“日卡”、6.9元体验套餐...本质上是把复杂环境打包好,让用户低成本尝鲜。
“很多人其实是来‘排雷’的,”刘华说,“大家都有点焦虑,怕落后。”
门槛降低,并不意味着成本下降。
在刘华看来,“用互联网发展阶段类比,现在的算力成本毫无疑问还是在一个发展初期、很贵的阶段。”
正因为贵,开发者才会精打细算,平台也不敢轻易放开调用规模。
社交平台上,一度流行用文言文与AI对话——更短的字数意味着更少的Token!
也有人讨论:跟AI说“你好”“谢谢”,是不是不必要的资源浪费?毕竟AI不需要情绪价值。
但很多浪费不在用户可控范围内。MiMo大模型团队负责人罗福莉提到,有些框架的上下文管理很糟糕,单次查询会触发多轮低价值工具调用,真实成本可能是订阅价格的数十倍!
头部厂商也在做取舍:OpenAI关停视频生成项目Sora,被解读为算力与投入产出的权衡。
阿里巴巴、腾讯、字节跳动等大厂对AI业务的调整,核心也是算力资源聚焦。
大家都意识到:未来拼的不是算力规模,而是算力利用率!
苏玉不打算把自己的AI使用方法完全分享给身边人。
如何和Claude交互、喂什么样的语料——这是她的小秘密,短期内也是她的竞争力。
如果同事请她推荐好用的模型,她会强烈推荐Gemini和ChatGPT,“当然,DeepSeek也是个好选择”。说完调皮地眨眨眼。
在“一人公司”“超级个体”流行的当下,这样的“小心机”并不罕见。当AI的好用程度对应成一个个可以计价的Token,真正拉开差距的,其实是使用它的人。
AI不会淘汰人,但会用AI的人会淘汰不会用AI的人。
你现在每月在AI上花多少钱?有没有遇到过“Token断粮”的尴尬时刻?
点赞+分享,让更多人看到AI时代的真实成本!