

最近有个惊人的发现:AI已经悄悄跨越了关键门槛!它们不再只是陪你聊天解闷的玩具,而是能真正创造经济价值的工具了!但问题来了:当AI越来越能干,我们是该高兴还是该担心?
以前我们总说AI厉害,但到底有多厉害?光靠感觉可不行!
最近OpenAI搞了个大动作!他们推出了一个叫GDPVAL的新测试,这个测试可不一般:
结果怎么样?
人类专家赢了,但赢得相当艰难!只是勉强获胜!更惊人的是,测试发现AI进步速度极快,新模型得分远超旧模型!
你猜AI输在哪里?
不是我们常说的“幻觉”问题,也不是胡说八道!AI主要输在:
而这些恰恰是最容易修复的短板!这意味着什么?
如果当前趋势持续下去,下一代AI模型很可能在这项测试中全面超越人类专家!
但别急着担心失业!这里有个关键区别:
GDPVAL测试的是“任务”,而我们做的是“工作”!
只要AI还做不到像人类一样处理复杂互动,它就取代不了你的岗位!
以前大家都认为,AI想独立完成长任务非常难!比如写一个完整的软件,只要中间错一步,后面就全完了!
但剑桥大学等机构的最新研究彻底颠覆了这个认知!
AI的能力不仅没有遇到瓶颈,反而在爆发式增长!研究人员发现了四大原因:
这意味着什么?
AI智能体现在能够应对那些需要更多步骤才能完成的任务,而且整个过程无需人工干预!
从GPT-3到GPT-5,五年间AI保持了指数级增长!智能体能力增加的速度完全没有放缓!
指标显示,AI能以至少50%几率独立完成的任务长度在持续增加!这意味着在不远的未来,我们就能看到AI完成需要专业人士一天甚至一周时间才能完成的复杂任务!
回到开头那个问题:让AI做个PPT,结果生成了17个版本!
这其实暴露了一个更深刻的问题:如果我们不认真思考工作的本质,很可能会被AI生成的“电子垃圾”大潮淹没!
想象一下:
工作量是减少了,但你需要花更多时间去筛选、整理、判断!这真的是我们想要的效率吗?
Ethan Mollick教授警告说:工作中使用AI会带来一个非常可能发生的风险——我们会无意识地让智能体去完成一堆比我们当下所做的更多,但完全不必要的任务!
那么,正确的打开方式是什么?
OpenAI给出了明确建议:专家应该将任务委托给AI,把AI生成的结果当成初稿,由人类审查,从而与AI合作解决问题!
具体流程应该是这样的:
如果专家遵循这种工作流程,研究估计他们可以:
具有经济实用性的智能体已经出现!比如通过让AI智能体去复现学术论文,可以应对学术界的“可复现性危机”!
尽管智能体能够完成的任务仍然有限,但它确实有经济价值,并且这个价值正在持续递增!
现在到了最关键的问题:未来会是什么样子?
会出现哪一个未来,区别不在于AI技术的演变,而在于我们选择如何使用AI!
我们可以选择两种路径:
真正的智能体革命不是让AI替我们工作,而是让AI帮我们做得更好!
通过在我们的判断中决定什么值得做,而不仅仅是能做什么,我们可以确保这些工具使我们变得更有能力,而不仅仅是更有效率!
AI不会取代你的工作,但会用AI的人会取代不用AI的你!
你工作中用过AI吗?是提高了效率,还是增加了筛选负担?
如果觉得这篇文章对你有启发,记得点赞分享给更多朋友!让我们一起思考如何更好地与AI共处!
