内容来源
作者王维嘉,中国科技大学无线电系学士,斯坦福大学电气工程博士,曾任数字中国/中国IT互联网峰会创始常务理事,欧美同学会2005委员会共同创始人、第三届理事长,阿拉善企业家生态协会创始终身会员、第三届副会长
本文为王先生在企业家社群里的讨论要点,本文经授权发布,并略经编辑。
最近所有人都在讨论很 DeepSeek。网上也充斥着各种各样的分析:从技术分析到财务分析。在此,我与也通过几个方面展开聊聊,通与各位共同探讨。
作为在硅谷待了40年的人,我对技术创新有一个深刻的体会——它就像在一座广阔的大山里寻找金矿。
我们知道这里可能有金矿,但没人确切知道它在哪儿。因此,许多团队纷纷进入这座山,不同的人探索不同的方向,试图找到突破口。
回顾人工智能的发展,2012年,AI在图像识别领域取得了第一次重大突破,之后进入围棋领域,这是我们所谓的AI 1.0时代。
1
语言模型的崛起:被忽视的岔道
2017年,谷歌提出了Transformer模型,最初的目的是改进语言翻译,如英文与法文之间的互译。
然而,当时大部分业内人士都认为语言市场相对较小,无法与图像和视频识别相提并论,因此谷歌并未深入探索。
但OpenAI的团队却持不同看法。他们认为,语言是人类智慧的核心载体,其潜力远比想象中更大。
2
推理学习的突破:AI的新方向
随着ChatGPT发布后,全球AI公司纷纷投入这一领域,不断扩大模型规模、增加训练数据。
然而,随着模型的膨胀,AI的发展遇到了瓶颈。就在大家在这条“阳光大道”上前进时,OpenAI又做出了第二个突破——推理学习。
他们发现,与其单纯扩大模型规模,不如优化推理能力。即使模型本身不大,只要推理能力足够强,AI的性能仍然可以提升数十倍、甚至上百倍。
3
DeepSeek的独特性:
技术理想与开源精神
在这样的背景下,DeepSeek成为了一个非常特别的团队。他们坚持开源,而开源精神在中国并不常见。通常,行业的领先者会选择保护自己的技术,而落后者则依靠开源来利用全球智慧。例如,Meta(Facebook)同样选择了开源,因为他们相较于OpenAI处于劣势。
然而,在中国,很少有团队愿意坚持开源,因为开源意味着付出,却未必有直接的商业回报。
DeepSeek的开源精神更接近于西方的Linux和Wikipedia文化,而中国在这方面的传统并不深厚。因此,他们能在这样的环境下坚持这一理念,实属难得。
4
DeepSeek的技术积累与探索
因此,该团队对AI的理解与实践已有十多年的积累。
他们对技术高度敏感,甚至可能在ChatGPT问世之前,就已经开始探索Transformer在大语言模型中的应用。
5
自动推理训练:AI发展的新路径
DeepSeek采用类似的方法,让AI能够自主学习,而不需要人工干预。这不仅提升了模型的训练效率,同时也大幅降低了训练成本。
6
DeepSeek的技术影响:
是否改变了AI竞争格局?
还有很多人关心,DeepSeek的突破是否会改变中美AI竞争格局?我的看法是,虽然这次突破缩小了中美技术差距,但整体格局并未改变。
7
AI技术对市场的影响
当时,蒸汽机的燃烧效率提升,很多人以为煤炭需求会减少,但事实相反,煤炭需求大幅增长。原因在于,成本下降后,蒸汽机的应用范围大幅扩展,最终总需求反而增加。
8
AI的未来:AGI时代即将来临?
AI的浪潮才刚刚开始,类似于互联网在2000年前后的发展阶段。未来10-20年,AI仍将持续高速增长。
目前,全球领先的AI实验室(如OpenAI、Anthropic、Google、微软)普遍预测通用人工智能(AGI)将在2-5年内实现。AGI的定义是:机器能够完成绝大部分人类智力活动。如果这一目标实现,AI市场规模将远超互联网,达到十万亿美元乃至几十万亿美元的级别。
DeepSeek在AI技术探索中找到了一条新的路径,自动推理训练的突破极大降低了AI推理成本,为AGI的发展提供了重要支持。尽管这一突破尚不足以改变全球AI格局,但它证明了中国AI团队在资源有限的情况下,依然能够实现创新。
未来,AI技术的演进将持续加速,我们正在见证一个变革时代的到来。DeepSeek的故事,也许只是AI革命中的一个篇章,但它无疑为整个行业的发展提供了新的启示。