王维嘉：DeepSeek的突破是否会改变中美AI竞争格局？

2025-01-30

文章转载自"优客工场ucommune"

内容来源

作者王维嘉，中国科技大学无线电系学士，斯坦福大学电气工程博士，曾任数字中国／中国IT互联网峰会创始常务理事，欧美同学会2005委员会共同创始人、第三届理事长，阿拉善企业家生态协会创始终身会员、第三届副会长

本文为王先生在企业家社群里的讨论要点，本文经授权发布，并略经编辑。

最近所有人都在讨论很 DeepSeek。网上也充斥着各种各样的分析：从技术分析到财务分析。在此，我与也通过几个方面展开聊聊，通与各位共同探讨。

DeepSeek：

技术创新、AI发展与未来展望

作为在硅谷待了40年的人，我对技术创新有一个深刻的体会——它就像在一座广阔的大山里寻找金矿。

我们知道这里可能有金矿，但没人确切知道它在哪儿。因此，许多团队纷纷进入这座山，不同的人探索不同的方向，试图找到突破口。

回顾人工智能的发展，2012年，AI在图像识别领域取得了第一次重大突破，之后进入围棋领域，这是我们所谓的AI 1.0时代。

当时，行业的主要方向是图像和视频识别，大家认为这才是最具潜力的赛道。

语言模型的崛起：被忽视的岔道

2017年，谷歌提出了Transformer模型，最初的目的是改进语言翻译，如英文与法文之间的互译。

然而，当时大部分业内人士都认为语言市场相对较小，无法与图像和视频识别相提并论，因此谷歌并未深入探索。

但OpenAI的团队却持不同看法。他们认为，语言是人类智慧的核心载体，其潜力远比想象中更大。

因此，尽管资源有限，他们仍然坚持深耕语言模型，最终在2022年11月发布了ChatGPT。这就像是他们在“金矿”之外发现了一条小岔道，决定深入探索，结果竟然找到了真正的“金矿”。

推理学习的突破：AI的新方向

随着ChatGPT发布后，全球AI公司纷纷投入这一领域，不断扩大模型规模、增加训练数据。

然而，随着模型的膨胀，AI的发展遇到了瓶颈。就在大家在这条“阳光大道”上前进时，OpenAI又做出了第二个突破——推理学习。

他们发现，与其单纯扩大模型规模，不如优化推理能力。即使模型本身不大，只要推理能力足够强，AI的性能仍然可以提升数十倍、甚至上百倍。

这一发现相当于在原有的AI发展路径之外，又开辟了一条新的道路。2023年9月24日，OpenAI发布O1模型，正式开启了这一新方向。

DeepSeek的独特性：

技术理想与开源精神

在这样的背景下，DeepSeek成为了一个非常特别的团队。他们坚持开源，而开源精神在中国并不常见。通常，行业的领先者会选择保护自己的技术，而落后者则依靠开源来利用全球智慧。例如，Meta（Facebook）同样选择了开源，因为他们相较于OpenAI处于劣势。

然而，在中国，很少有团队愿意坚持开源，因为开源意味着付出，却未必有直接的商业回报。

DeepSeek的开源精神更接近于西方的Linux和Wikipedia文化，而中国在这方面的传统并不深厚。因此，他们能在这样的环境下坚持这一理念，实属难得。

DeepSeek的技术积累与探索

DeepSeek的创始人梁文峰自2013年起便开始从事量化投资，并广泛应用机器学习技术。

因此，该团队对AI的理解与实践已有十多年的积累。

他们对技术高度敏感，甚至可能在ChatGPT问世之前，就已经开始探索Transformer在大语言模型中的应用。

此外，他们还吸引了中国最聪明的一批工程师，并且借助全球开源工具，迅速进入AI最前沿的探索之路。最重要的是，他们不仅跟随推理学习的趋势，还进一步找到了一条新的技术路径——自动推理训练。

自动推理训练：AI发展的新路径

DeepSeek的自动推理训练类似于AlphaGo Zero的自我博弈学习模式。最初，AlphaGo是通过学习大量历史棋局训练出来的，而AlphaGo Zero则完全依靠自我对弈进行训练，最终超越了前者。

DeepSeek采用类似的方法，让AI能够自主学习，而不需要人工干预。这不仅提升了模型的训练效率，同时也大幅降低了训练成本。

由于DeepSeek的算力资源有限，他们必须找到更高效的训练方式，而最终，他们成功地将推理成本降低了两个数量级。

DeepSeek的技术影响：

是否改变了AI竞争格局？

还有很多人关心，DeepSeek的突破是否会改变中美AI竞争格局？我的看法是，虽然这次突破缩小了中美技术差距，但整体格局并未改变。

原因有几点：

芯片短板：AI的发展高度依赖算力，而中国在芯片制造方面仍然落后于美国。
算法突破主要发生在西方：从2012年的AlexNet到2017年的Transformer，再到2022年的ChatGPT，核心算法的突破主要发生在美国，欧洲（如法国Mistral公司）也有一定贡献，但相对较小。
DeepSeek的贡献占比：如果将全球AI技术突破总量设为100%，DeepSeek的贡献可能占5%。这个比例已经非常了不起，但尚不足以撼动整体格局。