找工位
空间入驻
小程序

王维嘉:DeepSeek的突破是否会改变中美AI竞争格局?

2025-01-30
文章转载自"优客工场ucommune"


DeepSeek对整个AI的影响,绝对是个利好。第一个利好就是让AI的应用快速落地;第二利好是会扩大未来对芯片的需求;第三个利好是成本,DeepSeek每次访问的成本openAI的1/30且盈利。

/ NEWS TODAY

内容来源

作者王维嘉,中国科技大学无线电系学士,斯坦福大学电气工程博士,曾任数字中国/中国IT互联网峰会创始常务理事,欧美同学会2005委员会共同创始人、第三届理事长,阿拉善企业家生态协会创始终身会员、第三届副会长

本文为王先生在企业家社群里的讨论要点,本文经授权发布,并略经编辑。

最近所有人都在讨论很 DeepSeek。网上也充斥着各种各样的分析:从技术分析到财务分析。在此,我与也通过几个方面展开聊聊,通与各位共同探讨。

0

DeepSeek:

               技术创新、AI发展与未来展望

作为在硅谷待了40年的人,我对技术创新有一个深刻的体会——它就像在一座广阔的大山里寻找金矿。

我们知道这里可能有金矿,但没人确切知道它在哪儿。因此,许多团队纷纷进入这座山,不同的人探索不同的方向,试图找到突破口。

回顾人工智能的发展,2012年,AI在图像识别领域取得了第一次重大突破,之后进入围棋领域,这是我们所谓的AI 1.0时代。

当时,行业的主要方向是图像和视频识别,大家认为这才是最具潜力的赛道。


1

语言模型的崛起:被忽视的岔道


2017年,谷歌提出了Transformer模型,最初的目的是改进语言翻译,如英文与法文之间的互译。

然而,当时大部分业内人士都认为语言市场相对较小,无法与图像和视频识别相提并论,因此谷歌并未深入探索。

但OpenAI的团队却持不同看法。他们认为,语言是人类智慧的核心载体,其潜力远比想象中更大。

因此,尽管资源有限,他们仍然坚持深耕语言模型,最终在2022年11月发布了ChatGPT。这就像是他们在“金矿”之外发现了一条小岔道,决定深入探索,结果竟然找到了真正的“金矿”。


2

推理学习的突破:AI的新方向

随着ChatGPT发布后,全球AI公司纷纷投入这一领域,不断扩大模型规模、增加训练数据。

然而,随着模型的膨胀,AI的发展遇到了瓶颈。就在大家在这条“阳光大道”上前进时,OpenAI又做出了第二个突破——推理学习。

他们发现,与其单纯扩大模型规模,不如优化推理能力。即使模型本身不大,只要推理能力足够强,AI的性能仍然可以提升数十倍、甚至上百倍。

这一发现相当于在原有的AI发展路径之外,又开辟了一条新的道路。2023年9月24日,OpenAI发布O1模型,正式开启了这一新方向。


3

DeepSeek的独特性:

         技术理想与开源精神

在这样的背景下,DeepSeek成为了一个非常特别的团队。他们坚持开源,而开源精神在中国并不常见。通常,行业的领先者会选择保护自己的技术,而落后者则依靠开源来利用全球智慧。例如,Meta(Facebook)同样选择了开源,因为他们相较于OpenAI处于劣势。

然而,在中国,很少有团队愿意坚持开源,因为开源意味着付出,却未必有直接的商业回报。

DeepSeek的开源精神更接近于西方的Linux和Wikipedia文化,而中国在这方面的传统并不深厚。因此,他们能在这样的环境下坚持这一理念,实属难得。


4

DeepSeek的技术积累与探索

DeepSeek的创始人梁文峰自2013年起便开始从事量化投资,并广泛应用机器学习技术。

因此,该团队对AI的理解与实践已有十多年的积累。

他们对技术高度敏感,甚至可能在ChatGPT问世之前,就已经开始探索Transformer在大语言模型中的应用。

此外,他们还吸引了中国最聪明的一批工程师,并且借助全球开源工具,迅速进入AI最前沿的探索之路。最重要的是,他们不仅跟随推理学习的趋势,还进一步找到了一条新的技术路径——自动推理训练。

5

自动推理训练:AI发展的新路径

DeepSeek的自动推理训练类似于AlphaGo Zero的自我博弈学习模式。最初,AlphaGo是通过学习大量历史棋局训练出来的,而AlphaGo Zero则完全依靠自我对弈进行训练,最终超越了前者。

DeepSeek采用类似的方法,让AI能够自主学习,而不需要人工干预。这不仅提升了模型的训练效率,同时也大幅降低了训练成本。

由于DeepSeek的算力资源有限,他们必须找到更高效的训练方式,而最终,他们成功地将推理成本降低了两个数量级。


6

DeepSeek的技术影响:

         是否改变了AI竞争格局?

还有很多人关心,DeepSeek的突破是否会改变中美AI竞争格局?我的看法是,虽然这次突破缩小了中美技术差距,但整体格局并未改变。


原因有几点:
  1. 芯片短板:AI的发展高度依赖算力,而中国在芯片制造方面仍然落后于美国。
  2. 算法突破主要发生在西方:从2012年的AlexNet到2017年的Transformer,再到2022年的ChatGPT,核心算法的突破主要发生在美国,欧洲(如法国Mistral公司)也有一定贡献,但相对较小。
  3. DeepSeek的贡献占比:如果将全球AI技术突破总量设为100%,DeepSeek的贡献可能占5%。这个比例已经非常了不起,但尚不足以撼动整体格局。

7

AI技术对市场的影响

DeepSeek的突破对商业市场的影响是显而易见的,尤其是在投资领域。例如,在2017年,英伟达的市值仅约300亿美元,如今已增长至万亿美元级别。
DeepSeek的低成本AI训练方法,使市场对AI芯片的需求预期发生了变化,这种变化类似于19世纪英国的Jevons悖论。

当时,蒸汽机的燃烧效率提升,很多人以为煤炭需求会减少,但事实相反,煤炭需求大幅增长。原因在于,成本下降后,蒸汽机的应用范围大幅扩展,最终总需求反而增加。

      同样,DeepSeek降低了AI推理成本,使AI应用场景进一步拓展,反而可能导致算力需求增加,而不是减少。


8

AI的未来:AGI时代即将来临?

AI的浪潮才刚刚开始,类似于互联网在2000年前后的发展阶段。未来10-20年,AI仍将持续高速增长。

更重要的问题是,AI究竟能做到什么程度?

目前,全球领先的AI实验室(如OpenAI、Anthropic、Google、微软)普遍预测通用人工智能(AGI)将在2-5年内实现。AGI的定义是:机器能够完成绝大部分人类智力活动。如果这一目标实现,AI市场规模将远超互联网,达到十万亿美元乃至几十万亿美元的级别。

DeepSeek的技术突破,进一步验证了以较低成本实现AGI的可能性。毕竟,AI的应用必须具备成本优势,否则企业宁愿使用人力。DeepSeek的贡献,使得低成本AGI的实现变得更加可行。


DeepSeek在AI技术探索中找到了一条新的路径,自动推理训练的突破极大降低了AI推理成本,为AGI的发展提供了重要支持。尽管这一突破尚不足以改变全球AI格局,但它证明了中国AI团队在资源有限的情况下,依然能够实现创新。

未来,AI技术的演进将持续加速,我们正在见证一个变革时代的到来。DeepSeek的故事,也许只是AI革命中的一个篇章,但它无疑为整个行业的发展提供了新的启示。