我爱免费 发表于 2025-12-23 07:21

AI进化与算力变局:一场关于后英伟达时代的知识盛宴

作者:微信文章
2025年12月21日,终于参加上了朱博士精心准备三个多月的AI分享盛宴——“从AI进化看后英伟达时代算力格局的变数”。正所谓好饭不怕晚,尤其是这样慢工出细活的专业知识分享,无论等待多久都值得。整场分享持续三个半小时,信息密集、见解深刻,值得静下心来细细品味。感兴趣的朋友可以前往朱博士的视频号“以年观日”观看直播回放,一起享受这场思维与知识的盛宴。以下是从这场知识盛宴提炼出来的核心要点,希望能为未能亲临现场的朋友,提供一次身临其境的思维体验。


英伟达的崛起:不止是硬件,更是生态帝国

在AI浪潮席卷全球的今天,英伟达(NVIDIA)无疑是最耀眼的明星。其市值一度突破五万亿美元,登顶世界第一。更惊人的是其盈利能力:上个财年,英伟达的毛利率高达75%,净利率达到55.8%,甚至超过了以高利润率著称的贵州茅台。这背后,英伟达构建的远不止是强大的GPU硬件。

1. 硬件性能的“铁三角”
AI数据中心的硬件性能由三大要素决定:算力、显存和带宽
算力: GPU的运算速度,好比厨房里的“高压锅”,决定了处理任务的速度。显存: 存放中间数据的高速内存,好比“备菜台”。台子太小,厨师就得频繁去冰箱取食材,效率低下。带宽: 数据传输速度,好比“水龙头的水流”。水流太小,再好的锅和台子也得干等。

英伟达在这三方面都做到了行业领先,尤其是在高速互联技术(如NVLink和收购Mellanox带来的技术)上,使其在构建大规模计算集群时优势明显。

2. 真正的壁垒:CUDA软件生态
然而,单靠硬件无法解释英伟达的统治地位。其真正的“护城河”在于CUDA软件生态。可以将其想象为一本顶尖的“烹饪秘籍”:
底层优化: CUDA将AI计算中最频繁的操作(如矩阵乘法)优化到极致,如同将“刀工”练成绝技。高层封装: 它将复杂的神经网络计算单元封装成易于调用的“预制菜包”,开发者无需从零开始。系统调度: 高层库(如TensorRT)能高效调度成千上万个GPU协同工作,解决“百人盛宴”的资源分配难题。

这套系统孕育了一个庞大的开发者社区。全球数百万AI研究者发表的论文,几乎都在为CUDA生态“添砖加瓦”。这使得从英伟达平台迁移到其他平台(如AMD的ROCm)成本极高,如同让习惯了一套顶级厨具和流程的大厨,突然去一个布局、脾性完全不同的新厨房工作,效率会一落千丈。
需求无底洞:AI对算力的饥渴永无止境

驱动英伟达辉煌的,是AI行业对算力近乎无限的渴求。这背后有几个核心动力:

1. 杰文斯悖论(Jevons Paradox)
技术进步降低了单一任务的算力成本,却极大地扩展了应用场景,导致总消耗量不降反增。AI越智能、算力越便宜,我们对它的依赖就越深。

2. 三大需求爆发点
载体泛化: AI将从云端走向万物,手机、汽车、家居甚至监控摄像头都可能内置大模型,算力入口呈指数级增长。模态跃迁: 从生成文本到生成高清视频、3D世界,所需算力是前者的数万倍。智能体(Agent)爆发: AI从“一问一答”进化为能自主执行复杂任务的智能体,可以7x24小时不间断工作,消耗巨量算力。

3. 缩放定律(Scaling Law)
OpenAI等机构提出的缩放定律表明,模型的智能程度与参数量、数据量和计算量强相关。只要持续投入更多算力,模型就会变得更聪明,甚至“涌现”出未曾训练过的能力。这驱使科技巨头们进行“算力军备竞赛”。

数据显示,前沿大模型的训练成本每年增长2-3倍。无论是OpenAI的研究主管,还是Anthropic的CEO,都表示现有的算力远远无法满足他们的需求。美国前五大科技公司(如微软、谷歌、亚马逊)明年的相关资本开支计划已接近5000亿美元。
挑战者四起:英伟达的城墙外已烽火连天

尽管护城河深,但英伟达并非高枕无忧。其商业模式存在一个根本性裂痕:最大的客户,也是最大的竞争对手。

1. 云巨头的“反叛”
为了摆脱对单一供应商的依赖和降低成本,各大云厂商都在全力自研AI芯片:
谷歌(Google): 其TPU已发展多年,完全服务于自有业务(如搜索、YouTube)。最新一代TPU v5p在单芯片性能上已接近英伟达旗舰产品。更重要的是,谷歌凭借其庞大的AI业务(如Gemini模型),为TPU提供了最直接的反馈和优化场景。亚马逊(AWS): 自研的Trainium芯片已发展到第三代,官方称其性能提升显著。AWS的策略是提供混合架构,让客户可以在英伟达GPU和自研芯片间灵活选择。微软、Meta等: 也都在芯片自研道路上投入巨资。

2. 创业公司的“奇袭”
一些初创公司选择了不同的技术路径,试图在细分市场打开局面:

Groq: 专注于为特定模型架构设计专用推理芯片,追求极致的单任务速度,宣称其推理速度远超传统GPU。
Cerebras: 制造“晶圆级”超大芯片,将整个系统集成在一块晶圆上,以消除多芯片互联的通信瓶颈,专攻训练市场。
Tenstorrent: 由传奇芯片设计师吉姆·凯勒(Jim Keller)挂帅。其思路是基于开源的RISC-V架构,打造灵活、低成本的AI芯片,主攻对成本敏感的边缘和终端市场(如汽车电子)。

3. 编译器的“秦始皇”
一个潜在的颠覆性力量来自软件层。有团队(如MLIR)正在尝试打造AI时代的“统一编程语言”,目标是让开发者写一套代码,就能无缝运行在英伟达、AMD、谷歌等任何AI芯片上。这就像为讲不同语言的国家提供了一个通用的“英语”中间层,能极大降低生态迁移成本。如果成功,将直接动摇CUDA生态的根基。

4. AI自身:最大的“颠覆者”?
最有趣的挑战可能来自AI本身。未来,如果AI的编程能力足够强大,它或许能自动将基于CUDA优化的代码,高效地移植到其他硬件平台。对于AI来说,学习不同硬件平台的特性没有人类那样的习惯和成本障碍。一旦软件生态的枷锁被AI打破,竞争将重新回到硬件性能、成本和能效的本质。
AI的短板与未来:智能的边界与经济的重塑

在算力战争的背后,AI技术本身也面临诸多根本性挑战。

1. 当前AI的五大短板
表现不稳定(“锯齿状”智能): 能在国际数学奥林匹克拿金牌,却可能在小学数学题上犯错。在长周期、复杂任务中容易出错。缺乏持续学习能力: 模型训练完成后即“定型”,不会在与用户的互动中持续学习和改进。缺乏规划与回溯能力: 思维链是线性的,一条路走到黑,无法像人类一样制定A/B/C计划并在执行中动态调整。容易产生“幻觉”: 因为训练机制要求它必须生成下一个词,即使不知道答案,它也会“编造”。样本效率低下: 需要海量数据才能学会一个技能,而人类往往只需少量经验。这导致AI难以应对训练数据中罕见的“边界情况”。

2. 通往更高级智能的探索
为了突破这些限制,研究者们正在探索新方向:
价值函数与内部评估: 让AI像人类一样拥有内在的“良知”或直觉,能进行自我评估,而不仅仅依赖外部反馈。理解物理规律与世界模型: 让AI不仅学习文本表面,更能理解世界内在的物理规律、因果关系和三维空间感。从“记忆知识”到“运用知识”: 未来的模型可能不需要记住所有知识,而是具备强大的搜索和推理能力,在需要时动态调用知识。

3. AI将如何重塑经济与职业?
AI的终极发展将对社会经济产生深远影响:
对经济增长的影响: 乐观派认为,AI能自动化科研,加速“非竞争性想法”的生产,从而大幅提升经济增速。悲观派则认为,历史上技术革命并未显著改变长期经济增长率(约2%),AI可能只是维持这一增长的工具。对财富分配的影响: 如果AI能完成大多数人类工作,传统“劳动换取收入”的经济循环可能崩溃。一种设想是征收“机器人税”,用以实施“全民基本收入”(UBI),保障所有人的基本消费能力。对职业的影响: 容易被AI替代的工作通常具有以下特征:输入输出纯数字化、流程高度标准化、无需承担最终责任、无需复杂人际沟通。反之,需要承担终极责任、依赖人际互动和情感共鸣的职业(如顶尖运动员、艺术家)可能更持久。



国内AI的盈利迷思与算力自主

在全球激战正酣时,中国AI行业也在探索自己的道路。

1. 盈利模式之困
与国际上流行的订阅制(如ChatGPT Plus)不同,国内C端订阅模式面临挑战。一方面有谷歌Gemini这样的强大竞品提供免费服务,另一方面用户付费意愿和习惯仍在培养。因此,国内厂商的盈利主要依靠:
自有业务支撑: 如字节跳动的广告推荐、阿里的电商搜索,将AI能力内化以提升主营业务效率。B端企业服务收费: 将AI模型和能力以API或解决方案的形式提供给企业客户,按调用量或年费收费。

2. 算力供应链的“紧箍咒”
全球超过95%的高端GPU市场被英伟达、AMD、谷歌、亚马逊等主流厂商占据,且高度依赖台积电制造。对于中国而言,获取先进算力面临地缘政治限制。这倒逼国内科技巨头(百度、阿里、华为等)和创业公司加速自研AI芯片。

虽然国产芯片在绝对性能上仍有差距,但通过系统架构创新(如华为利用光通信技术连接大量芯片组成超节点)和软件优化,可以在某些场景下达到相近的计算效率。美国的限制在客观上为国产芯片厂商腾出了市场空间和试错机会。
一场动态平衡的无限游戏

英伟达凭借其顶尖的硬件性能与牢不可破的CUDA软件生态,构筑了极高的竞争壁垒,享受着丰厚的利润。然而,城墙之外早已烽烟四起:巨头自研、创业公司奇袭、编译器革命,乃至AI自身,都在从不同维度发起挑战。

与此同时,驱动这场战争的燃料——AI算力需求,因“缩放定律”和场景爆炸而看不到尽头。但AI技术本身仍存在稳定性、持续学习、规划能力等根本性短板,突破这些限制可能需要价值函数、世界模型等新范式。

这是一场在技术、生态、供应链、地缘政治等多条战线上同时进行的无限游戏。没有永恒的王者,只有不断的迭代与超越。对于英伟达,最大的威胁或许不是某个具体的对手,而是行业本身高度动态、快速进化的本质。正如朱博所言:“这个行业是高度动态发展,你如果投英伟达,你投的不光是他现有的(优势),你还要投的是他未来(的执行力)。”

最终,胜出的可能不是拥有最锋利“矛”或最坚固“盾”的公司,而是最能适应这场永不停息的技术风暴的玩家。



2025年历次分享活动:

善用工具,让投资走得更稳更远(11月份深圳后院分享)

一场回家的游戏(9月份深圳后院分享)

疑难案件辩护策略(8月份深圳后院分享)
页: [1]
查看完整版本: AI进化与算力变局:一场关于后英伟达时代的知识盛宴