新闻 发表于 2025-6-21 11:09

AI大神Karpathy演讲笔记:软件3.0时代每个开发者必须了解的技术演进

作者:微信文章

Andrej #Karpathy 在前两天的 YC Startup School 上的演讲视频,反复看了好几遍,作为 #AI应用 开发者非常有收获。
软件 3.0 时代 已经到来,作为开发者,我们正站在技术变革的前沿。这不仅仅是一次工具的升级,而是编程范式的根本性转变。



1. 软件的 3 次进化:从传统编程到自然语言编程。2. LLM 的本质是新一代的操作系统。3. 理解 LLM 的优势和劣势,并在开发中有效应用。4. 软件 3.0 时代的开发机遇与技术方向。
如果你只听说过 MCP 还没动手实践过,推荐去看这本《MCP极简开发 轻松打造高效智能体》@秋叶大叔 的新书。
关注公众号 @极客开源👆 获取最新一手#AI大模型 #开源项目信息,如果这篇文章对你有用,可以点个“♥️推荐”,听说会影响公众号推荐算法。1. 软件的 3 次进化(The Three Evolutions of Software)

软件 1.0:我们用 #Python、C++ 等传统编程语言编写的、给计算机的确定性指令,这是我们最熟悉的经典软件开发模式;

软件 2.0:神经网络权重,开发者不直接编写业务逻辑,而是通过优化数据集来「训练」出一个模型(如图像分类器),其参数就是代码。

软件 3.0:可通过自然语言编程的大语言模型(#LLM),「提示词 Prompt」本身就是一种新的程序,用以指挥 LLM 这个「新计算机」完成任务。



这三种范式并非相互替代,而是共存的。作为开发者,我们需要精通这三者,并根据项目需求灵活选择或组合使用。
2)LLM 的本质:新一代的操作系统 (The Nature of LLMs: A New Operating System)

Karpathy 用多个比喻来描述 LLM,最终认为「操作系统」是最贴切的。



类比 1:电力/公共设施 (Utility):LLM 像电网,由大公司投入巨额资本构建,然后通过 #API 以计量方式提供服务。当顶尖 LLM 宕机时,就像全球性的"智能断电"。



类比 2:晶圆厂 (Fab):LLM 的研发需要深厚的技术树和研发秘密,类似于#半导体制造。



最贴切的类比:操作系统 (Operating System):
LLM 就像一个新的 #CPU,#上下文窗口 (context window) 则是其内存 (#RAM)。生态系统也呈现出类似 OS 的格局:少数闭源提供商(如 #OpenAI/#Anthropic)如同 #Windows/#macOS,而开源生态(如 #Llama)则可能发展为 #Linux。我们正处在计算机的「1960 年代」:由于计算资源昂贵,LLM 目前集中在云端,我们通过"分时共享"的方式访问它们,个人计算革命尚未到来。



一个前所未有的特点是「技术扩散方向的反转」:以往的颠覆性技术(如计算机、#互联网)首先应用于政府和企业,再普及到消费者。而 LLM 则首先在消费端(如"教我如何煮鸡蛋")得到广泛应用,是自下而上的普及。
3)理解 LLM 的「心理学」:与「人格模拟」协作开发

LLM 是「随机的人格模拟器」,它们在模拟人类文本数据的过程中,涌现出了类似人类的心理特征。


超能力(Superpowers):拥有百科全书式的知识和近乎完美的记忆力。认知缺陷(Congnitive Deficits):幻觉、安全问题、顺行性遗忘症(Anterograde Amnesia)、「锯齿状」智能(Jagged Intelligence)。
作为#开发者,我们必须要学会在利用其超级能力的同时,设计开发工作流来规避其缺陷。
4)核心机遇:开发者如何在软件 3.0 时代中应用 LLM

这部分是软件 3.0 时代的开发者最需要关注的一点。
4.1 构建「部分自主应用」(Partial Autonomy Apps)

不要直接与「操作系统」对话,而要构建专用的开发工具和应用程序,例如用 #Cursor 辅助编码,而不是在 #ChatGPT 里来回复制粘贴代码。



这类应用的共同特点:
自动化的上下文管理:智能管理代码上下文和项目信息。编排对 LLM 的多次、多种调用:如#嵌入模型、#代码生成模型、#代码审查模型 等。专用的图形用户界面 (GUI):#GUI 是人机协作的关键,它利用人脑强大的视觉处理能力,让开发者可以快速审核、接受或拒绝 AI 的修改(如代码的 diff 视图),这远比阅读纯文本高效。「自主性滑块」 (Autonomy Slider):开发者可以根据任务复杂性,自由调节 AI 的自主程度,从简单的#代码补全,到修改整个文件,再到对整个代码库进行重构。4.2 高效人机协作:给 AI 「套上缰绳」

人机协作是一个「生成-验证」循环,我们的目标是让这个循环尽可能快。

把 AI 控制在短缰绳上 (Keep the AI on a leash):避免让 AI 产生巨大、复杂的输出,因为验证这些输出的瓶颈仍然是人类。应采用小步、迭代的方式推进开发。

Karpathy 以「自动驾驶」为例,2013 年完美的演示并不意味着问题已解决,完全自主需要漫长的时间。我们对 AI #Agent 的期待也应如此,现在是「智能体十年」的开端,而非「智能体之年」。

隐喻:我们现在要做的更多是「钢铁侠战衣」(增强开发者能力),而不是「钢铁侠军团」(完全自主的#编程机器人)。4.3 为智能体构建基础设施(Build for Agents)



智能体是网络上一种「新的信息消费者和操纵者」。作为#开发者,我们需要调整现有数字基础设施以适应它们。

创建 'llm.txt' 文件,像 'robots.txt' 一样,用简单的 #Markdown 告诉 LLM 网站的核心内容。

提供对 LLM 友好的文档,例如用 Markdown 编写 API 文档,并将"点击这里"等面向人类的指令替换为 agent 可执行的 'curl' 命令。

开发工具(如 git-ingest, DeepWiki),将人类界面(如 #GitHub 页面)一键转换为 LLM 易于理解和处理的文本格式。



软件 3.0 时代为开发者带来了前所未有的机遇和挑战。掌握自然语言编程,学会与 AI 协作,构建智能化的#开发工具,这些将成为新时代开发者的核心竞争力。

如果你只听说过 MCP 还没动手实践过,推荐去看这本《MCP极简开发 轻松打造高效智能体》@秋叶大叔 的新书。

本书致力于帮助读者系统、全面地掌握 MCP 的核心原理与实战应用技巧。适读人群:AI 应用开发者和软件工程师、产品经理和技术主管,以及希望在工作中应用 MCP 提升效率的职场人士或者高校理工科专业的师生。



1. 内容系统全面,详解核心概念与架构解析。

2. 强调平台支持,包括AI编程平台和智能体开发平台。

3. 实践指导:提供详细的实践指导,搭建MCP开发环境、构建Server和Client以及它们之间的联动。

4. 从基础到进阶,重点介绍基于MCP Server的智能体开发实践。

页: [1]
查看完整版本: AI大神Karpathy演讲笔记:软件3.0时代每个开发者必须了解的技术演进