【AI大神Karpathy演讲笔记:软件3.0时代每个开发者必须了解的技术演进】萍聚社区-德国热线-德国实用信息网人工智能

新闻发表于 2025-6-21 10:09

AI大神Karpathy演讲笔记:软件3.0时代每个开发者必须了解的技术演进

作者：微信文章

Andrej #Karpathy 在前两天的 YC Startup School 上的演讲视频，反复看了好几遍，作为 #AI应用开发者非常有收获。
软件 3.0 时代已经到来，作为开发者，我们正站在技术变革的前沿。这不仅仅是一次工具的升级，而是编程范式的根本性转变。

1. 软件的 3 次进化：从传统编程到自然语言编程。2. LLM 的本质是新一代的操作系统。3. 理解 LLM 的优势和劣势，并在开发中有效应用。4. 软件 3.0 时代的开发机遇与技术方向。
如果你只听说过 MCP 还没动手实践过，推荐去看这本《MCP极简开发轻松打造高效智能体》@秋叶大叔的新书。
关注公众号 @极客开源👆 获取最新一手#AI大模型 #开源项目信息，如果这篇文章对你有用，可以点个“♥️推荐”，听说会影响公众号推荐算法。1. 软件的 3 次进化（The Three Evolutions of Software）

软件 1.0：我们用 #Python、C++ 等传统编程语言编写的、给计算机的确定性指令，这是我们最熟悉的经典软件开发模式；

软件 2.0：神经网络权重，开发者不直接编写业务逻辑，而是通过优化数据集来「训练」出一个模型（如图像分类器），其参数就是代码。

软件 3.0：可通过自然语言编程的大语言模型（#LLM），「提示词 Prompt」本身就是一种新的程序，用以指挥 LLM 这个「新计算机」完成任务。

这三种范式并非相互替代，而是共存的。作为开发者，我们需要精通这三者，并根据项目需求灵活选择或组合使用。
2）LLM 的本质：新一代的操作系统 (The Nature of LLMs: A New Operating System)

Karpathy 用多个比喻来描述 LLM，最终认为「操作系统」是最贴切的。

类比 1：电力/公共设施 (Utility)：LLM 像电网，由大公司投入巨额资本构建，然后通过 #API 以计量方式提供服务。当顶尖 LLM 宕机时，就像全球性的"智能断电"。

类比 2：晶圆厂 (Fab)：LLM 的研发需要深厚的技术树和研发秘密，类似于#半导体制造。

最贴切的类比：操作系统 (Operating System)：
LLM 就像一个新的 #CPU，#上下文窗口 (context window) 则是其内存 (#RAM)。生态系统也呈现出类似 OS 的格局：少数闭源提供商（如 #OpenAI/#Anthropic）如同 #Windows/#macOS，而开源生态（如 #Llama）则可能发展为 #Linux。我们正处在计算机的「1960 年代」：由于计算资源昂贵，LLM 目前集中在云端，我们通过"分时共享"的方式访问它们，个人计算革命尚未到来。

一个前所未有的特点是「技术扩散方向的反转」：以往的颠覆性技术（如计算机、#互联网）首先应用于政府和企业，再普及到消费者。而 LLM 则首先在消费端（如"教我如何煮鸡蛋"）得到广泛应用，是自下而上的普及。
3）理解 LLM 的「心理学」：与「人格模拟」协作开发

LLM 是「随机的人格模拟器」，它们在模拟人类文本数据的过程中，涌现出了类似人类的心理特征。

超能力（Superpowers）：拥有百科全书式的知识和近乎完美的记忆力。认知缺陷（Congnitive Deficits）：幻觉、安全问题、顺行性遗忘症（Anterograde Amnesia）、「锯齿状」智能（Jagged Intelligence）。
作为#开发者，我们必须要学会在利用其超级能力的同时，设计开发工作流来规避其缺陷。
4）核心机遇：开发者如何在软件 3.0 时代中应用 LLM

这部分是软件 3.0 时代的开发者最需要关注的一点。
4.1 构建「部分自主应用」（Partial Autonomy Apps）

不要直接与「操作系统」对话，而要构建专用的开发工具和应用程序，例如用 #Cursor 辅助编码，而不是在 #ChatGPT 里来回复制粘贴代码。

这类应用的共同特点：
自动化的上下文管理：智能管理代码上下文和项目信息。编排对 LLM 的多次、多种调用：如#嵌入模型、#代码生成模型、#代码审查模型等。专用的图形用户界面 (GUI)：#GUI 是人机协作的关键，它利用人脑强大的视觉处理能力，让开发者可以快速审核、接受或拒绝 AI 的修改（如代码的 diff 视图），这远比阅读纯文本高效。「自主性滑块」 (Autonomy Slider)：开发者可以根据任务复杂性，自由调节 AI 的自主程度，从简单的#代码补全，到修改整个文件，再到对整个代码库进行重构。4.2 高效人机协作：给 AI 「套上缰绳」

人机协作是一个「生成-验证」循环，我们的目标是让这个循环尽可能快。

把 AI 控制在短缰绳上 (Keep the AI on a leash)：避免让 AI 产生巨大、复杂的输出，因为验证这些输出的瓶颈仍然是人类。应采用小步、迭代的方式推进开发。

Karpathy 以「自动驾驶」为例，2013 年完美的演示并不意味着问题已解决，完全自主需要漫长的时间。我们对 AI #Agent 的期待也应如此，现在是「智能体十年」的开端，而非「智能体之年」。

隐喻：我们现在要做的更多是「钢铁侠战衣」（增强开发者能力），而不是「钢铁侠军团」（完全自主的#编程机器人）。4.3 为智能体构建基础设施（Build for Agents）

智能体是网络上一种「新的信息消费者和操纵者」。作为#开发者，我们需要调整现有数字基础设施以适应它们。

创建 'llm.txt' 文件，像 'robots.txt' 一样，用简单的 #Markdown 告诉 LLM 网站的核心内容。

提供对 LLM 友好的文档，例如用 Markdown 编写 API 文档，并将"点击这里"等面向人类的指令替换为 agent 可执行的 'curl' 命令。

开发工具（如 git-ingest, DeepWiki），将人类界面（如 #GitHub 页面）一键转换为 LLM 易于理解和处理的文本格式。

软件 3.0 时代为开发者带来了前所未有的机遇和挑战。掌握自然语言编程，学会与 AI 协作，构建智能化的#开发工具，这些将成为新时代开发者的核心竞争力。

如果你只听说过 MCP 还没动手实践过，推荐去看这本《MCP极简开发轻松打造高效智能体》@秋叶大叔的新书。

本书致力于帮助读者系统、全面地掌握 MCP 的核心原理与实战应用技巧。适读人群：AI 应用开发者和软件工程师、产品经理和技术主管，以及希望在工作中应用 MCP 提升效率的职场人士或者高校理工科专业的师生。

1. 内容系统全面，详解核心概念与架构解析。

2. 强调平台支持，包括AI编程平台和智能体开发平台。

3. 实践指导：提供详细的实践指导，搭建MCP开发环境、构建Server和Client以及它们之间的联动。

4. 从基础到进阶，重点介绍基于MCP Server的智能体开发实践。

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI大神Karpathy演讲笔记:软件3.0时代每个开发者必须了解的技术演进