Contents

AI Agent 时代的操作系统:为什么 Linux 成了智能体的母语

上一篇文章的一个伏笔

上一篇《AI 时代新 Office 三件套》里,我讲了一个观点:AI 时代最持久的格式,往往最简单。

纯文本战胜了富文本。CSV 正在取代 Excel 成为 AI 处理表格数据的首选。Markdown 成了 AI 的「普通话」。

核心逻辑是:当内容的第一消费者从人变成 AI,简单、开放、人类可读的格式天然占优。因为 AI 不需要漂亮的排版,它需要清晰的语义边界。

但那只讲了数据层

今天这篇文章,我想讲基础设施层

因为如果你把视线从文件格式往上移一层,会发现一个更惊人的事实:

AI Agent 时代的操作系统,不是某个新的 GUI 平台,而是 Linux。

不是类比。不是修辞。是字面意义上的——AI Agent 的底层基础设施,就长在 Linux 的内核上。


一个被反复提及的比喻

Anthropic 在构建 Agent 架构时,团队和核心开发者反复用一个比喻来描述他们的三大组件:

Agent 组件对应 Linux职责
MCP(模型上下文协议)管道(pipe)统一连接,解耦调用
Skills(技能包)一切皆文件可加载、可组合的技能封装
Harness(执行引擎)操作系统内核资源调度、隔离、异常处理

这个比喻不是公关话术。它在设计哲学、生态治理和底层技术三个维度上,都站得住脚。

让我一层一层拆开说。


第一层:MCP 就是 AI 的管道

Linux 最强大的特性是什么?不是它的文件系统,不是它的进程管理。

是管道。

一个 grep 命令,一个 sort 命令,一个 uniq 命令,单独看都很简单。但用管道连起来——grep error log.txt | sort | uniq -c——你就有了一个强大的日志分析器。

管道的本质是什么?统一接口 + 文本流 + 解耦。

每个程序只需要做一件事:从标准输入读,处理后写到标准输出。它不需要知道上游是谁、下游是谁。管道负责连接一切。

MCP(Model Context Protocol)做的事情,完全一样。

MCP 定义了 AI 模型和外部工具之间的标准交互方式。模型不需要知道每个工具的 API 差异、认证机制或数据结构——它只需要通过 MCP 标准接口发起调用。

更妙的是 MCP 的传输层设计。其中 stdio 方式——MCP 服务器作为子进程启动,模型通过标准输入发送 JSON-RPC 请求,从标准输出读取响应——这本质上就是一个 Linux 管道。

开发者可以写出一个读取 stdin、输出 JSON 的 Python 脚本,立即成为一个可用的 MCP 服务器。这跟 Linux 下写一个管道友好的小工具,体验完全一致。

MCP 不是「借鉴」了管道哲学。MCP 就是管道哲学在 AI 时代的直接延续。


第二层:Skills 就是「一切皆文件」

「一切皆文件」是 Linux 的另一块基石。

在 Linux 里,普通文件、目录、设备、套接字、甚至进程信息,都被抽象为文件系统中的节点。你只需要掌握一套读写操作,就能操控几乎所有的系统资源。

Anthropic 的 Skills,把这套哲学从系统层搬到了 Agent 的能力组织层。

一个 Skill 是什么?就是一个结构化文件夹,里面放着指令文件(SKILL.md)、示例代码、领域知识文档、工作流描述。全部是明文——Markdown、YAML、Python。

Agent 需要执行某个领域的任务时,就像操作系统从磁盘加载程序一样,把对应的 Skill 文件夹内容「读」到上下文窗口里。

这种设计有三个关键优势:

可组合性。 多个 Skills 文件夹并列放置,Agent 根据任务需要加载对应的「程序」。就像 Linux 的 /usr/bin 目录下放着几百个命令,你需要哪个就调用哪个。

可检查性。 因为一切以明文呈现,用户可以像浏览目录一样审阅一个 Skill 包的全部内容和行为逻辑。你打开一个 SKILL.md 文件,就能知道这个 Skill 会做什么、不会做什么。这在闭源的 API 时代是不可想象的。

社区共建。 任何人都可以创建、修改、打包和分发一个 Skill 文件夹。就像 Linux 下写一个脚本分享给别人一样简单。

在 API 时代,你「调用」一个服务。在 Skill 时代,你「阅读」一个能力。前者是黑盒,后者是白盒。


第三层:Harness 就是操作系统

如果说 MCP 和 Skills 是单一机制层面的类比,那 Harness 就是对整个操作系统的综合对应。

现代操作系统做什么?CPU 调度、内存分配、进程隔离、异常捕获、系统监控。

Harness 在 Agent 执行环境中做什么?

操作系统职责Harness 对应
虚拟内存与持久存储记忆管理(短期会话 + 长期跨会话状态)
系统调用与进程隔离工具调用路由 + 沙箱执行
进程调度器多 Agent 任务调度、并发控制
信号与错误日志异常处理、日志、追踪、审计

Agent 的运行不再是一系列零散工具调用的简单拼接,而是置于一个真正受控、可靠、可监控的「操作系统」之上。

这意味着,理解 Agent 执行环境,本质上就是在理解操作系统。你需要知道进程的生命周期、权限的边界、资源的约束、故障的模式。

这些不是系统管理员的专属知识了。这是 AI Agent 时代每个进阶用户的必修课。


第四层:治理层面的深度绑定

设计哲学的类比可以是修辞。但 Anthropic 在生态治理层面的实际行动,把这些类比变成了制度性的事实。

2025 年,Anthropic 宣布将 MCP 协议捐赠给 Linux 基金会旗下的 Agentic AI Foundation(AAIF)

这个动作的意义怎么强调都不为过。

Linux 基金会运营着什么?Linux 内核、Kubernetes、Node.js……人类最大的协作式软件项目。它的治理模式强调社区驱动、厂商中立、技术共识。

Anthropic 没有选择自建封闭生态,也没有成立独立联盟。它直接把自己的核心协议「嫁接」到了那个运营着 Linux 内核的基金会之上。

这等于在制度层面承认:Agent 生态应该走 Linux 走过的路——开放、中立、社区驱动。

Linux 的成功不在于它一开始就有最优雅的内核设计。而在于它提供了一个足够中性、开放、可任意修改和重分发的基础层,从而吸引了全球开发者的共同投入。

MCP 的目标正是在 Agent 工具调用层复制这一模式。一旦 MCP 成为和 HTTP、USB-C 一样普及的公共品,围绕其上的 Skills 市场、Harness 解决方案和专业化 Agent 才能繁荣起来。

这不是公关行为。这是整体架构设计的内在延伸。


第五层:Agent 就长在 Linux 内核上

以上四层,还都在类比和制度层面。但最直接的依赖,在物理层面。

Harness 及其承载的 Agent 执行环境,大量利用了 Linux 内核提供的 cgroupsnamespace 等容器化特性。

cgroups(控制组) 负责限制进程的 CPU、内存、磁盘 I/O 和网络带宽。当 Harness 需要防止某个 Agent 任务耗尽主机资源(比如无限循环的代码执行),它为该进程树分配独立的 cgroup,设定配额。这和 Docker 在底层使用 cgroups 的方式完全一致。

namespace(命名空间) 提供进程级视图隔离。Harness 利用它为每个 Agent 会话创建受限的执行环境——只能访问指定目录,无法窥探宿主系统的其他进程或网络资源。

再加上 seccomp(安全计算模式)、capabilities 等细粒度权限控制……

所有这些技术,原本是为 Docker、Kubernetes 等容器生态而发展和成熟的,如今正在被无缝迁移到 AI Agent 基础设施之中。

Agent 的沙箱,本质上就是一个容器。容器的底层,就是 Linux 内核。

理解 Agent 的安全模型,本质上就是理解 Linux 的 namespace 隔离、cgroup 资源控制和文件系统权限。这不是可选的背景知识,这是直接的生产力工具。


一条贯穿始终的线索

现在让我们退一步,把两篇文章串起来看。

上一篇《AI 时代新 Office 三件套》讲了一个规律:

最持久的格式,往往最简单。 纯文本战胜富文本。CSV 取代 Excel 成为 AI 处理表格的首选。Markdown 成了 AI 的普通话。

这篇讲了一个更深层的规律:

最强大的基础设施,往往最基础。 管道哲学被 MCP 继承。「一切皆文件」被 Skills 继承。容器技术被 Harness 继承。Linux 从 1991 年诞生,三十多年了,它成了 AI Agent 时代的操作系统。

两条线索指向同一个结论:

AI 没有发明新格式,也没有发明新操作系统。AI 只是把已有的、最简单、最开放的技术,推到了舞台中央。

Markdown 1991 年诞生,CSV 1972 年诞生,Linux 1991 年诞生,管道哲学 1970 年代诞生。

它们都活了三四十年。它们不是被设计出来的标准,它们是长出来的生态。

AI 时代到来,这些老技术突然焕发了第二春。不是因为它们变了。

是 AI 选择了它们。


对个人意味着什么?

上一篇我说,掌握 Markdown、CSV、HTML,是 AI 时代知识工作者的新基本功。

这篇我要说:掌握 Linux 基础知识,是 AI Agent 时代的元技能。

不需要成为内核开发者。但以下四个模块,值得投入:

文件系统与权限。 理解目录树、路径、文件权限位(rwx)。足以应对 Skills 目录组织、配置文件编辑。

进程与管道。 了解进程 ID、前台后台、标准输入输出重定向(>|)。可帮助理解 MCP 工具的生命周期和日志输出。

容器基础。 学会用 Docker 跑一个镜像、挂载卷、映射端口、查看日志。这几乎就等于在本地部署和调试一个完整的 Agent 执行环境。

Shell 脚本。 能写简单的 bash 脚本,将多个命令行工具组合成自动化流程。这将直接对应到自定义 Skills 或自动化工作流的编写。

这些知识的学习曲线平缓,几周内就能入门。而它们提供的回报是持久的——因为无论 AI 模型如何进化,以 Linux 为基础的计算基础设施在未来相当长时间内仍将是运行 Agent 的核心底座。


写在最后

上世纪 90 年代,理解「文件」和「文件夹」是进入个人计算机世界的敲门砖。

今天,理解「管道」的思想、理解「进程」与「容器」的边界,将成为推开 AI Agent 大门的钥匙。

格式之争,表面是技术问题。底层是人与机器的关系问题。

当机器开始「读」我们写的东西,我们的写作方式变了——Markdown 成了普通话。

当机器开始「跑」在我们构建的系统上,我们的系统观念也变了——Linux 成了智能体的母语。

不是我们选择了这些老技术。

是 AI 选择了它们。而我们,恰好跟上了。


参考资料:Anthropic MCP/Skills/Harness 架构文档、Agentic AI Foundation 官方公告、Linux 内核 cgroups/namespace 文档。