Agent，工程的起航

原创发布时间：2026-04-19 | 更新时间：2026-05-19

有了前面基础知识的铺垫，终于来到了 LLM 的实践应用环节 —— 智能体，LLM 的落地应用。

AI Agent（智能体）是 2025 年初开始普及的围绕 LLM 的工程实践。

随着工程化的成熟，业界已经发展出一套驾驭 LLM 的方法论和最佳实践，

本文按这套工程实践展开，分享 AI Agent 的关键逻辑。

过程中会以当下流行的本地智能体 OpenClaw 为例。

架构实例：OpenClaw 架构#

OpenClaw 的简要架构如下：

stateDiagram-v2
    direction LR

    %% 外部平台（消息源）
    feishu   : 飞书
    qq       : QQ
    wechat   : 微信
    telegram : Telegram
    nostr    : Nostr
    otherch  : ...

    %% 客户端
    webui   : Web UI
    tui     : 命令行 TUI<br/>（Terminal UI）
    node_app: Node App<br/>（iOS, Android）

    %% 关键实体
    openclaw : <strong>OpenClaw</strong>
    llm      : 大语言模型<br/>Large Language Model

    %% OpenClaw 核心
    state openclaw {
        direction LR
        ch      : 通道层<br/>（Channel Layer）
        gw      : <b>核心网关</b><br/>（Core Gateway）
        skill   : <b>技能引擎</b><br/>（Skill Engine）
        session : <b>会话管理</b><br/>（Session Manager）
        mem     : <b>记忆</b><br/>（Memory）
        plugin  : 插件系统<br/>（Plugin）

        ch      --> gw
        session --> gw
        skill   --> gw
        mem     --> gw
    }

    %% 外部平台 → Channel Layer
    feishu   --> ch
    qq       --> ch
    wechat   --> ch
    telegram --> ch
    nostr    --> ch
    otherch    --> ch

    %% 客户端 → Gateway
    webui   --> gw
    tui     --> gw
    node_app--> gw

    %% Gateway → LLM
    gw --> llm : LLM Providers

    %% 样式
    style feishu    fill:#e8f4fd,stroke:#4a90d9
    style qq        fill:#e8f4fd,stroke:#4a90d9
    style wechat    fill:#e8f4fd,stroke:#4a90d9
    style telegram  fill:#e8f4fd,stroke:#4a90d9
    style nostr     fill:#e8f4fd,stroke:#4a90d9
    style otherch   fill:#e8f4fd,stroke:#4a90d9

    style webui     fill:#d9f0e0,stroke:#5a9a6e
    style tui       fill:#d9f0e0,stroke:#5a9a6e
    style node_app  fill:#d9f0e0,stroke:#5a9a6e

    style openclaw  fill:#f5f5f5,stroke:#999,stroke-width:2px
    style gw        fill:#f0e8ff,stroke:#9a6ed4,stroke-width:3px
    style ch        fill:#f0e8ff,stroke:#9a6ed4
    style session   fill:#f0e8ff,stroke:#9a6ed4
    style mem       fill:#f0e8ff,stroke:#9a6ed4
    style skill     fill:#f0e8ff,stroke:#9a6ed4

    style llm       fill:#fff3cd,stroke:#d48806,stroke-width:2px

OpenClaw 是运行在个人电脑或服务器上的 AI Agent 框架。

消息经由 Channel Layer 接入，由 Core Gateway 统一路由，配合 Session Manager 管理对话上下文，技能引擎与记忆模块提供长期能力，最终调度 LLM 生成回复。

关键组件说明

通道层（Channel Layer）

消息适配层，将各平台（QQ、飞书、Telegram、Nostr 等）格式统一为内部 schema，再送入 Gateway
核心网关（Core Gateway）

消息路由核心，负责鉴权、会话分发、上下游协调，是整个系统的中枢
会话管理（Session Manager）

管理对话生命周期、上下文窗口、跨 session 记忆与状态持久化
技能引擎（Skill Engine）

技能执行引擎，按需挂载业务技能（天气预报、飞书文档、代码执行等），按指南调度工具
记忆（Memory）

记忆存储层，支持短期记忆（最近几天）与长期记忆（跨会话持久化）
子代理（Sub-Agent）

由 Gateway 派生出的并行任务执行单元，适用于复杂任务多 agent 协调分工处理（图中未画出）
插件系统（Plugin）

通过能力注册制和事件钩子，自定义扩展 OpenClaw 的各种能力

架构抽象：分层架构#

对于一般的 AI Agent，按个人理解，我把它抽象成如下几层：

层级	名称	说明
8	👤 用户层	需求·权限·审计
7	📖 技能层	工具使用说明和技能手册（skill.md），AI 时代的 App
6	🔧 工具层	命令·接口·MCP，智能体的武器装备库
5	🤖 智能体层	LLM 驾驭系统，AI 时代的 OS（Claude Code, Codex, OpenClaw）
4	🧠 模型层	智能引擎，AI 时代的发动机/CPU（OpenAI, Anthropic, Google）
3	🏗️ 基础设施层	服务器·存储·网络（AWS, Azure, 阿里云）
2	🔲 芯片层	GPU·TPU（英伟达 Nvidia，Google）
1	⚡ 能源层	超大型 AI 数据中心年耗电量相当于一座中等城市的居民年用电量

上下文 Context#

在模型训练阶段，如果输入的是干净且全面的数据，最后模型学会的就是这些数据组成的统计结构。

模型训练出来后，知识的量就已经固定了。

在模型推理阶段，提示词（prompt）的品质，将直接决定了大模型输出的质量。

就好像在水快要放干的鱼塘里面捞鱼，虽然随意都能抓到，但若使用有效的工具，效果将大大提升。

大模型的核心是自注意力机制，所谓的提示词工程（Prompt Engineering），就是为了管理 LLM 的注意力

OpenClaw 的提示词由以下部分组成：

系统提示词（System Prompt）
技能列表（Skills）
工具列表（Tools）
记忆（Memory）
历史对话内容（Chat History）

系统提示词是对 LLM 的约束和框定，OpenClaw 中，由位于 agent 工作区（workspace）的多个 markdown 文件（*.md）组成。

OpenClaw agent 定义文件

文件	用途	Context 注入
📋 AGENTS.md	宪法，Agent 的工作手册与行为指南	✅
🍼 BOOTSTRAP.md	首次启动引导，引导完成后删除	✅，仅引导阶段
🪪 IDENTITY.md	Agent 的身份，名字、角色、风格、头像	✅
❤️ SOUL.md	Agent 的灵魂，核心原则与处事态度	✅
🔧 TOOLS.md	工具备注，环境配置	✅
👥 USER.md	用户档案，基本信息与偏好	✅，仅一对一会话
🧠 MEMORY.md	长期记忆	✅，仅一对一会话
🌙 DREAMS.md	梦境日志，浅睡眠的反思碎片	❌
💓 HEARTBEAT.md	心跳检查清单，周期性后台任务	❌

与写给人类阅读的 README.md 对应，AGENTS.md 是写给 AI Agent 阅读的，是一种被越来越多的智能体采用的命名约定与格式规范，它定义了智能体的工作手册与行为指南

一个上下文例子（精简后）

{
  "model": "qwen3.5:0.8b",
  "messages": [
    {
      "role": "system",
      "content": "You are a personal assistant running inside OpenClaw ... + 技能清单（Skills）、工具清单（Tools）"
    },
    {
      "role": "user",
      "content": "A new session was started via /new or /reset ..."
    },
    {
      "role": "assistant",
      "content": "",
      "tool_calls": [
        {
          "function": {
            "name": "read",
            "arguments": {
              "path": "/root/.openclaw/workspace-thea/memory/2026-04-18.md"
            }
          }
        },
        {
          "function": {
            "name": "read",
            "arguments": {
              "path": "/root/.openclaw/workspace-thea/memory/2026-04-17.md"
            }
          }
        }
      ]
    },
    {
      "role": "tool",
      "content": "<the CONTENT in /root/.openclaw/workspace-thea/memory/2026-04-18.md>",
      "tool_name": "read"
    },
    {
      "role": "tool",
      "content": "<the CONTENT in /root/.openclaw/workspace-thea/memory/2026-04-17.md>",
      "tool_name": "read"
    },
    {
      "role": "assistant",
      "content": "下午好，Johnson 👋 新的一天，有什么想聊的或者需要帮忙的吗？"
    },
    {
      "role": "user",
      "content": "未来三天天气怎么样？"
    },
    {
      "role": "assistant",
      "content": "",
      "tool_calls": [
        {
          "function": {
            "name": "read",
            "arguments": {
              "path": "/usr/local/node-v22.22.0/lib/node_modules/openclaw/skills/weather/SKILL.md"
            }
          }
        }
      ]
    },
    {
      "role": "tool",
      "content": "<the CONTENT /usr/local/node-v22.22.0/lib/node_modules/openclaw/skills/weather/SKILL.md>",
      "tool_name": "read"
    },
    {
      "role": "assistant",
      "content": "",
      "tool_calls": [
        {
          "function": {
            "name": "exec",
            "arguments": {
              "command": "curl -s \"wttr.in/Foshan?format=3\" && echo \"\" && curl -s \"wttr.in/Foshan?1\""
            }
          }
        }
      ]
    },
    {
      "role": "tool",
      "content": "<佛山的天气预报内容>",
      "tool_name": "exec"
    },
    {
      "role": "assistant",
      "content": "",
      "tool_calls": [
        {
          "function": {
            "name": "exec",
            "arguments": {
              "command": "curl -s \"wttr.in/Foshan?format=j1\" | python3 -c \"\nimport sys, json\nd = json.load(sys.stdin)\ndays = d['weather']\nlocation = d['nearest_area'][0]['areaName'][0]['value']\nprint(f'📍 佛山 (Foshan) 未来三天天气：\\n')\nfor i, day in enumerate(days):\n    date = day['date']\n    max_t = day['maxtempC']\n    min_t = day['mintempC']\n    desc = day['hourly'][4]['weatherDesc'][0]['value']  # midday description\n    rain = day['hourly'][4]['precipMM']\n    humidity = day['hourly'][4]['humidity']\n    print(f'📅 {date} (周{[\\\"日\\\",\\\"一\\\",\\\"二\\\",\\\"三\\\",\\\"四\\\",\\\"五\\\",\\\"六\\\"][(i+4)%7]})')\n    print(f'   {desc}，气温 {min_t}–{max_t}°C')\n    print(f'   降水概率 {rain}mm，湿度 {humidity}%\\n')\n\"\n"
            }
          }
        }
      ]
    },
    {
      "role": "tool",
      "content": "📍 佛山 (Foshan) 未来三天天气：\n\n📅 2026-04-19 (周四)\n   Cloudy ，气温 28–34°C\n   降水概率 0.0mm，湿度 40%\n\n📅 2026-04-20 (周五)\n   Cloudy ，气温 26–32°C\n   降水概率 0.0mm，湿度 45%\n\n📅 2026-04-21 (周六)\n   Patchy rain nearby，气温 26–33°C\n   降水概率 0.1mm，湿度 40%",
      "tool_name": "exec"
    },
    {
      "role": "assistant",
      "content": "📍 **佛山未来三天天气：**\n\n- **今天（周四）：** 多云 🌥️，28–34°C，湿度 40%\n- **明天（周五）：** 多云 🌥️，26–32°C，湿度 45%\n- **后天（周六）：** 局部小雨 🌦️，26–33°C，湿度 40%\n\n这周气温比较稳定，周末可能有小雨，出门记得带伞～"
    }
  ],
  "stream": true,
  "tools": [
    {
      "type": "function",
      "function": {
        "name": "read",
        "description": "Read the contents of a file. Supports text files and images (jpg, png, gif, webp). Images are sent as attachments. For text files, output is truncated to 2000 lines or 50KB (whichever is hit first). Use offset/limit for large files. When you need the full file, continue with offset until complete.",
        "parameters": {
          "type": "object",
          "required": [
            "path"
          ],
          "properties": {
            "path": {
              "description": "Path to the file to read (relative or absolute)",
              "type": "string"
            },
            "offset": {
              "description": "Line number to start reading from (1-indexed)",
              "type": "number"
            },
            "limit": {
              "description": "Maximum number of lines to read",
              "type": "number"
            }
          }
        }
      }
    },
    {
      "type": "function",
      "function": {
        "name": "exec",
        "description": "Execute shell commands with background continuation for work that starts now. Use yieldMs/background to continue later via process tool. For long-running work started now, rely on automatic completion wake when it is enabled and the command emits output or fails; otherwise use process to confirm completion. Use process whenever you need logs, status, input, or intervention. Use pty=true for TTY-required commands (terminal UIs, coding agents).",
        "parameters": {
          "type": "object",
          "required": [
            "command"
          ],
          "properties": {
            "command": {
              "description": "Shell command to execute",
              "type": "string"
            },
            "workdir": {
              "description": "Working directory (defaults to cwd)",
              "type": "string"
            },
            "env": {
              "type": "object",
              "patternProperties": {
                "^(.*)$": {
                  "type": "string"
                }
              }
            },
            "yieldMs": {
              "description": "Milliseconds to wait before backgrounding (default 10000)",
              "type": "number"
            },
            "background": {
              "description": "Run in background immediately",
              "type": "boolean"
            },
            "timeout": {
              "description": "Timeout in seconds (optional, kills process on expiry)",
              "type": "number"
            },
            "pty": {
              "description": "Run in a pseudo-terminal (PTY) when available (TTY-required CLIs, coding agents)",
              "type": "boolean"
            },
            "elevated": {
              "description": "Run on the host with elevated permissions (if allowed)",
              "type": "boolean"
            },
            "host": {
              "description": "Exec host/target (auto|sandbox|gateway|node).",
              "type": "string"
            },
            "security": {
              "description": "Exec security mode (deny|allowlist|full).",
              "type": "string"
            },
            "ask": {
              "description": "Exec ask mode (off|on-miss|always).",
              "type": "string"
            },
            "node": {
              "description": "Node id/name for host=node.",
              "type": "string"
            }
          }
        }
      }
    }
  ],
  "options": {
    "num_ctx": 131072
  },
  "think": true
}

以上例子的完整版会话上下文可以在「这里」查看（文件大小 69 KB）

其中的 system prompt 部分可以在「这里」查看（文件大小 32 KB）

一个会话中，与 LLM 的交互，上下文就像是滚雪球，越滚越大，并且这个初始雪球并不小，一个 OpenClaw 新会话上下文可能就会有 13K tokens 之多

Transformer 架构的自注意力机制（Self-Attention）机制并不会削弱远距离 token 的权重，只要模型正确学到了训练数据的内在模式，提示词开头的 token 照样会对末尾的 token 生成产生影响。 但过大的上下文，会一定程度上稀释单个提示词 token 的权重，要求模型在训练阶段就已经捕抓到了远距离 token 的注意力关系，所以当上下文过大时，我们就需要考虑重置（/new）或压缩（/compact）上下文

技能 Skills#

如果你给原始人一辆车，那大概率只能看到光着膀子的原始人趴在车顶上晒太阳或躺在车底避雨。但倘若你教会他们如何驾驶这辆车，那你或许只能看见汽车飞驰而过扬起的灰尘和听到远处传来的机车轰鸣声

技能（skill）是 AI Agent 中一种可复用、模块化的能力封装，它将特定的工具、流程和指令打包成一个标准单元，让 agent 在面对相应任务时能快速调用。

Skill 本质是一份 markdown 文档（SKILL.md），可选附上相关脚本和资源文件，放在一个以 skill 名称命名的文件夹中：

skill-name/
├── SKILL.md          # 必需：元数据 + 使用说明
├── scripts/          # 可选：可执行脚本
├── references/       # 可选：参考文档
├── assets/           # 可选：模板、资源文件
└── ...               # 其他任意文件或目录

为了让 Skills 能复用在各种智能体上，目前已经形成了相关的行业标准：Agent Skills

它是 Anthropic 推出的开放标准，已广泛被各种 AI 产品所采纳（Claude Code、Cursor、GitHub Copilot、OpenClaw 等）

一个天气查询 SKILL.md 的例子

---
name: weather
description: 查询指定城市或地点的当前天气和未来预报。当用户询问'天气'、'气温'、'下雨吗'、'要不要带伞'、或任意城市名+天气时激活。支持中英文输出。
license: MIT
compatibility: 需网络访问能力（调用外部天气 API）
metadata:
  author: thea
  version: "1.0"
---

# Weather Skill

## 功能说明

根据用户提供的城市或地点，查询：
- 当前天气状况、气温、湿度、风力
- 未来 1-3 天天气预报
- 出行建议（如带伞、防晒等）

## 输入参数

| 参数 | 类型 | 必填 | 说明 |
|------|------|------|------|
| location | string | 是 | 城市或地点名称 |

## 执行流程

1. 从用户输入中解析 location（如"佛山天气" → "佛山"）
2. 调用天气 API（优先使用 wttr.in 或 Open-Meteo）
3. 将返回数据格式化为易读的中文文本
4. 附上简短的出行建议

## 输出示例

> 📍 **佛山今日天气**
> 多云，28–34°C，湿度 40%
> 东风 2 级
> 
> 💡 出行建议：今日气温较高，注意防晒。

## 注意事项

- 若城市未找到，返回："未找到该城市的天气信息"
- 若 API 超时或失败，返回："查询失败，请稍后重试"
- 默认使用摄氏度，可根据用户语言偏好调整

## 参考资料

- wttr.in: https://wttr.in/
- Open-Meteo: https://open-meteo.com/

每个 skill 解决某一类具体问题，agent 通过自然语言指令 + skill 的描述匹配来决定调用哪个 skill。

渐进式披露（Progressive disclosure）是一种上下文管理技术，为了减少 token 消耗和上下文污染。先在给 LLM 的提示词中列出每个 skill 的名称（name）和描述（description），然后让 LLM 根据上下文决定是否进一步加载某一项技能的完整文件（SKILL.md）

有时候也不是 skill 安装得越多越好的，太多 skills 的 name 和 description 也会把上下文塞满，分散 LLM 的注意力。更好的做法是，建立不同的 agent，不同的 agent 启用不同的技能，让不同的 agent 各有所长

列几个当下流行的 skills 市场：

ClawHub：OpenClaw 生态的官方 skills 市场
skills.sh：社区运营的开放 agent skills 生态
Github：可通过 npx skills add <github repos> 直接安装任意 github 代码仓库中的 /skills

Tools & MCP#

Tool（工具）是赋予 AI 模型执行外部动作或访问外部数据能力的接口。它打破了 LLM 只能生成纯文本的局限，让模型真正能与世界交互。

Tool 可以是本地命令、访问网络的命令，甚至可以是通过代码调用的外部接口。例如前面的读取本地文件和通过 curl 命令获取天气的命令。

通过代码调用外部接口时，每个 AI 应用都需要编写客户端代码。为了解决"每个 AI 应用都重复造轮子对接工具和数据"的问题， Anthropic 在 2024 年底提出 MCP 并开源。

MCP（Model Context Protocol，模型上下文协议）是一个开放协议，旨在标准化 AI 助手与外部数据源、工具之间的通信方式。

类似于 HTTP 在 Web 中的角色 —— MCP 想要成为 AI 时代的数据与工具接入的标准协议

下面是简化版的 MCP 架构

stateDiagram-v2
    direction LR

    host     : Host（AI 应用）
    mcp_cli1 : MCP Client1
    mcp_cli2 : MCP Client2
    mcp_ser1 : MCP Server1
    mcp_ser2 : MCP Server2

    %% OpenClaw 核心
    state host {
        direction LR
        mcp_cli1
        mcp_cli2
    }

    mcp_cli1 --> mcp_ser1
    mcp_cli2 --> mcp_ser2

    note left of mcp_cli1
        与 Server 维持一比一连接
    end note

    note right of mcp_ser1
        暴露工具（Tools），
        提供数据资源（Resources）
    end note

    style mcp_cli1   fill:#d9f0e0,stroke:#5a9a6e
    style mcp_cli2   fill:#d9f0e0,stroke:#5a9a6e
    style mcp_ser1   fill:#fff3cd,stroke:#d48806,stroke-width:2px
    style mcp_ser2   fill:#fff3cd,stroke:#d48806,stroke-width:2px

MCP Server 可以与 Host 部署在同一台服务器上，也可以部署到远程服务器上，不同的部署方式，MCP Client 会使用不同的传输方式（transport mode）与 MCP Server 交互。

STDIO 本地进程通信（本地部署 MCP Server）
Streamable HTTP（远程部署 MCP Server）

MCP 协议是一个有状态（stateful）的通讯协议，MCP Client 通过 initialize method 主动请求 MCP Server 创建 MCP session，MCP Server 维护 MCP session 并返回 MCP-Session-Id。

以 Streamable HTTP 传输方式为例，典型的通信时序关系

sequenceDiagram
    participant C as Client
    participant S as Server

    Note over C,S: TCP 连接建立

    C->>S: POST /mcp (method=initialize)
    Note right of S: 创建 session state<br/>生成 session_id: abc

    S-->>C: 200 OK<br/>Header: mcp-session-id: abc<br/>Body: JSON-RPC response (serverInfo, capabilities)

    Note over C,S: TCP 连接保持 (Keep-Alive) 或已断开后重建

    C->>S: POST /mcp (tools/list)<br/>Header: mcp-session-id: abc
    Note right of S: 根据 abc 找到对应 session state

    S-->>C: 200 OK<br/>Body: JSON-RPC response (tool list)

    C->>S: POST /mcp (tools/call)<br/>Header: mcp-session-id: abc
    Note right of S: 根据 abc 找到对应 session state

    S-->>C: 200 OK / SSE stream<br/>Body: JSON-RPC response (tool result)

    Note over C,S: Session 结束 (explicit DELETE 或服务器超时)

    C->>S: DELETE /mcp<br/>Header: mcp-session-id: abc
    Note right of S: 验证 abc 存在<br/>清理 session state

    S-->>C: 200 OK / 204 No Content<br/>

    Note over C,S: 服务器清理 abc 对应的 session state

Streamable HTTP = HTTP POST（客户端发请求）+ SSE（Server-Sent Events 服务器流式推送），两者结合实现了远程 MCP 通信的请求响应 + 服务端实时推送能力

MCP 基于 JSON-RPC 2.0 构建，通信来往的所有消息均为 JSON 格式。

项目中常使用的主要几类原语有：

初始化连接 initialize

请求（Request）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "initialize",
  "params": {
    "protocolVersion": "2024-11-05",
    "capabilities": {
      "roots": {
        "listChanged": true
      },
      "sampling": {}
    },
    "clientInfo": {
      "name": "ExampleClient",
      "version": "1.0.0",
    }
  }
}

响应（Response）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "protocolVersion": "2024-11-05",
    "capabilities": {
      "logging": {},
      "prompts": {
        "listChanged": true
      },
      "resources": {
        "subscribe": true,
        "listChanged": true
      },
      "tools": {
        "listChanged": true
      }
    },
    "serverInfo": {
      "name": "ExampleServer",
      "version": "1.0.0",
  }
}

读取 Prompt 列表 prompts/list

请求（Request）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "prompts/list",
  "params": {
    "cursor": "optional-cursor-value"
  }
}

响应（Response）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "prompts": [
      {
        "name": "code_review",
        "description": "Asks the LLM to analyze code quality and suggest improvements",
        "arguments": [
          {
            "name": "code",
            "description": "The code to review",
            "required": true
          }
        ]
      }
    ],
    "nextCursor": "next-page-cursor"
  }
}

读取某个 Prompt prompts/get

请求（Request）：

{
  "jsonrpc": "2.0",
  "id": 2,
  "method": "prompts/get",
  "params": {
    "name": "code_review",
    "arguments": {
      "code": "def hello():\n    print('world')"
    }
  }
}

响应（Response）：

{
  "jsonrpc": "2.0",
  "id": 2,
  "result": {
    "description": "Code review prompt",
    "messages": [
      {
        "role": "user",
        "content": {
          "type": "text",
          "text": "Please review this Python code:\ndef hello():\n    print('world')"
        }
      }
    ]
  }
}

读取资源列表 resources/list

请求（Request）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "resources/list",
  "params": {
    "cursor": "optional-cursor-value"
  }
}

响应（Response）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "resources": [
      {
        "uri": "file:///project/src/main.rs",
        "name": "main.rs",
        "description": "Primary application entry point",
        "mimeType": "text/x-rust"
      }
    ],
    "nextCursor": "next-page-cursor"
  }
}

读取某个资源 resources/read

请求（Request）：

{
  "jsonrpc": "2.0",
  "id": 2,
  "method": "resources/read",
  "params": {
    "uri": "file:///project/src/main.rs"
  }
}

响应（Response）：

{
  "jsonrpc": "2.0",
  "id": 2,
  "result": {
    "contents": [
      {
        "uri": "file:///project/src/main.rs",
        "mimeType": "text/x-rust",
        "text": "fn main() {\n    println!(\"Hello world!\");\n}"
      }
    ]
  }
}

读取工具列表 tools/list

请求（Request）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/list",
  "params": {
    "cursor": "optional-cursor-value"
  }
}

响应（Response）：

{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "tools": [
      {
        "name": "get_weather",
        "description": "Get current weather information for a location",
        "inputSchema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "City name or zip code"
            }
          },
          "required": ["location"]
        }
      }
    ],
    "nextCursor": "next-page-cursor"
  }
}

调用某个工具 tools/call

请求（Request）：

{
  "jsonrpc": "2.0",
  "id": 2,
  "method": "tools/call",
  "params": {
    "name": "get_weather",
    "arguments": {
      "location": "New York"
    }
  }
}

响应（Response）：

{
  "jsonrpc": "2.0",
  "id": 2,
  "result": {
    "content": [
      {
        "type": "text",
        "text": "Current weather in New York:\nTemperature: 72°F\nConditions: Partly cloudy"
      }
    ],
    "isError": false
  }
}

MCP 2024-11-05 版本的完整 Features 列表

Server 提供:

notifications/prompts/list_changed
notifications/resources/list_changed
notifications/resources/updated
notifications/tools/list_changed
notifications/message
notifications/progress
prompts/list
prompts/get
resources/list
resources/read
resources/templates/list
resources/subscribe
resources/unsubscribe
tools/list
tools/call
completion/complete
logging/setLevel

Client 提供:

notifications/roots/list_changed
roots/list
sampling/createMessage

MCP Server 的 Prompts、Resources、Tools 三种能力是开放给 AI 应用的不同控制域的

Prompts：用户控制（User-controlled）
Resources：应用控制（Application-controlled）
Tools：模型控制（Model-controlled）

它们描述的是谁有权触发/调用对应的能力，本质上是权限与控制权的分层。

stateDiagram-v2
    direction LR

    human : 人类（用户）
    host  : Host（AI 应用）
    llm   : 大语言模型（LLM）

    state host {
        llm
    }

    human --> host

    note left of human
        「用户控制」：
        用户主动选择 Prompts
    end note

    note left of host
        「应用控制」：
        应用程序决定何时读取 Resources
    end note

    note right of llm
        「模型控制」：
        模型自主判断调用某个 Tool
    end note

    style human fill:#f0f8ff,stroke:#666,stroke-width:1px
    style llm fill:#ffdd57,stroke:#333,stroke-width:2px

MCP 已经是事实上的行业标准，是智能体与外部系统间的“通用语言”

会话 Sessions#

在上一篇文章的上下文长度章节中，我们提到了每一个 LLM 都是有上下文长度限制。

每一轮对话，都会附加到对话历史列表中，整个对话列表组成一个会话（session）。

随着对话的进行，不断滚大的会话终有到达模型上下文长度上限的时候，所以会话是有生命周期的。

会话的状态可以分为：

Running：活跃状态，随时可以接着继续聊
Stopped：已归档，留档一段时间
Deleted：已删除，释放存储空间

因为会话只是多轮对话的集合，所以是可以同时开启多个会话，每个会话聚焦不同的任务。

以 OpenClaw 来举例，每一个 agent 的每一个渠道（Channel），例如飞书、QQ、微信，都可以对应一个隔离的活跃会话。

需要关注会话当前的的上下文水位，当一个会话的任务已结束，随手打开一个新的会话而不是在原有会话继续聊是个好习惯，既能减少 token 消耗，也可避免上下文信息污染。

以 OpenClaw 来举例，可以通过 /status 这个 slash command 来查看当前会话的的上下文水位。如果超过 60% 了，可以通过 /compact 压缩，或 /new 另起一个新的会话

记忆 Memory#

会话是有生命周期的，一旦关闭，前面所有的聊天历史都会消失，大模型对你的记忆回归为一张白纸。

前面提到 OpenClaw 的 IDENTITY.md、SOUL.md、USER.md 等文件，可以理解为记忆的一部分。

但它们是相对静止的，不会随着你与大模型的交互而累积，大模型不会变得越来越懂你。

记忆和自我进化，是智能体的核心能力，常见的做法是：

从会话中提取记忆，在会话中学习技能

flowchart LR
    A["💬 <b>会话</b><br/>模型与人类、与工具的互动"]
    B["🧠 <b>记忆</b><br/>从会话中提取记忆"]
    C["⚙️  <b>技能</b><br/>在会话中学习技能"]

    A --> B
    A --> C

    style A fill:#f0f8ff,stroke:#1890ff,stroke-width:2px,rx:12
    style B fill:#fff0f6,stroke:#eb2f96,stroke-width:2px,rx:12
    style C fill:#f6ffed,stroke:#52c41a,stroke-width:2px,rx:12

    linkStyle 0 stroke:#ccc,stroke-width:2px
    linkStyle 1 stroke:#ccc,stroke-width:2px

OpenClaw 当前不支持自动从会话中提取技能，有另外一款智能体 Hermes Agent 以拥有自我提升机制而闻名

记忆的提出并传递到下一轮会话过程是这样的：

flowchart LR
    A["💬 <b>老会话</b><br/>"]
    B["🧠 <b>短期记忆</b><br/>每日笔记<br/>memory/YYYY-MM-DD.md"]
    C["🧠 <b>长期记忆</b><br/>MEMORY.md"]
    D["💬 <b>新会话</b><br/>"]

    A e1@--会话结束/会话压缩--> B
    B e2@--晚上做梦（Dreaming）--> C
    A e3@--晚上做梦（Dreaming）--> C
    C e4@-.注入.-> D
    B e5@-.注入.-> D

    style A fill:#f0f8ff,stroke:#1890ff,stroke-width:2px,rx:12
    style B fill:#fff0f6,stroke:#eb2f96,stroke-width:2px,rx:12
    style C fill:#fff0f6,stroke:#eb2f96,stroke-width:2px,rx:12
    style D fill:#fff7e6,stroke:#1890ff,stroke-width:2px,rx:12

    e1@{ animate: true }
    e2@{ animate: true }
    e3@{ animate: true }
    e4@{ animate: true }
    e5@{ animate: true }

OpenClaw 当前使用做梦机制（Dreaming）提取记忆，它有三个阶段（类人设计）：

轻睡眠阶段（Light Phase）：去重、归类，生成候选行
快速眼动睡眠阶段（REM Phase）：提取模式，生成反思摘要
深度睡眠阶段（Deep Phase）：追加写入短期记忆和长期记忆文件

结语#

包括 OpenClaw 在内的所有 agent 本质上只是把大语言模型这个大脑关在笼子里面，然后去驾驭它。所不同的是，有些智能体产品更加激进，敢于给 agent 授权，给它更多的空间，而有些相对节制，严格控制权限，如此而已。

例如相比 Claude Code、Copilot、Codex、OpenCode 等 AI coding agent，OpenClaw 释放给了更多的权限给智能体，让它自由掌控一整个操作系统，调用任何命令。同时打通了流行的 IM 软件，让用户随时随地可以通过对话的方式指挥智能体执行任务，极大地降低了使用门槛。另外，它支持后台运行，可配置心跳与定时任务，实现了无人值守的自动化。其它方面与一般的 agent 无异。由于大模型存在幻觉和随机特性，这种做法其实存在安全隐患，也会有稳定性问题的。

OpenClaw 更像一个操作系统，它可以自我运行，随时访问。而 Claude Code、OpenCode 等更像是一个工具，但是它们离变成操作系统也只有一步之遥，只需要变成后台运行、添加更多的访问入口即可（事实上它们已经开始这么做了）。

不过无论怎样，智能体生态已经慢慢形成开放标准，例如 MCP、Agent Skills、AGENTS.md。所有这些 agent 正在趋于同化。

其实大语言模型厂商也没闲着，它们除了在提高模型性能、扩充上下文长度之外，也在逐渐植入 agent 的能力，比如工具调用、缓存上下文，所以大语言模型平台和通用智能体之间的界限也在逐渐变得模糊。

另一方面，拥有行业数据的企业，其业务能力是这一波 AI 冲击的护城墙，就看 AI 能不能强大到可以越过城墙，从高空俯视，直接实施降维打击。但倘若垂直行业能主动拥抱 AI，把业务结合 AI 重构起来，那会是另外一种结局。

AI 的本质是效率放大器，而非凭空创造价值，唯有深耕业务、精进认知，再结合 AI 技术赋能，才能实现更大的价值。简单来说，业务与认知是前面的 1，AI 是后面的 0

以上虽然以 OpenClaw 为例子，但实际讲得是 AI 智能体工程的技术方法。

即使 OpenClaw 的定位是本地 AI 助手，但它同时也是当前 AI 智能体工程领域第一梯队的实战应用，

开源与开放的架构，让 OpenClaw 更具学习与研究价值，

其设计思想与方法论可迁移至我们的业务流程，交叉学习、触类旁通是我写本文的初心。