DoneHub

TrendRadar：告别无效刷屏，只看真正关心的新闻

2026-05-15T16:00:00.000Z

一、背景

每天打开手机，十几个 APP 轮番刷一遍，微博热搜、知乎热榜、抖音热点、今日头条……刷完一圈下来，两个小时过去了，真正有用的信息可能就三五条。剩下的是什么？震惊体标题党、营销软文、明星八卦、各种算法硬塞给你的”你可能感兴趣”。

更气人的是，明明只想看看科技圈今天发生了什么，却被”某明星离婚”霸占了热搜第一。平台算法绑架了我们的注意力，想看的内容找不到，不想看的铺天盖地。

有没有一种工具，能帮你从”被动接收”变成”主动获取”？TrendRadar 就是这么一个开源项目——聚合全网热点，按你的关键词筛选，定时推送到你的手机。更重要的是，它还能让 AI 帮你分析这些热点背后的趋势和情绪。

二、TrendRadar 是什么

一句话概括：TrendRadar 是一个开源的热点新闻聚合分析工具。

它的核心思路很简单——把全网 50+ 个平台的热榜抓过来，按你设定的关键词过滤，把真正关心的内容推给你。推送渠道也很丰富：飞书、钉钉、企业微信、Telegram、邮件、Bark（iOS）、Slack，甚至自定义 Webhook。

更厉害的是，它内置了 AI 分析功能。不仅是聚合热点，还能让 AI 帮你：

分析热点趋势走向
判断舆论情绪（正面/负面/争议）
跨平台关联分析
生成洞察报告

这就像雇了一个私人新闻助理，每天帮你从海量信息中提炼出真正有价值的干货。

三、数据是怎么来的

TrendRadar 的数据来源是另一个开源项目 NewsNow。这个项目聚合了全网 50+ 个平台的热榜数据，包括：

国内综合	科技平台	金融平台	国际媒体
知乎、微博	IT之家、36氪	华尔街见闻	Hacker News
百度热搜	稀土掘金	财联社	GitHub Trending
抖音、今日头条	V2EX	雪球	Product Hunt
澎湃新闻、凤凰网	酷安	金十数据	联合早报
虎扑、贴吧	少数派	格隆汇	卫星通讯社

NewsNow 通过调用各平台的官方 API 或爬取页面来获取热榜数据，然后统一输出成标准格式。TrendRadar 直接调用 NewsNow 的公开 API：

1	https://newsnow.busiyi.world/api/s?id=zhihu&latest

返回的数据格式是这样的：

{
  "status": "success",
  "items": [
    {
      "title": "如何评价DeepSeek新模型?",
      "url": "https://zhuanlan.zhihu.com/p/xxx",
      "extra": {
        "info": "1234万热度",
        "hover": "摘要描述..."
      }
    }
  ]
}

所以 TrendRadar 不需要自己去啃各平台的反爬机制，数据源维护这个苦活儿由 NewsNow 项目负责。万一某个平台接口变了，NewsNow 更一下就行，TrendRadar 用户完全不用操心。

四、核心功能一览

热榜聚合

默认支持 11 个主流平台：知乎、微博、百度热搜、抖音、今日头条、B站热搜、华尔街见闻、财联社、澎湃新闻、凤凰网、贴吧。想加更多平台？直接在配置文件里加就行。

关键词筛选

这是核心功能。你在 frequency_words.txt 里写上关心的关键词，系统就只推送包含这些词的新闻。语法很灵活：

# 最简单的：直接写关键词
华为

# 多个关键词归为一组（空行分隔）
华为
鸿蒙
任正非

# 给词组起个名字
[科技巨头]
华为
腾讯
字节

# 正则匹配（精确匹配英文单词，避免误匹配）
/\bAI\b/ => AI相关
人工智能

# 排除不想看的
[苹果公司]
苹果
!水果        # 排除"水果"相关的

# 限制显示条数
特斯拉
@10          # 最多显示10条

# 必须同时包含多个词
+发布会
+新品        # 必须同时出现"发布会"和"新品"

AI 智能筛选（新功能）

如果你不想自己写关键词，可以用 自然语言描述 你关注的方向。在 ai_interests.txt 里写：

下面是我要关注的内容：

1. 中国科技与互联网公司：重点关注 DeepSeek、华为、腾讯...
2. 大模型与 AI 产品：关注 OpenAI、Claude、ChatGPT...
3. AI 基础设施与云算力：关注英伟达、AMD...
4. 芯片与半导体制造：关注芯片、光刻机...
...

# 标题质量要求
- 不要标题党/震惊体
- 不要营销软文

AI 会自动理解你的兴趣，给每条新闻打分，只推送高相关度的内容。这个功能需要配置 AI API（支持 DeepSeek、OpenAI、Gemini 等）。

三种推送模式

模式	说明	适用人群
daily（当日汇总）	每天定时推送当天所有匹配新闻	企业管理者、普通用户
current（当前榜单）	每次推送当前榜单匹配新闻	自媒体人、内容创作者
incremental（增量监控）	只推送新出现的内容，零重复	投资者、交易员

举个例子：你监控”特斯拉”，每小时执行一次。如果选择 incremental 模式，只有第一次出现的新闻才会推送给你，后续重复出现的就不打扰了。适合高频监控场景。

调度系统（时间线）

你可以精细控制”什么时间做什么事”。比如：

工作日：早上9点速览、中午看热点、晚上7点汇总
周末：睡到自然醒，10点开始推送，有新增就推

预设了 5 种模板：always_on（全天候）、morning_evening（早晚汇总）、office_hours（办公时间）、night_owl（夜猫子）、custom（完全自定义）。

AI 分析推送

开启后，每次推送都会附带一份 AI 生成的洞察报告，包含：

核心热点态势
舆论风向争议
异动与弱信号
研判策略建议

AI 还能分析每条新闻的排名变化轨迹、热度持续时间、跨平台表现。比如某条新闻在微博排第3，知乎排第5，抖音排第8——AI 能告诉你这个话题的”全网热度分布”。

AI 多语言翻译

如果你订阅了海外 RSS（如 Hacker News），AI 可以帮你把英文标题翻译成中文。反过来，如果你想用英文读国内热点，也可以翻译成英文。

MCP 智能分析（进阶功能）

这是给深度用户准备的。TrendRadar 实现了 MCP (Model Context Protocol) 协议，可以接入 Claude Desktop、Cherry Studio、Cursor 等 AI 客户端。

你可以用自然语言跟新闻数据”对话”：

"分析过去一周 DeepSeek 的热度变化"
"对比知乎和微博今天的热点差异"
"生成一份今天的科技热点摘要，推送到飞书"
"搜索特斯拉相关新闻，分析情感倾向"

AI 会自动调用 TrendRadar 的 21 个分析工具，帮你做深度数据挖掘。

五、部署方式

GitHub Actions（零服务器）

适合没有服务器的用户。流程是：

Fork TrendRadar 仓库到自己的 GitHub
配置 GitHub Secrets（填推送渠道的 webhook URL）
GitHub Actions 定时运行，自动抓取并推送

缺点是每次运行完环境就销毁，数据没法本地存。需要配置云存储（如 Cloudflare R2）来持久化数据。

Docker（推荐）

适合有服务器、NAS 或长期运行电脑的用户。数据本地存储，更稳定。

# 克隆项目
git clone https://github.com/sansan0/TrendRadar.git
cd TrendRadar

# 配置
cp config/config.yaml.example config/config.yaml
# 编辑 config.yaml 和 frequency_words.txt

# 启动
docker compose up -d

Docker 部署还有个好处：可以同时跑两个容器——一个做新闻推送，一个做 MCP AI 分析服务。

本地运行

Windows/Mac/Linux 直接跑：

# Windows
setup-windows.bat

# Mac/Linux
./setup-mac.sh

# 运行
python main.py

六、配置要点

config.yaml 主配置

这是核心配置文件，结构如下：

app:
  timezone: "Asia/Shanghai"        # 时区

schedule:
  enabled: true
  preset: "morning_evening"        # 调度模板

platforms:
  enabled: true
  sources:                         # 监控平台列表
    - id: "zhihu"
      name: "知乎"
    - id: "weibo"
      name: "微博"

report:
  mode: "incremental"              # 推送模式
  display_mode: "keyword"          # 显示方式

filter:
  method: "keyword"                # keyword | ai

notification:
  enabled: true
  channels:
    feishu:
      webhook_url: ""
    telegram:
      bot_token: ""
      chat_id: ""

ai:
  model: "deepseek/deepseek-chat"  # AI 模型
  api_key: ""                      # API Key

ai_analysis:
  enabled: true                    # 开启 AI 分析
  max_news_for_analysis: 50        # 分析数量上限

ai_translation:
  enabled: true
  language: "中文"

frequency_words.txt 关键词配置

前面已经介绍过语法，这里补充几个实用技巧：

技巧1：从宽到严，逐步调整

刚开始可以写宽泛的关键词，观察几天后再加过滤词：

# 第一版：先测试
AI
ChatGPT

# 第二版：发现太多广告，加过滤
AI
ChatGPT
!培训
!课程
!广告

# 第三版：只想看技术相关，加必须词
AI
ChatGPT
+技术

技巧2：正则表达式精确匹配英文

英文容易误匹配，比如 ai 会匹配到 training 里的 ai。用正则解决：

# 精确匹配独立单词
/\bAI\b/i => AI相关

# 匹配开头或结尾
/^breaking/     # 只匹配开头是 breaking 的
/发布$/         # 只匹配结尾是"发布"的

不会写正则？直接问 ChatGPT：”帮我写一个正则表达式，精确匹配英文单词 AI，不匹配 training 里的 ai，格式是 /正则/ => 别名”

技巧3：全局过滤不想看的

有些内容不管什么关键词都不想看，用 [GLOBAL_FILTER]：

[GLOBAL_FILTER]
震惊
刚刚
竟然
广告
推广

[WORD_GROUPS]
你的关键词配置...

推送渠道配置

企业微信（最简单）：

打开企业微信，进入目标群聊
点击右上角”…”，选择”群机器人”
添加机器人，复制 Webhook URL
填入配置或 GitHub Secrets

飞书：

访问 https://botbuilder.feishu.cn/home/my-command
新建机器人指令
选择”Webhook 触发”，复制 URL

配置参数模板：

{
  "message_type": "text",
  "content": { "text": "{{内容}}" }
}

Telegram：

需要两个配置：bot_token 和 chat_id。

在 Telegram 搜索 @BotFather，发送 /newbot 创建机器人
获取 Bot Token
向你的机器人发一条消息
访问 https://api.telegram.org/bot/getUpdates
从返回 JSON 找到 chat.id

邮件：

支持 Gmail、QQ邮箱、163、Outlook 等。QQ邮箱需要用授权码（不是密码），在邮箱设置里开启 SMTP 服务后生成。

七、实际使用体验

我部署了一套配置，关键词设为：AI、DeepSeek、华为、特斯拉、芯片、大模型。推送模式选 incremental，调度选 morning_evening。

效果是这样的：

早上 9 点：收到推送，包含昨晚到今早新出现的 15 条相关热点。AI 分析报告附在最后，告诉我”AI 领域今天舆论偏正面，DeepSeek 新模型发布引发热议，华为鸿蒙讨论度上升”。

晚上 8 点：收到当日汇总，包含全天所有匹配新闻（去重后约 30 条）。AI 给了一份更完整的趋势分析，包括”哪些话题持续在榜”、”哪些是新爆发点”。

好处：

不用刷 APP 了。之前每天刷微博知乎抖音至少两小时，现在 5 分钟看完推送就行。
信息密度高。一条推送包含 11 个平台的热点，跨平台对比一目了然。
AI 分析有价值。不是简单的汇总，而是告诉你趋势、情绪、关联。比如”特斯拉降价”这个话题，AI 能分析出”微博讨论偏负面（吐槽割韭菜），知乎讨论偏中性（分析影响），抖音讨论偏正面（喊降价真香）”。

注意点：

关键词不要太多。我刚开始写了 30 多个关键词，结果每次推送 100 多条，信息过载。后来精简到 6 个核心关键词，效果好多了。
AI 分析有成本。默认模型是 DeepSeek，很便宜。按官方估算，每小时推送一次，每天约 0.1 元。如果想省钱，可以把 max_news_for_analysis 从 150 降到 50。
GitHub Actions 有延迟。定时任务触发时间不稳定，可能有 ±15 分钟偏差。如果需要精准推送，建议用 Docker 部署到自己的服务器。

八、MCP 功能进阶用法

如果你想深度挖掘新闻数据，MCP 功能很有价值。

配置 MCP 客户端

以 Cherry Studio 为例（推荐，有 GUI）：

运行 TrendRadar 的 MCP 服务：

# Windows
start-http.bat

# Mac/Linux
./start-http.sh

在 Cherry Studio 设置里添加 MCP 服务器：
- 类型：streamableHttp
- URL：http://127.0.0.1:3333/mcp
开始对话。

MCP 可以做什么

趋势分析：

1	"分析最近 7 天 DeepSeek 的热度变化"

AI 会调用 analyze_topic_trend 工具，返回：

首次出现时间、持续时间
排名变化曲线（第3→第1→第5）
热度峰值、爆火判断
趋势预测

平台对比：

1	"对比知乎和微博今天关于 AI 的讨论差异"

AI 会对比两个平台的热点分布、情绪倾向、讨论角度差异。

情感分析：

1	"分析特斯拉最近新闻的情感倾向"

返回正面/负面/中性分布，以及典型情感关键词。

生成报告并推送：

1	"写一份今天的科技热点摘要，推送到飞书"

AI 会调用 generate_summary_report 生成报告，然后调用 send_notification 推送。自动处理格式转换（Markdown → 飞书格式）。

MCP 工具列表

分类	工具	功能
基础	`get_latest_news`	获取最新新闻
	`get_news_by_date`	按日期查询
	`get_trending_topics`	热点统计
RSS	`get_latest_rss`	RSS 内容
	`search_rss`	RSS 搜索
搜索	`search_news`	统一搜索
	`find_related_news`	相似新闻
分析	`analyze_topic_trend`	趋势分析
	`analyze_sentiment`	情感分析
	`aggregate_news`	跨平台聚合
	`compare_periods`	时期对比
	`generate_summary_report`	生成报告
通知	`send_notification`	推送消息
文章	`read_article`	读取正文

总共 21 个工具，覆盖了从查询到分析到推送的全流程。

九、数据存储

TrendRadar 的数据存储在 SQLite 数据库，按日期分库：

output/
├── news/
│   ├── 2025-05-16.db    # 当天热榜数据
│   ├── 2025-05-15.db    # 历史数据
├── rss/
│   ├── 2025-05-16.db    # RSS 数据
└── html/
    └── 当日汇总.html     # HTML 报告

数据库表结构设计得很好：

news_items：存储新闻条目（标题、URL、排名）
rank_history：记录排名变化历史（每次抓取的排名）
crawl_records：记录抓取时间和数量

这样设计的好处是可以追踪热度变化轨迹。比如某条新闻早上排第 5，中午排第 3，晚上掉到第 10——这些变化都会被记录下来，供 AI 分析。

十、与其他工具对比

工具	TrendRadar	RSS 阅读器	热榜网站
数据源	50+ 平台热榜	RSS订阅源	单一或少量平台
筛选方式	关键词+AI	手动订阅	无筛选
推送	多渠道	需额外工具	无推送
AI 分析	内置	无	无
趋势追踪	有	无	无
部署复杂度	中	低	无需部署

TrendRadar 的优势在于：聚合 + 筛选 + 分析 + 推送 一条龙。RSS 阅读器适合订阅特定博客，热榜网站适合快速浏览，但都没有 AI 分析和自动推送。

十一、项目地址和资源

GitHub：https://github.com/sansan0/TrendRadar
可视化配置编辑器：https://sansan0.github.io/TrendRadar/
NewsNow 数据源：https://github.com/ourongxing/newsnow

项目维护得很活跃，版本迭代快（从 v1.0 到 v6.7），文档也很详细。有问题可以去 GitHub Issues 提，作者回复很及时。

十二、总结

TrendRadar 解决的问题是：如何从信息洪流中高效获取有价值的内容。

它不是简单的热榜聚合，而是：

用关键词/AI筛选过滤噪音
用多渠道推送直达手机
用AI分析提供深度洞察
用MCP协议支持自定义数据挖掘

如果你每天花大量时间刷 APP 看热点，却总觉得信息过载、抓不住重点——试试 TrendRadar。部署一次，配置好关键词，之后就等着推送敲门，看完推送就完事。

从”被动接收算法推荐”变成”主动获取关心内容”，这才是高效的信息消费方式。

存储芯片双雄：DRAM与NAND Flash全景解析

2026-05-13T16:00:00.000Z

一、背景

2026年，AI浪潮席卷全球，最近都被这些新闻刷频了：

“三星市值突破新高，HBM订单排到明年”
“海力士股价暴涨，成英伟达最大HBM供应商”
“美光宣布HBM3e量产，AI存储竞争白热化”
“长鑫存储融资成功，中国DRAM再获突破”

作为科技爱好者，你可能会有很多困惑：

内存条、固态硬盘、HBM… 到底都是什么？
为什么AI训练需要HBM，而不是普通内存条？
三星、海力士、美光、长鑫、长江存储… 各家到底做什么？

这篇文章，用两个视角帮你彻底理清：DRAM和NAND Flash——存储芯片世界的两大支柱。

二、第一视角：DRAM

一、DRAM是什么？

DRAM = Dynamic Random Access Memory，中文叫”动态随机存取存储器”。

通俗理解：DRAM就是你电脑上的”临时工作台”。

你在用Word写文档：
硬盘（SSD）── 长期保存文件，断电后还在
     ↓ 打开文件时加载
内存条（DRAM）── 临时存放正在编辑的内容，断电就没了
     ↓ CPU随时读取
CPU ── 处理文字、格式、排版

忘记保存就断电？文件没了。因为DRAM里的数据瞬间清空。

二、为什么叫”动态”？

这是DRAM与其他内存技术最大的区别：数据需要不断”刷新”才能保持。

DRAM的存储单元 = 1个电容 + 1个晶体管

电容充电 = 存储"1"
电容放电 = 存储"0"

问题：电容会自然漏电，电荷慢慢流失
      几毫秒后，数据就没了

解决：每隔几毫秒"刷新"一次
      把电荷补回去，数据才能保持

这就是”动态”的含义：数据不是静态保存的，需要动态、持续地刷新。

对比一下SRAM（静态随机存取存储器）：

特性	DRAM	SRAM
存储单元	1电容+1晶体管	6个晶体管
需要刷新	✅ 必须周期刷新	❌ 不需要
密度	高（结构简单）	低（结构复杂）
容量	大（单芯片可达16GB）	小（通常几KB到几MB）
成本	便宜	贵
应用	内存条、手机内存	CPU缓存（L1/L2/L3）

一句话：DRAM性价比高，适合做大容量内存；SRAM性能好但贵，只做CPU内部的小缓存。

三、DRAM的核心特点

特点	说明
易失性	断电后数据立即丢失
需要刷新	每隔几毫秒必须刷新，否则数据消失
速度快	读写速度远快于硬盘
密度高	单芯片可存储大量数据
成本低	每GB价格相对便宜

四、DRAM产品家族

都属于DRAM技术，但针对不同场景优化：

产品	特点	用途	带宽	代表厂商
DDR4/DDR5	标准内存条	PC、服务器	~25GB/s	三星/海力士/美光/长鑫
LPDDR4/LPDDR5	低功耗版	手机、平板	~60GB/s	三星/海力士/美光/长鑫
HBM/HBM3e	堆叠高带宽	AI训练GPU	~1TB/s+	三星/海力士/美光
GDDR6/GDDR7	显卡显存	游戏显卡	~160GB/s	三星/海力士/美光
Server DRAM	服务器专用	数据中心	~50GB/s	三星/海力士/美光/长鑫
Mobile DRAM	移动端定制	智能穿戴、IoT	~10GB/s	各厂商均有

五、重点解读：HBM为什么是AI的命门

普通内存条有个致命瓶颈：带宽不够。

1 2	普通内存条：单通道带宽约 25GB/s（DDR5-6400） AI训练需求：几百 GB/s 甚至 TB/s 级别

GPU（如英伟达H100）算力极强，但数据喂不进去——传统内存条成了瓶颈。

HBM的解决方案：垂直堆叠

传统内存条：
┌───┐
│芯片│ ← 平铺在PCB上，信号要走很远
└───┘

HBM：
┌─────┐
│芯片8│ ↑
├─────┤ │ 垂直堆叠8-12层
│芯片7│ │ 通过TSV（硅通孔）连接
│ ... │ │ 路径极短，速度极快
└──┬──┘ ↓
   └── GPU芯片（紧邻封装）

核心技术：

技术	作用
TSV（硅通孔）	在芯片上打微孔，垂直导通
3D堆叠	8层、12层DRAM芯片叠在一起
CoWoS封装	把HBM和GPU封装在同一块硅中介层上

性能对比：

类型	带宽	应用
DDR5内存条	~25GB/s	电脑、服务器
HBM3	~1TB/s	AI训练GPU
HBM3e	~1.5TB/s+	最先进AI芯片

这就是为什么英伟达H100价格3万美元起步——HBM成本占了很大比例。

六、DRAM厂商格局

全球市场份额（2025年Q1）：

排名	厂商	国家	份额	趋势	技术水平
1	三星电子	韩国	~40-41%	↓略降	最领先
2	SK海力士	韩国	~28-29%	↑上升	HBM领先
3	美光科技	美国	~23-24%	稳定	一流
4	长鑫存储	中国	~5-6%	↑上升	追赶中
5	南亚科技	中国台湾	~2%	稳定	中端
6	华邦电子	中国台湾	~1%	稳定	中低端
7	力积电	中国台湾	<1%	稳定	代工

三巨头控制93%+市场

2025年关键变化：

海力士份额上升：HBM业务驱动，成英伟达最大HBM供应商
长鑫份额上升：从3-5%提升到5-6%，国产替代加速
三星份额略降：战略转向高利润HBM，减少低端产能

技术能力矩阵：

厂商	DDR5	LPDDR5X	HBM3e	GDDR7	制程
三星	✅	✅	✅	✅	12nm
海力士	✅	✅	✅领先	✅	12nm
美光	✅	✅	✅	✅	12nm
长鑫	✅	✅	❌	❌	17nm
南亚科	✅	❌	❌	❌	20nm
华邦	❌	❌	❌	❌	25nm

中国现状：长鑫存储是中国大陆唯一的DRAM厂商，2016年成立，填补了国内空白。目前主攻DDR4/DDR5、LPDDR4/LPDDR5，HBM仍在研发阶段。

日本现状：日本已无DRAM厂商。曾经的霸主尔必达2012年破产被海力士收购，日本DRAM产业终结。

三、第二视角：NAND Flash

一、NAND Flash是什么？

NAND Flash，中文叫”NAND闪存”，是一种非易失性存储器。

通俗理解：NAND Flash就是你电脑的”永久仓库”。

你的手机：
RAM（DRAM）8GB ── 运行APP时临时用，断电清空
存储（NAND）128GB ── 保存照片、APP、文件，断电后还在

你的电脑：
内存条（DRAM）16GB ── 正在运行的程序
固态硬盘（NAND）512GB ── 系统、软件、所有文件

核心特点：断电后数据不会丢失，可以长期保存。

二、为什么叫”NAND”和”闪存”

NAND是逻辑门电路的名字（Not AND），用这种结构的晶体管阵列存储数据，所以叫NAND Flash。

“闪存”的由来：

传统EEPROM：擦除需要几秒
NAND Flash：擦除只需几毫秒

像"闪光"一样快 → Flash Memory（闪存）

三、工作原理

NAND存储单元 = 浮栅晶体管

┌─────────────────┐
│ 浮栅            │ ← 电子被困在这里
│  有电子 = 存储"0"│    不会跑掉
│  无电子 = 存储"1"│
└─────────────────┘

写入：把电子注入浮栅（高压）
擦除：把电子从浮栅拉出来（更高电压）
读取：检测浮栅是否有电子

关键点：电子被困在浮栅里，没有电源也能长期保存——这就是”非易失性”的原因。

四、NAND Flash的核心特点

特点	说明
非易失性	断电后数据保留
不需要刷新	与DRAM不同，写入后自然保持
密度高	单芯片容量远超DRAM
有擦写寿命	每个单元可擦写几千到几万次
速度较慢	比DRAM慢，但比机械硬盘快很多

五、NAND分类（按每单元存储位数）

类型	全称	每单元存储	特点	寿命	应用
SLC	Single-Level Cell	1 bit	最快、最耐用、最贵	10万次	企业/军工
MLC	Multi-Level Cell	2 bit	平衡性能与成本	3000-1万次	高端消费
TLC	Triple-Level Cell	3 bit	主流选择，性价比高	500-3000次	消费级SSD
QLC	Quad-Level Cell	4 bit	便宜但慢	100-1000次	大容量存储

简单理解：
SLC = 每格只放1个东西，空间利用率低，但耐用快速
TLC = 每格塞3个东西，空间利用率高，但慢一些
QLC = 每格塞4个东西，最便宜，但寿命最短

六、3D NAND：垂直堆叠技术

传统NAND是平铺的，容量有限。现代技术把存储单元垂直堆叠：

传统2D NAND：
┌──┐ ┌──┐ ┌──┐ ┌──┐ ← 平铺在一层

3D NAND：
┌──┐
│232│ ↑ 垂直堆叠
├──┤ │ 像盖楼房一样
│...│ │ 同样面积，容量翻倍
└──┘ ↓

主流3D NAND层数：

厂商	最高层数
三星	236层
海力士	238层
美光	232层
长江存储	232层（Xtacking技术）

七、长江存储的独创技术：Xtacking

传统3D NAND：
┌─────────────────┐
│ 存储单元+外围电路 │ ← 同一片晶圆上制造
│    叠在一起      │    层数增加会互相干扰
└─────────────────┘

Xtacking架构：
┌──────────┐   ┌──────────┐
│ 存储单元  │ ←→ │ 外围电路  │ ← 两片晶圆分别制造
│（垂直堆叠）│   │（高速逻辑）│   再键合在一起
└──────────┘   └──────────┘

优势：存储密度更高、I/O速度更快、制造效率更高。

八、NAND Flash产品家族

产品	特点	用途	速度
SSD固态硬盘	大容量高速存储	电脑硬盘	3-7GB/s
UFS	高速嵌入式存储	中高端手机	~4GB/s
eMMC	集成控制器，成本低	低端手机/IoT	~400MB/s
SD卡/TF卡	可插拔便携	相机/无人机	~100MB/s
USB闪存盘	便携通用	数据传输	~100MB/s

九、NAND Flash厂商格局

全球市场份额（2025年）：

排名	厂商	国家	份额	趋势	技术水平
1	三星电子	韩国	~35-38%	稳定	最领先
2	凯侠	日本	~15-18%	稳定	一流（2024年IPO）
3	西部数据	美国	~12-15%	稳定	一流（与凯侠合资）
4	SK海力士	韩国	~12-15%	↑上升	一流（含Solidigm）
5	美光科技	美国	~10-12%	稳定	一流
6	长江存储	中国	~5-8%	受限	接近一流

三星+凯侠+西数+海力士控制80%+市场

2025年关键变化：

凯侠完成IPO：2024年底上市，获得资金扩张
西部数据拆分：计划将SanDisk业务独立分拆
长江存储受限：美国制裁持续，全球份额增长受阻，但国内市场稳步发展

中国现状：长江存储是中国最大的NAND Flash厂商，技术水平与国际差距较小，232层Xtacking技术已接近第一梯队。

日本现状：凯侠（原东芝存储）专注NAND Flash，是日本唯一的存储芯片厂商。日本已无DRAM厂商。

四、两视角对比：DRAM vs NAND Flash

核心区别

维度	DRAM	NAND Flash
断电后	❌ 数据丢失	✅ 数据保留
需要刷新	✅ 必须周期刷新	❌ 不需要
速度	很快（几十GB/s）	较慢（几GB/s）
容量	小（8-16GB/芯片）	大（256GB-4TB/芯片）
擦写寿命	无限（理论上）	有（几千到几万次）
成本/GB	较贵	便宜
典型产品	内存条、HBM	固态硬盘、手机存储
生活比喻	“临时工作台”	“永久仓库”

用一个场景理解

你打开一个大型游戏：
┌─────────────────────────────────────┐
│ 固态硬盘（NAND）                     │
│ 存着游戏的所有文件（50GB）           │
│ 断电后还在                           │
└─────────────────────────────────────┘
         ↓ 启动游戏时加载
┌─────────────────────────────────────┐
│ 内存条（DRAM）                       │
│ 临时存放正在运行的游戏数据（8GB）     │
│ 断电就没了                           │
└─────────────────────────────────────┘
         ↓ GPU随时读取渲染
┌─────────────────────────────────────┐
│ GPU + HBM                            │
│ AI时代：GPU算力强，HBM喂得快          │
│ 传统内存条喂不饱GPU                  │
└─────────────────────────────────────┘

五、中国存储产业现状

两家企业，两条路线

企业	技术领域	定位	国际差距
长鑫存储	DRAM	中国唯一内存厂商	差距较大（落后约2代）
长江存储	NAND Flash	中国最大闪存厂商	差距较小（接近第一梯队）

为什么差距不同？

DRAM差距较大：

三星、海力士、美光有40年技术积累
DRAM工艺极其复杂，专利壁垒高
设备（光刻机、刻蚀机）受国外限制

NAND差距较小：

NAND技术路线相对灵活
长江存储Xtacking架构实现”弯道超车”
层数堆叠更多依赖工艺创新，而非单纯制程

六、总结

新闻里提到的	属于哪个领域	哪家厂商在做
内存条涨价	DRAM	三星/海力士/美光/长鑫
HBM供不应求	DRAM（高端）	三星/海力士/美光
固态硬盘新品	NAND Flash	三星/凯侠/西部数据/长江存储
长鑫融资成功	DRAM	中国唯一DRAM厂商
长江存储突破	NAND Flash	中国NAND厂商

DRAM：三巨头（三星+海力士+美光）控制90%市场，长鑫是中国唯一希望，日本已无厂商。

NAND Flash：六强格局（三星/海力士/凯侠/西数/美光/长江存储），长江存储技术水平接近一流。

多Agent系统的设计与评估

2026-04-29T16:00:00.000Z

“任务越复杂越该用多Agent”——听起来好像没毛病，但这句话背后藏着一个巨大的陷阱。很多人一拍脑袋就上多Agent，结果延迟爆表、成本失控、日志一团浆糊，最后发现单Agent加个工具调用就能搞定。上一篇我们聊了 Multi-Agent 系统的设计原理，今天换个角度：什么时候该用多Agent？用完之后，怎么评判这套设计到底好不好？

一、先破一个误区：复杂度不是决策标准

很多人一听到”多Agent”，脑子里的画面是这样的：一个主控 Agent 坐镇中央，下面挂着写代码的、做测试的、写文档的，各司其职，特别壮观。

但壮观不等于好用。

复杂度从来不是选择多Agent的理由。 真正的决策标准只有两个维度：并发收益和上下文约束。

用一张表说清楚：

场景特征	单Agent够用吗	要不要上多Agent
步骤严格串行，后一步依赖前一步结果	够用	不要，纯浪费
多个子任务互相独立，可以同时跑	不够	要，并行收益明显
单个任务的上下文撑爆模型窗口	不够	要，必须切分
子任务之间需要频繁交换中间状态	勉强	谨慎，通信开销可能吃掉收益

但这张表太粗了，真实决策远比这复杂。下面我们拆开来讲。

二、决策框架：四把尺子量出答案

2.1 第一把尺子：任务依赖图是线性的还是扇出的？

这是最核心的判断依据。

线性依赖是指任务之间有严格的先后顺序：A 的输出是 B 的输入，B 的输出是 C 的输入。比如用户问”我的退款到哪一步了”——先识别意图，再查订单库，最后组织回复。这三步必须串行，中间插不进任何并行操作。

扇出依赖是指一个任务可以拆成多个互不相关的子任务同时执行。比如”帮我审查这个代码仓库的安全性”——注入漏洞扫描、内存泄漏检测、代码风格检查，这三件事之间没有任何数据依赖，完全可以同时开工。

画成图就是这样的区别：

线性依赖（单Agent）：
意图识别 → 查数据库 → 组织回复
  A    →    B     →    C

扇出依赖（多Agent）：
            ┌→ 安全检测 ──┐
主控规划 ──→├→ 性能分析 ──├→ 汇总合并
            └→ 规范检查 ──┘

判断标准：如果你的任务依赖图画出来是一条直线，用单Agent。如果画出来像一把扇子，考虑多Agent。

2.2 第二把尺子：上下文窗口是不是硬瓶颈？

有些任务看起来是线性的，但数据量大到单个模型根本吃不下。这时候即使任务是串行的，你也得想办法切分。

举个例子：给你一个 50 万行的代码仓库，要求生成完整的 API 文档。这不是并行任务——你需要理解全局架构才能写好文档。但问题是，50 万行代码塞不进任何模型的上下文窗口。

这时候多Agent的价值不是并行加速，而是上下文切片：

Agent-1：扫描 controller 层，提取接口定义
Agent-2：扫描 service 层，提取业务逻辑
Agent-3：扫描 entity 层，提取数据模型
主控 Agent：拿到三份切片报告，合并生成文档

每个 Agent 只需要处理自己那一层的代码，上下文压力骤降。最后主控 Agent 拿到的是三份精炼过的报告，而不是几十万行原始代码。

判断标准：估算一下任务需要的上下文 token 量。如果超过模型窗口的 60%，就要考虑切分了。留 40% 的余量给系统 Prompt、工具调用和中间推理。

2.3 第三把尺子：延迟预算够不够？

这是最容易被忽略的一把尺子。

多Agent系统的延迟公式非常残酷：

1	总延迟 = max(各子Agent延迟) + 主控规划延迟 + 主控汇总延迟 + 通信开销

注意这里用的是 max 不是 sum——因为子 Agent 是并行的，总延迟取决于最慢的那个。听起来不错对吧？但别忘了后面还有三项固定开销。

在真实的线上环境里，大模型的一次调用延迟通常在 2-8 秒。一个三层架构的多Agent系统，光是规划和汇总就要各调一次模型，加上子 Agent 的执行时间，端到端延迟很容易突破 15 秒。

对比一下单Agent方案：

1 2	单Agent：意图识别(2s) → 工具调用(1s) → 总结回复(2s) = 5s 多Agent：规划(3s) + max(子Agent×3)(4s) + 汇总(3s) + 通信(1s) = 11s

判断标准：如果你的场景是面向用户的实时交互（聊天机器人、客服系统），延迟预算通常在 5 秒以内。这种场景下多Agent几乎一定会超时，单Agent + 工具调用是更务实的选择。如果是后台批处理任务（代码审计、报告生成），延迟预算宽松，多Agent才有发挥空间。

2.4 第四把尺子：Token 预算能不能扛得住？

多Agent系统的 Token 消耗不是线性增长，而是阶梯式跳涨。

每一次 Agent 调用，你都要支付：

系统 Prompt（每次都一样，但每次都要算钱）
上下文注入（任务描述、历史信息）
模型推理（输出 token）

假设你有一个主控 Agent + 5 个子 Agent，每个 Agent 的系统 Prompt 是 2000 token，任务描述平均 1000 token，输出平均 1500 token。那么一轮完整执行的 Token 消耗大约是：

主控：2000 + 1000 + 1500 = 4500
子Agent×5：(2000 + 1000 + 1500) × 5 = 22500
汇总：2000 + 3000(子Agent结果) + 2000 = 7000
总计：约 34000 token

而单Agent完成同样任务，可能只需要 5000-8000 token。

判断标准：如果你的系统要处理高并发请求（比如每秒几百个），Token 成本的差异会被放大几百倍。在做架构选型时，先算一笔账：多Agent方案的 Token 成本是单Agent的几倍？这个倍数你的预算扛不扛得住？

三、四个典型场景的决策推演

光讲理论不过瘾，我们拿四个真实场景来跑一遍决策流程。

3.1 场景一：智能客服（结论：单Agent）

用户问：”我的订单 #12345 退款到哪一步了？”

依赖图分析：识别意图 → 查订单 → 回复。严格线性，没有并行空间。

上下文分析：一次对话的上下文很小，远不到窗口极限。

延迟分析：用户在等回复，延迟预算 3 秒。

Token 分析：高并发场景（成千上万用户同时咨询），成本敏感。

四把尺子量完，全部指向单Agent。上多Agent就是过度设计。

3.2 场景二：企业级代码安全审计（结论：多Agent）

需求：扫描一个 10 万行代码仓库，输出安全漏洞报告。

依赖图分析：注入扫描、内存泄漏检测、依赖漏洞检查、代码规范审查——四个子任务完全独立。

上下文分析：10 万行代码远超单模型窗口，必须切片。

延迟分析：后台批处理，用户可以等几分钟，延迟预算宽松。

Token 分析：低并发（一天可能就跑几次），成本可控。

四把尺子量完，全部指向多Agent。

3.3 场景三：长文档摘要生成（结论：伪多Agent / 单Agent + 分段策略）

需求：把一份 200 页的技术文档浓缩成 5 页摘要。

乍一看，200 页文档肯定塞不进上下文，应该用多Agent切分对吧？

但仔细想想：文档摘要是有全局连贯性要求的。你不能让 Agent-A 总结第 1-50 页、Agent-B 总结第 51-100 页，然后拼在一起——这样出来的摘要会有大量重复、遗漏和逻辑断裂。

更好的方案是单Agent + 分段迭代策略：

第一轮：单Agent处理第1-50页，产出中间摘要A
第二轮：单Agent带着摘要A处理第51-100页，产出中间摘要B
第三轮：单Agent带着摘要B处理第101-150页，产出中间摘要C
第四轮：单Agent带着摘要C处理第151-200页，产出最终摘要

每一轮都保留了前序上下文的精华，保证了连贯性。这比多Agent并行切分效果好得多。

教训：上下文超限不等于必须上多Agent。有时候串行分段 + 状态传递比并行切分更适合有连贯性要求的任务。

3.4 场景四：多语言翻译流水线（结论：看情况）

需求：把一份技术文档翻译成英、日、韩三种语言。

表面分析：三种语言互不依赖，可以并行——看起来应该用多Agent。

深层分析：翻译的前置步骤（术语提取、风格统一）是共享的。如果三个 Agent 各自提取术语，出来的译文风格会不一致。

最优方案：混合架构。

1
2
3

阶段一（单Agent）：提取术语表 + 定义翻译风格指南
阶段二（多Agent并行）：三个Agent分别翻译三种语言，共享术语表
阶段三（单Agent）：审校三份译文的一致性

教训：很多任务不是纯粹的”该用”或”不该用”多Agent，而是在流水线的某些阶段用、某些阶段不用。混合架构才是最常见的生产形态。

四、怎么评估一个多Agent系统设计得好不好？

选对了场景只是第一步。就算你决策正确，多Agent系统仍然可能设计得很烂。下面是一套评估框架，从五个维度给系统打分。

4.1 评估维度一：任务分解的合理性

这是最基础也最关键的维度。分解不合理，后面的一切都是空中楼阁。

好的分解有三个特征：

特征	说明	反例
子任务之间低耦合	每个子Agent能独立完成自己的工作，不需要等别人的结果	Agent-A 需要 Agent-B 的输出才能开始
子任务粒度适中	不太粗（一个Agent干不完）也不太细（拆太碎通信开销吃掉收益）	把”查数据库”拆成”建立连接””发送SQL””解析结果”三个Agent
子任务边界清晰	每个Agent的职责范围明确，不会出现两个Agent干同一件事	安全Agent和性能Agent都在扫描同一段代码的同一个函数

快速检验法：拿一张纸，把每个子Agent的任务写下来。如果你发现两个子Agent的任务描述有超过 30% 的重叠，分解就有问题。

4.2 评估维度二：通信开销占比

多Agent系统的总成本 = 计算成本 + 通信成本。

通信成本包括：

主控 Agent 向子 Agent 传递任务描述的 Token
子 Agent 向主控 Agent 返回结果的 Token
主控 Agent 汇总所有结果的 Token
如果子 Agent 之间需要通信（不推荐），还有交叉通信的 Token

健康的系统：通信开销占总 Token 消耗的 20% 以内。

有问题的系统：通信开销超过 40%。这意味着你在花大量 Token 让 Agent 之间”传纸条”，而不是干实事。

计算公式：

1	通信开销占比 = (任务传递Token + 结果回传Token + 汇总Token) / 总Token消耗 × 100%

如果你算出来这个比例很高，说明要么子任务拆得太碎（太多小Agent在传话），要么结果压缩做得不好（子Agent带回来的信息太冗余）。

4.3 评估维度三：并行效率

多Agent的核心价值是并行。如果并行效率低，用多Agent就没有意义。

并行效率的定义：

1	并行效率 = 单Agent串行完成时间 / 多Agent并行完成时间

理论上，N 个 Agent 并行，效率应该接近 N。但实际上很难达到，因为：

子 Agent 的任务量不均衡（最慢的那个决定了总时间）
主控 Agent 的规划和汇总有固定延迟
通信有网络开销

并行效率	评价	建议
> 2.0x	优秀	多Agent方案值得投入
1.5x - 2.0x	一般	看场景，如果成本敏感可以考虑单Agent
< 1.5x	差	多Agent带来的收益不够覆盖额外开销，回退单Agent

提升并行效率的关键：让每个子 Agent 的工作量尽量均衡。如果一个子 Agent 1 秒就跑完了，另一个要跑 10 秒，那你的并行效率就被拖后腿了。

4.4 评估维度四：容错与可观测性

这是工程落地时最容易翻车的维度。

容错能力评估清单：

一个子 Agent 超时或失败了，系统会怎样？是直接整体失败，还是能降级处理？
子 Agent 返回了错误结果（幻觉），主控 Agent 能不能识别出来？
有没有设置最大重试次数？重试的 Token 成本有没有上限？

可观测性评估清单：

出了问题，你能在日志里定位到是哪个 Agent 在哪个环节出错的吗？
每个 Agent 的输入输出有没有完整记录？
你能不能回放一次完整的执行过程来做 Debug？

一个残酷的现实：大部分多Agent系统的日志都是一团浆糊。主控 Agent 调了 5 个子 Agent，每个子 Agent 又调了若干工具，出了问题你只能看到一个笼统的”执行失败”，根本不知道是哪一步在胡说八道。

好的设计：给每个 Agent 执行分配一个唯一的 trace ID，所有日志都带上这个 ID，方便链路追踪。

4.5 评估维度五：边际收益递减点

这是最需要工程直觉的一个维度。

多Agent系统的子 Agent 数量不是越多越好。存在一个边际收益递减点——超过这个点，增加 Agent 带来的并行收益小于增加的通信开销和协调成本。

    收益
     ↑
     │        ╭───────── 收益曲线
     │      ╱
     │    ╱
     │  ╱
     │╱
     ├──────────────────→ Agent数量
     ↑
边际收益递减点

经验值：在大部分场景下，子 Agent 数量控制在 3-8 个是比较合理的区间。超过 10 个，协调成本会急剧上升。

怎么找到这个点？ 最靠谱的方法是跑基准测试：

从 2 个子 Agent 开始，记录执行时间和 Token 消耗
逐步增加到 3、4、5… 个
画出”Agent数量 vs 端到端延迟”和”Agent数量 vs Token成本”两条曲线
找到延迟不再显著下降、但 Token 成本还在上升的那个拐点

那个拐点就是你的最优 Agent 数量。

五、一个完整的评估 Checklist

把上面五个维度浓缩成一份可执行的检查清单。拿到任何一套多Agent系统设计方案，对照这张表打分：

任务分解合理性                          □ 通过  □ 不通过
├─ 子任务之间是否低耦合？               □ 是    □ 否
├─ 粒度是否适中？                       □ 是    □ 否
└─ 边界是否清晰？                       □ 是    □ 否

通信开销占比                            □ 通过  □ 不通过
├─ 通信Token占比 < 20%？               □ 是    □ 否
└─ 子Agent结果是否经过压缩？            □ 是    □ 否

并行效率                                □ 通过  □ 不通过
├─ 并行加速比 > 1.5x？                 □ 是    □ 否
└─ 子Agent工作量是否均衡？              □ 是    □ 否

容错与可观测性                          □ 通过  □ 不通过
├─ 子Agent失败是否可降级？              □ 是    □ 否
├─ 每个Agent是否有trace ID？            □ 是    □ 否
└─ 能否回放完整执行过程？               □ 是    □ 否

边际收益                                □ 通过  □ 不通过
├─ 子Agent数量是否在合理区间(3-8)？     □ 是    □ 否
└─ 是否做过基准测试找最优解？           □ 是    □ 否

5 个维度全部通过，这是一套合格的多Agent系统设计。有 1-2 个不通过，需要针对性优化。3 个以上不通过——回去重新考虑一下，这个场景是不是真的需要多Agent。

六、总结

回到文章开头的问题：什么场景下用多Agent系统？

答案不是”任务越复杂越好”，而是当你同时撞上了两个天花板时：

单一模型的上下文天花板——数据量大到一个模型吃不下
串行执行的延迟天花板——子任务之间没有依赖，串行跑太慢

只撞上第一个天花板，用单Agent + 分段策略就能解决。只撞上第二个天花板，用单Agent + 异步并发工具调用也能凑合。两个同时撞上，才是多Agent真正不可替代的场景。

而在评估一套多Agent系统设计时，不要只看架构图好不好看，要拿数据说话：通信开销占比多少？并行效率多少？边际收益递减点在哪？

用工程的刚性去约束架构的浪漫，这才是做系统设计的正确姿势。

Agent 记忆系统设计规范

2026-04-26T16:00:00.000Z

如果你在构建 Agent，一定想过这个问题：怎么让 Agent 跨会话记住用户的偏好、项目的背景、之前犯过的错误？大部分人的做法是搞一个文件，把所有「需要记住的东西」往里塞。文件越来越大，token 成本越来越高，而且大部分内容跟当前对话根本没关系。Claude Code 的记忆系统给出了一个反直觉的设计原则：工程量最大的部分不是「怎么存」，也不是「怎么取」，而是「什么该存、什么不该存」。

一、核心哲学：记忆是代码的补集

这套记忆系统的设计哲学可以用一句话概括：

记忆是代码的补集。

听起来简单，但这是整个设计里最有启发性的原则。具体来说：

维度	代码/工具擅长	记忆系统擅长
时效性	实时查询、权威来源	跨会话沉淀、经验积累
可变性	随代码更新自动失效	需要主动维护、可能过时
粒度	精确到函数/文件	模糊的意图、偏好、上下文

该存的：全部是「关于人和上下文」的信息——人的偏好、纠正、动机、外部资源指针。这些藏在代码之外，不查记忆就无从得知。

不该存的：全部是「关于代码和项目状态」的信息——代码是实时的、可查的、权威的。代码能回答的问题，不要让记忆来回答。

这个分界线一旦清晰，你会发现很多之前觉得「应该记住」的东西，其实根本不该存。

二、四种该存的记忆

2.1 用户记忆：记用户是谁

用户记忆记录的是用户的角色、技术背景、工作习惯、知识水平。

好的例子：

「这个用户是数据科学家，目前在做日志系统的调研。」
「这个用户写了十年 Go，但第一次碰 React。」

这类记忆的设计意图是让 Agent 能调整沟通方式和工作策略。面对一个资深后端工程师，Agent 不需要解释基础概念，可以直接用技术术语；面对一个初学者，Agent 需要更耐心地铺垫背景。

关键约束：记忆的目的是「怎么更好地帮这个人」，不是「给这个人画像」。不要记录对用户的负面评价，也不要记录跟工作无关的个人信息。

1
2
3

❌ 不要记：「这个用户脾气不好，经常发火」
❌ 不要记：「这个用户喜欢喝咖啡」
✅ 要记：「这个用户偏好简洁回复，不需要末尾总结」

2.2 反馈记忆：记纠正和肯定

这是四种记忆里设计最精细的一种。源码里对它有三个关键要求。

要求一：规则 + 原因 + 适用场景

每条反馈记忆必须包含三个部分：

1	规则是什么 → Why → 什么时候该应用

举个实际例子。用户说：

「测试不要 mock 数据库，上个季度我们就是因为 mock 测试通过了但生产环境迁移失败才出的事故。」

如果只记「不要 mock 数据库」，Agent 在所有测试里都不敢 mock，包括那些跟数据库迁移完全无关的单元测试。

但如果它知道原因是「mock 和生产环境行为不一致导致迁移失败」，它就能判断：集成测试不该 mock，但纯逻辑的单元测试 mock 是没问题的。

记原因，是为了让 Agent 能在新场景下做判断，而不是机械地执行规则。

要求二：不要只记纠正，也要记肯定

源码注释里说得很直白：

如果你只记录用户说「不要这样做」的时刻，它只知道什么是错的，不知道什么是对的。时间长了，它会回避一切不确定的做法，变得畏手畏脚。

但肯定信号比纠正信号更难捕捉。用户说「不要这样做」很明显，但用户说「对，就是这样」或者默默接受了一个不寻常的方案，需要主动注意这些肯定信号。

例子：

用户说：「对，这次用一个大 PR 是对的，拆开反而是无意义的工作量。」

这条记忆的价值是：下次遇到类似的重构场景，Agent 知道这个用户倾向于合并提交，而不是拆成很多小 PR。这不是纠正，是一个被验证过的判断。

要求三：区分个人偏好和项目规范

「不要在回复末尾加总结」→ 个人偏好，只对这个用户有效
「集成测试必须用真实数据库」→ 项目规范，对所有协作者有效

源码里用 scope 来区分这两种。个人偏好存在私有目录，项目规范存在团队共享目录。

2.3 项目记忆：记正在发生什么

项目记忆记录的是当前项目里正在发生的事：谁在做什么、为什么要做、截止日期是什么。

例子：

「本周四之后冻结所有非关键合并，移动端团队要切发布分支。」
「正在重写认证中间件，原因是法务团队指出旧的 token 存储方式不符合合规要求，所以做决策的时候要优先考虑合规性而不是技术优雅。」

关键规则：相对日期必须转换成绝对日期

用户说「周四冻结」，记忆里存的是具体的年月日，比如「2026-03-07」。

为什么？因为记忆是跨会话的。如果存「周四」，下周再看这条记忆就不知道是哪个周四了。

另一个特点：衰减得很快

一个月前的项目状态大概率已经过时了。所以源码要求项目记忆必须记录「为什么」。即使事实过时了，背后的动机仍然有参考价值。

1 2	事实过时：「正在重写认证中间件」→ 可能已经写完了动机仍有效：「合规要求优先于技术优雅」→ 这个决策原则长期有效

2.4 引用记忆：记外部资源在哪里

引用记忆记录的是外部资源的位置：bug 在哪个系统里追踪、监控面板的地址是什么、设计文档在哪个平台。

例子：

「流水线相关的 bug 都在 Linear 的 INGEST 项目里追踪。」
「API 延迟的监控面板在 grafana.internal/d/api-latency，值班的时候看这个。」

这是四种里最简单的，但也是最实用的。它本质上是一个「去哪里找信息」的索引。

三、五种不该存的东西

这部分才是整个设计里最有启发性的。很多人做记忆系统的第一件事，就是把不该存的东西全存了。

3.1 代码模式、架构、文件路径、项目结构

这是最反直觉的。很多人觉得 Agent 应该记住「项目用了什么框架、目录怎么组织、哪个文件负责什么」。

Claude Code 说：不要存这些。

为什么？因为这些信息可以直接从代码里读出来。Agent 随时可以通过读代码和搜索来获取当前的项目结构。

把这些存进记忆有两个问题：

问题一：浪费空间
每次对话都要加载一堆本来可以实时查的信息

问题二：过时风险
代码改了但记忆没更新 → Agent 基于过时信息决策 → 很难发现

背后的原则：如果一个信息可以从当前项目状态推导出来，就不要存进记忆。记忆只存那些「看代码看不出来」的东西。

3.2 版本管理历史

谁改了什么、最近的提交记录——这些用版本管理工具查就行了。

Git 是实时的、权威的，不需要记忆来存一份可能过时的副本。

3.3 调试方案和修复方法

修复已经在代码里了，提交信息里有上下文。存「怎么修的」没有意义，因为代码本身就是最好的参考。

3.4 配置文件里已经写过的东西

如果你的项目里有 CLAUDE.md 或其他配置文件已经定义了编码规范，记忆系统不需要再存一份。

重复存储不仅浪费空间，还会在两份内容不一致的时候制造混乱。

1
2
3

配置文件说：「使用 pnpm」
记忆文件说：「使用 npm」
→ Agent 该听谁的？

3.5 临时性的任务细节

当前正在做什么、对话里的中间状态——这些是短期的，属于当前会话的上下文，不该进入长期记忆。

四、一条特别重要的规则

即使用户明确要求你记住某些东西，如果它属于上面五类，也不该记。

例子：

用户：「记住这周的 PR 列表」

Agent 不应该直接存 PR 列表，而应该反问：

「这些 PR 里有什么让你意外的或者不明显的？那个部分才值得记。」

活动日志不是记忆，从活动中提炼出的洞察才是。

用户要求存不该存的内容时，正确的做法是提炼价值点。PR 列表本身不该存，但如果某个 PR 的处理方式让用户觉得「这样做是对的」，那个判断才值得存成反馈记忆。

五、信息来源决策树

把上面的原则整理成一个判断流程：

这条信息能从代码/工具实时获取吗？
         │
         ├── 能 → 不存，实时查
         │
         └── 不能 → 属于哪种类型？
                         │
                         ├── 用户特征 → 用户记忆
                         ├── 纠正/肯定 → 反馈记忆
                         ├── 项目动态 → 项目记忆
                         └── 外部资源 → 引用记忆

六、实践中的常见错误

错误一：把记忆当成项目文档

1 2	❌ 存储：「src/auth 目录负责认证逻辑，包含 middleware.ts 和 token.ts」 ✅ 实时查：Glob + Read 工具

错误二：把记忆当成聊天记录

1 2	❌ 存储：「用户昨天问怎么配置 Redis，我回答了...」 ✅ 不存：这是会话上下文，不是长期记忆

错误三：记了规则但没记原因

1
2
3

❌ 存储：「不要用 forEach」
✅ 存储：「避免在 async 函数里用 forEach，原因是 forEach 不等待 Promise 完成，
         曾导致批量写入只执行了一半，适用场景是异步批量操作」

错误四：只记纠正不记肯定

1 2	❌ 只存：「不要在回复末尾加总结」 ✅ 也要存：「用户确认：重构时用一个大PR是对的，拆开反而增加工作量」

七、记忆系统的质量检验清单

在写入一条记忆之前，问自己这些问题：

□ 是否存了代码可查的内容？→ 删除或反问用户
□ 是否包含「为什么」？→ 补充动机
□ 是否指定适用范围？→ 补充项目/模块边界
□ 相对时间是否转绝对时间？→ 如「明天」→「2026-03-16」
□ 是否存在相似记忆？→ 合并去重
□ 敏感信息是否过滤？→ 拒绝存储密码、密钥、PII

八、总结

Claude Code 记忆系统的核心设计可以概括为一句话：少而精。

记忆的价值不在于数量，而在于每条记忆都能在关键时刻减少认知负担。

如果你在给自己的 Agent 做记忆系统，这个分类框架可以直接拿来用：

四种该存：

用户是谁（角色、背景、习惯）
用户纠正和肯定过什么（含规则、原因、适用场景）
项目背后的动机和时间线（相对日期→绝对日期）
外部资源在哪里（索引而非内容）

五种不该存：

代码能告诉你的一切
版本历史能告诉你的一切
提交记录能告诉你的一切
配置文件已经说过的一切
临时性的中间状态

这样做的好处是：你的记忆文件会非常精简，每一条都是高价值的、代码里找不到的信息。模型每次加载记忆的时候，看到的全是有用的东西，没有噪声。

相关文章：

Memory 系统：跨会话持久化知识库 — Claude Code 记忆系统的技术实现细节
Claude Code 源码深度解析系列 — 更多 Claude Code 架构分析

DeepSeek V4 技术解读

2026-04-24T08:30:00.000Z

背景

2026年4月24日，DeepSeek 正式发布了 V4 系列模型。这不是一次普通的版本迭代——它解决了一个困扰 AI 行业多年的根本问题：长上下文的效率瓶颈。

本文将深入解读 DeepSeek V4 的核心技术创新，帮助你理解这次发布为何值得关注。

一、模型规格：更大但不更贵

DeepSeek V4 发布了两个版本：

模型	总参数量	激活参数量	上下文长度
DeepSeek-V4-Pro	1.6T	49B	100万 tokens
DeepSeek-V4-Flash	284B	13B	100万 tokens

对比上一代 V3.2（671B 总参数，37B 激活），V4-Pro 参数量翻了 2.4 倍，但激活参数仅增加 32%。更重要的是，两者都原生支持 100万 token 上下文——这是之前任何开源模型都做不到的。

为什么”更大但不更贵”？

得益于 MoE（Mixture-of-Experts）架构，每次推理只激活一小部分参数。V4-Pro 的激活率仅为 3%（49B/1.6T），这意味着：

推理成本接近一个 50B 参数的稠密模型
但拥有 1.6T 参数的知识容量和表达能力

这是 DeepSeek 从 V2 开始就坚持的技术路线，V4 把这个策略推向了新高度。

二、核心架构创新：打破 O(n²) 的魔咒

Transformer 的标准注意力机制计算复杂度是 O(n²)——序列长度翻倍，计算量翻四倍。当上下文达到百万级别时，这变成了不可承受之重。

DeepSeek V4 用混合注意力架构彻底解决了这个问题。

2.1 CSA（Compressed Sparse Attention）

CSA 的核心思路是：压缩 + 稀疏选择。

原始序列：n 个 token
     ↓ 压缩（每 m 个 token 合成一个 KV entry）
压缩序列：n/m 个 compressed KV entry
     ↓ 稀疏选择（Lightning Indexer 选 top-k）
参与计算的：k 个 compressed KV entry

具体流程：

KV Cache 压缩：将每 m 个 token 的 KV entry 通过加权聚合压缩成一个条目，序列长度降到 1/m
Lightning Indexer：为每个 query token 生成 indexer queries，与压缩后的 KV 偂相似度计算，选出 top-k 个最相关的压缩块
Core Attention：只在选出的 k 个压缩块上做完整的 attention 计算

关键参数（V4-Pro）：

压缩率 m = 4（每 4 个 token 压缩成 1 个）
Indexer head 数 = 64，head 维度 = 128
Top-k = 1024（每个 query 只关注 1024 个压缩块）

2.2 HCA（Heavily Compressed Attention）

HCA 是更激进的压缩策略，用于处理”不需要精细关注的历史信息”：

1
2
3

压缩率 m' = 128（每 128 个 token 合成一个 KV entry）
     ↓
直接对压缩后的 KV 做完整 attention（不做稀疏选择）

HCA 的哲学是：远处的信息可以”模糊处理”，近处的信息才需要精细关注。

2.3 混合架构设计

V4 不是全用 CSA 或全用 HCA，而是交替使用：

前 2 层：纯滑动窗口 attention（保留近期信息的精细度）
后续层：CSA 和 HCA 交替，形成”粗细结合”的信息处理

这种设计让模型既能高效处理长上下文，又能保持对关键信息的精确检索能力。

2.4 效率提升有多夸张？

官方给出了硬核数据（100万 token 上下文场景）：

指标	V4-Pro vs V3.2	V4-Flash vs V3.2
单 token FLOPs	27%（节省 3.7×）	10%（节省 10×）
KV Cache 大小	10%（节省 9.5×）	7%（节省 13.7×）

这意味着：以前跑不起的百万级上下文任务，现在可以在单卡上跑了。

三、mHC：残差连接的”数学升级版”

残差连接 x + F(x) 是 Transformer 的基石，但深层堆叠时会遇到问题：

信号可能逐层放大 → 数值爆炸
信号可能逐层衰减 →梯度消失

DeepSeek V4 引入了 Manifold-Constrained Hyper-Connections (mHC)，用数学约束解决这个问题。

核心思路

传统残差连接：

1	X_next = X + F(X) // 简单加法

mHC：

1
2
3

X_next = B·X + C·F(A·X)  // A、B、C 是线性映射矩阵
         ↑
      B 约束在双随机矩阵流形上（行和=1，列和=1，元素≥0）

关键约束：B 的谱范数 ≤ 1，这意味着信号传播是”非膨胀的”，不会爆炸。

为什么叫”流形约束”？

双随机矩阵构成的空间是一个流形（Manifold）——Birkhoff Polytope。mHC 通过 Sinkhorn-Knopp 算法，把矩阵 B 投影到这个流形上：

1
2
3

1. 对 B 取 exponential（保证正元素）
2. 迭代做行归一化、列归一化
3. 收敛到一个双随机矩阵

这套数学确保了深层堆叠时的稳定性，同时保留了模型的表达能力。

四、Muon 优化器：万亿参数训练的新配方

训练万亿参数模型，AdamW 已经不够稳了。V4 引入了 Muon 优化器。

核心算法

G = gradient
M = momentum_buffer
M = μ·M + G  // 动量累积
O = HybridNewtonSchulz(μ·M + G)  // Nesterov trick + 正交化
W = W·(1 - ηλ) - η·O  // weight decay + update

关键步骤是 Hybrid Newton-Schulz 迭代，把梯度矩阵正交化：

# 10 步迭代，分两阶段
# Stage 1（前 8 步）：快速收敛
M_k = 3.4445·M_{k-1} - 4.7750·(M·M^T)·M + 2.0315·(M·M^T)^2·M

# Stage 2（后 2 步）：精确定位到正交矩阵
M_k = 2·M_{k-1} - 1.5·(M·M^T)·M + 0.5·(M·M^T)^2·M

正交化的好处：

避免”跑偏”——梯度方向更明确
避免”数值爆炸”——矩阵谱范数被约束
收敛更快——不需要 Adam 的二阶矩估计

配合稳定性技术

V4 还用了两招来防止 loss spike：

Anticipatory Routing：路由决策用”历史参数”而非”当前参数”，打破 MoE 路由的恶性循环
SwiGLU Clamping：把 SwiGLU 的线性分量 clamp 到 [-10, 10]，直接压制异常值

五、FP4 量化感知训练：天生适应低精度

以往的量化是”训练后补救”——模型在高精度下训练，推理时强行降精度，性能必然下降。

V4 的创新：训练时就让模型适应 FP4。

应用范围

MoE 专家权重：占模型大部分参数，FP4 压缩节省大量显存
QK 路径（Lightning Indexer 的 indexer 部分）：长上下文检索的核心计算，FP4 加速

关键技术点

FP4 → FP8 的无损反量化：

FP4 (E2M1) → FP8 (E4M3)
          ↑
FP8 多 2 个 exponent bit，动态范围更大
只要 block 内的 scale factor 差异不超过阈值，信息完全保留

这意味着：

训练时用 FP8 做计算（模拟 FP4）
推理时直接用 FP4 权重，零性能损失
整个 pipeline 可以复用现有的 FP8 训练框架

六、训练基础设施：工程硬核

V4 的基础设施投入展现了”长期主义”的工程思维。

6.1 TileLang：Kernel 开发的 DSL

传统 CUDA Kernel 开发效率低、难迭代。V4 用 TileLang 这个 DSL：

用声明式语法描述 Kernel 逻辑
Z3 SMT Solver 做形式化分析（证明正确性）
自动生成高性能 CUDA 代码

开发效率 + 运行效率，两者兼得。

6.2 确定性训练

V4 的 Kernel 全程批不变（Batch-Invariant）：

同一 token 无论在 batch 哪个位置，输出 bitwise 一致
用特殊设计避免了原子加法带来的不确定性
训练过程可复现，调试有据可查

这对大规模训练调试、定位问题至关重要。

6.3 MoE EP 的细粒度重叠

Expert Parallelism 的通信开销大。V4 把 MoE 层拆成 4 个阶段：

1	Dispatch (通信) → Linear-1 (计算) → Activation → Linear-2 (计算) → Combine (通信)

关键洞察：计算时间 > 通信时间，所以通信可以被计算掩盖。

V4 把专家分成”wave”，每个 wave 的通信和计算流水线化，实现 1.5-1.96× 加速。

七、性能基准：开源模型的新标杆

知识任务

Benchmark	V4-Pro-Max	K2.6	GLM-5.1	Gemini 3.1 Pro
SimpleQA Verified	57.9	36.9	38.1	75.6
Chinese-SimpleQA	84.4	75.9	75.0	85.9

V4-Pro-Max 在知识任务上领先开源对手 20+ 百分点，但距离 Gemini 3.1 Pro 还有一段差距。

Agent 能力：开源最佳

这是 V4 最重要的能力跃升之一。官方披露：

Agentic Coding：V4-Pro 达到当前开源模型最佳水平
内部实测：已成为 DeepSeek 公司内部员工使用的 Agentic Coding 首选模型
体验对比：优于 Claude Sonnet 4.5，交付质量接近 Claude Opus 4.6 非思考模式

V4 针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品进行了专项适配优化，在代码任务、文档生成等场景表现显著提升。

推理与代码

Benchmark	V4-Pro-Max	GPT-5.4	Gemini 3.1 Pro
Codeforces Rating	3206	3168	3052
Apex Shortlist	90.2	78.1	89.1

这是开源模型首次在代码竞赛上追平闭源模型。V4-Pro-Max 在 Codeforces 排名第 23 位（人类选手中）。

长上下文

Benchmark	V4-Pro-Max	Claude Opus 4.6	Gemini 3.1 Pro
MRCR 1M (MMR)	83.5	92.9	76.3
CorpusQA 1M	62.0	71.7	53.8

V4-Pro 在真实场景的 CorpusQA 上超越 Gemini 3.1 Pro，在 MRCR 上接近 Claude Opus 4.6。

八、V4-Flash：经济高效的选择

V4-Flash 是一个重要的补充版本，让不同需求的用户都能找到合适的方案。

与 V4-Pro 的对比

维度	V4-Flash	V4-Pro
激活参数	13B	49B
推理速度	更快	较慢
API 成本	更低	较高
世界知识	稍逊	大幅领先开源
推理能力	接近 Pro	开源最佳
Agent 简单任务	旗鼓相当	更优
Agent 高难度任务	有差距	最佳

适用场景：

V4-Flash：日常对话、简单代码任务、成本敏感场景
V4-Pro：复杂 Agent 任务、深度推理、高质量输出需求

九、三种推理模式：灵活的推理成本

V4 支持三种推理模式，让用户按需求选择成本：

模式	特点	适用场景
Non-Think	快速直觉响应，无 thinking tokens	日常对话、低风险决策
Think	逻辑分析，中等 thinking budget	复杂问题、规划任务
Think Max	极限推理，长 thinking budget	数学证明、高难度任务

Think Max 模式会在系统 prompt 里注入特殊指令：

1 2	Reasoning Effort: Absolute maximum with no shortcuts permitted. You MUST be very thorough in your thinking...

这让模型”把推理推到极限”，在 HLE、IMO 等高难度任务上表现最优。

十、API 使用指南

模型调用

DeepSeek API 已同步上线 V4-Pro 与 V4-Flash，支持 OpenAI ChatCompletions 接口与 Anthropic 接口：

# OpenAI 格式
from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",  # 或 deepseek-v4-flash
    messages=[{"role": "user", "content": "你好"}]
)

关键参数

参数	说明
`model`	`deepseek-v4-pro` 或 `deepseek-v4-flash`
`max_tokens`	最大输出长度，默认 8K
`reasoning_effort`	思考强度：`high` 或 `max`（仅思考模式）

思考模式

对于复杂的 Agent 场景，建议使用思考模式并设置强度为 max：

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "复杂任务..."}],
    reasoning_effort="max"  # 极限推理
)

⚠️ 重要提示

旧 API 模型名 deepseek-chat 和 deepseek-reasoner 将于 2026年7月24日 停止使用：

当前阶段 deepseek-chat → 指向 V4-Flash 非思考模式
当前阶段 deepseek-reasoner → 指向 V4-Flash 思考模式

请尽快迁移到新的模型名称。

十一、开源与本地部署

权重下载

平台	链接
HuggingFace	https://huggingface.co/collections/deepseek-ai/deepseek-v4
ModelScope	https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

本地部署建议

由于 V4-Pro 参数量达 1.6T，本地部署需要：

多卡推理：至少 8× A100 80GB 或同等显存
量化推理：FP4 量化后可显著降低显存需求
V4-Flash：单卡 A100 80GB 可运行

技术报告

完整技术细节请参考官方技术报告：

DeepSeek V4 技术报告（PDF）

十二、行业启示：V4 带来的新范式

12.1 长上下文不再是奢侈品

以前，百万级上下文是”理论上可行但经济上不行”。V4 把成本降到 原来的 10-30%，让以下场景变得可行：

Test-time Scaling：推理阶段可以长时间思考，不受上下文限制
长 horizon Agent：复杂多轮任务（如软件工程流水线）有足够”记忆空间”
在线学习：持续吸收新信息，无需全量重训练

12.2 开源 vs 闭源的格局变化

V4 是一个信号：开源模型不仅追上了能力，还追上了效率性价比。

V4-Flash 用 13B 激活参数，就能达到接近 GPT-5.2 的推理水平
在代码任务上，开源首次追平闭源

这意味着闭源模型的”护城河”正在缩小。

12.3 架构创新的长期价值

V4 的创新不是”刷榜技巧”，而是架构层面的根本改进：

CSA/HCA 解决了 Transformer 的 O(n²) 瓶颈
mHC 让残差连接更稳定、可堆叠更深
Muon 优化器可能成为万亿参数训练的新标配

这些创新会启发更多研究，推动整个行业向前。

十三、局限与展望

官方坦承了几个局限：

架构相对复杂：为了降低风险，保留了 V3 的很多验证过的组件，未来会精简
训练稳定性原理未完全理解：Anticipatory Routing 和 SwiGLU Clamping 有效，但数学原理还在探索
多模态尚未集成：未来版本会加入视觉能力

展望方向：

进一步的稀疏化探索（如稀疏 embedding）
低延迟架构优化（让长上下文交互更流畅）
长 horizon Agent 的深度优化

总结

DeepSeek V4 的意义不在于某个具体指标的提升，而在于它解决了长上下文效率这个根本问题。

通过 CSA/HCA 混合注意力、mHC 残差升级、Muon 优化器、FP4 量化训练等一系列创新，V4 让百万级上下文从”理论上可行”变成”经济上可行”。

这为 AI 的下一阶段——更深的 test-time scaling、更长的 Agent 任务、更灵活的在线学习——铺好了基础设施。

开源模型第一次在效率和能力的综合维度上，追上了闭源前沿。这是整个行业值得关注的里程碑。

参考资源：

奇技淫巧：Java / Python 应用调用阿里百炼 Coding Plan 服务

2026-04-18T16:00:00.000Z

阿里云百炼 Coding Plan 官方宣称”仅限编程工具使用”，但实际上其 endpoint 基于 OpenAI 兼容协议，Java/Python 应用完全可以调用。本文分享如何用 LangChain4j 和 OpenAI SDK 突破这一限制，直接消耗 Coding Plan 额度。

一、背景：一个被”误解”的服务

阿里云百炼的 Coding Plan 是一项面向 AI 编程助手的服务套餐，提供专门的模型调用额度。官方客服的说法是：

“Coding Plan 的专属 API Key（格式为 sk-sp-xxxxx）仅限在支持的编程工具（如 Claude Code、OpenClaw 等）中使用，不能用于 Java 应用直接调用大模型。若您的 Java 应用需要调用百炼大模型，请使用百炼通用 API Key（格式为 sk-xxxxx），该 Key 支持调用包括 Coding 模型在内的所有百炼模型，并按量计费。”

这意味着如果你想在 Java 应用中使用百炼大模型，需要：

额外开通百炼通用 API Key（格式为 sk-xxxxx）
按量付费，产生额外费用

但实际上，Coding Plan 的额度完全可以在 Java/Python 应用中使用！ 本文将分享这个”奇技淫巧”。

二、问题发现：为什么 Coding Plan Key 在 Java 中”失效”？

2.1 错误的调用方式

很多开发者（包括我）最初使用阿里云官方的 dashscope-sdk-java 调用百炼：

// pom.xml

    com.alibaba
    dashscope-sdk-java
    2.22.15


// Java 代码
Generation gen = new Generation();
GenerationParam param = GenerationParam.builder()
    .apiKey("sk-sp-xxxxx")  // Coding Plan API Key
    .model("qwen-plus")
    .messages(messages)
    .build();
GenerationResult result = gen.call(param);

结果：API 返回 InvalidApiKey 错误，或者即使调通了，消耗的是通用额度而非 Coding Plan 额度！

2.2 根本原因分析

Coding Plan 的 API Key 使用的是 OpenAI 兼容协议，endpoint 地址不同于通用百炼服务：

服务类型	API Key 格式	Endpoint	模型名称
通用百炼	`sk-xxxxx`	`https://dashscope.aliyuncs.com/compatible-mode/v1`	`qwen-plus`, `qwen-max`
Coding Plan	`sk-sp-xxxxx`	`https://coding.dashscope.aliyuncs.com/v1`	`多个模型` 等

官方的 dashscope-sdk-java 只支持通用百炼 endpoint，无法连接 Coding Plan 的 endpoint！

三、解决方案：使用 OpenAI 兼容模式

3.1 技术原理

Coding Plan 的 endpoint 基于 OpenAI API 兼容协议，任何支持 OpenAI API 的客户端都可以调用：

Python: 使用 openai SDK
Java: 使用 LangChain4j 的 langchain4j-open-ai 模块

只要将 base_url 指向 Coding Plan 的 endpoint，API Key 就能正常工作！

四、Java 实现：LangChain4j + Coding Plan

4.1 添加依赖


<properties>
    <langchain4j.version>0.35.0langchain4j.version>
properties>

<dependencies>
    
    <dependency>
        <groupId>dev.langchain4jgroupId>
        <artifactId>langchain4jartifactId>
        <version>${langchain4j.version}version>
    dependency>
    <dependency>
        <groupId>dev.langchain4jgroupId>
        <artifactId>langchain4j-open-aiartifactId>
        <version>${langchain4j.version}version>
    dependency>
dependencies>

4.2 配置文件

# application.properties - Coding Plan 配置
langchain4j.open-ai.chat-model.base-url=https://coding.dashscope.aliyuncs.com/v1
langchain4j.open-ai.chat-model.api-key=sk-sp-xxxxx
langchain4j.open-ai.chat-model.model-name=kimi-k2.5
langchain4j.open-ai.chat-model.temperature=0.3
langchain4j.open-ai.chat-model.max-tokens=4096

关键点：base-url 必须是 coding.dashscope.aliyuncs.com/v1，不是通用的 dashscope.aliyuncs.com！

4.3 Java 代码实现

import dev.langchain4j.data.message.AiMessage;
import dev.langchain4j.data.message.ChatMessage;
import dev.langchain4j.data.message.SystemMessage;
import dev.langchain4j.data.message.UserMessage;
import dev.langchain4j.model.chat.ChatLanguageModel;
import dev.langchain4j.model.openai.OpenAiChatModel;
import dev.langchain4j.model.output.Response;

import java.time.Duration;
import java.util.Arrays;
import java.util.List;

public class CodingPlanExample {

    private final ChatLanguageModel chatModel;

    public CodingPlanExample(String baseUrl, String apiKey, String modelName) {
        // 使用 OpenAI 兼容模式构建 ChatModel
        this.chatModel = OpenAiChatModel.builder()
                .baseUrl(baseUrl)  // Coding Plan endpoint
                .apiKey(apiKey)    // Coding Plan API Key
                .modelName(modelName)
                .temperature(0.3)
                .maxTokens(4096)
                .timeout(Duration.ofSeconds(60))
                .build();
    }

    public String chat(String systemPrompt, String userMessage) {
        List messages = Arrays.asList(
                SystemMessage.from(systemPrompt),
                UserMessage.from(userMessage)
        );

        Response response = chatModel.generate(messages);

        if (response == null || response.content() == null) {
            throw new RuntimeException("模型返回结果为空");
        }

        return response.content().text();
    }

    public static void main(String[] args) {
        CodingPlanExample example = new CodingPlanExample(
                "https://coding.dashscope.aliyuncs.com/v1",
                "sk-sp-xxxxx",
                "kimi-k2.5"
        );

        String result = example.chat(
                "你是一位专业的翻译助手",
                "将以下内容翻译为英文：你好世界"
        );

        System.out.println(result);
    }
}

4.4 Spring Boot 集成示例

@Configuration
public class LangChain4jConfig {

    @Value("${langchain4j.open-ai.chat-model.base-url}")
    private String baseUrl;

    @Value("${langchain4j.open-ai.chat-model.api-key}")
    private String apiKey;

    @Value("${langchain4j.open-ai.chat-model.model-name}")
    private String modelName;

    @Bean
    public ChatLanguageModel chatLanguageModel() {
        return OpenAiChatModel.builder()
                .baseUrl(baseUrl)
                .apiKey(apiKey)
                .modelName(modelName)
                .timeout(Duration.ofSeconds(60))
                .build();
    }
}

@Service
public class TranslationService {

    private final ChatLanguageModel chatModel;

    public TranslationService(ChatLanguageModel chatModel) {
        this.chatModel = chatModel;
    }

    public String translate(String content, String sourceLang, String targetLang) {
        String systemPrompt = String.format(
                "你是翻译专家，将内容从%s翻译为%s，直接输出结果",
                sourceLang, targetLang
        );

        List messages = Arrays.asList(
                SystemMessage.from(systemPrompt),
                UserMessage.from(content)
        );

        return chatModel.generate(messages).content().text();
    }
}

五、Python 实现：OpenAI SDK + Coding Plan

5.1 安装依赖

1	pip install openai

5.2 Python 代码

from openai import OpenAI

# 使用 Coding Plan endpoint
client = OpenAI(
    base_url="https://coding.dashscope.aliyuncs.com/v1",
    api_key="sk-sp-xxxxx"
)

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "你是一位专业的翻译助手"},
        {"role": "user", "content": "将以下内容翻译为英文：你好世界"}
    ],
    temperature=0.3,
    max_tokens=4096
)

print(response.choices[0].message.content)

5.3 异步调用示例

from openai import AsyncOpenAI
import asyncio

async_client = AsyncOpenAI(
    base_url="https://coding.dashscope.aliyuncs.com/v1",
    api_key="sk-sp-xxxxx"
)

async def translate_async(content: str) -> str:
    response = await async_client.chat.completions.create(
        model="kimi-k2.5",
        messages=[
            {"role": "system", "content": "你是翻译专家"},
            {"role": "user", "content": content}
        ]
    )
    return response.choices[0].message.content

# 批量翻译
async def batch_translate(contents: list[str]) -> list[str]:
    tasks = [translate_async(c) for c in contents]
    return await asyncio.gather(*tasks)

# 运行示例
async def main():
    results = await batch_translate(["你好世界", "人工智能"])
    print(results)

asyncio.run(main())

六、实际应用场景

6.1 职位内容翻译

@Service
public class JobTranslationService {

    private final ChatLanguageModel chatModel;

    public String translateJobDescription(String content, String sourceLang, String targetLang) {
        String systemPrompt = buildTranslationPrompt(sourceLang, targetLang);

        List messages = Arrays.asList(
                SystemMessage.from(systemPrompt),
                UserMessage.from(content)
        );

        return chatModel.generate(messages).content().text();
    }

    private String buildTranslationPrompt(String sourceLang, String targetLang) {
        return String.format("""
            你是一位专业的职位内容翻译专家。
            请将用户输入的职位描述从%s翻译为%s。

            翻译要求：
            1. 保持原文的段落结构和格式
            2. 专业术语使用行业标准翻译
            3. 直接输出翻译结果
            """, sourceLang, targetLang);
    }
}

6.2 文档内容生成

public String generateDocumentOutline(String topic) {
    String prompt = """
        根据以下主题，生成一份技术文档大纲：
        主题：%s

        要求：
        1. 结构清晰，层次分明
        2. 每个章节要有简要说明
        3. 使用 Markdown 格式输出
        """.formatted(topic);

    List messages = Arrays.asList(
        SystemMessage.from("你是技术文档撰写专家"),
        UserMessage.from(prompt)
    );

    return chatModel.generate(messages).content().text();
}

6.3 智能客服对话

@Service
public class CustomerServiceBot {

    private final ChatLanguageModel chatModel;

    public String handleUserMessage(String userMessage, List history) {
        List messages = new ArrayList<>();

        // 系统提示词
        messages.add(SystemMessage.from("""
            你是专业的客服助手，帮助用户解答产品相关问题。
            回答要求：
            1. 语气友好专业
            2. 回答简洁明了
            3. 如果无法回答，引导用户联系人工客服
            """));

        // 添加历史对话
        for (String h : history) {
            messages.add(UserMessage.from(h));
        }

        // 当前消息
        messages.add(UserMessage.from(userMessage));

        return chatModel.generate(messages).content().text();
    }
}

七、关键注意事项

7.1 Endpoint 不要混用

Key 类型	正确 Endpoint	错误 Endpoint
`sk-sp-xxxxx` (Coding Plan)	`coding.dashscope.aliyuncs.com/v1`	`dashscope.aliyuncs.com`
`sk-xxxxx` (通用)	`dashscope.aliyuncs.com/compatible-mode/v1`	`coding.dashscope.aliyuncs.com`

混用会导致 InvalidApiKey 错误或消耗错误的额度！

7.2 模型名称差异

Coding Plan 支持的模型可能与通用百炼不同：

Coding Plan: kimi-k2.5 等
通用百炼: qwen-plus, qwen-max, qwen-turbo

请根据实际账号支持的模型选择。

7.3 Token 消耗监控

虽然使用了 Coding Plan 额度，但仍需关注：

单次调用 Token 数量
Coding Plan 额度剩余
设置合理的 max_tokens 防止超限

7.4 超时设置

Coding Plan 响应时间可能与通用服务不同，建议设置较长超时：

1	.timeout(Duration.ofSeconds(60)) // 或更长

八、总结

8.1 官方说法 vs 实际实践

官方说法	实际实践
Coding Plan Key 仅限编程工具使用	Java/Python 应用可正常使用
需要额外开通通用 Key	无需额外开通
按量付费产生额外费用	直接消耗 Coding Plan 额度
dashscope-sdk-java 不支持	LangChain4j/OpenAI SDK 完美支持

8.2 核心原理

Coding Plan 的 endpoint 基于 OpenAI API 兼容协议，这是业界通用的 LLM API 标准。任何支持 OpenAI 协议的客户端都可以调用，不受编程工具限制。

8.3 适用场景

✅ Java 后端服务调用 LLM
✅ Python 应用调用 LLM
✅ Spring Boot / LangChain4j 集成
✅ 翻译、生成、对话等各类 NLP 任务
❌ 直接使用 dashscope-sdk-java（不支持 Coding Plan endpoint）

九、参考资料

Hermes Agent：一个会"记住你"的 AI 助手

2026-04-16T16:00:00.000Z

如果你最近关注 AI Agent 领域，可能会注意到一个新名字——Hermes Agent。它来自 Nous Research，在短短两个月内从一个小型内部项目成长为功能完备的 AI Agent 平台。这篇文章聊聊它到底有什么不一样，以及为什么值得你花时间了解。

一、Hermes Agent 是什么？

简单说，它是一个可以自我进化的 AI Agent 框架。

市面上大多数 Agent 工具，你用完一次，下次还要重新教它。你说”帮我整理今天的 Git 提交记录”，它执行了。第二天你再说同样的话，它又从头开始理解。对话结束后，一切归零。

Hermes Agent 不一样。它有个叫”技能系统”的东西。第一次你教它做某件事，完成后它会问自己：这件事我以后是不是经常要做？如果答案是肯定的，它会把整个过程打包成一个技能。下次你只需要说”整理提交”，它就能直接调用这个技能。

这不是预设好的模板，是 Agent 自己判断、自己创建、自己优化的。用久了，它会越来越懂你的工作习惯。

二、为什么突然火了？

翻一下 Hermes Agent 的版本历史，你会发现一个有意思的时间线：

版本	发布日期	说明
v0.1.0	2026年2月底	内部预发布版本
v0.2.0	3月12日	首个公开版本，216个PR，63位贡献者
v0.3.0	3月17日	流式输出、插件架构、Honcho记忆
v0.4.0	3月23日	6个新消息平台、4个新推理提供商
v0.9.0	4月13日	Android支持、iMessage、微信接入
v0.10.0	4月16日	Nous工具网关，订阅用户零额外API

从2月底到4月中旬，不到两个月，发布了10个大版本。平均每三四天一个版本。这不是营销驱动的节奏，是真实需求驱动的迭代速度。

看看 v0.2.0 的发布说明：”In just over two weeks, Hermes Agent went from a small internal project to a full-featured AI agent platform — thanks to an explosion of community contributions.”

这句话翻译过来：两个星期，从内部小项目变成完整平台，原因是社区贡献爆发。

为什么爆发？因为 Hermes Agent 解决了一个长期痛点——Agent 的记忆和学习能力。之前大家做 Agent，要么接受”每次对话归零”的现实，要么自己写一套复杂的持久化逻辑。Hermes Agent 把这套逻辑内置了，而且是真正意义上的”学习”，不只是”存储”。

三、核心特质

3.1 闭环学习，不是单次执行

这点前面说了，展开讲一下细节。

Hermes Agent 的学习机制包含几个层次：

技能自动创建：完成复杂任务后，Agent 会分析这个任务是否有重复价值。有，就创建技能。技能里包含了执行步骤、需要的工具、注意事项。

技能自我改进：你用某个技能的时候如果给了反馈，比如”这次格式不对”或”下次加上这个字段”，Agent 会把这些反馈写进技能描述里。下一次执行会自动应用。

定期提醒：Agent 有个机制叫”periodic nudges”，会周期性地提醒自己把重要信息持久化。不是被动等待你要求，是主动思考”这个信息值得记住吗”。

跨会话搜索：你问”上次我们讨论的那个方案是什么”，它会搜索历史对话，用 LLM 做摘要，然后告诉你。这不是简单的关键词搜索，是语义层面的召回。

3.2 Honcho 用户建模

Hermes Agent 内置了一个叫 Honcho 的用户建模系统。这个名字来自 plastic-labs 的 Honcho 项目，是一个专门做”AI 理解用户”的框架。

它的作用是：Agent 会持续观察你的偏好、习惯、工作方式，然后建立一个用户模型。你喜欢简洁回复，它记住；你讨厌某种操作方式，它记住；你对某个项目有特殊约定，它跨会话保持。

这不是简单的”记住你说过的话”，是”理解你是什么样的人”。

3.3 多平台统一接入

这点对实际使用很重要。

你可以在 Telegram、Discord、Slack、WhatsApp、Signal 这些平台跟 Hermes Agent 对话，也可以在终端用 CLI。同一个 Agent，不同入口，记忆和技能是共享的。

这意味着你早上在公司电脑用 CLI 让它整理日报，晚上回家用 Telegram 继续讨论，它记得你白天说了什么。

3.4 定时任务，原生支持

大多数 Agent 框架没有内置的定时任务系统。你想让 Agent 每天早上自动发日报，要么写外部脚本触发，要么依赖某个外部调度器。

Hermes Agent 内置了 cron 调度。你用自然语言描述：”每天早上9点，汇总昨天的 Git 提交并发到 Telegram”，它会自动解析、创建任务、按时执行。

这对于”Agent 作为助手”的场景很重要。真正的助手不只是你叫它才动，是会主动做事情。

3.5 云端部署，不是本地绑定

这点是 Hermes Agent 相比很多同类产品的优势。

它支持六种终端后端：本地、Docker、SSH、Daytona、Singularity、Modal。其中 Modal 和 Daytona 是”无服务器”模式——你的 Agent 环境在云端，空闲时几乎不花钱，有请求时自动唤醒。

这意味着你可以把 Hermes Agent 部署到云端，然后从 Telegram 发消息触发。不在电脑前的时候，Agent 依然在工作。这对于”随时随地操作”的需求很关键。

3.6 多模型，随时切换

Hermes Agent 支持大量 LLM 提供商：

Nous Portal（官方订阅服务）
OpenRouter（200+模型）
Anthropic（Claude 系列）
OpenAI（GPT 系列）
Google AI Studio（Gemini）
阿里云百炼（DashScope）
智谱 AI（GLM）
Moonshot（Kimi）
MiniMax
小米 MiMo
NVIDIA NIM
DeepSeek
xAI（Grok）
Hugging Face
AWS Bedrock
还有更多…

切换模型用一个命令：hermes model。不需要改代码，不需要重新部署，运行时切换。

这对于实际使用很重要。不同的任务适合不同的模型，你可能写代码用 Claude，快速问答用 GPT-mini，中文内容用 Qwen。Hermes Agent 让这种切换变得零成本。

四、对 OpenClaw 用户的意义

如果你正在用 OpenClaw，听到 Hermes Agent 可能会想：又一个类似的工具，有必要换吗？

这里有个事实你可能不知道：Hermes Agent 是 OpenClaw 的官方进化版本。

翻 Hermes Agent 的文档，你会发现专门的迁移章节：

1
2
3

## Migrating from OpenClaw

If you're coming from OpenClaw, Hermes can automatically import your settings, memories, skills, and API keys.

迁移命令很简单：

1 2	hermes claw migrate --dry-run # 先预览会迁移什么 hermes claw migrate # 执行迁移

迁移内容包括：

SOUL.md（人格设定）
已有技能
命令白名单
消息平台配置
API 密钥（Telegram、OpenRouter、OpenAI、Anthropic 等）
工作空间说明（AGENTS.md）

这说明 Hermes Agent 的开发团队明确知道 OpenClaw 用户群体，并且专门做了兼容路径。

那为什么要从 OpenClaw 换到 Hermes Agent？几个实际理由：

功能	OpenClaw	Hermes Agent
技能系统	有，但不自改进	有，且会自我优化
定时任务	无	内置 cron
云端部署	本地运行	Modal/Daytona 无服务器
用户建模	会话级	Honcho 深度建模
MCP 协议	无	支持
消息平台	Telegram、飞书等	Telegram、Discord、Slack、WhatsApp、Signal

如果你需要定时任务、云端部署、Agent 学习能力，Hermes Agent 提供了这些 OpenClaw 没有的东西。

五、安装和使用指南

5.1 Mac 用户

Mac 上安装最简单，一行命令：

1	curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh \| bash

安装完成后：

1 2	source ~/.zshrc # 或者 source ~/.bashrc hermes # 启动

首次运行会引导你配置。按照提示选择 LLM 提供商、设置 API Key 就可以开始使用。

5.2 Windows 用户

Windows 原生不支持，需要通过 WSL2。

先安装 WSL2：

1	wsl --install

然后进入 WSL2 的 Linux 环境，运行和 Mac 一样的安装命令。

这步对不熟悉 Linux 的用户可能有点门槛，但设置好后使用体验和 Mac 一样。

5.3 常用命令

hermes              # 启动交互式 CLI
hermes model        # 选择模型提供商和具体模型
hermes tools        # 配置启用的工具
hermes gateway      # 启动消息平台网关（Telegram、Discord 等）
hermes setup        # 完整设置向导
hermes doctor       # 检查配置是否有问题
hermes update       # 更新到最新版本

在对话中使用的斜杠命令：

/new              # 开始新对话
/model            # 切换模型
/skills           # 浏览可用技能
/retry            # 重试上一轮
/undo             #撤销上一轮
/compress         # 压缩上下文
/usage            # 查看用量

5.4 配置阿里云百炼

如果你之前用 OpenClaw 配了阿里云百炼的 Coding Plan，在 Hermes Agent 里可以直接用：

# 设置环境变量
export DASHSCOPE_API_KEY=你的API密钥

# 如果用国内版，额外设置
export DASHSCOPE_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1

或者在 ~/.hermes/.env 文件里写：

1	DASHSCOPE_API_KEY=sk-xxxxxxxx

然后用命令切换提供商：

1 2	hermes model alibaba hermes model qwen3-coder-plus

六、OpenClaw 用户迁移指南

如果你已经有 OpenClaw 的配置，迁移步骤：

1. 安装 Hermes Agent

1 2	curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh \| bash source ~/.zshrc

2. 运行迁移命令

1	hermes setup

Setup 向导会自动检测 ~/.openclaw 目录，提示你是否迁移。

或者任何时候手动运行：

1 2	hermes claw migrate --dry-run # 预览会迁移什么 hermes claw migrate # 执行迁移

3. 检查迁移结果

1	hermes doctor # 检查配置是否正确

4. 开始使用

1	hermes # 启动 CLI

迁移后，你的 SOUL.md（人格设定）、已有技能、命令白名单、消息平台配置都会保留。API 密钥会自动迁移到 ~/.hermes/.env。

注意：OpenClaw 支持 Telegram、飞书等平台，这些配置会直接迁移。

七、适合什么人用？

如果你的需求是：

写代码为主 → 继续用 Claude Code，它在代码理解上更强
操作电脑、整理文件 → Hermes Agent 或 OpenClaw 都能胜任
重复性任务多 → Hermes Agent，技能系统会帮你省时间
需要定时自动化 → Hermes Agent，内置 cron
离开电脑时也想用 → Hermes Agent，云端部署 + Telegram
飞书/Telegram 是核心场景 → Hermes Agent 或 OpenClaw 都能胜任

如果你已经在用 OpenClaw，不需要立即换。两个工具核心功能重叠约 70%，Hermes Agent 新增的是学习能力、定时任务和云端部署。这些对你有没有价值，看你的实际需求。

但如果你想尝试 Hermes Agent，迁移成本很低。一条命令就能把 OpenClaw 的配置全部导过去，不存在”从头设置”的问题。

八、总结

Hermes Agent 的价值不在”功能更多”，在”设计思路不同”。

大多数 Agent 工具的设计假设是：用户发起对话 → Agent 执行 → 结束。下一次对话从零开始。

Hermes Agent 的设计假设是：Agent 和用户是长期关系，Agent 应该越来越懂用户，而不是每次都从陌生人开始。

这个假设的差异，导致了功能设计的差异：技能自动创建、技能自我改进、Honcho 用户建模、跨会话搜索、定期提醒持久化。

这些功能单独看都不复杂，组合起来形成一个闭环：Agent 做事 → Agent 学习 → Agent 下次做得更好。

这个闭环是 Hermes Agent 和其他 Agent 工具的本质区别。

如果你对”Agent 可以学习和进化”这个概念感兴趣，值得花半小时安装试试。不需要完全替换你现有的工具，先体验一下它的学习机制，看看是否符合你的预期。

九、相关资源

Hermes Agent GitHub：https://github.com/NousResearch/hermes-agent
官方文档：https://hermes-agent.nousresearch.com/docs/
Skills Hub：https://agentskills.io
Nous Research Discord：https://discord.gg/NousResearch
HermesClaw（微信桥接）：https://github.com/AaronWong1999/hermesclaw

Claude Code 为什么不用 LangChain/LangGraph：自研架构的深层逻辑

2026-04-14T16:00:00.000Z

LangChain 和 LangGraph 是当下最流行的 Agent 开发框架，但 Anthropic 的 Claude Code 却完全不用它们。这不是傲慢，而是基于技术本质、产品体验、API 特性和工程可控性的四重考量。本文从多个层面剖析 Claude Code 的自研架构选择，以及它用什么技术替代了 LangChain/LangGraph 的能力。

一、先说结论

Claude Code 不用 LangChain/LangGraph，原因有四个：

层面	LangChain/LangGraph 的限制	Claude Code 的选择
架构层面	ReAct 模式的串行瓶颈	Async Generator 状态机
API 层面	无法充分利用 Anthropic API 特性	原生 SDK 直接集成
性能层面	抽象层增加延迟	零抽象，直接流式处理
可控层面	框架黑盒，难以定制	全栈自研，精准控制

一句话概括：LangChain/LangGraph 是”通用框架”，Claude Code 是”专用系统”。通用框架追求易用，专用系统追求极致体验。

二、架构层面：为什么放弃 ReAct

2.1 ReAct 模式的根本缺陷

LangChain 和 LangGraph 的核心都是 ReAct 模式（Reasoning + Acting）：

1	思考(Thought) → 行动(Action) → 观察(Observation) → 思考 → ...

这个模式直观易懂，但存在三个根本缺陷：

缺陷一：串行瓶颈

┌─────────────────────────────────────────────────────────────┐
│                    ReAct 串行流程                            │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  用户输入 → 等待完整响应 → 解析工具调用 → 执行工具 → 等待 →  │
│            └───────────────────────────────────┘            │
│                        用户感知到的延迟                       │
│                                                             │
│  问题：用户要等模型生成完整响应后才能看到工具执行             │
│                                                             │
└─────────────────────────────────────────────────────────────┘

在 CLI 交互场景中，这种延迟是致命的——用户盯着屏幕等待，不知道发生了什么。

缺陷二：无法利用流式传输

现代 LLM API 都支持流式输出（SSE），但 ReAct 模式下流式的价值被大大削弱：

# LangChain 的 Agent 执行
agent.run("帮我分析这个项目")

# 内部流程：
# 1. LLM 生成完整响应（即使流式，也要等 action 完整）
# 2. OutputParser 解析响应文本
# 3. 提取工具名称和参数
# 4. 执行工具
# 5. 工具结果返回给 LLM
# 6. 重复...

# 流式输出的价值：实时看到模型"在想什么"
# 但工具执行：必须等完整响应后才能开始
# 两者冲突，流式体验被割裂

缺陷三：状态恢复困难

ReAct 模式没有统一的状态表示，每一步都是独立的：

Step 1: Thought → Action → Observation  (无状态记忆)
Step 2: Thought → Action → Observation  (重新开始)
Step 3: ...

当 API 超时、Token 溢出时：
- LangChain：抛出异常，用户需手动处理
- LangGraph：需要显式定义 checkpoint，复杂度高
- Claude Code：State 对象统一承载，自动恢复

2.2 Claude Code 的替代方案：Async Generator 状态机

Claude Code 用一个 while(true) 循环 + State 赋值 替代 ReAct：

// src/query.ts 核心（简化版）
export async function* query(params: QueryParams): AsyncGenerator<QueryUpdate> {
  let state: State = {
    messages: [...],
    toolUseContext: {...},
    turnCount: 0,
    transition: undefined,
  }

  while (true) {
    // 阶段1: 消息压缩（自动处理 Token 溢出）
    // 阶段2: 流式 API 调用（工具即时执行）
    // 阶段3: 决策点（继续还是结束）
    // 阶段4: 工具编排（并行只读，串行写入）
    // 阶段5: 状态更新
    
    state = next  // 通过赋值驱动循环
    continue
  }
}

核心优势对比：

维度	ReAct	Async Generator 状态机
执行方式	串行，等待完整响应	流式，工具即时执行
状态管理	无统一状态	State 对象承载所有信息
错误恢复	手动处理	6 种内置恢复策略
内存安全	可能递归溢出	状态赋值，无递归风险
可观测性	需要额外追踪	transition 字段记录转换原因

2.3 流式即时执行：StreamingToolExecutor

Claude Code 的关键创新是 工具在模型生成过程中就开始执行：

┌─────────────────────────────────────────────────────────────┐
│                 Claude Code 流式执行流程                      │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  模型流式输出：                                              │
│    "我来帮你分析这个项目..."                                 │
│    "首先读取 README..."                                     │
│    [生成 tool_use 块: Read { path: "README.md" }]           │
│                                                             │
│                    ↓ 立即执行                                │
│                                                             │
│  StreamingToolExecutor:                                     │
│    检测到 tool_use → 立即调用 Read 工具                     │
│    工具结果实时返回                                          │
│                                                             │
│  用户感知：                                                  │
│    实时看到模型思考                                          │
│    实时看到工具执行                                          │
│    无需等待完整响应                                          │
│                                                             │
└─────────────────────────────────────────────────────────────┘

对比 LangChain：

LangChain 流程：
  用户输入 → 等待(模型完整响应) → 解析 → 执行工具 → 等待 → ...
  总延迟 = 模型生成时间 + 解析时间 + 工具执行时间

Claude Code 流程：
  用户输入 → 流式生成(工具即时执行) → 流式输出 → ...
  总延迟 = max(模型生成时间, 工具执行时间)

三、API 层面：原生特性的充分利用

3.1 LangChain 的”框架税”

LangChain 作为通用框架，需要在多种模型 API 之间保持一致性。这意味着：

1
2
3

Anthropic API 特性          → LangChain 抽象层 → 用户代码
                                    ↓
                          被抹平或延迟支持

Anthropic 独有的 API 特性：

特性	说明	LangChain 支持情况
Prompt Caching	提示词缓存，降本 90%	2024 年后才支持，使用复杂
Extended Thinking	思维链输出，推理透明	LangChain 无原生支持
Computer Use	屏幕操作能力	LangChain 无原生支持
原生 tool_use	结构化工具调用块	LangChain 用 OutputParser 解析文本
原生流式 tool_use	流式传输中工具即时触发	LangChain 需等待完整响应

3.2 Claude Code 的原生集成

Claude Code 直接使用 Anthropic SDK，充分利用所有原生特性：

示例：Prompt Caching 的利用

// Claude Code 的提示词组装（src/constants/prompts.ts）

// 静态可缓存区域（scope: 'global'）
const systemPrompt = {
  type: 'text',
  text: `
    ## 角色定义
    Claude Code 是一个...
    
    ## 系统规则
    你必须遵守...
    
    ## 工具说明
    以下工具可用...
  `,
  cache_control: { type: 'ephemeral' }  // 缓存标记
}

// 动态不可缓存区域（scope: 'ephemeral'）
const dynamicPrompt = {
  type: 'text',
  text: `
    ## 当前环境
    工作目录: ${cwd}
    
    ## 用户记忆
    ${claudeMdContent}
  `,
  cache_control: { type: 'ephemeral' }  // 独立缓存
}

缓存效果：

第一次调用：完整 token 计费
后续调用：静态部分缓存命中，降本约 90%

LangChain 也支持 Prompt Caching，但需要用户手动配置，且无法像 Claude Code 这样精细划分缓存边界。

示例：原生 tool_use 块

// Anthropic API 响应格式
{
  content: [
    { type: 'text', text: '我来帮你...' },
    {
      type: 'tool_use',
      id: 'toolu_01...',
      name: 'Read',
      input: { file_path: '/path/to/file' }
    }
  ]
}

// Claude Code 直接处理
for (const block of response.content) {
  if (block.type === 'tool_use') {
    // 立即执行，无需解析文本
    await executeTool(block.name, block.input)
  }
}

对比 LangChain：

# LangChain 的工具调用
response = llm.invoke(prompt)

# OutputParser 解析文本
parsed = output_parser.parse(response.content)
# 解析可能失败，格式不固定

if parsed['action']:
    tool_name = parsed['action']['tool']
    tool_input = parsed['action']['input']
    result = tools[tool_name].run(tool_input)

LangChain 需要 OutputParser 解析模型输出的文本，这是脆弱的——模型格式不固定时解析会失败。

四、性能层面：零抽象的流式优先

4.1 LangChain 的抽象层堆叠

LangChain 的抽象层结构：

用户代码
  → Chain
    → AgentExecutor
      → LLM
        → Memory
          → Tools
            → OutputParser
              → 实际 API 调用

每一层都增加处理开销。对于 Web 应用，这些开销可以忽略；但对于 CLI 交互工具，延迟是致命的。

4.2 Claude Code 的零抽象设计

Claude Code 的结构：

用户输入
  → query() AsyncGenerator
    → Anthropic SDK（直接调用）
      → 工具执行（流式即时）

没有中间抽象层，API 响应直接流式传递给用户。

4.3 工具编排的性能优化

Claude Code 的工具编排策略：

工具调用列表
  │
  ├─ 分类：只读 vs 写入
  │
  ├─ 只读工具 ──→ 并行执行（最多 10 个并发）
  │   ├─ Read      ──→ 同时开始
  │   ├─ Grep      ──→ 同时开始
  │   ├─ Glob      ──→ 同时开始
  │   └─ WebFetch  ──→ 同时开始
  │
  └─ 写入工具 ──→ 串行执行（保证顺序）
      ├─ FileEdit  ──→ 等待上一个完成
      ├─ Write     ──→ 等待上一个完成
      └─ Bash      ──→ 等待上一个完成

LangChain 的工具执行：

1
2
3

# LangChain Agent 默认串行执行
for tool_call in parsed_tool_calls:
    result = tool.run(tool_call.input)  # 一个一个执行

LangChain 需要显式配置并行，且配置复杂；Claude Code 自动分析工具性质，智能编排。

五、可控层面：全栈自研的精准控制

5.1 框架黑盒问题

使用 LangChain/LangGraph 时，你无法精准控制：

场景	LangChain 行为	你的控制力
工具执行顺序	默认串行	需要显式配置
错误恢复	抛出异常	需要自己处理
Token 溢出	截断或报错	需要自己检测
提示词组装	模板拼接	无法精细控制
流式输出	部分支持	需要适配框架

5.2 Claude Code 的精准控制

Claude Code 自研每一层，可以精确控制：

控制一：工具执行权限

// Claude Code 的权限系统（src/utils/permissions）

type PermissionResult = {
  behavior: 'allow' | 'deny' | 'ask'
  message?: string
  suggestions?: string[]
}

// 精细的权限检查
async function checkPermissions(tool, input, context) {
  // 1. deny 规则最高优先级
  if (matchesDenyRule(tool.name)) {
    return { behavior: 'deny', message: 'Blocked by deny rule' }
  }
  
  // 2. 工具自定义检查
  if (tool.checkPermissions) {
    const result = await tool.checkPermissions(input, context)
    if (result.behavior !== 'passthrough') {
      return result
    }
  }
  
  // 3. allow 规则
  if (matchesAllowRule(tool.name, input)) {
    return { behavior: 'allow' }
  }
  
  // 4. 默认询问用户
  return { behavior: 'ask', message: 'Do you want to allow?' }
}

控制二：自动压缩策略

// Claude Code 的四级压缩（src/query）

// Level 1: Snip — 删除旧消息中的冗余 token
messages = snipMessages(messages)

// Level 2: Micro — 修改已缓存消息的内容
messages = microCompact(messages)

// Level 3: Collapse — 分阶段摘要历史消息
messages = collapseMessages(messages)

// Level 4: Auto Compact — 通过 Claude 生成完整摘要
messages = await autoCompact(messages)

// LangChain 的处理方式：
// messages = messages.slice(-max_tokens)  // 简单截断

控制三：钩子扩展系统

// settings.json
{
  "hooks": {
    "PreToolUse": [
      {
        "matcher": "Bash",
        "hooks": [
          {
            "type": "command",
            "command": "security-check.sh"
          }
        ]
      }
    ],
    "PostToolUse": [
      {
        "matcher": "FileEdit",
        "hooks": [
          {
            "type": "command",
            "command": "run-tests.sh"
          }
        ]
      }
    ]
  }
}

用户可以在工具执行的任意阶段注入自定义逻辑，LangChain 需要继承类或修改源码才能实现类似功能。

六、能力映射：Claude Code 用什么替代 LangChain/LangGraph

6.1 LangChain 能力 → Claude Code 替代方案

LangChain 能力	Claude Code 替代方案	实现文件
LLM 调用	Anthropic SDK 直接集成	`src/query.ts`
工具定义	`Tool` 类型 + `buildTool()`	`src/Tool.ts`
工具注册	三阶段流水线注册	`src/tools.ts`
Agent 循环	`while(true)` 状态机	`src/query.ts`
Memory	Channel 系统 + 文件记忆	`src/state/`, `src/memdir/`
RAG	文件工具 + 向量工具（可选 MCP）	`src/tools/`
OutputParser	原生 `tool_use` 块解析	无需解析
Callbacks	钩子系统	`src/hooks/`

6.2 LangGraph 能力 → Claude Code 替代方案

LangGraph 能力	Claude Code 替代方案	实现文件
StateGraph	`State` 对象 + 状态赋值	`src/query.ts`
节点定义	`while` 循环的阶段划分	`src/query.ts:307-1728`
边流转	`transition` + `continue`	`src/query/transitions.ts`
条件分支	`if/switch` + `state.transition`	`src/query.ts`
Checkpoint	消息历史 + 文件系统	`src/assistant/`
多 Agent	`AgentTool` + 子代理系统	`src/tools/AgentTool/`
可视化调试	`transition` 字段追踪	可观测性设计

6.3 核心代码映射

LangChain Agent → Claude Code query()

1
2
3

# LangChain
agent = AgentExecutor.from_agent_and_tools(agent, tools)
result = agent.invoke({"input": "do something"})

// Claude Code
for await (const update of query({ messages, tools, systemPrompt })) {
  console.log(update)  // 实时输出
}

LangGraph StateGraph → Claude Code while 循环

# LangGraph
graph = StateGraph(AgentState)
graph.add_node("agent", agent_node)
graph.add_node("tool", tool_node)
graph.add_conditional_edges("agent", should_continue, 
    {"continue": "tool", "end": END})
app = graph.compile()

// Claude Code（src/query.ts）
while (true) {
  // 阶段 2: 流式 API 调用
  const response = await callModel(state)
  
  // 阶段 3: 决策点（条件分支）
  if (hasToolUse(response)) {
    // 阶段 4: 工具执行
    const results = await executeTools(response.tool_use_blocks)
    state = { ...state, messages: [...messages, results] }
    continue  // 继续循环
  } else {
    // 结束
    yield finalResult
    return
  }
}

七、什么时候该用 LangChain/LangGraph

Claude Code 的自研架构不是所有人的最优解。它们的选择基于：

顶级工程团队：有能力自研高性能架构
单一模型依赖：只需要支持 Anthropic API
极致体验追求：CLI 交互需要零延迟感知
深度定制需求：权限、压缩、钩子都需要精准控制

如果你不具备这些条件，LangChain/LangGraph 仍然是好选择：

你的情况	推荐
小团队，快速验证想法	LangChain
需要支持多种模型	LangChain
需要可视化 Agent 流程	LangGraph
需要多 Agent 协作且不想自研	LangGraph 或 CrewAI
Web 应用，延迟不敏感	LangChain/LangGraph
企业级系统，有专业团队	LangGraph 或自研

八、总结

Claude Code 不用 LangChain/LangGraph，不是傲慢，而是基于产品定位的理性选择：

LangChain/LangGraph 定位：通用框架
  → 易用性优先
  → 支持多种模型
  → 抽象层统一
  → 适合快速原型和通用应用

Claude Code 定位：专用系统
  → 性能优先
  → 单一模型极致利用
  → 零抽象流式处理
  → 适合 CLI 交互和专业场景

Claude Code 用什么替代了 LangChain/LangGraph：

替代	技术
ReAct 循环	Async Generator 状态机
工具定义	Tool 类型 + buildTool()
工具执行管道	七步执行管道
状态管理	State 对象 + 状态赋值
错误恢复	6 种内置恢复策略
扩展机制	钩子系统 + MCP 协议

核心启示：框架不是必须的，适合自己的才是最好的。LangChain/LangGraph 解决了”怎么快速搭建 Agent”的问题；Claude Code 解决了”怎么搭建极致体验的 Agent”的问题。

参考资料

Claude Code 源码揭秘：整体架构概览

2026-04-06T16:00:00.000Z

2026年3月31日，Anthropic 的 Claude Code 源码意外泄露。这个全球最流行的 AI 编程助手，其背后的架构设计远超外界想象——它不是简单的 Prompt 包装，而是一个精心设计的流式状态机系统。本文将从整体架构视角，为你揭开 Claude Code 的神秘面纱。

导读：一个根本性的问题

在深入源码之前，我们需要回答一个根本性的问题：Claude Code 到底是什么？

很多人的第一反应是：”不就是一个调用 Claude API 的 CLI 工具吗？加了一些 Prompt，让模型能读写文件、执行命令。”

这种理解大大低估了 Claude Code 的复杂度。当你打开源码，会发现：

1356 个 TypeScript 文件
48+ 个内置工具，每个工具都有完整的生命周期管理
4 种 Agent 类型，支持复杂的协作编排
4 级上下文压缩，实现”无限对话”
6 种故障恢复策略，确保用户体验的稳定性
3 级提示词缓存，大幅降低成本和延迟

这不是一个”简单的 Prompt 工具”，而是一个深度集成的 AI 编程环境。

一、技术栈与项目结构

1.1 核心技术栈

Claude Code 的技术选型非常精简但高效：

类别	技术	说明
运行时	Bun	高性能 JavaScript 运行时
语言	TypeScript	类型安全
终端 UI	React + Ink	React 语法写终端应用
CLI 解析	Commander.js	命令行参数处理
API	Anthropic SDK	原生 API 集成
协议	MCP, LSP	模型上下文协议、语言服务器协议

1.2 目录结构概览

src/
├── assistant/          # 会话历史管理
├── bootstrap/          # 启动初始化、全局状态
├── bridge/             # 远程桥接系统（Bridge）
├── buddy/              # 交互伴侣（动画、观察者）
├── cli/                # CLI 入口、传输层
├── commands/           # 60+ 斜杠命令
├── components/         # React UI 组件
├── constants/          # 系统提示词、常量
├── context/            # 上下文管理
├── coordinator/        # 协调器模式
├── entrypoints/        # 入口文件（CLI、SDK）
├── hooks/              # React Hooks
├── ink/                # Ink 框架扩展
├── memdir/             # 记忆系统
├── migrations/         # 数据迁移
├── native-ts/          # 原生模块（Yoga 布局等）
├── outputStyles/       # 输出样式配置
├── plugins/            # 插件系统
├── proactive/          # 主动模式
├── query/              # 查询循环核心
├── remote/             # 远程会话管理
├── schemas/            # JSON Schema 定义
├── screens/            # 全屏页面
├── server/             # 内置服务器
├── services/           # 核心服务层
├── skills/             # Skills 系统
├── state/              # 状态管理
├── tasks/              # 后台任务系统
├── tools/              # 48+ 内置工具
├── types/              # TypeScript 类型定义
├── utils/              # 工具函数
├── vendor/             # 第三方集成（Computer Use）
├── vim/                # Vim 模式
└── voice/              # 语音模式

这个结构体现了模块化设计的精髓：每个目录职责清晰，边界明确。

二、核心架构设计

2.1 整体架构图

┌─────────────────────────────────────────────────────────────┐
│                      用户输入                                │
└─────────────────────────────────────────────────────────────┘
                              │
                              ▼
┌─────────────────────────────────────────────────────────────┐
│                   QueryEngine (入口)                         │
│  - 构建系统提示词 (prompts.ts + context.ts + claudemd.ts)   │
│  - 组装工具池 (tools.ts + MCP)                              │
└─────────────────────────────────────────────────────────────┘
                              │
                              ▼
┌─────────────────────────────────────────────────────────────┐
│              query() AsyncGenerator 循环                    │
│  ┌──────────────────────────────────────────────────────┐  │
│  │ 阶段1: 消息压缩 (snip → micro → collapse → compact)  │  │
│  │ 阶段2: 流式 API 调用 (callModel + StreamingToolExec) │  │
│  │ 阶段3: 决策点 (继续 or 完成)                          │  │
│  │ 阶段4: 工具编排 (并行只读 + 串行写入)                 │  │
│  │ 阶段5: 状态更新 (state = next → continue)            │  │
│  └──────────────────────────────────────────────────────┘  │
└─────────────────────────────────────────────────────────────┘
                              │
          ┌───────────────────┼───────────────────┐
          ▼                   ▼                   ▼
┌─────────────────┐  ┌─────────────────┐  ┌─────────────────┐
│    工具系统      │  │   多 Agent 系统  │  │   扩展生态      │
│  48+ 内置工具    │  │  Subagent       │  │  Skills         │
│  MCP 动态工具    │  │  Fork           │  │  Plugins        │
│  三层过滤机制    │  │  Teammate       │  │  Hooks           │
│  7步执行管道     │  │  Remote         │  │  MCP 协议        │
└─────────────────┘  └─────────────────┘  └─────────────────┘

2.2 核心设计理念

Claude Code 的架构体现了三个核心理念：

理念一：流式优先（Streaming First）

整个架构围绕 AsyncGenerator 设计，一切都是流式的：

模型响应是流式的
工具在模型生成过程中就开始执行
进度实时更新
压缩策略是渐进式的

这意味着用户永远不需要等待——看到模型在思考、工具在执行、结果在产出。

理念二：工具驱动（Tool-Driven）

Claude Code 的哲学是：Agent 的能力等于其工具的能力。

子代理生成？是一个工具（AgentTool）
团队管理？是一个工具（TeamCreate/SendMessage）
文件编辑？是一个工具（FileEdit）
技能执行？是一个工具（SkillTool）

这意味着所有能力都通过统一的工具接口暴露，模型通过自然语言推理来决定使用哪个工具。不需要显式的编排逻辑——模型本身就是编排器。

理念三：优雅降级（Graceful Degradation）

6 种恢复策略确保 Claude Code 几乎不会因为技术问题中断用户的工作流：

Token 超限？自动压缩
API 超时？自动重试
模型失败？降级到备用模型
工具失败？记录错误，继续对话

三、核心模块解析

3.1 query.ts - Agent 的心脏

src/query.ts 是整个 Agent 的核心，约 1730 行。它不是简单的”想-做-看”循环，而是一个流式状态机：

export async function* query(params: QueryParams): AsyncGenerator<...> {
  let state: State = {
    messages,
    toolUseContext,
    autoCompactTracking,
    maxOutputTokensRecoveryCount,
    hasAttemptedReactiveCompact,
    maxOutputTokensOverride,
    pendingToolUseSummary,
    stopHookActive,
    turnCount,
    transition,
  }

  while (true) {
    // 阶段1: 消息压缩
    // 阶段2: 流式 API 调用
    // 阶段3: 决策点
    // 阶段4: 工具执行
    // 阶段5: 状态更新
    state = next  // 通过赋值而非递归驱动循环
    continue
  }
}

关键设计：通过 state = next 赋值驱动循环，而非递归调用。这保证了：

内存稳定：不会因为深度递归导致栈溢出
状态可追溯：每一轮的状态转换原因都被记录
恢复可控：任何阶段的错误都可以通过修改 state 来恢复

3.2 Tool.ts - 工具的定义

src/Tool.ts 定义了工具的完整接口（约 792 行）：

type Tool = {
  // 身份
  name: string
  aliases?: string[]        // 向后兼容的旧名称
  searchHint?: string       // ToolSearch 关键词匹配

  // 能力声明
  isEnabled(): boolean
  isConcurrencySafe(input): boolean   // 是否可并行
  isReadOnly(input): boolean          // 是否只读
  isDestructive(input): boolean       // 是否破坏性

  // 生命周期
  validateInput(input, context)       // 输入验证
  checkPermissions(input, context)    // 权限检查
  call(input, context, ...)           // 实际执行

  // 输出与渲染
  renderToolUseMessage(input)         // 渲染调用信息
  renderToolResultMessage(content)    // 渲染结果信息
  mapToolResultToToolResultBlockParam()  // 映射为 API 格式

  // 智能特性
  inputSchema: Zod schema             // Zod 类型验证
  maxResultSizeChars: number           // 结果大小阈值
  getToolUseSummary?(input): string    // 工具使用摘要
}

这种设计使得每个工具都是自描述、自验证、自渲染的——框架不需要了解工具的内部逻辑，只需调用标准接口。

3.3 系统提示词组装

src/constants/prompts.ts（约 577 行）实现了分层管道动态组装系统提示词：

┌─────────────────────────────────────────────────────────────┐
│                    静态可缓存区域                              │
│  ┌───────────────────────────────────────────────────────┐  │
│  │ 角色定义  │  系统规则  │  任务指导  │  工具说明  │  风格  │  │
│  └───────────────────────────────────────────────────────┘  │
├─────────────────────── 缓存边界 ────────────────────────────┤
│                    动态可变区域                                │
│  ┌───────────────────────────────────────────────────────┐  │
│  │ 会话指引 │ 记忆系统 │ 环境信息 │ MCP 指令 │ Token 预算 │  │
│  └───────────────────────────────────────────────────────┘  │
└─────────────────────────────────────────────────────────────┘

缓存边界是一个关键设计：

边界之上：跨用户、跨组织通用的内容，使用 scope: 'global' 缓存
边界之下：用户/会话特定的内容，使用 scope: 'ephemeral' 缓存

四、与 LangChain/ReAct 的本质区别

这是理解 Claude Code 架构的关键。大多数人认为 Claude Code 使用的是经典的 ReAct 模式：

1	思考(Thought) → 行动(Action) → 观察(Observation) → 思考 → ...

实际上，Claude Code 没有采用这个模式。

4.1 架构范式对比

维度	LangChain	Claude Code
核心模式	ReAct（Think→Act→Observe）	Async Generator 状态机
执行模型	同步阻塞	流式非阻塞
工具执行	等待模型完整响应后执行	流式传输中即时执行
状态管理	外部 Memory 对象	内置状态赋值 + 循环
错误恢复	需要手动编排	6 种内置恢复策略
上下文压缩	简单截断或摘要	四级渐进式压缩
多 Agent	Chain/Graph 显式编排	统一工具接口 + 状态机
扩展机制	Python 类继承	技能 + 插件 + 钩子 + MCP
缓存策略	无	全局/会话/按轮三级缓存

4.2 为什么不用 ReAct？

ReAct 模式有几个固有限制：

串行瓶颈：每一步必须等待完整的”思考→行动→观察”循环
无流式能力：模型生成完整响应后才能开始执行工具
恢复困难：没有统一的状态表示，难以实现自动恢复
缓存不友好：每次循环的 prompt 结构变化大，难以利用缓存

Claude Code 的 Async Generator 模式解决了所有这些问题：

流式执行：工具在模型生成过程中就开始运行
状态可控：State 对象包含所有需要的信息，恢复只需修改状态
缓存优化：静态提示词全局缓存，动态部分最小化
并行能力：只读工具自动并行，写入工具串行保序

五、关键源文件索引

组件	文件路径	行数	说明
核心循环	`src/query.ts`	~1730	Agent 主循环
查询引擎	`src/QueryEngine.ts`	~687	高层封装
工具定义	`src/Tool.ts`	~792	Tool 类型系统
工具注册	`src/tools.ts`	~389	工具发现和注册
系统提示词	`src/constants/prompts.ts`	~577	提示词组装
上下文管理	`src/context.ts`	~300	系统/用户上下文
Agent 生成	`src/tools/AgentTool/AgentTool.tsx`	~600	Agent 工具入口
技能系统	`src/skills/bundledSkills.ts`	~300	技能注册与管理
权限系统	`src/utils/permissions/permissions.ts`	~500	权限检查
状态管理	`src/state/AppStateStore.ts`	~400	全局状态

六、总结

Claude Code 的架构设计体现了简洁与强大的平衡：

一个循环：while (true) 驱动的状态机
一个状态：State 对象承载所有上下文
一个接口：Tool 类型统一所有能力

没有 Agent → AgentExecutor → Chain → Memory → Callback 的嵌套抽象层，这使得代码易于理解、调试和扩展。

在接下来的系列文章中，我们将深入每个模块，揭示更多设计细节。

系列文章导航：

下一篇：打破 ReAct 迷思：Async Generator 状态机

打破 ReAct 迷思：Async Generator 状态机

2026-04-05T16:00:00.000Z

当大多数人谈论 AI Agent 架构时，ReAct（Reasoning + Acting）几乎是唯一的答案。但 Claude Code 选择了一条不同的路——Async Generator 状态机。这个设计决策背后有着深刻的思考，它解决了 ReAct 的根本性限制，为流式交互和优雅恢复奠定了基础。

导读：ReAct 的困境

如果你熟悉 AI Agent 开发，一定对 ReAct 模式不陌生：

1	思考(Thought) → 行动(Action) → 观察(Observation) → 思考 → ...

这个模式直观且易于理解，已经成为 LangChain、AutoGPT 等框架的标配。但当你深入使用时，会发现它有几个难以回避的问题：

问题一：串行瓶颈
每一轮”思考”必须等待模型生成完整响应后才能开始执行工具。用户盯着屏幕等待，体验割裂。

问题二：无法利用流式传输
模型支持流式输出，但 ReAct 模式下，流式传输的价值被大大削弱——你必须等待完整的 action 才能执行。

问题三：恢复困难
当 API 超时、Token 溢出或工具失败时，ReAct 没有统一的状态表示来支持自动恢复。

Claude Code 的解决方案是：放弃 ReAct，使用 Async Generator 状态机。

一、状态机的核心设计

1.1 State 数据结构

src/query.ts 定义了状态机的核心状态（第 204-217 行）：

type State = {
  messages: Message[]                    // 完整对话历史
  toolUseContext: ToolUseContext          // 工具执行上下文
  autoCompactTracking: AutoCompactTracking  // 自动压缩追踪
  maxOutputTokensRecoveryCount: number   // 输出恢复计数
  hasAttemptedReactiveCompact: boolean   // 是否已尝试反应式压缩
  maxOutputTokensOverride: number        // 输出 token 覆盖值
  pendingToolUseSummary: Promise<...>    // 待处理的工具摘要
  stopHookActive: boolean               // 停止钩子状态
  turnCount: number                      // 对话轮数
  transition: Continue | undefined       // 状态转换原因
}

关键洞察：transition 字段记录了每一轮状态转换的原因。这使得调试和测试变得非常清晰——你可以精确知道为什么 Agent 从一个状态跳转到另一个状态。

1.2 核心循环：五个阶段

整个 while (true) 循环（第 307-1728 行）分为五个阶段：

┌─────────────────────────────────────────────────────────────┐
│                      while (true)                           │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  阶段1: 消息准备与智能压缩（第 365-543 行）                  │
│    ├─ Snip 压缩：智能删除旧消息中的冗余 token               │
│    ├─ Micro 压缩：修改已缓存消息的内容                      │
│    ├─ 上下文折叠：分阶段摘要历史消息                        │
│    └─ Auto Compact：通过 Claude 生成完整摘要                │
│                                                             │
│  阶段2: 流式 API 调用（第 652-954 行）                       │
│    ├─ 构建 API 请求（含 CacheSafeParams）                   │
│    ├─ 流式处理响应                                          │
│    ├─ StreamingToolExecutor 即时执行工具                    │
│    └─ 累积 usage 指标                                       │
│                                                             │
│  阶段3: 决策点（第 1062-1358 行）                            │
│    ├─ 有工具调用？→ 继续循环（阶段 4）                      │
│    └─ 无工具调用？→ 运行 Stop 钩子 → 返回结果               │
│                                                             │
│  阶段4: 工具编排执行（第 1363-1409 行）                      │
│    ├─ 分区：只读 vs 写入                                    │
│    ├─ 只读工具 → 并行执行（最多 10 个并发）                 │
│    └─ 写入工具 → 串行执行（防止竞态条件）                   │
│                                                             │
│  阶段5: 状态更新与循环（第 1704-1728 行）                    │
│    └─ state = next → continue                              │
│                                                             │
└─────────────────────────────────────────────────────────────┘

1.3 状态更新的优雅之处

这是整个设计最优雅的部分——通过状态赋值而非递归调用驱动循环：

// src/query.ts:1715-1728
const next: State = {
  messages: [...messagesForQuery, ...assistantMessages, ...toolResults],
  toolUseContext: toolUseContextWithQueryTracking,
  autoCompactTracking: tracking,
  turnCount: nextTurnCount,
  transition: { reason: 'next_turn' },
}
state = next
// 回到 while(true) 循环顶部

没有递归，没有回调地狱，只是简单的 state = next 然后 continue。

为什么这很重要？

内存稳定：不会因为深度递归导致栈溢出
状态可追溯：每一轮的状态转换原因都被记录
恢复可控：任何阶段的错误都可以通过修改 state 来恢复

二、流式优先的执行模型

2.1 StreamingToolExecutor 的设计

Claude Code 的一个关键创新是 StreamingToolExecutor——当模型生成 tool_use 块时，工具立即开始运行，而不是等模型生成完整响应。

// src/services/tools/StreamingToolExecutor.ts
class StreamingToolExecutor {
  async *processToolUseBlocks(toolUseBlocks: ToolUseBlock[]): AsyncGenerator {
    for (const block of toolUseBlocks) {
      // 在流式传输过程中就开始执行
      const result = await this.executeTool(block)
      yield result
    }
  }
}

对比 ReAct：

模式	工具执行时机	用户体验
ReAct	等待模型完整响应	割裂，需要等待
Async Generator	流式传输中即时执行	流畅，实时反馈

2.2 工具编排策略

工具执行不是简单的逐个运行，而是有精心设计的编排策略（src/services/tools/toolOrchestration.ts）：

工具调用列表
  │
  ├─ 分区：只读 vs 写入
  │
  ├─ 只读工具 ──→ 并行执行（最多 10 个并发）
  │   ├─ Read
  │   ├─ Grep
  │   ├─ Glob
  │   └─ WebFetch
  │
  └─ 写入工具 ──→ 串行执行（防止竞态条件）
      ├─ FileEdit
      ├─ FileWrite
      └─ Bash (非只读)

设计原理：

只读工具没有副作用，可以安全并行
写入工具可能相互影响，必须串行保证顺序
10 个并发限制防止资源耗尽

三、六种故障恢复策略

这是 Claude Code 最精妙的设计之一。核心循环内置了 6 种恢复策略，确保用户体验的稳定性：

3.1 恢复策略详解

恢复策略	触发条件	恢复方式
`collapse_drain_retry`	prompt 过长	排空已暂存的上下文折叠，重试
`reactive_compact_retry`	仍然过长	通过 Claude 生成摘要，重试
`max_output_tokens_escalate`	触及 8k 默认限制	升级到 64k 限制重试
`max_output_tokens_recovery`	触及任何限制	注入”继续”提示，重试（最多 3 次）
`stop_hook_blocking`	Stop 钩子阻塞	将阻塞错误注入上下文，重试
`token_budget_continuation`	预算尚余	注入预算提示，继续执行

3.2 恢复代码示例

每种恢复都通过修改 state 实现：

// 例：prompt 过长恢复
if (error.type === 'prompt_too_long') {
  // 排空所有暂存的折叠
  const compacted = drainStagedCollapses(state.messages)
  state = { 
    ...state, 
    messages: compacted, 
    transition: { reason: 'collapse_drain_retry' } 
  }
  continue  // 回到循环顶部重试
}

// 例：max_output_tokens 恢复
if (error.type === 'max_output_tokens') {
  state = {
    ...state,
    maxOutputTokensRecoveryCount: state.maxOutputTokensRecoveryCount + 1,
    transition: { reason: 'max_output_tokens_recovery' }
  }
  // 注入"继续"提示
  messages.push(createUserMessage({ content: 'Please continue.' }))
  continue
}

3.3 为什么这些恢复策略重要？

想象一个场景：用户正在让 Claude 修改一个大型代码库，对话已经进行了 50 轮，积累了大量上下文。突然：

Token 溢出 → 自动压缩，用户无感知
API 超时 → 自动重试，用户无感知
模型达到输出限制 → 注入”继续”，自动续写

用户几乎感觉不到任何中断。这是 Claude Code 能提供流畅体验的关键。

四、与 LangChain Agent 的具体差异

4.1 代码对比

LangChain Agent（简化）：

agent = initialize_agent(tools, llm, agent="zero-shot-react-description")
result = agent.run("do something")
# 内部：LLM → parse → tool → LLM → parse → tool → ... → final answer
# 每一步都是独立的 LLM 调用

Claude Code Agent（简化）：

for await (const msg of query({ messages, tools, systemPrompt })) {
  yield msg  // 实时产出消息
  // 内部：流式 LLM → 流式工具执行 → 状态更新 → 继续
  // 单次 API 调用可以触发多个工具，工具在流式中执行
}

4.2 关键差异

维度	LangChain	Claude Code
每一轮	独立的 LLM 调用	流式 API 调用
工具解析	OutputParser 解析文本	原生 `tool_use` 块
执行方式	等待完整响应	流式即时执行
错误处理	手动 try-catch	内置 6 种恢复
并行工具	需要显式编排	自动分区并行

4.3 与 LangGraph 的对比

LangGraph 是 LangChain 的升级版，引入了图结构：

维度	LangGraph	Claude Code
状态流转	显式图节点 + 边	隐式状态机（while + continue）
可视化	可导出为图	状态转换原因可追溯
持久化	Checkpoint + State	文件系统 + 消息历史
人机交互	interrupt_before/after	权限系统 + 钩子
多 Agent	需要显式编排	AgentTool 统一接口

Claude Code 的优势在于简单性——不需要定义图结构，一个 while 循环就能处理所有情况。

五、设计原则总结

从源码分析中，我们可以总结出以下核心设计原则：

5.1 最小抽象原则

与 LangChain 的”万物皆抽象”不同，Claude Code 的核心只有：

一个循环（while (true) in query()）
一个状态（State 对象）
一个接口（Tool 类型）

没有 Agent → AgentExecutor → Chain → Memory → Callback 的嵌套抽象层。

5.2 原生 API 集成

Claude Code 直接使用 Anthropic API 的原生能力：

原生工具调用：无需 OutputParser，直接使用 tool_use 块
原生流式传输：无需包装层，直接消费 SSE 流
原生缓存：利用 API 的 prompt caching 特性
原生思维链：直接使用 extended thinking

这避免了”框架税”——LangChain 等框架在 LLM 和开发者之间增加的抽象层。

5.3 可观测性设计

transition 字段的设计体现了对可观测性的重视：

type Continue = {
  reason: 'next_turn' 
    | 'collapse_drain_retry'
    | 'reactive_compact_retry'
    | 'max_output_tokens_recovery'
    | 'stop_hook_blocking'
    | 'token_budget_continuation'
}

每一轮循环都知道自己为什么继续，这对于调试和测试至关重要。

六、关键源文件索引

文件	行数	职责
`src/query.ts`	~1730	Agent 主循环，状态机核心
`src/QueryEngine.ts`	~687	高层封装，对外 API
`src/services/tools/StreamingToolExecutor.ts`	~200	流式工具执行器
`src/services/tools/toolOrchestration.ts`	~150	工具编排策略
`src/query/transitions.ts`	~50	状态转换类型定义
`src/query/tokenBudget.ts`	~100	Token 预算管理
`src/query/stopHooks.ts`	~200	Stop 钩子处理

七、总结

Claude Code 的 Async Generator 状态机设计解决了 ReAct 模式的根本性限制：

流式执行：工具在模型生成过程中就开始运行
状态可控：统一的 State 对象，恢复只需修改状态
自动恢复：6 种内置策略确保用户体验稳定
缓存友好：静态部分全局缓存，动态部分最小化
并行能力：只读工具自动并行，写入工具串行保序

这个设计选择体现了 Claude Code 团队对产品体验的深刻理解：用户不应该等待，也不应该因为技术问题中断。

系列文章导航：

上一篇：Claude Code 源码揭秘：整体架构概览
下一篇：工具系统设计：从定义到执行的七步管道

Computer Use：桌面控制的九层安全关卡

2026-04-05T16:00:00.000Z

Computer Use 是 Claude Code 最具争议也最强大的能力——AI 可以直接操控你的桌面，点击按钮、输入文字、截图分析。这听起来像科幻电影，但 Claude Code 实现了一个九层安全关卡系统，确保每一步操作都在可控范围内。更关键的是，它通过 Python Bridge 实现跨语言通信，让 TypeScript 代理驱动 Python 执行器。

导读：当 AI 控制你的屏幕

想象这个场景：

Claude Code 正在帮你调试一个 GUI 应用。它打开应用窗口，点击菜单，输入测试数据，截图分析结果，然后告诉你”登录按钮在点击后无响应”。

这就是 Computer Use——AI 直接操控桌面环境的能力。

但这也带来巨大的安全风险：AI 可能误删文件、点击错误按钮、泄露敏感信息。Claude Code 的解决方案是九层安全关卡，每一层都可以中断操作。

一、Computer Use 架构概览

1.1 整体架构

┌─────────────────────────────────────────────────────────────┐
│                    Computer Use 架构                         │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Claude Code (TypeScript)                                   │
│       ↓                                                     │
│  Computer Use Tool                                          │
│       ↓                                                     │
│  JSON-RPC over stdio                                        │
│       ↓                                                     │
│  Python Bridge (computer_controller.py)                     │
│       ↓                                                     │
│  Platform Abstraction Layer                                 │
│       ├─ Windows: pyautogui + Win32 API                    │
│       ├─ macOS: PyObjC + AppleScript                       │
│       └─ Linux: xdotool + Gdk/Xlib                         │
│       ↓                                                     │
│  Desktop Environment                                        │
│                                                             │
└─────────────────────────────────────────────────────────────┘

1.2 为什么用 Python？

虽然 Claude Code 是 TypeScript 项目，但 Computer Use 使用 Python 实现：

原因	说明
生态成熟	pyautogui、PyObjC 等库已稳定运行多年
跨平台	Python GUI 库对 Windows/macOS/Linux 支持一致
快速迭代	不需要为每个平台单独编写 native 代码

二、24 个桌面操作工具

2.1 工具分类

┌─────────────────────────────────────────────────────────────┐
│                   24 个 Computer Use 工具                    │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  输入类（Input）                                             │
│    ├─ computer_mouse_click      左键/右键/中键点击          │
│    ├─ computer_mouse_double_click 双击                     │
│    ├─ computer_mouse_drag       拖拽操作                    │
│    ├─ computer_mouse_move       移动鼠标                    │
│    ├─ computer_mouse_scroll     滚轮滚动                    │
│    ├─ computer_keyboard_hotkey  组合键（Ctrl+C 等）         │
│    ├─ computer_keyboard_press   单键按下                    │
│    ├─ computer_keyboard_type    文字输入                    │
│    └─ computer_clipboard_paste  粘贴内容                    │
│                                                             │
│  显示类（Display）                                           │
│    ├─ computer_screen_capture   截图                        │
│    ├─ computer_screen_get_size  获取屏幕尺寸                │
│    ├─ computer_window_list      窗口列表                    │
│    ├─ computer_window_activate  激活窗口                    │
│    ├─ computer_window_get_position 窗口位置                 │
│    └─ computer_window_get_size  窗口尺寸                    │
│                                                             │
│  文件类（File）                                              │
│    ├─ computer_file_read        读取文件                    │
│    ├─ computer_file_write       写入文件                    │
│    ├─ computer_file_delete      删除文件                    │
│    ├─ computer_file_list        列出目录                    │
│    ├─ computer_file_move        移动文件                    │
│    ├─ computer_file_copy        复制文件                    │
│    └─ computer_file_info        文件信息                    │
│                                                             │
│  进程类（Process）                                           │
│    ├─ computer_process_list     进程列表                    │
│    ├─ computer_process_start    启动进程                    │
│    └─ computer_process_kill     杀死进程                    │
│                                                             │
└─────────────────────────────────────────────────────────────┘

2.2 工具定义示例

// src/tools/ComputerUseTool/tools.ts
const computer_mouse_click = {
  name: 'computer_mouse_click',
  inputSchema: {
    type: 'object',
    properties: {
      x: { type: 'number', description: 'X coordinate' },
      y: { type: 'number', description: 'Y coordinate' },
      button: { 
        type: 'string', 
        enum: ['left', 'right', 'middle'],
        default: 'left'
      },
      clicks: { type: 'number', default: 1 },
    },
    required: ['x', 'y'],
  },
  description: 'Click at the specified coordinates',
}

三、九层安全关卡

3.1 安全关卡架构

┌─────────────────────────────────────────────────────────────┐
│                    九层安全关卡                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Gate 1: 功能门控（Feature Gate）                           │
│    └─ tengu_computer_use Feature Flag 必须开启             │
│                                                             │
│  Gate 2: 用户确认（User Consent）                           │
│    └─ 首次使用弹出确认对话框                                │
│                                                             │
│  Gate 3: 操作类型检查（Action Type）                        │
│    └─ 读写操作需要额外确认                                  │
│                                                             │
│  Gate 4: 路径约束（Path Constraint）                        │
│    ├─ 文件操作限制在白名单目录                              │
│    └─ 禁止访问 .git、.claude、系统目录                      │
│                                                             │
│  Gate 5: 危险命令过滤（Dangerous Command）                   │
│    ├─ 禁止 rm -rf、killall 等命令                          │
│    ├─ 禁止访问密码管理器、银行应用                          │
│                                                             │
│  Gate 6: 屏幕边界检查（Screen Boundary）                    │
│    ├─ 鼠标坐标必须在屏幕范围内                              │
│    └─ 窗口操作必须针对可见窗口                              │
│                                                             │
│  Gate 7: 操作频率限制（Rate Limit）                         │
│    ├─ 每秒最多 10 次操作                                    │
│    └─ 连续失败 3 次暂停                                     │
│                                                             │
│  Gate 8: 截图内容分析（Screenshot Analysis）                │
│    ├─ 检测敏感内容（密码框、私人信息）                      │
│    └─ 检测错误弹窗                                          │
│                                                             │
│  Gate 9: 实时监控（Real-time Monitoring）                   │
│    ├─ 用户可随时按 Ctrl+C 中断                             │
│    ├─ 操作日志实时输出                                      │
│                                                             │
└─────────────────────────────────────────────────────────────┘

3.2 Gate 实现示例

// src/tools/ComputerUseTool/security.ts
function gateComputerUseAction(
  action: ComputerUseAction,
  context: ToolUseContext,
): GateResult {
  // Gate 1: Feature Gate
  if (!feature('tengu_computer_use')) {
    return { action: 'deny', reason: 'Feature not enabled' }
  }

  // Gate 2: User Consent
  if (!context.computerUseConsent) {
    return { action: 'ask', reason: 'First-time use requires consent' }
  }

  // Gate 3: Action Type
  if (isWriteAction(action) && !context.computerUseWriteConsent) {
    return { action: 'ask', reason: 'Write operation requires confirmation' }
  }

  // Gate 4: Path Constraint
  if (action.type === 'file') {
    if (!isInAllowedDirectory(action.path, context.allowedDirectories)) {
      return { action: 'deny', reason: 'Path not in allowed directories' }
    }
  }

  // Gate 5: Dangerous Command
  if (isDangerousCommand(action)) {
    return { action: 'deny', reason: 'Dangerous command blocked' }
  }

  // Gate 6: Screen Boundary
  if (action.type === 'mouse') {
    const screenSize = getScreenSize()
    if (action.x < 0 || action.x > screenSize.width ||
        action.y < 0 || action.y > screenSize.height) {
      return { action: 'deny', reason: 'Coordinates out of screen bounds' }
    }
  }

  // Gate 7: Rate Limit
  if (isRateLimited(context.computerUseHistory)) {
    return { action: 'wait', reason: 'Rate limit exceeded', waitTime: 1000 }
  }

  // Gate 8: Screenshot Analysis (performed after capture)
  // Gate 9: Real-time Monitoring (handled by interrupt mechanism)

  return { action: 'allow' }
}

四、Python Bridge 通信协议

4.1 JSON-RPC over stdio

// src/tools/ComputerUseTool/bridge.ts
interface BridgeMessage {
  jsonrpc: '2.0'
  id: number
  method: string
  params: Record<string, unknown>
}

interface BridgeResponse {
  jsonrpc: '2.0'
  id: number
  result?: unknown
  error?: { code: number; message: string }
}

async function callBridge(method: string, params: unknown): Promise<unknown> {
  const message: BridgeMessage = {
    jsonrpc: '2.0',
    id: nextId++,
    method,
    params,
  }

  // 写入 stdin
  bridgeProcess.stdin.write(JSON.stringify(message) + '\n')

  // 读取 stdout
  const response = await readBridgeResponse()

  if (response.error) {
    throw new BridgeError(response.error.code, response.error.message)
  }

  return response.result
}

4.2 Python 执行器

# computer_controller.py
import json
import sys
from typing import Any

class ComputerController:
    def __init__(self):
        self.handlers = {
            'computer_mouse_click': self.mouse_click,
            'computer_keyboard_type': self.keyboard_type,
            'computer_screen_capture': self.screen_capture,
            # ... 24 个处理器
        }

    def run(self):
        while True:
            line = sys.stdin.readline()
            if not line:
                break

            request = json.loads(line)
            method = request['method']
            params = request['params']
            id = request['id']

            try:
                handler = self.handlers[method]
                result = handler(**params)
                response = {
                    'jsonrpc': '2.0',
                    'id': id,
                    'result': result
                }
            except Exception as e:
                response = {
                    'jsonrpc': '2.0',
                    'id': id,
                    'error': {'code': 1, 'message': str(e)}
                }

            sys.stdout.write(json.dumps(response) + '\n')
            sys.stdout.flush()

    def mouse_click(self, x: int, y: int, button: str = 'left'):
        import pyautogui
        pyautogui.click(x, y, button=button)

    def screen_capture(self) -> str:
        import pyautogui
        import base64
        screenshot = pyautogui.screenshot()
        # 返回 base64 编码
        return base64.b64encode(screenshot).decode('utf-8')

五、截图分析机制

5.1 截图流程

Model 决定截图
    ↓
computer_screen_capture 工具调用
    ↓
Python Bridge 执行 pyautogui.screenshot()
    ↓
PNG → Base64 编码
    ↓
返回给 Claude Code
    ↓
作为 image block 注入对话
    ↓
Model 多模态分析

5.2 截图内容过滤

// src/tools/ComputerUseTool/screenshotFilter.ts
async function filterScreenshot(
  base64Image: string,
): Promise<FilterResult> {
  // 1. 使用本地 OCR 检测敏感文本
  const detectedText = await localOcrDetect(base64Image)

  // 2. 检测敏感关键词
  const sensitiveKeywords = ['password', 'secret', 'api key', 'token']
  const foundSensitive = sensitiveKeywords.some(k => 
    detectedText.toLowerCase().includes(k)
  )

  if (foundSensitive) {
    return {
      action: 'blur',
      regions: findSensitiveRegions(detectedText),
      reason: 'Sensitive content detected',
    }
  }

  return { action: 'allow' }
}

六、窗口管理系统

6.1 窗口发现

// 窗口列表返回格式
interface WindowInfo {
  id: number
  title: string
  process: string
  position: { x: number; y: number }
  size: { width: number; height: number }
  visible: boolean
}

// 示例返回
[
  { id: 1234, title: 'VS Code', process: 'code', position: { x: 0, y: 0 }, size: { width: 1920, height: 1080 }, visible: true },
  { id: 5678, title: 'Chrome', process: 'chrome', position: { x: 100, y: 100 }, size: { width: 800, height: 600 }, visible: true },
]

6.2 窗口激活策略

// 激活窗口的安全检查
async function activateWindow(windowId: number): Promise<void> {
  // 1. 检查窗口是否存在
  const window = await getWindowInfo(windowId)
  if (!window) {
    throw new Error('Window not found')
  }

  // 2. 检查窗口是否属于敏感应用
  const sensitiveApps = ['Keychain Access', '1Password', 'Banking App']
  if (sensitiveApps.some(app => window.title.includes(app))) {
    throw new Error('Cannot activate sensitive application')
  }

  // 3. 执行激活
  await callBridge('computer_window_activate', { window_id: windowId })
}

七、操作审计日志

7.1 日志格式

interface ComputerUseLogEntry {
  timestamp: number
  action: string
  params: Record<string, unknown>
  result: 'success' | 'deny' | 'error'
  reason?: string
  duration: number
  screenshot?: string  // 操作后的截图（可选）
}

// 示例日志
[
  { timestamp: 1712345678, action: 'mouse_click', params: { x: 100, y: 200 }, result: 'success', duration: 50 },
  { timestamp: 1712345680, action: 'keyboard_type', params: { text: 'hello' }, result: 'success', duration: 100 },
  { timestamp: 1712345682, action: 'file_delete', params: { path: '/etc/passwd' }, result: 'deny', reason: 'Dangerous path', duration: 0 },
]

7.2 日志存储

// 日志持久化到文件
const LOG_PATH = '.claude/computer_use_history.jsonl'

async function appendLog(entry: ComputerUseLogEntry): Promise<void> {
  const logLine = JSON.stringify(entry) + '\n'
  await fs.appendFile(LOG_PATH, logLine)
}

八、中断机制

8.1 Ctrl+C 中断

// 监听中断信号
process.on('SIGINT', async () => {
  // 1. 通知 Python Bridge 停止
  await callBridge('stop', {})

  // 2. 恢复鼠标状态
  await callBridge('mouse_move', { x: lastSafeX, y: lastSafeY })

  // 3. 记录中断
  appendLog({
    timestamp: Date.now(),
    action: 'interrupt',
    params: {},
    result: 'success',
    reason: 'User pressed Ctrl+C',
    duration: 0,
  })

  // 4. 提示用户
  console.log('\nComputer Use interrupted. All operations stopped.')
})

8.2 紧急停止

Python Bridge 维护一个紧急停止标志：

# computer_controller.py
class ComputerController:
    def __init__(self):
        self.emergency_stop = False

    def run(self):
        while not self.emergency_stop:
            # ... 处理请求

    def stop(self):
        self.emergency_stop = True
        # 恢复鼠标到安全位置
        pyautogui.moveTo(self.safe_x, self.safe_y)

九、平台适配层

9.1 Windows 实现

# platform/windows.py
import pyautogui
import ctypes
from ctypes import wintypes

def get_active_window():
    """获取活动窗口"""
    hwnd = ctypes.windll.user32.GetForegroundWindow()
    return hwnd

def get_window_title(hwnd):
    """获取窗口标题"""
    length = ctypes.windll.user32.GetWindowTextLengthW(hwnd)
    title = ctypes.create_unicode_buffer(length + 1)
    ctypes.windll.user32.GetWindowTextW(hwnd, title, length + 1)
    return title.value

9.2 macOS 实现

# platform/macos.py
import pyautogui
from AppKit import NSWorkspace, NSRunningApplication

def get_active_window():
    """获取活动窗口"""
    workspace = NSWorkspace.sharedWorkspace()
    app = workspace.activeApplication()
    return app.localizedName()

def activate_window(title):
    """激活窗口"""
    workspace = NSWorkspace.sharedWorkspace()
    apps = workspace.runningApplications()
    for app in apps:
        if app.localizedName() == title:
            app.activateWithOptions_(NSApplicationActivateIgnoringOtherApps)
            break

9.3 Linux 实现

# platform/linux.py
import pyautogui
import subprocess

def get_active_window():
    """获取活动窗口"""
    result = subprocess.run(
        ['xdotool', 'getactivewindow'],
        capture_output=True,
        text=True
    )
    return int(result.stdout.strip())

def get_window_title(window_id):
    """获取窗口标题"""
    result = subprocess.run(
        ['xdotool', 'getwindowname', str(window_id)],
        capture_output=True,
        text=True
    )
    return result.stdout.strip()

十、关键源文件索引

文件	职责
`src/tools/ComputerUseTool/ComputerUseTool.ts`	工具定义、权限检查、安全关卡
`src/tools/ComputerUseTool/bridge.ts`	Python Bridge 通信
`src/tools/ComputerUseTool/security.ts`	九层安全关卡实现
`src/tools/ComputerUseTool/tools.ts`	24 个工具定义
`src/tools/ComputerUseTool/screenshotFilter.ts`	截图内容过滤
`computer_controller.py`	Python 执行器主入口
`platform/windows.py`	Windows 平台适配
`platform/macos.py`	macOS 平台适配
`platform/linux.py`	Linux 平台适配

十一、总结

Claude Code 的 Computer Use 系统体现了几个核心设计原则：

九层防御：从功能门控到实时监控，层层把关
跨语言架构：TypeScript 代理 + Python 执行器
JSON-RPC 协议：简单高效的跨进程通信
平台抽象：统一接口，底层适配三大操作系统
审计日志：完整记录所有操作，便于追溯
用户可控：随时 Ctrl+C 中断，恢复安全状态

这个设计让 AI 真正能够”看见”和”操控”桌面环境，同时保持高度安全性。

系列文章导航：

上一篇：Channel 系统：IM 远程控制 Agent
下一篇：Terminal UI：React + Ink 的 TUI 实现

Channel 系统：IM 远程控制 Agent

2026-04-05T16:00:00.000Z

你在手机上打开 Telegram，给 Claude Code 发一条消息，它就开始在你的电脑上工作——这就是 Channel 系统。它打破了 AI 编程助手只能在终端中交互的限制，实现了真正的远程控制。更精妙的是，它有六层访问控制和权限中继机制，确保安全性。

导读：打破终端的边界

传统的 AI 编程助手只能在终端中交互。如果你想让它工作，你必须坐在电脑前。

Channel 系统改变了这一切：

你在手机上通过 Telegram 发消息
Claude Code 收到消息，理解意图，执行操作
结果回复到你的 Telegram 聊天窗口

这不是简单的消息转发——这是一个完整的远程控制系统：

六层访问控制确保只有授权的 Channel 能推送消息
权限中继让你在手机上也能审批危险操作
MCP 协议让任何 IM 平台都能集成

一、Channel 的本质

1.1 Channel 就是一个 MCP Server

从技术角度看，一个 Channel 就是一个特殊的 MCP Server：

// Channel 的能力声明
{
  "experimental": {
    "claude/channel": {}           // 声明 Channel 能力
    "claude/channel/permission": {}  // 声明权限中继能力（可选）
  }
}

1.2 Channel 的两种形态

1
2
3

type ChannelEntry =
  | { kind: 'plugin'; name: string; marketplace: string; dev?: boolean }
  | { kind: 'server'; name: string; dev?: boolean }

形态	说明	安全性
plugin	来自 marketplace 的验证插件	需要白名单
server	直接指定的 MCP 服务器名称	需要 dev 旁路

二、消息流转全链路

2.1 入站流程（IM → Agent）

┌─────────────────────────────────────────────────────────────┐
│                    入站消息流程                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Telegram/Feishu/Discord                                    │
│       ↓                                                     │
│  Channel Plugin（MCP Server）                               │
│       ↓                                                     │
│  notifications/claude/channel { content, meta }             │
│       ↓                                                     │
│  useManageMCPConnections → registerNotificationHandler      │
│       ↓                                                     │
│  wrapChannelMessage() →   │
│       ↓                                                     │
│  enqueue({ priority: 'next', isMeta: true })                │
│       ↓                                                     │
│  SleepTool 每 ~1s 轮询 hasCommandsInQueue()                │
│       ↓                                                     │
│  Model 看到  标签，理解消息来源                      │
│                                                             │
└─────────────────────────────────────────────────────────────┘

2.2 出站流程（Agent → IM）

┌─────────────────────────────────────────────────────────────┐
│                    出站消息流程                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Model 决定使用哪个工具回复                                   │
│       ↓                                                     │
│  callTool() → Channel 的 MCP 工具                           │
│  （reply / react / edit_message / download_attachment）      │
│       ↓                                                     │
│  MCP 协议调用 Channel Server                                │
│       ↓                                                     │
│  Channel Server 发送消息到 IM 平台                           │
│       ↓                                                     │
│  Telegram/Feishu/Discord 用户收到回复                        │
│                                                             │
└─────────────────────────────────────────────────────────────┘

2.3 消息封装格式

1
2
3

<channel source="plugin:telegram:tg" user="alice" chat_id="123456">
帮我看看 main.ts 有什么问题
channel>

模型看到这个标签后，就知道消息来自 Telegram 的用户 alice，并会使用 Telegram 的 reply 工具回复。

三、六层访问控制

3.1 Gate 函数

// src/services/mcp/channelNotification.ts
function gateChannelServer(
  serverName: string,
  capabilities: ServerCapabilities | undefined,
  pluginSource: string | undefined,
): ChannelGateResult  // { action: 'register' } | { action: 'skip', kind, reason }

3.2 六层关卡详解

┌─────────────────────────────────────────────────────────────┐
│                    六层访问控制                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Gate 1: 能力声明（Capability）                             │
│    └─ MCP Server 必须声明 claude/channel 能力              │
│                                                             │
│  Gate 2: 运行时开关（Runtime Gate）                         │
│    └─ tengu_harbor Feature Flag 必须开启                   │
│                                                             │
│  Gate 3: OAuth 认证（Auth）                                 │
│    └─ 必须通过 OAuth 认证（API Key 用户被阻止）             │
│                                                             │
│  Gate 4: 组织策略（Policy）                                 │
│    └─ Teams/Enterprise 必须在托管设置中显式启用             │
│                                                             │
│  Gate 5: 会话白名单（Session）                              │
│    └─ 必须在 --channels 参数列表中                         │
│                                                             │
│  Gate 6: Marketplace 验证 + 白名单（Allowlist）             │
│    ├─ 验证插件来源标签与实际安装来源匹配                    │
│    └─ 插件必须在 GrowthBook 审批白名单中                   │
│                                                             │
└─────────────────────────────────────────────────────────────┘

3.3 Gate 结果类型

type ChannelGateResult =
  | { action: 'register' }           // 通过所有检查
  | { action: 'skip'; kind: string; reason: string }  // 某层拦截

// kind 枚举：capability | disabled | auth | policy | session | marketplace | allowlist

四、权限中继系统

4.1 为什么需要权限中继

当 Claude Code 需要执行敏感操作（如运行 Bash 命令），会弹出权限确认对话框。但如果用户通过 Telegram 远程控制 Agent，他看不到本地终端的对话框。

权限中继解决了这个问题：将权限提示转发到 IM 平台，让用户在手机上也能审批或拒绝操作。

4.2 出站：权限请求

// 通知 Schema
const CHANNEL_PERMISSION_REQUEST_METHOD =
  'notifications/claude/channel/permission_request'

type ChannelPermissionRequestParams = {
  request_id: string      // 5 字母标识符（如 "tbxkq"）
  tool_name: string       // 工具名（如 "Bash"）
  description: string     // 人类可读描述
  input_preview: string   // JSON 输入预览，截断到 200 字符
}

4.3 Short Request ID 设计

5 个字母标识符的设计充满巧思：

// src/services/mcp/channelPermissions.ts
function shortRequestId(toolUseID: string): string {
  // 25 字母表：a-z 去掉 l（与 1/I 混淆）
  const alphabet = 'abcdefghijkmnopqrstuvwxyz'
  const id = hashToId(toolUseID, alphabet)
  
  // 脏话过滤
  for (const bad of ID_AVOID_SUBSTRINGS) {
    if (id.includes(bad)) {
      return shortRequestId(`${toolUseID}:retry`)  // 重试
    }
  }
  
  return id
}

设计决策：

纯字母：手机用户不需要切换键盘模式
大小写不敏感：适配手机自动更正
脏话过滤：防止尴尬场景

4.4 入站：权限响应

用户在 IM 中回复格式：yes tbxkq 或 no tbxkq

// 服务端解析正则
const PERMISSION_REPLY_RE = /^\s*(y|yes|n|no)\s+([a-km-z]{5})\s*$/i

// 结构化通知
const ChannelPermissionNotificationSchema = z.object({
  method: z.literal('notifications/claude/channel/permission'),
  params: z.object({
    request_id: z.string(),
    behavior: z.enum(['allow', 'deny']),
  }),
})

4.5 多源竞争

权限响应来自四个来源，先到先得：

┌──────────────┐   ┌──────────────┐   ┌──────────────┐   ┌──────────────┐
│   本地终端    │   │    Bridge    │   │   Channels   │   │    Hooks     │
│  Local UI    │   │   远程控制    │   │ Telegram etc │   │  Permission  │
└──────┬───────┘   └──────┬───────┘   └──────┬───────┘   └──────┬───────┘
       │                   │                   │                  │
       └───────────────────┴───────────────────┴──────────────────┘
                                    │
                              claim() — 先到先得
                                    │
                              ┌─────┴─────┐
                              │  resolve   │
                              │  allow/deny│
                              └───────────┘

五、安全设计

5.1 XML 注入防护

Channel 消息中的元数据会成为 XML 属性。两道防线：

// 键名过滤：只允许纯标识符格式
const SAFE_META_KEY = /^[a-zA-Z_][a-zA-Z0-9_]*$/

// 值转义
function escapeXmlAttr(value: string): string {
  return value
    .replace(/&/g, '&')
    .replace(/"/g, '"')
    .replace(/, '<')
    .replace(/>/g, '>')
}

5.2 Marketplace 验证

--channels plugin:slack@anthropic 只是用户的”意图声明”。运行时验证：

const actual = pluginSource
  ? parsePluginIdentifier(pluginSource).marketplace
  : undefined
if (actual !== entry.marketplace) {
  return { action: 'skip', kind: 'marketplace', reason: 'Tag mismatch' }
}

5.3 权限中继的信任边界

问题：Claude 会自我审批吗？

答案：审批方是通过 Channel 的人类，不是 Claude。但信任边界不是终端——而是白名单。一个被妥协的 Channel Server 可以伪造响应，但：

它本来就有无限的对话注入能力
权限对话框减缓攻击速度，但不能完全阻止

5.4 skipSlashCommands

Channel 消息入队时设置 skipSlashCommands: true，确保 IM 用户发送的 /help 等文本不会被解释为 Claude Code 的斜杠命令。

六、插件 Channel 架构

6.1 Plugin Manifest 声明

{
  "name": "telegram",
  "version": "1.0.0",
  "mcpServers": {
    "tg": {
      "command": "node",
      "args": ["./server.js"],
      "env": {
        "BOT_TOKEN": "${user_config.bot_token}",
        "OWNER_ID": "${user_config.owner_id}"
      }
    }
  },
  "channels": [
    {
      "server": "tg",
      "displayName": "Telegram",
      "userConfig": {
        "bot_token": {
          "type": "string",
          "description": "Telegram Bot API Token",
          "required": true,
          "secret": true
        },
        "owner_id": {
          "type": "string",
          "description": "Your Telegram User ID",
          "required": true
        }
      }
    }
  ]
}

6.2 作用域命名

插件提供的 MCP Server 会被添加作用域前缀：

// 输入：{ "tg": { ... } } from telegram@anthropic
// 输出：{ "plugin:telegram:tg": { ... } }

function addPluginScopeToServers(servers, pluginName, pluginSource) {
  const scopedServers = {}
  for (const [name, config] of Object.entries(servers)) {
    const scopedName = `plugin:${pluginName}:${name}`
    scopedServers[scopedName] = {
      ...config,
      scope: 'dynamic',
      pluginSource,
    }
  }
  return scopedServers
}

七、命令行接口

7.1 启动参数

# 使用已审批的 Channel 插件
claude --channels plugin:telegram@anthropic plugin:feishu@anthropic

# 本地开发模式（旁路白名单）
claude --dangerously-load-development-channels plugin:my-channel@local

# 两者可以同时使用
claude --channels plugin:telegram@anthropic \
       --dangerously-load-development-channels plugin:dev-channel@local

7.2 特性门控

// src/main.tsx
if (feature('KAIROS') || feature('KAIROS_CHANNELS')) {
  program.addOption(new Option('--channels ', '...').hideHelp())
  program.addOption(new Option('--dangerously-load-development-channels ', '...').hideHelp())
}

hideHelp() 表示这些选项不会出现在 --help 输出中——Channel 功能目前处于隐藏特性阶段。

八、关键源文件索引

文件	行数	职责
`src/services/mcp/channelNotification.ts`	~320	门控、消息封装、白名单集成
`src/services/mcp/channelPermissions.ts`	~240	权限中继、请求 ID 生成
`src/services/mcp/channelAllowlist.ts`	~80	GrowthBook 白名单查询
`src/services/mcp/useManageMCPConnections.ts`	-	连接管理、通知处理器注册
`src/components/messages/UserChannelMessage.tsx`	~140	终端渲染 Channel 消息
`src/components/DevChannelsDialog.tsx`	~105	开发模式确认对话框
`src/utils/plugins/mcpPluginIntegration.ts`	-	插件 MCP 集成、作用域命名
`src/bootstrap/state.ts`	-	全局 Channel 白名单状态

九、总结

Channel 系统体现了几个核心设计原则：

安全优先：六层访问控制确保只有授权 Channel 能推送消息
协议驱动：Channel 就是 MCP Server，任何语言都可以实现
松耦合：Channel 失败不会阻断本地工作流
渐进式信任：从全局开关到白名单，信任级别逐级递增
插件友好：声明式配置，自动用户配置提示
权限中继：远程审批危险操作

这个设计让 Claude Code 真正成为一个”无处不在”的 AI 编程助手。

系列文章导航：

上一篇：Memory 系统：跨会话持久化知识库
下一篇：Computer Use：桌面控制的九层安全关卡

Memory 系统：跨会话持久化知识库

2026-04-05T16:00:00.000Z

让 Claude Code 跨会话记住你是谁、你偏好什么、项目正在发生什么——这是 Memory 系统的核心目标。它不是简单的聊天记录持久化，而是一个结构化的知识管理系统，通过四种记忆类型、自动提取机制、团队同步等功能，让 AI 真正”理解”你。

导读：为什么需要 Memory？

假设你今天让 Claude Code 帮你重构代码，明天让它继续优化。如果没有 Memory：

Claude 不知道你昨天做了什么
Claude 不知道你的编码风格偏好
Claude 不知道项目正在进行的决策

每次对话都从零开始，这是 AI 编程助手的一个根本性限制。

Claude Code 的 Memory 系统解决了这个问题：让 AI 跨会话积累知识。

一、四种记忆类型

1.1 类型定义

┌─────────────────────────────────────────────────────┐
│                   四种记忆类型                        │
├─────────────────────────────────────────────────────┤
│                                                     │
│  User（用户画像）                                    │
│    └─ 角色、目标、技能水平、偏好                     │
│    └─ 示例："用户是数据科学家，关注日志系统"        │
│                                                     │
│  Feedback（行为反馈）                                │
│    └─ 对 Claude 工作方式的纠正或肯定                │
│    └─ 示例："集成测试用真实数据库，不用 mock"        │
│                                                     │
│  Project（项目动态）                                 │
│    └─ 谁在做什么、为什么、截止日期                  │
│    └─ 示例："3/5 起合并冻结，移动团队发版"          │
│                                                     │
│  Reference（外部引用）                               │
│    └─ 外部系统指针：仪表板、工单系统、Slack 频道    │
│    └─ 示例："Pipeline bug 在 Linear 'INGEST' 项目"  │
│                                                     │
└─────────────────────────────────────────────────────┘

1.2 不存储的内容

Memory 系统有一个核心原则：只记住无法从代码中推断出来的东西。

记住	不记住
你是数据科学家，关注日志系统	代码架构、文件结构
“不要 mock 数据库”	Git 历史、谁改了什么
周四后冻结非关键合并	已有的 CLAUDE.md 内容
Bug 跟踪在 Linear 的 INGEST 项目	调试方案（修复已在代码里）

二、Memory 存储格式

2.1 文件结构

~/.claude/
└── projects/
    └── {项目路径哈希}/
        └── memory/                    ← 自动记忆目录
            ├── MEMORY.md              ← 索引文件
            ├── user_role.md           ← 用户画像记忆
            ├── feedback_testing.md    ← 行为反馈记忆
            ├── project_freeze.md      ← 项目动态记忆
            ├── reference_linear.md    ← 外部引用记忆
            └── team/                  ← 团队共享记忆
                ├── MEMORY.md
                └── ...

2.2 记忆文件格式

每个记忆文件使用 YAML frontmatter + Markdown：

---
name: testing_policy
description: 集成测试必须用真实数据库，不能用 mock
type: feedback
---

**规则：** 集成测试必须连接真实数据库，禁止使用 mock。

**Why:** 去年第四季度出现过 mock 测试通过但生产迁移失败的问题。

**How to apply:** 所有标记为 integration test 的测试文件都要使用测试数据库连接。

2.3 MEMORY.md 索引文件

MEMORY.md 是索引而不是内容，它始终加载到上下文中：

# Memory Index

- [用户角色](user_role.md) — 数据科学家，关注可观测性/日志
- [测试策略](feedback_testing.md) — 集成测试用真实数据库，不 mock
- [合并冻结](project_freeze.md) — 2026-03-05 起冻结非关键合并
- [Bug 追踪](reference_linear.md) — 流水线 bug 在 Linear INGEST 项目

限制：最多 200 行或 25KB，超出会被截断。

三、Memory 提取机制

3.1 自动提取流程

触发时机：每次模型完成回复（无 tool_use）时
         ↓
守卫检查：主代理？功能门控开启？自动记忆启用？
         ↓
频率控制：turnsSinceLastExtraction++ (默认每 1 次)
         ↓
互斥检查：主代理自己写了记忆？→ 跳过
         ↓
扫描现有记忆 → 生成清单
         ↓
运行分叉代理（runForkedAgent）
  - 共享父会话提示词缓存
  - 最多 5 个 turn
  - 限制工具权限
         ↓
写入新记忆文件 + 更新 MEMORY.md
         ↓
通知用户："Memory updated in ..."

3.2 工具权限限制

// src/services/extractMemories/extractMemories.ts
function createAutoMemCanUseTool(memoryDir: string): CanUseToolFn {
  return (toolName, input) => {
    // ✅ 允许：Read, Grep, Glob（无限制）
    if (['Read', 'Grep', 'Glob'].includes(toolName)) {
      return true
    }
    
    // ✅ 允许：Bash（只读命令：ls, find, grep, cat...）
    if (toolName === 'Bash' && isReadOnlyCommand(input.command)) {
      return true
    }
    
    // ✅ 允许：Edit/Write（仅 auto-memory 目录内）
    if (['Edit', 'Write'].includes(toolName)) {
      return isInsideMemoryDir(input.file_path, memoryDir)
    }
    
    // ❌ 拒绝：MCP, Agent, 非只读 Bash
    return false
  }
}

3.3 互斥机制

防止重复保存：

function hasMemoryWritesSince(
  messages: Message[],
  sinceUuid: string,
): boolean {
  // 扫描 sinceUuid 之后的所有 assistant 消息
  // 如果有任何 Edit/Write 指向 auto-memory 目录 → return true
  for (const msg of messages) {
    if (msg.uuid === sinceUuid) break
    if (msg.type === 'assistant') {
      for (const block of msg.content) {
        if (block.type === 'tool_use' && 
            ['Edit', 'Write'].includes(block.name) &&
            isMemoryPath(block.input.file_path)) {
          return true
        }
      }
    }
  }
  return false
}

四、Memory 在 Prompt 中的使用

4.1 系统提示词注入

// src/memdir/memdir.ts
async function loadMemoryPrompt(): Promise<string | null> {
  const sections = []
  
  // 1. 记忆类型说明
  sections.push(`## Types of memory`)
  sections.push(...getMemoryTypeDescriptions())
  
  // 2. 不存储的内容
  sections.push(`## What NOT to save`)
  sections.push(...getWhatNotToSaveList())
  
  // 3. 如何保存记忆
  sections.push(`## How to save memories`)
  sections.push(getSaveInstructions())
  
  // 4. 何时查阅记忆
  sections.push(`## When to access memories`)
  sections.push(getAccessGuidelines())
  
  // 5. 引用前验证
  sections.push(`## Before recommending`)
  sections.push(getValidationGuidelines())
  
  // 6. MEMORY.md 索引内容
  sections.push(`## MEMORY.md`)
  sections.push(await loadMemoryIndex())
  
  return sections.join('\n\n')
}

4.2 智能检索

每次用户查询时动态选择相关记忆：

// src/memdir/findRelevantMemories.ts
async function findRelevantMemories(
  query: string,
  memoryDir: string,
  recentTools: string[] = [],
): Promise<RelevantMemory[]> {
  // 1. 扫描所有 .md 文件（排除 MEMORY.md）
  const files = await scanMemoryFiles(memoryDir)
  
  // 2. 解析 frontmatter（前 30 行）
  const candidates = await Promise.all(
    files.map(f => parseMemoryFile(f))
  )
  
  // 3. Sonnet 模型选择
  const selected = await sideQuery({
    model: 'claude-sonnet-4-5',
    systemPrompt: MEMORY_SELECTOR_PROMPT,
    messages: [{ role: 'user', content: query }],
    context: { candidates, recentTools },
  })
  
  // 4. 返回选中记忆
  return selected.map(s => ({ path: s.path, mtimeMs: s.mtimeMs }))
}

Sonnet 选择器提示词：

你是记忆选择器。从候选记忆中选择对处理用户查询有用的记忆。

规则：
- 最多选 5 个
- 不确定是否有用就不要选
- 如果提供了最近使用的工具列表，不要选这些工具的使用文档
  （但要选择关于这些工具的警告/陷阱/已知问题）

返回格式：
- memory_path: 选择原因

4.3 新鲜度警告

function memoryFreshnessText(mtimeMs: number): string {
  const days = memoryAgeDays(mtimeMs)
  if (days <= 1) return ''  // 今天/昨天：无警告
  
  return `This memory is ${days} days old. Memories are point-in-time 
observations that may become stale. Verify against current code before 
asserting as fact.`
}

五、团队 Memory 同步

5.1 API 端点

1 2	GET /api/claude_code/team_memory?repo={owner/repo} ← 拉取 PUT /api/claude_code/team_memory?repo={owner/repo} ← 推送

5.2 同步语义

操作	行为
Pull	服务器内容覆盖本地文件（服务器优先）
Push	仅上传内容哈希不同的键（delta 上传）
删除	本地删除不会删除远程（下次 pull 会恢复）

5.3 冲突解决

async function pushTeamMemory(state): Promise<PushResult> {
  // 1. 读取本地文件 → 计算哈希
  const localFiles = await readLocalMemoryFiles()
  const localHashes = computeHashes(localFiles)
  
  // 2. 对比 serverChecksums → 生成 delta
  const delta = computeDelta(localHashes, state.serverChecksums)
  
  // 3. 上传 delta
  const response = await api.pushTeamMemory(delta)
  
  // 4. 遇到 412 冲突：
  if (response.status === 412) {
    // 探测 GET ?view=hashes 获取最新 checksums
    const latest = await api.getTeamMemoryHashes()
    // 重新计算 delta（排除队友已推送的相同内容）
    const newDelta = recomputeDelta(localHashes, latest)
    // 重试（最多 2 次）
    return pushTeamMemory({ ...state, serverChecksums: latest })
  }
  
  return { success: true }
}

5.4 安全限制

单文件最大：250KB
上传体最大：200KB（分批上传）
秘密扫描：使用 gitleaks 规则扫描凭证，检测到则跳过该文件

六、AutoDream：后台记忆整合

6.1 触发条件

// src/services/autoDream/autoDream.ts
async function shouldTriggerAutoDream(): Promise<boolean> {
  // 四重门控
  if (hoursSinceLastConsolidation < minHours) return false  // 时间门：默认 24h
  if (sessionsSinceLastConsolidation < minSessions) return false  // 会话门：默认 5 次
  if (otherProcessConsolidating) return false  // 锁门：互斥
  if (timeSinceLastScan < 10 * 60 * 1000) return false  // 扫描节流：10 分钟
  
  return true
}

6.2 四阶段流程

┌─────────────────────────────────────────────────────┐
│              AutoDream 四阶段流程                    │
├─────────────────────────────────────────────────────┤
│                                                     │
│  Phase 1: 定向（Orientation）                       │
│    └─ 确定要审查的会话列表                          │
│                                                     │
│  Phase 2: 收集（Collection）                        │
│    └─ 从会话中提取候选记忆                          │
│                                                     │
│  Phase 3: 整合（Consolidation）                     │
│    └─ 合并、去重、更新记忆文件                      │
│                                                     │
│  Phase 4: 修剪（Pruning）                           │
│    └─ 删除过时或重复的记忆                          │
│                                                     │
└─────────────────────────────────────────────────────┘

6.3 DreamTask 状态

type DreamTaskState = {
  type: 'dream'
  phase: 'starting' | 'updating'  // updating = 已开始编辑文件
  sessionsReviewing: number       // 正在审查的会话数
  filesTouched: string[]          // 编辑过的文件路径
  turns: DreamTurn[]              // 对话轮次记录
}

七、关键源文件索引

文件	职责
`src/memdir/paths.ts`	路径解析，优先级链
`src/memdir/memdir.ts`	提示词构建，MEMORY.md 截断
`src/memdir/memoryScan.ts`	扫描目录、解析 frontmatter
`src/memdir/memoryTypes.ts`	四种记忆类型定义
`src/memdir/findRelevantMemories.ts`	Sonnet 智能检索
`src/services/extractMemories/`	自动提取服务
`src/services/teamMemorySync/`	团队记忆同步
`src/services/autoDream/`	AutoDream 后台整合
`src/utils/frontmatterParser.ts`	YAML frontmatter 解析
`src/components/memory/`	UI 组件
`src/commands/memory/`	`/memory` 命令

八、总结

Claude Code 的 Memory 系统体现了几个核心设计原则：

结构化知识：四种记忆类型，避免信息混淆
自动提取：后台智能分析对话，提取有价值信息
智能检索：Sonnet 模型动态选择相关记忆
新鲜度管理：旧记忆附带警告，使用前需验证
团队同步：服务器优先语义，支持协作
AutoDream：后台”做梦”整理记忆

这个设计让 AI 真正能够”记住”用户，而不是每次都从零开始。

系列文章导航：

上一篇：权限与安全：分层模型与人机协作
下一篇：Channel 系统：IM 远程控制 Agent

多 Agent 编排：四种代理类型与协作机制

2026-04-05T16:00:00.000Z

Claude Code 的多 Agent 系统可能是其最被低估的设计之一。它不是简单的”子代理调用”，而是一个完整的协作框架：四种 Agent 类型（Subagent、Fork、Teammate、Remote）、Teams 邮箱通信、权限同步、Worktree 隔离。这个设计让 Claude Code 能够处理单 Agent 无法完成的复杂任务。

导读：为什么需要多 Agent？

假设你让 Claude Code 做这件事：

“帮我把这个项目的所有 TypeScript 文件迁移到 strict 模式，同时更新 ESLint 配置，然后运行所有测试确保没有回归。”

单 Agent 会怎么做？顺序执行：修改 tsconfig → 修改 ESLint → 修改文件 → 运行测试。每一步都要等待上一步完成。

但如果使用多 Agent：

Explore Agent：并行扫描所有 TypeScript 文件，识别需要修改的地方
多个 Fork Agent：并行修改不同的文件组
Plan Agent：协调修改顺序，避免冲突
Verification Agent：运行测试，验证修改

这就是多 Agent 编排的价值：并行化、专业化、隔离性。

一、五种 Agent 类型和职责

1.1 Agent 类型概览

┌─────────────────────────────────────────────────┐
│                  Agent Tool                      │
│              (入口 & 路由分发)                    │
├───────────┬───────────┬───────────┬─────────────┤
│  Subagent │  Fork     │ Teammate  │   Remote    │
│  (子代理)  │ (分叉)    │ (队友)    │   (远程)    │
│           │           │           │             │
│ 独立上下文 │ 继承上下文 │ 团队协作   │ CCR 环境   │
│ 按类型过滤 │ 缓存共享   │ 邮箱通信   │ 远程执行   │
│ 工具池     │ 字节一致   │ 权限同步   │ 轮询结果   │
└───────────┴───────────┴───────────┴─────────────┘
                        │
                  ┌─────┴─────┐
                  │ DreamTask │
                  │ (记忆整合)  │
                  │ 定时后台   │
                  └───────────┘

1.2 内置 Agent 类型

Agent 类型	用途	工具池限制
General Purpose	通用任务	全部工具
Explore	代码库探索	Read, Grep, Glob, WebSearch
Plan	制定计划	全部工具，但受限输出
Verification	验证结果	Bash, Read, Grep
Coordinator	编排协调	受限工具集

1.3 Agent 定义结构

// src/tools/AgentTool/loadAgentsDir.ts
type AgentDefinition = {
  agentType: string              // Agent 类型标识
  description: string            // 描述
  getSystemPrompt: (context) => string  // 系统提示词
  tools?: string[]               // 允许的工具（'*' = 全部）
  disallowedTools?: string[]     // 禁止的工具
  model?: string                 // 模型选择
  permissionMode?: PermissionMode // 权限模式
  isBuiltin?: boolean            // 是否内置
}

二、Agent 生成流程：四条路径

2.1 入口：AgentTool.call()

src/tools/AgentTool/AgentTool.tsx 中的 call() 函数是所有 Agent 生成的入口：

AgentTool.call(input)
  │
  ├─ team_name + name? ──────→ 路径1: spawnTeammate()
  │
  ├─ run_in_background?  ────→ 路径2: registerAsyncAgent()
  │     └─ agent.background?
  │
  ├─ 省略 subagent_type? ───→ 路径3: Fork (buildForkedMessages())
  │     └─ fork 实验开启?
  │
  └─ 默认 ───────────────────→ 路径4: runAgent() 同步执行

2.2 路径1：Teammate 生成

触发条件：team_name 和 name 同时存在

流程：

// src/tools/shared/spawnMultiAgent.ts
async function spawnTeammate(config, context) {
  // 1. 检测执行后端
  const backend = detectBackend()  // tmux / iTerm2 / in-process
  
  // 2. 生成唯一 agentId
  const agentId = formatAgentId(name, teamName)
  
  // 3. 分配颜色
  const color = assignColor(name)
  
  // 4. 创建执行环境
  if (backend === 'in-process') {
    await spawnInProcessTeammate(config, context)
  } else if (backend === 'tmux') {
    await TmuxBackend.createPane(config)
  } else if (backend === 'iTerm2') {
    await ITerm2Backend.createWindow(config)
  }
  
  // 5. 写入 TeamFile
  await updateTeamFile(teamName, { members: [...members, newMember] })
  
  return { status: 'teammate_spawned', agentId, tmuxPaneId, ... }
}

In-Process 队友的隔离：

// src/utils/swarm/spawnInProcess.ts
async function spawnInProcessTeammate(config, context) {
  // 1. 独立的 AbortController（不随 leader 中断）
  const abortController = new AbortController()
  
  // 2. AsyncLocalStorage 上下文隔离
  runWithTeammateContext(teammateContext, async () => {
    // 3. 独立的任务状态
    // 4. 独立的消息循环
    // 5. 共享的权限管道（通过 mailbox）
  })
}

2.3 路径2：异步 Subagent

触发条件：run_in_background=true 或 Agent 定义中 background: true

流程：

registerAsyncAgent()
  │
  ├─ 创建 LocalAgentTask（status: 'running'）
  ├─ 注册到 agentNameRegistry（如有 name）
  ├─ 创建输出文件符号链接
  ├─ 创建 AbortController（链接到父代理）
  ├─ 发射 SDK event: task_started
  │
  └─ void runAsyncAgentLifecycle()  ← 异步分离执行
       │
       ├─ 创建 ProgressTracker
       ├─ 遍历 makeStream() 生成器
       │   ├─ 追加消息到 agentMessages[]
       │   ├─ 更新进度（tokens、tools、activities）
       │   └─ 发射 SDK progress events
       │
       └─ 完成时：
           ├─ finalizeAgentTool()（提取结果）
           ├─ completeAgentTask()（标记完成）
           ├─ 清理 worktree（如有隔离）
           └─ enqueuePendingNotification()（通知主代理）

2.4 路径3：Fork Subagent

触发条件：省略 subagent_type 且 Fork 实验开启

核心优化：通过字节级一致的 API 请求前缀，实现 prompt cache 命中。

buildForkedMessages(directive, assistantMessage)
  │
  ├─ 保留父代理完整的 assistant message（所有 tool_use 块）
  ├─ 构建 user message：
  │   ├─ 对每个 tool_use 创建占位 tool_result（字节一致）
  │   └─ 追加 per-child directive（唯一差异部分）
  │
  └─ 结果：字节级一致的 API 前缀 → prompt cache 命中！

Fork 子代理的行为约束（通过 FORK_BOILERPLATE_TAG 注入）：

1. 你是分叉的工作进程，不是主代理
2. 不要对话、提问或建议后续步骤
3. 直接使用工具（Bash、Read、Write 等）
4. 如修改文件，在报告前提交更改
5. 工具调用之间不要输出文本
6. 严格限制在指令范围内
7. 报告控制在 500 词以内
8. 响应必须以 "Scope:" 开头

2.5 路径4：同步 Subagent

触发条件：默认路径（无 team_name、无 background、非 fork）

流程：

runAgent(promptMessages, toolUseContext, options)
  │
  ├─ 解析 Agent 定义（getSystemPrompt、tools、permissions）
  ├─ 构建系统提示词（buildEffectiveSystemPrompt）
  ├─ 创建隔离的 ToolUseContext（createSubagentContext）
  ├─ 启动查询循环（query() async generator）
  │   ├─ 发送 API 请求
  │   ├─ 处理流式事件
  │   ├─ 执行工具调用
  │   └─ 累积消息和 usage
  │
  └─ 返回 AgentToolResult
       ├─ content: 最后 assistant 消息的文本
       ├─ totalToolUseCount
       ├─ totalDurationMs
       └─ totalTokens

三、工具池系统：三层过滤

3.1 第一层：全局禁止

ALL_AGENT_DISALLOWED_TOOLS — 对所有 Agent 禁止的工具：

工具	禁止原因
TaskOutput	仅主代理可读取任务输出
ExitPlanMode	仅主代理可退出计划模式
EnterPlanMode	仅主代理可进入计划模式
AskUserQuestion	子代理不应直接问用户
TaskStop	仅主代理可终止任务
Agent	防止递归生成（Ant 内部例外）

3.2 第二层：Agent 类型过滤

// src/tools/AgentTool/agentToolUtils.ts
function filterToolsForAgent(tools, agentDef) {
  // 1. 移除 ALL_AGENT_DISALLOWED_TOOLS
  // 2. 如果非内置 Agent，额外移除 CUSTOM_AGENT_DISALLOWED_TOOLS
  // 3. 如果是异步 Agent，限制为 ASYNC_AGENT_ALLOWED_TOOLS
  // 4. MCP 工具始终允许
}

ASYNC_AGENT_ALLOWED_TOOLS（15 个）：

1
2
3

Read, WebSearch, TodoWrite, Grep, WebFetch, Glob,
Bash/PowerShell, FileEdit, FileWrite, NotebookEdit,
Skill, SyntheticOutput, ToolSearch, EnterWorktree, ExitWorktree

3.3 第三层：Agent 定义过滤

function resolveAgentTools(agentDef, availableTools) {
  if (tools === ['*'] || undefined)  → 通配符，全部允许
  if (tools === ['Read', 'Grep'])    → 仅允许列表中的工具
  if (disallowedTools === ['Agent']) → 从可用工具中减去
}

过滤流程图：

所有可用工具
  │
  ├─ 减去 ALL_AGENT_DISALLOWED_TOOLS ──→ 通用禁止
  │
  ├─ 非内置？减去 CUSTOM_AGENT_DISALLOWED_TOOLS
  │
  ├─ 异步？限制为 ASYNC_AGENT_ALLOWED_TOOLS
  │
  ├─ 有 tools 列表？取交集
  │
  ├─ 有 disallowedTools？取差集
  │
  └─ 最终工具池

四、上下文传递机制

4.1 CacheSafeParams — 缓存安全参数

// src/utils/forkedAgent.ts
type CacheSafeParams = {
  systemPrompt: SystemPrompt       // 系统提示词
  userContext: { [k: string]: string }  // 目录结构、CLAUDE.md 等
  systemContext: { [k: string]: string } // git status、环境信息
  toolUseContext: ToolUseContext    // 工具配置、模型、选项
  forkContextMessages: Message[]   // Fork 上下文消息（用于缓存共享）
}

缓存共享原理：

┌─────────────────────────────────────────┐
│         共享前缀（字节一致）              │
│  ┌──────────────────────────────────┐   │
│  │ System Prompt                    │   │
│  │ User Context                     │   │
│  │ System Context                   │   │
│  │ Tool Use Context                 │   │
│  │ 对话历史 Messages                │   │
│  │ Assistant Message (all tool_use) │   │
│  │ User Message (placeholder results)│  │
│  └──────────────────────────────────┘   │
├─────────────────────────────────────────┤
│  唯一差异：per-child directive text      │
└─────────────────────────────────────────┘

4.2 SubagentContext — 子代理上下文隔离

type SubagentContextOverrides = {
  options?: ToolUseContext['options']           // 自定义工具、模型
  agentId?: AgentId                            // 子代理 ID
  agentType?: string                           // Agent 类型
  messages?: Message[]                         // 自定义消息历史
  readFileState?: ToolUseContext['readFileState'] // 文件读取缓存
  abortController?: AbortController            // 中止控制器

  // 显式 opt-in 共享（默认隔离）
  shareSetAppState?: boolean                   // 共享 AppState 写入
  shareSetResponseLength?: boolean             // 共享响应长度度量
  shareAbortController?: boolean               // 共享中止控制器

  // 实验性注入
  criticalSystemReminder_EXPERIMENTAL?: string // 每轮重新注入的提醒
  contentReplacementState?: ContentReplacementState
}

隔离 vs 共享：

资源	默认	说明
readFileState	克隆	文件读取缓存独立
messages	新建	消息历史独立
abortController	新建（链接父）	父取消时子也取消
setAppState	No-op	默认不影响父状态
contentReplacementState	克隆	内容替换状态独立

五、Agent Teams：邮箱通信

5.1 TeamFile 结构

// 存储路径：~/.claude/teams/{team_name}/config.json
{
  name: string                        // 团队名称
  description?: string                // 团队描述
  createdAt: number                   // 创建时间戳
  leadAgentId: string                 // Team Lead 的 Agent ID
  leadSessionId?: string              // Lead 的会话 UUID
  hiddenPaneIds?: string[]            // UI 中隐藏的 pane
  teamAllowedPaths?: TeamAllowedPath[] // 团队级共享权限
  members: Array<{
    agentId: string                   // 成员 Agent ID
    name: string                      // 显示名称
    agentType?: string                // 角色类型
    model?: string                    // 使用的模型
    prompt?: string                   // 初始任务
    color?: string                    // UI 颜色
    planModeRequired?: boolean        // 是否需要 plan 审批
    joinedAt: number                  // 加入时间
    tmuxPaneId: string                // 终端 pane ID
    cwd: string                       // 工作目录
    worktreePath?: string             // Worktree 路径
    sessionId?: string                // 会话 ID
    subscriptions: string[]           // 消息订阅
    backendType?: 'tmux'|'iterm2'|'in-process'
    isActive?: boolean                // false=空闲, true/undefined=活跃
    mode?: PermissionMode             // 当前权限模式
  }>
}

5.2 邮箱系统

存储路径：~/.claude/teams/{team_name}/inboxes/{agent_name}.json

type TeammateMessage = {
  from: string        // 发送者名称
  text: string        // 消息内容（纯文本或 JSON）
  timestamp: string   // ISO 时间戳
  read: boolean       // 是否已读
  color?: string      // 发送者颜色
  summary?: string    // 5-10 词摘要
}

并发安全：使用 proper-lockfile 文件锁，10 次重试，5-100ms 指数退避。

5.3 收件箱轮询

// src/hooks/useInboxPoller.ts
// 轮询间隔：1000ms

useEffect(() => {
  const interval = setInterval(async () => {
    const messages = await readUnreadMessages(agentName, teamName)
    
    for (const msg of messages) {
      if (isShutdownRequest(msg.text)) {
        // 处理关停请求
      } else if (isPlanApprovalResponse(msg.text)) {
        // 处理 plan 审批
      } else if (isPermissionRequest(msg.text)) {
        // 路由到权限系统
      } else {
        // 纯文本消息 → 提交为新对话轮
        onSubmitMessage(formatted)
      }
    }
  }, INBOX_POLL_INTERVAL_MS)
}, [])

5.4 消息路由

SendMessage({ to, message })
  │
  ├─ to === "*" → 广播
  │   └─ 遍历所有队友，逐个写入 mailbox
  │
  ├─ agentNameRegistry.has(to) → in-process 子代理
  │   └─ 通过 AppState pending messages 队列路由
  │
  ├─ teamFile.members.find(to) → 进程级队友
  │   └─ writeToMailbox(to, message, teamName)
  │
  ├─ to.startsWith("bridge:") → 远程会话
  │   └─ postInterClaudeMessage(sessionId, message)
  │
  └─ to.startsWith("uds:") → Unix Domain Socket
      └─ sendToUdsSocket(socketPath, message)

六、Worktree 隔离

6.1 创建流程

// src/utils/worktree.ts
async function createAgentWorktree(slug) {
  // 1. 校验 slug（防目录逃逸攻击）
  validateWorktreeSlug(slug)
  
  // 2. 创建 git worktree
  git worktree add {path} -b {branch}
  
  // 3. 符号链接大目录（节省磁盘）
  symlink(node_modules, worktree/node_modules)
  
  // 4. 应用 sparse-checkout（如配置）
  if (sparseCheckoutPaths) {
    git sparse-checkout set {paths}
  }
  
  // 5. 返回 WorktreeSession
  return { worktreePath, worktreeBranch, headCommit }
}

6.2 清理机制

Agent 完成后自动检测是否有改动（hasWorktreeChanges()）
有改动：返回 worktree 路径和分支名给用户
无改动：自动删除 worktree（removeAgentWorktree()）
异常退出：通过 registerTeamForSessionCleanup() 确保清理

七、权限同步机制

7.1 团队级权限

type TeamAllowedPath = {
  path: string        // 绝对目录路径
  toolName: string    // 适用的工具（如 "Edit", "Write"）
  addedBy: string     // 添加者名称
  addedAt: number     // 添加时间
}

队友启动时，自动继承团队级权限规则。

7.2 Bubble 模式

Fork Agent 使用 bubble 权限模式 — 权限提示冒泡到父代理终端：

Fork Agent 需要权限
  │
  └─ bubble 模式 → 权限请求发送到父代理
       │
       └─ 父代理的 ToolUseConfirm 对话框显示
            │
            ├─ 用户批准 → 结果回传给 Fork Agent
            └─ 用户拒绝 → Fork Agent 收到拒绝

八、关键源文件索引

文件	职责
`src/tools/AgentTool/AgentTool.tsx`	主工具实现，路由分发
`src/tools/AgentTool/runAgent.ts`	执行引擎，查询循环
`src/tools/AgentTool/agentToolUtils.ts`	工具池解析，结果终结
`src/tools/AgentTool/forkSubagent.ts`	Fork 语义，消息继承
`src/tools/AgentTool/loadAgentsDir.ts`	Agent 定义类型，解析加载
`src/tools/AgentTool/builtInAgents.ts`	内置 Agent 注册表
`src/tools/shared/spawnMultiAgent.ts`	队友生成入口
`src/utils/swarm/spawnInProcess.ts`	进程内队友生成
`src/utils/swarm/teamHelpers.ts`	团队文件读写
`src/utils/teammateMailbox.ts`	邮箱消息队列
`src/utils/forkedAgent.ts`	缓存安全参数，子代理上下文
`src/utils/worktree.ts`	Git worktree 隔离
`src/tasks/LocalAgentTask/LocalAgentTask.tsx`	本地 Agent 任务

九、总结

Claude Code 的多 Agent 系统设计体现了几个核心原则：

分层编排：四种 Agent 类型，满足不同场景需求
上下文隔离：子代理默认独立上下文，显式 opt-in 共享
缓存优化：Fork Agent 通过字节一致前缀实现 prompt cache 共享
邮箱通信：Teams 通过文件系统邮箱实现异步协作
权限同步：团队级权限自动继承，Bubble 模式支持权限冒泡
Worktree 隔离：安全的实验性修改环境

这个设计使得 Claude Code 能够处理单 Agent 无法完成的复杂任务，同时保持系统的稳定性和可观测性。

系列文章导航：

上一篇：工具系统设计：从定义到执行的七步管道
下一篇：Context 管理：四级压缩与无限对话的秘密

Context 管理：四级压缩与无限对话的秘密

2026-04-05T16:00:00.000Z

“对话没有上下文限制”——这是 Claude Code 的一个核心承诺。但它真的能做到吗？答案是：通过四级压缩系统，实现”伪无限对话”。这背后的设计非常精妙：不是简单截断，而是智能地压缩和保留关键信息。

导读：上下文限制的困境

所有 LLM 都有上下文限制。Claude 3.5 Sonnet 是 200k tokens，但实际可用空间更小，因为：

系统提示词占用 ~20k tokens
工具定义占用 ~15k tokens
每轮对话累积消息

假设你进行了 50 轮对话，每轮平均 4k tokens，那就是 200k tokens —— 已经触及限制。

传统解决方案：简单截断历史消息。但问题很明显：

用户之前的重要信息被丢弃
Agent 可能重复问同样的问题
长期任务上下文丢失

Claude Code 的方案：四级渐进式压缩。

一、四级压缩策略概览

┌─────────────────────────────────────────────────────────────┐
│                    四级压缩策略                              │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  第 1 级：Snip 压缩                                          │
│    对已处理的消息进行智能裁剪                                │
│    ├─ 移除重复的文件内容                                    │
│    ├─ 截断过长的工具输出                                    │
│    └─ 触发时机：每轮自动                                    │
│                                                             │
│  第 2 级：Micro 压缩                                         │
│    修改已缓存消息的内容                                     │
│    ├─ 不改变缓存键                                          │
│    └─ 触发时机：每轮自动                                    │
│                                                             │
│  第 3 级：上下文折叠（Context Collapse）                     │
│    分阶段摘要历史消息                                       │
│    ├─ 先摘要最旧的消息                                      │
│    ├─ 保留最近的细节                                        │
│    └─ 触发时机：上下文接近限制                              │
│                                                             │
│  第 4 级：Auto Compact                                       │
│    通过 Claude 生成完整摘要                                 │
│    ├─ 替换所有历史消息                                      │
│    └─ 触发时机：上下文严重不足                              │
│                                                             │
└─────────────────────────────────────────────────────────────┘

二、第一级：Snip 压缩

2.1 工作原理

Snip 压缩对已处理的消息进行智能裁剪——移除重复的文件内容、过长的工具输出等。

// src/services/compact/snipCompact.ts
function snipMessages(messages: Message[]): Message[] {
  const seen = new Set<string>()
  
  return messages.map(msg => {
    if (msg.type === 'user') {
      // 检测重复的文件内容
      const content = extractFileContent(msg)
      if (seen.has(content)) {
        // 重复内容，替换为引用
        return {
          ...msg,
          content: `[Duplicate file content, see earlier in conversation]`
        }
      }
      seen.add(content)
    }
    
    if (msg.type === 'tool_result') {
      // 截断过长的工具输出
      if (msg.content.length > MAX_TOOL_RESULT_SIZE) {
        return {
          ...msg,
          content: msg.content.slice(0, MAX_TOOL_RESULT_SIZE) + 
            `\n... [truncated, ${msg.content.length} total chars]`
        }
      }
    }
    
    return msg
  })
}

2.2 智能裁剪规则

内容类型	裁剪策略
重复文件内容	替换为引用标记
大型工具输出	保留前 4KB + 截断标记
Base64 图片	保留元数据，替换内容
长对话引用	摘要化

三、第二级：Micro 压缩

3.1 工作原理

Micro 压缩修改已缓存消息的内容，而不改变缓存键。这是一种”原地优化”策略。

// src/services/compact/microCompact.ts
function microCompactMessages(messages: Message[]): Message[] {
  return messages.map(msg => {
    if (msg.type === 'assistant') {
      // 移除多余的空白和格式
      const compressed = compressContent(msg.content)
      
      // 移除重复的 tool_use 说明
      const deduped = deduplicateToolUses(compressed)
      
      return { ...msg, content: deduped }
    }
    return msg
  })
}

3.2 关键特性

不影响缓存：缓存键基于消息 ID 和位置，不基于内容
无损压缩：保留所有语义信息
增量应用：每次处理一点点，避免大变动

四、第三级：上下文折叠（Context Collapse）

4.1 工作原理

当上下文接近限制时，系统启动 Context Collapse —— 将历史消息分阶段摘要。

// src/services/contextCollapse/index.ts
async function contextCollapse(
  messages: Message[],
  options: CollapseOptions
): Promise<Message[]> {
  // 1. 识别可折叠的消息段
  const segments = identifyCollapsibleSegments(messages)
  
  // 2. 按优先级排序（最旧的优先）
  const sortedSegments = segments.sort((a, b) => 
    a.startIndex - b.startIndex
  )
  
  // 3. 对每个段生成摘要
  const summaries: Message[] = []
  for (const segment of sortedSegments) {
    if (shouldCollapse(segment, options)) {
      const summary = await generateSummary(segment.messages)
      summaries.push(createSummaryMessage(summary, segment))
    }
  }
  
  // 4. 替换原消息段
  return replaceSegmentsWithSummaries(messages, summaries)
}

4.2 折叠策略

渐进式折叠：不是一次性摘要全部，而是渐进式折叠——先摘要最旧的消息，保留最近的细节。

原消息序列：
[Msg1] [Msg2] [Msg3] [Msg4] [Msg5] [Msg6] [Msg7] [Msg8] [Msg9] [Msg10]
  ↑                                                           ↑
  最旧                                                        最新

第一次折叠（上下文 > 150k）：
[Summary1] [Msg6] [Msg7] [Msg8] [Msg9] [Msg10]
  ↑ 摘要了 Msg1-Msg5

第二次折叠（上下文 > 180k）：
[Summary1] [Summary2] [Msg8] [Msg9] [Msg10]
                        ↑ 摘要了 Msg6-Msg7

第三次折叠（上下文 > 195k）：
[Summary1] [Summary2] [Summary3] [Msg10]
                                  ↑ 摘要了 Msg8-Msg9

4.3 摘要格式

## Summary of Previous Work

### Tasks Completed
- Implemented user authentication with JWT
- Added password reset functionality
- Created user profile page

### Files Modified
- src/auth/auth.service.ts: Added JWT token generation
- src/user/user.controller.ts: Added profile endpoints
- src/user/user.service.ts: Added password reset logic

### Current State
- Authentication system is fully functional
- Password reset emails are being sent
- Profile page is accessible at /profile

### Pending Items
- Need to add email verification
- Need to implement rate limiting

五、第四级：Auto Compact

5.1 工作原理

当所有局部优化都不够时，通过 Claude 自身生成一个完整的对话摘要，替换所有历史消息。

// src/services/compact/autoCompact.ts
async function autoCompact(
  messages: Message[],
  context: ToolUseContext
): Promise<Message[]> {
  // 1. 构建 compact 请求
  const compactPrompt = buildCompactPrompt(messages)
  
  // 2. 调用 Claude 生成摘要
  const summary = await query({
    messages: [createUserMessage(compactPrompt)],
    systemPrompt: COMPACT_SYSTEM_PROMPT,
    toolUseContext: context,
    maxTurns: 1,
  })
  
  // 3. 创建新的消息序列
  const summaryMessage = createSummaryMessage(summary)
  
  // 4. 替换历史消息
  return [summaryMessage]
}

5.2 触发条件

// src/services/compact/autoCompact.ts
function shouldTriggerAutoCompact(state: AutoCompactTracking): boolean {
  // 1. 检查 token 使用率
  const usageRatio = state.currentTokens / state.maxTokens
  if (usageRatio < 0.9) return false  // 低于 90% 不触发
  
  // 2. 检查是否已经尝试过
  if (state.hasAttemptedAutoCompact) return false
  
  // 3. 检查距离上次 compact 的轮数
  if (state.turnsSinceLastCompact < MIN_TURNS_BETWEEN_COMPACT) return false
  
  return true
}

5.3 Compact 系统提示词

const COMPACT_SYSTEM_PROMPT = `
You are a summarization assistant. Your job is to create a concise but 
complete summary of a conversation.

Your summary should:
1. Capture all important decisions and their reasoning
2. List all files that were created or modified
3. Note any pending tasks or open questions
4. Preserve the context needed to continue the work

Format your summary as:
## Summary
[Brief overview of the conversation]

## Decisions Made
- [Decision 1]: [Reasoning]
- [Decision 2]: [Reasoning]

## Files Modified
- [File path]: [What was changed]

## Pending Tasks
- [Task 1]
- [Task 2]

## Context for Continuation
[Any other relevant context]
`

六、上下文注入

6.1 系统上下文

每次 API 调用前，自动注入系统上下文：

// src/context.ts
function getSystemContext(): SystemContext {
  return {
    gitStatus: getGitStatus(),          // 当前分支、最近提交、文件状态
    currentDate: new Date().toISOString(),
    cacheBreakerInjection: getSystemInjection(),
  }
}

6.2 用户上下文

// src/context.ts
function getUserContext(): UserContext {
  return {
    claudeMdContent: loadClaudeMdFiles(),  // 所有 CLAUDE.md 合并内容
    mcpInstructions: getMcpInstructions(),  // MCP 服务器指令
    memoryContent: loadMemoryPrompt(),      // 记忆系统内容
  }
}

6.3 系统提醒

系统提醒是一种特殊的附件消息，注入到工具结果或用户消息中：

1
2
3

<system-reminder>
  这里是系统级的上下文信息，与具体的工具结果无关。
system-reminder>

用途包括：

文件读取时的安全警告
记忆系统的时效提醒
用户侧问的附带信息
Deferred 工具的可用通知

七、Token 预算管理

7.1 预算计算

// src/query/tokenBudget.ts
function calculateTokenBudget(
  model: string,
  messages: Message[],
  systemPrompt: string,
  tools: Tools,
): TokenBudget {
  // 1. 获取模型上下文限制
  const contextLimit = getModelContextLimit(model)  // 如 200k
  
  // 2. 计算固定消耗
  const systemPromptTokens = countTokens(systemPrompt)
  const toolsTokens = countToolsTokens(tools)
  const fixedCost = systemPromptTokens + toolsTokens
  
  // 3. 计算消息消耗
  const messagesTokens = countMessagesTokens(messages)
  
  // 4. 计算可用预算
  const availableBudget = contextLimit - fixedCost - messagesTokens
  
  // 5. 预留输出空间
  const outputReserve = 8192  // 默认输出限制
  const finalBudget = availableBudget - outputReserve
  
  return {
    total: contextLimit,
    fixed: fixedCost,
    messages: messagesTokens,
    available: finalBudget,
  }
}

7.2 预算警告

// src/utils/tokens.ts
function calculateTokenWarningState(budget: TokenBudget): TokenWarningState {
  const usageRatio = budget.messages / budget.available
  
  if (usageRatio > 0.95) {
    return { level: 'critical', message: 'Context nearly exhausted' }
  }
  if (usageRatio > 0.85) {
    return { level: 'warning', message: 'Context running low' }
  }
  if (usageRatio > 0.70) {
    return { level: 'info', message: 'Context usage moderate' }
  }
  return { level: 'ok', message: '' }
}

八、恢复与压缩的关系

8.1 压缩触发的恢复

当压缩策略执行后，会记录状态：

state = {
  ...state,
  autoCompactTracking: {
    hasAttemptedAutoCompact: true,
    turnsSinceLastCompact: 0,
    compressedTokens: savedTokens,
  },
  transition: { reason: 'reactive_compact_retry' }
}

8.2 恢复链

prompt_too_long 错误
  │
  ├─ 尝试 Snip 压缩 → 重试
  │   └─ 成功 → 继续
  │
  ├─ 尝试 Micro 压缩 → 重试
  │   └─ 成功 → 继续
  │
  ├─ 尝试 Context Collapse → 重试
  │   └─ 成功 → 继续
  │
  └─ 尝试 Auto Compact → 重试
      └─ 成功 → 继续
      └─ 失败 → 报错给用户

九、关键源文件索引

文件	职责
`src/services/compact/autoCompact.ts`	自动压缩触发和管理
`src/services/compact/compact.ts`	压缩实现
`src/services/compact/reactiveCompact.ts`	反应式压缩（错误触发）
`src/services/contextCollapse/index.ts`	上下文折叠实现
`src/services/compact/snipCompact.ts`	Snip 压缩
`src/utils/tokens.ts`	Token 计数和预算管理
`src/context.ts`	系统和用户上下文
`src/utils/attachments.ts`	系统提醒附件

十、总结

Claude Code 的四级压缩系统是其”无限对话”承诺的技术基础：

Snip 压缩：智能移除重复内容，每轮自动
Micro 压缩：原地优化缓存消息，不影响缓存
Context Collapse：渐进式摘要，保留最近细节
Auto Compact：Claude 生成的完整摘要

这个设计的关键洞察是：不是简单截断，而是智能压缩。通过保留关键信息（决策、文件修改、待办事项），Agent 能够在压缩后继续有效工作。

系列文章导航：

上一篇：多 Agent 编排：四种代理类型与协作机制
下一篇：System Prompt 工程：动态组装与缓存优化

权限与安全：分层模型与人机协作

2026-04-05T16:00:00.000Z

AI Agent 执行命令、修改文件、访问网络——这些都是高风险操作。Claude Code 的权限系统设计了一个分层的决策模型：规则 → 模式 → 钩子 → 分类器 → 用户确认。每一层都可以独立中断工具调用，确保安全性。

导读：为什么权限如此重要？

想象这个场景：

AI Agent 正在帮你重构代码，突然它执行了 rm -rf node_modules。

如果没有权限检查，这个命令会直接执行，删除所有依赖。但在 Claude Code 中，这个命令会触发：

规则检查：匹配 deny 规则？rm -rf * 通常是 deny 的
模式检查：当前是什么权限模式？default 模式需要确认
钩子检查：PreToolUse 钩子是否拦截？
分类器检查：安全分类器是否判定为危险？
用户确认：弹出对话框，让用户决定

每一层都是独立的防线，确保危险操作不会静默执行。

一、分层权限模型

1.1 权限决策层级

┌─────────────────────────────────────┐
│         权限规则（Rules）             │
│  来源：userSettings, projectSettings │
│        flagSettings, policySettings  │
├─────────────────────────────────────┤
│        权限模式（Modes）              │
│  default | plan | acceptEdits       │
│  bypassPermissions | auto | bubble  │
├─────────────────────────────────────┤
│         钩子（Hooks）                │
│  PreToolUse 可拦截或修改            │
├─────────────────────────────────────┤
│      安全分类器（Classifier）         │
│  ML 模型评估工具调用安全性           │
├─────────────────────────────────────┤
│         用户确认                     │
│  弹出对话框，展示详细信息            │
└─────────────────────────────────────┘

1.2 权限模式详解

// src/types/permissions.ts
type PermissionMode =
  | 'acceptEdits'      // 工作目录内编辑自动允许
  | 'bypassPermissions' // 完全绕过权限
  | 'default'          // 默认模式，需要审批
  | 'dontAsk'          // 自动拒绝
  | 'plan'             // 计划模式
  | 'auto'             // 自动模式（AI 分类器决策）
  | 'bubble'           // 内部模式（权限冒泡到父代理）

模式行为表：

模式	读操作	写操作	危险操作
`default`	可能询问	询问	询问
`acceptEdits`	自动	自动（工作目录内）	询问
`bypassPermissions`	自动	自动	自动
`dontAsk`	自动拒绝	自动拒绝	自动拒绝
`plan`	自动	询问	询问
`auto`	分类器决策	分类器决策	询问
`bubble`	冒泡到父	冒泡到父	冒泡到父

二、权限决策流程

2.1 完整决策链

// src/utils/permissions/permissions.ts
async function hasPermissionsToUseToolInner(
  tool: Tool,
  input: unknown,
  context: ToolUseContext,
): Promise<PermissionResult> {
  // ===== Phase 1: 否决阶段 =====
  
  // 1a. 检查工具级 deny 规则
  const denyResult = checkDenyRules(tool.name, input, context)
  if (denyResult) return { behavior: 'deny', ...denyResult }
  
  // 1b. 检查工具级 ask 规则（沙箱自动允许例外）
  const askResult = checkAskRules(tool.name, input, context)
  if (askResult && !isSandboxAutoAllow(input, context)) {
    return { behavior: 'ask', ...askResult }
  }
  
  // 1c. 工具特定权限检查
  if (tool.checkPermissions) {
    const toolResult = await tool.checkPermissions(input, context)
    if (toolResult.behavior !== 'passthrough') return toolResult
  }
  
  // 1d. 工具实现拒绝
  const implResult = checkImplementationDeny(tool, input, context)
  if (implResult) return { behavior: 'deny', ...implResult }
  
  // 1e. 需要用户交互（绕过模式也需审批）
  if (requiresUserInteraction(tool, input)) {
    return { behavior: 'ask', message: 'This operation requires user interaction' }
  }
  
  // 1f. 内容特定 ask 规则
  const contentAskResult = checkContentAskRules(tool, input, context)
  if (contentAskResult) return { behavior: 'ask', ...contentAskResult }
  
  // 1g. 安全检查（.git/, .claude/等路径）
  const safetyResult = checkPathSafety(tool, input, context)
  if (safetyResult) return { behavior: 'ask', ...safetyResult }
  
  // ===== Phase 2: 允许阶段 =====
  
  // 2a. bypassPermissions 模式检查
  if (context.permissionContext.mode === 'bypassPermissions') {
    return { behavior: 'allow', decisionReason: { type: 'mode' } }
  }
  
  // 2b. 工具级 allow 规则
  const allowResult = checkAllowRules(tool.name, input, context)
  if (allowResult) return { behavior: 'allow', ...allowResult }
  
  // ===== Phase 3: 默认 =====
  return { behavior: 'passthrough' }
}

2.2 决策原因追溯

每次权限决策都会记录原因：

type DecisionReason =
  | { type: 'rule'; source: PermissionRuleSource; pattern: string }
  | { type: 'mode'; mode: PermissionMode }
  | { type: 'hook'; hookName: string }
  | { type: 'classifier'; score: number }
  | { type: 'user'; temporary: boolean }

这对于调试和审计至关重要。

三、规则匹配机制

3.1 规则来源

type PermissionRuleSource =
  | 'userSettings'      // 用户全局设置
  | 'projectSettings'   // 项目设置
  | 'localSettings'     // 本地设置
  | 'policySettings'    // 策略设置（只读）
  | 'flagSettings'      // 功能标志设置
  | 'cliArg'            // CLI 参数
  | 'command'           // 命令
  | 'session'           // 会话级（临时）

3.2 规则模式匹配

// 精确匹配
{ tool: 'Bash', behavior: 'deny' }

// 参数模式匹配
{ tool: 'Bash(git *)', behavior: 'allow' }   // 允许所有 git 命令
{ tool: 'Bash(rm -rf *)', behavior: 'deny' }  // 禁止 rm -rf

// 通配符
{ tool: 'File*', behavior: 'allow' }          // 允许所有 File 开头的工具
{ tool: '*', behavior: 'deny' }               // 禁止所有工具

3.3 子命令处理（Bash 工具）

对于复合命令（如 cmd1 && cmd2 | cmd3）：

// src/tools/BashTool/bashPermissions.ts
function checkCompoundCommand(command: string, context): PermissionResult {
  // 1. 使用 tree-sitter 解析命令
  const ast = parseCommand(command)
  
  // 2. 提取所有子命令
  const subCommands = extractSubCommands(ast)
  
  // 3. 每个子命令独立检查
  for (const sub of subCommands) {
    const result = checkSubCommand(sub, context)
    if (result.behavior === 'deny') {
      return { behavior: 'deny', message: `Subcommand denied: ${sub}` }
    }
  }
  
  // 4. 所有子命令允许则整个命令允许
  return { behavior: 'allow' }
}

四、Bash 工具安全设计

4.1 安全包装器剥离

// src/tools/BashTool/bashPermissions.ts
const SAFE_WRAPPER_PATTERNS = [
  /^timeout[ \t]+.../,  // timeout 命令
  /^time[ \t]+/,        // time 命令
  /^nice(?:[ \t]+...)?/, // nice 命令
  /^stdbuf(?:[ \t]+...)?/, // stdbuf 命令
  /^nohup[ \t]+/,       // nohup 命令
]

function stripSafeWrappers(command: string): string {
  for (const pattern of SAFE_WRAPPER_PATTERNS) {
    command = command.replace(pattern, '')
  }
  return command.trim()
}

为什么剥离：nohup rm -rf / 仍然是 rm -rf /，包装器不改变危险性。

4.2 Tree-sitter AST 安全解析

// src/tools/BashTool/bashPermissions.ts
async function parseCommandRaw(command: string): Promise<ParseResult> {
  const ast = await treeSitterParse(command)
  
  if (containsCommandSubstitution(ast)) {
    return { kind: 'too-complex', reason: 'Contains command substitution' }
  }
  
  if (containsExpansion(ast)) {
    return { kind: 'too-complex', reason: 'Contains expansion' }
  }
  
  const sem = checkSemantics(ast.commands)
  if (!sem.ok) {
    return { kind: 'dangerous', reason: sem.reason }
  }
  
  return { kind: 'simple', commands: ast.commands }
}

检测的危险模式：

eval、source、. 命令
$(...) 命令替换
反引号 `...` 命令替换
${...} 变量扩展
zsh 特殊内置命令

4.3 安全环境变量

const SAFE_ENV_VARS = new Set([
  'NODE_ENV', 'GOOS', 'GOARCH', 'RUST_LOG',
  'LANG', 'TZ', 'TERM', 'NO_COLOR',
  // 注意：PATH, LD_PRELOAD, PYTHONPATH 等危险变量不在白名单中
])

4.4 路径约束检查

// src/tools/BashTool/pathValidation.ts
function validateOutputRedirect(command: BashCommand, context): ValidationResult {
  for (const redirect of command.redirects) {
    const resolvedPath = resolvePath(redirect.target)
    
    // 检查是否在允许的工作目录内
    if (!isInAllowedDirectory(resolvedPath, context)) {
      return { ok: false, reason: `Redirect path not in allowed directory: ${resolvedPath}` }
    }
    
    // 检查是否是危险路径
    if (isDangerousPath(resolvedPath)) {
      return { ok: false, reason: `Redirect to dangerous path: ${resolvedPath}` }
    }
  }
  return { ok: true }
}

4.5 cd + git 复合命令检查

防止裸仓库 RCE（Remote Code Execution）：

function checkCdGitCompound(command: string): ValidationResult {
  const parts = parseCompoundCommand(command)
  
  for (let i = 0; i < parts.length; i++) {
    if (parts[i].startsWith('cd ') && parts[i + 1]?.startsWith('git ')) {
      const targetDir = extractCdTarget(parts[i])
      if (await isBareRepo(targetDir)) {
        return { ok: false, reason: 'Bare repo RCE risk' }
      }
    }
  }
  return { ok: true }
}

五、文件操作权限控制

5.1 危险文件和目录

// src/utils/permissions/filesystem.ts
export const DANGEROUS_FILES = [
  '.gitconfig', '.gitmodules',
  '.bashrc', '.bash_profile', '.zshrc',
  '.ripgreprc', '.mcp.json', '.claude.json'
]

export const DANGEROUS_DIRECTORIES = [
  '.git', '.vscode', '.idea', '.claude'
]

5.2 编辑前必须读取

// src/tools/FileEditTool/FileEditTool.ts
async function validateInput(input, context): Promise<ValidationResult> {
  // 必须先读取
  const readState = context.readFileState.get(input.file_path)
  if (!readState) {
    return { result: false, message: 'Must read file before editing' }
  }
  
  // 文件未被修改
  const currentMtime = (await stat(input.file_path)).mtimeMs
  if (currentMtime > readState.timestamp) {
    return { result: false, message: 'File was modified after reading' }
  }
  
  return { result: true }
}

5.3 自动编辑安全检查

function checkPathSafetyForAutoEdit(path: string): SafetyCheckResult {
  // 1. 可疑 Windows 路径模式
  if (/[<>:"|?*]/.test(path)) {
    return { safe: false, message: 'Invalid characters in path' }
  }
  
  // 2. ADS（Alternate Data Stream）攻击
  if (path.includes('::')) {
    return { safe: false, message: 'ADS attack detected' }
  }
  
  // 3. 短名称绕过
  if (/~[0-9]/.test(path)) {
    return { safe: false, message: 'Short name bypass detected' }
  }
  
  // 4. 长路径前缀
  if (path.startsWith('\\\\?\\')) {
    return { safe: false, message: 'Long path prefix detected' }
  }
  
  // 5. Claude 配置文件
  if (isClaudeConfigFile(path)) {
    return { safe: false, message: 'Claude config file' }
  }
  
  return { safe: true }
}

六、Auto 模式分类器

6.1 工作原理

在 auto 模式下，权限决策通过 AI 分类器：

// src/utils/permissions/yoloClassifier.ts
async function classifyWithAI(
  tool: Tool,
  input: unknown,
  context: ToolUseContext,
): Promise<PermissionResult> {
  // 1. 检查 acceptEdits 快速路径
  if (isAcceptEditsAllowed(tool, input, context)) {
    return { behavior: 'allow' }
  }
  
  // 2. 检查安全工具白名单
  if (isSafeTool(tool)) {
    return { behavior: 'allow' }
  }
  
  // 3. 调用分类器 API
  const classifierInput = tool.toAutoClassifierInput?.(input) || JSON.stringify(input)
  const score = await callClassifierAPI(classifierInput)
  
  // 4. 根据分数决策
  if (score > 0.8) {
    return { behavior: 'allow', decisionReason: { type: 'classifier', score } }
  }
  if (score < 0.2) {
    return { behavior: 'deny', decisionReason: { type: 'classifier', score } }
  }
  
  // 5. 不确定时询问用户
  return { behavior: 'ask' }
}

6.2 拒绝计数

// 防止分类器陷入拒绝循环
const denialTracking: DenialTrackingState = {
  consecutiveDenials: 0,
  maxConsecutiveDenials: 3,
}

function handleDenial(): PermissionResult {
  denialTracking.consecutiveDenials++
  if (denialTracking.consecutiveDenials >= denialTracking.maxConsecutiveDenials) {
    // 回退到用户审批
    return { behavior: 'ask', message: 'Too many denials, please decide' }
  }
  return { behavior: 'deny' }
}

七、钩子拦截

7.1 PreToolUse 钩子

// src/services/tools/toolHooks.ts
async function runPreToolUseHooks(
  tool: Tool,
  input: unknown,
  context: ToolUseContext,
): Promise<HookResult> {
  const hooks = getHooksForTool(tool.name, context)
  
  for (const hook of hooks) {
    const result = await executeHook(hook, {
      tool_name: tool.name,
      tool_input: input,
    })
    
    switch (result.exitCode) {
      case 0:
        // 成功，可能修改了 input
        if (result.stdout) {
          input = parseModifiedInput(result.stdout)
        }
        break
      case 2:
        // 阻塞，展示错误给模型
        return {
          blocked: true,
          message: result.stderr,
          modifiedInput: parseModifiedInput(result.stdout),
        }
      default:
        // 展示给用户
        logHookOutput(result.stdout)
        break
    }
  }
  
  return { blocked: false, modifiedInput: input }
}

7.2 钩子配置示例

// settings.json
{
  "hooks": {
    "PreToolUse": [{
      "matcher": "Bash(rm *)",
      "hooks": [{
        "type": "command",
        "command": "echo 'Deletion blocked' && exit 2"
      }]
    }],
    "PostToolUse": [{
      "matcher": "Edit",
      "hooks": [{
        "type": "command",
        "command": "npm run lint"
      }]
    }]
  }
}

八、关键源文件索引

文件	职责
`src/types/permissions.ts`	权限类型定义
`src/utils/permissions/permissions.ts`	权限检查核心逻辑
`src/utils/permissions/filesystem.ts`	文件系统权限控制
`src/utils/permissions/shellRuleMatching.ts`	Shell 规则匹配
`src/utils/permissions/bashClassifier.ts`	Bash 分类器
`src/utils/permissions/yoloClassifier.ts`	Auto 模式分类器
`src/tools/BashTool/bashPermissions.ts`	Bash 权限检查
`src/tools/BashTool/pathValidation.ts`	Bash 路径验证
`src/tools/FileEditTool/FileEditTool.ts`	文件编辑工具实现
`src/services/tools/toolHooks.ts`	工具钩子

九、总结

Claude Code 的权限系统体现了几个核心设计原则：

分层决策：规则 → 模式 → 钩子 → 分类器 → 用户确认
Deny 优先：任何 deny 匹配立即拒绝
AST 级安全：使用 tree-sitter 解析 Bash 命令，检测注入
路径约束：严格限制文件操作在工作目录内
编辑前读取：防止盲目覆盖，检测并发修改
可追溯性：每个决策都有原因记录

这个设计确保了 AI Agent 的安全性，同时保持了良好的用户体验。

系列文章导航：

上一篇：Skills 系统：条件激活与动态发现
下一篇：Memory 系统：跨会话持久化知识库

Skills 系统：条件激活与动态发现

2026-04-05T16:00:00.000Z

Skills 是 Claude Code 最强大的扩展机制之一。它不是简单的”命令别名”，而是完整的 AI 行为定义：可以限制工具池、覆盖模型、注入 Hook、选择执行上下文（inline 或 fork）。更令人惊叹的是，Skills 支持条件激活——只有当你操作特定文件时才被发现。

导读：Skills 不只是命令

很多人第一次看到 Skills 时，会认为它就是”斜杠命令”的别名。但实际上，Skills 是一个完整的 AI 行为定义系统：

---
name: code-review
description: Expert code review with best practices
allowed-tools: ['Read', 'Grep', 'WebSearch']
model: sonnet
context: fork
hooks:
  PreToolUse:
    - matcher: "Bash"
      hooks:
        - type: command
          command: "echo 'Review mode: read-only'"
---

You are a code reviewer. Analyze the code for:
- Security vulnerabilities
- Performance issues
- Code style and best practices
- Documentation completeness

Provide actionable feedback with specific line references.

这个 Skill 定义了：

工具限制：只读工具（Read、Grep、WebSearch）
模型选择：使用 Sonnet
执行上下文：Fork 模式（独立子代理）
Hook 注入：阻止 Bash 调用

一、Skills 系统架构

1.1 整体架构

┌─────────────────────────────────────────────────────┐
│                   Skills 系统                        │
│                                                     │
│  ┌─────────────┐  ┌──────────────┐  ┌────────────┐ │
│  │  Discovery   │  │   Prompt     │  │  SkillTool │ │
│  │  发现 & 加载  │→│  注入 & 呈现  │→│  执行引擎   │ │
│  └─────────────┘  └──────────────┘  └────────────┘ │
│         ↑                                    ↓      │
│  ┌─────────────┐                     ┌────────────┐ │
│  │  Activation  │                     │  Context   │ │
│  │  条件激活    │←────────────────────│  上下文修改 │ │
│  └─────────────┘                     └────────────┘ │
└─────────────────────────────────────────────────────┘

1.2 核心模块职责

模块	核心文件	职责
Discovery	`loadSkillsDir.ts`	从 6 种来源发现和加载 Skills
Prompt	`prompt.ts` + `attachments.ts`	将 Skill 列表注入 system-reminder
SkillTool	`SkillTool.ts`	验证、权限检查、执行 Skill
Activation	`loadSkillsDir.ts`	条件激活和动态发现
Context	`forkedAgent.ts`	上下文准备和修改

二、Skill 发现与加载

2.1 六种来源

┌─────────────────────────────────────────────────────┐
│                   Skills 来源                        │
├─────────────────────────────────────────────────────┤
│                                                     │
│  1. Bundled Skills（内置）                          │
│     └─ src/skills/bundled/*.md                     │
│                                                     │
│  2. Built-in Plugin Skills（内置插件）              │
│     └─ src/plugins/bundled/*/skills/*.md           │
│                                                     │
│  3. Managed Skills（管理）                          │
│     └─ ${MANAGED_PATH}/.claude/skills/             │
│                                                     │
│  4. User Skills（用户全局）                         │
│     └─ ~/.claude/skills/                           │
│                                                     │
│  5. Project Skills（项目级）                        │
│     └─ .claude/skills/                             │
│                                                     │
│  6. Plugin Skills（插件）                           │
│     └─ ~/.claude/plugins/*/skills/                 │
│                                                     │
└─────────────────────────────────────────────────────┘

2.2 加载优先级

// src/commands.ts
const loadAllCommands = memoize(async (cwd: string): Promise => {
  return [
    ...bundledSkills,        // 1. 内置 Skills（最高优先级）
    ...builtinPluginSkills,  // 2. 内置插件 Skills
    ...skillDirCommands,     // 3. 目录 Skills（managed → user → project）
    ...workflowCommands,     // 4. Workflow 命令
    ...pluginCommands,       // 5. 插件命令
    ...pluginSkills,         // 6. 插件 Skills
    ...COMMANDS(),           // 7. 内建命令（最低优先级）
  ]
})

2.3 去重机制

// src/skills/loadSkillsDir.ts
const seenFileIds = new Map<string, SettingSource>()
for (const entry of allSkillsWithPaths) {
  const fileId = await getFileIdentity(entry.filePath)  // realpath() 解析符号链接
  const existingSource = seenFileIds.get(fileId)
  if (existingSource !== undefined) continue  // 跳过重复
  seenFileIds.set(fileId, entry.skill.source)
  deduplicatedSkills.push(entry.skill)
}

三、Frontmatter 解析

3.1 Frontmatter 字段

// src/utils/frontmatterParser.ts
type FrontmatterData = {
  'allowed-tools'?: string | string[] | null
  description?: string | null
  'argument-hint'?: string | null
  when_to_use?: string | null
  version?: string | null
  model?: string | null          // haiku, sonnet, opus, inherit
  'user-invocable'?: string | null
  'disable-model-invocation'?: string | null
  hooks?: HooksSettings | null
  effort?: string | null         // low, medium, high, max
  context?: 'inline' | 'fork' | null
  agent?: string | null
  paths?: string | string[] | null  // 条件激活路径
  shell?: string | null          // bash, powershell
}

3.2 解析流程

SKILL.md 文件
    ↓
parseFrontmatter()              ← frontmatterParser.ts
    ├─ 分离 YAML frontmatter 和 Markdown 内容
    ├─ quoteProblematicValues()  ← 处理特殊字符
    └─ parseYaml()               ← 解析 YAML
    ↓
parseSkillFrontmatterFields()   ← loadSkillsDir.ts
    ├─ description 提取（frontmatter 或第一个 # 标题）
    ├─ parseUserSpecifiedModel() ← 模型别名解析
    ├─ parseEffortValue()        ← 力度级别解析
    ├─ parseHooksFromFrontmatter() ← Hook 配置验证
    └─ parseSlashCommandToolsFromFrontmatter() ← 工具列表解析
    ↓
createSkillCommand()            ← 生成 Command 对象

四、条件激活机制

4.1 工作原理

带 paths frontmatter 的 Skills 不会立即暴露给模型：

---
name: react-component-test
description: Generate tests for React components
paths: 
  - "src/components/**/*.tsx"
  - "src/components/**/*.jsx"
allowed-tools: ['Read', 'Write', 'Bash']
model: sonnet
---

Generate comprehensive tests for this React component...

这个 Skill 只有在你操作 src/components/ 下的文件时才会被发现。

4.2 激活流程

启动时
├─ 加载所有 Skills
├─ 有 paths 的 → conditionalSkills Map
└─ 无 paths 的 → 立即可用

运行时（文件操作触发）
├─ activateConditionalSkillsForPaths(filePaths, cwd)
│  ├─ 遍历 conditionalSkills Map
│  ├─ 用 ignore 库匹配 paths 模式
│  │  └─ filePath 转为 cwd 相对路径后匹配
│  ├─ 匹配成功:
│  │  ├─ 移入 dynamicSkills Map
│  │  ├─ 从 conditionalSkills 删除
│  │  └─ 记录遥测 tengu_dynamic_skills_changed
│  └─ 一旦激活，会话内持续有效
└─ 通知缓存失效 → skillsLoaded.emit()

4.3 动态发现

当操作深层目录文件时，系统自动发现新的 Skills：

// src/skills/loadSkillsDir.ts
async function discoverSkillDirsForPaths(
  filePaths: string[],
  cwd: string,
): Promise<string[]> {
  for (const filePath of filePaths) {
    let currentDir = dirname(filePath)
    // 从文件所在目录向上遍历到 cwd
    while (currentDir.startsWith(resolvedCwd + pathSep)) {
      const skillDir = join(currentDir, '.claude', 'skills')
      if (!dynamicSkillDirs.has(skillDir)) {
        dynamicSkillDirs.add(skillDir)
        if (await exists(skillDir) && !await isGitignored(currentDir)) {
          newDirs.push(skillDir)
        }
      }
      currentDir = dirname(currentDir)
    }
  }
  // 按深度排序（最深优先）
  return newDirs.sort((a, b) => b.split(pathSep).length - a.split(pathSep).length)
}

五、Skill 注入到对话

5.1 注入流程

Skills 通过 system-reminder 消息注入到对话中：

// src/utils/attachments.ts
async function getSkillListingAttachments(): Promise<AttachmentMessage[]> {
  const commands = await getSkillToolCommands(cwd)
  
  // 预算控制
  const budget = contextWindowTokens * 4 * 0.01  // 1% 上下文
  
  // 格式化
  const formatted = formatCommandsWithinBudget(commands, budget)
  
  return [{
    type: 'skill_listing',
    content: formatted,
    skillCount: commands.length,
  }]
}

5.2 预算控制

// src/tools/SkillTool/prompt.ts
export const SKILL_BUDGET_CONTEXT_PERCENT = 0.01  // 上下文窗口的 1%
export const DEFAULT_CHAR_BUDGET = 8_000           // 兜底预算
export const MAX_LISTING_DESC_CHARS = 250          // 每条描述上限

截断策略：

formatCommandsWithinBudget(commands, budget)
├─ 计算总预算
├─ 尝试全量描述
│  └─ 总字符 ≤ 预算 → 全部输出
│
├─ 分区: Bundled（不截断） + 其余
│  ├─ Bundled Skills 始终保留完整描述
│  └─ 其余 Skills 平分剩余预算
│
└─ 截断描述 → maxDescLen 字符

六、SkillTool 执行引擎

6.1 执行流程

SkillTool.call({ skill, args })
    │
    ├─ 1. 标准化输入（去除前导 /）
    ├─ 2. 远程 Skill 检查（实验性）
    ├─ 3. 查找 Command 对象
    ├─ 4. 记录使用频率
    │
    ├─ 5. 判断执行路径
    │   ├─ command.context === 'fork'
    │   │  └─ → executeForkedSkill()
    │   │
    │   └─ 默认 inline
    │      ├─ processPromptSlashCommand()
    │      │  ├─ getPromptForCommand(args, context)
    │      │  ├─ registerSkillHooks()
    │      │  ├─ addInvokedSkill()
    │      │  └─ 提取附件 → 创建消息
    │      │
    │      ├─ 提取 metadata: allowedTools, model, effort
    │      ├─ tagMessagesWithToolUseID()
    │      └─ 返回 { newMessages, contextModifier }
    │
    └─ 6. contextModifier() 闭包
       ├─ 更新 allowedTools
       ├─ 更新 model
       └─ 更新 effort

6.2 Inline vs Fork 扔回

Inline 返回:

{
  data: {
    success: true,
    commandName: 'commit',
    allowedTools: ['Bash', 'Read'],
    model: 'sonnet',
    status: 'inline',
  },
  newMessages: [...],        // 注入到对话
  contextModifier: (ctx) => { ... },  // 修改上下文
}

Fork 返回:

{
  data: {
    success: true,
    commandName: 'verify',
    status: 'forked',
    agentId: 'agent_abc123',
    result: '验证通过，所有测试已运行...',
  },
  // 无 newMessages — 结果嵌入 tool_result block
}

七、Hook 集成

7.1 Hook 注册

Skills 可以通过 frontmatter 声明 Hook：

---
name: test-runner
hooks:
  PostToolUse:
    - matcher: "Edit"
      hooks:
        - type: command
          command: "npm test"
          once: true
---

调用时自动注册为会话级 Hook：

// src/utils/hooks/registerSkillHooks.ts
function registerSkillHooks(
  setAppState, sessionId, hooks, skillName, skillRoot
): void {
  for (const eventName of HOOK_EVENTS) {
    for (const matcher of hooks[eventName] || []) {
      for (const hook of matcher.hooks) {
        // once: true → 执行一次后自动移除
        const onHookSuccess = hook.once
          ? () => removeSessionHook(setAppState, sessionId, eventName, hook)
          : undefined
        
        addSessionHook(
          setAppState, sessionId, eventName,
          matcher.matcher || '',
          hook, onHookSuccess, skillRoot,
        )
      }
    }
  }
}

八、权限系统

8.1 检查流程

checkPermissions({ skill, args }, context)
    │
    ├─ 1. Deny 规则检查（最高优先级）
    │   └─ getRuleByContentsForTool(context, SkillTool, 'deny')
    │       ├─ 精确匹配: "commit" === commandName
    │       └─ 前缀匹配: "review:*" → commandName.startsWith("review")
    │
    ├─ 2. 远程 Skill 自动允许
    │
    ├─ 3. Allow 规则检查
    │
    ├─ 4. 安全属性自动允许
    │   └─ skillHasOnlySafeProperties(command)
    │       └─ 无 hooks、无 allowedTools、无 fork
    │
    └─ 5. 默认: 询问用户

8.2 安全属性白名单

如果 Skill 只包含以下属性，自动允许：

SAFE_SKILL_PROPERTIES = {
  type, name, description, contentLength, source,
  loadedFrom, progressMessage, userInvocable,
  disableModelInvocation, hasUserSpecifiedDescription,
  getPromptForCommand, userFacingName, ...
}

九、关键源文件索引

文件	职责
`src/tools/SkillTool/SkillTool.ts`	SkillTool 定义、验证、权限、执行
`src/tools/SkillTool/prompt.ts`	工具提示词、Skill 列表格式化
`src/skills/loadSkillsDir.ts`	目录 Skill 发现、加载、去重、条件激活
`src/skills/bundledSkills.ts`	内置 Skill 注册系统
`src/skills/bundled/index.ts`	内置 Skills 初始化入口
`src/commands.ts`	命令聚合、排序、过滤
`src/utils/forkedAgent.ts`	Fork 上下文准备、结果提取
`src/utils/hooks/registerSkillHooks.ts`	Skill Hook 注册

十、总结

Claude Code 的 Skills 系统体现了几个核心设计原则：

声明式定义：通过 Frontmatter 定义 AI 行为
条件激活：基于文件路径的动态发现
双模式执行：Inline（注入对话）和 Fork（独立子代理）
上下文修改：动态调整工具池、模型、effort
Hook 集成：将 Skill 行为扩展到工具生命周期
权限控制：安全属性白名单自动允许

这个设计使得用户可以轻松定义新的 AI 行为，而不需要修改代码。

系列文章导航：

上一篇：System Prompt 工程：动态组装与缓存优化
下一篇：权限与安全：分层模型与人机协作

Terminal UI：React + Ink 的 TUI 实现

2026-04-05T16:00:00.000Z

Claude Code 的终端界面不是传统的 CLI——它是一个完整的 React 应用，运行在终端中。通过 Ink 框架（自定义 React Reconciler + Yoga 布局引擎），Claude Code 实现了组件化 UI、双缓冲渲染、交互式对话框等高级特性。这是 Terminal UI 开发的教科书级案例。

导读：终端里的 React 应用

当你打开 Claude Code，看到的不是普通的命令行输出：

┌─────────────────────────────────────────────────────────────┐
│ Claude Code                                                 │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│ ▶ What would you like me to help you with?                 │
│                                                             │
│ ┌─ Tools ─────────────────────────────────────────────────┐│
│ │ Read  Edit  Write  Bash  Grep  Glob  WebSearch          ││
│ └─────────────────────────────────────────────────────────┘│
│                                                             │
│ ┌─ Context ────────────────────────────────────────────────┐│
│ │ Memory: 3 entries loaded                                 ││
│ │ MCP: 2 servers connected                                 ││
│ │ Token budget: 150,000                                    ││
│ └─────────────────────────────────────────────────────────┘│
│                                                             │
│ [Type your message or press Enter for suggestions]         │
└─────────────────────────────────────────────────────────────┘

这是一个完整的 GUI 应用，运行在终端中。背后是 React + Ink 的魔法。

一、Ink 框架基础

1.1 React Reconciler 架构

┌─────────────────────────────────────────────────────────────┐
│                    React + Ink 架构                          │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  React Components                                           │
│       ↓                                                     │
│  React Reconciler（自定义）                                  │
│       ↓                                                     │
│  Ink Host Config                                            │
│       ├─ createInstance() → 创建 Yoga Node                 │
│       ├─ appendChild() → 添加子节点                         │
│       ├─ removeChild() → 删除子节点                         │
│       └─ commitUpdate() → 更新属性                          │
│       ↓                                                     │
│  Yoga Layout Engine                                         │
│       ├─ Flexbox 布局计算                                   │
│       ├─ 文字测量（基于终端字符）                            │
│       └─ 位置计算                                           │
│       ↓                                                     │
│  Terminal Renderer                                          │
│       ├─ ANSI 转义序列                                      │
│       ├─ 双缓冲渲染                                         │
│       └─ 输出合并                                           │
│       ↓                                                     │
│  stdout                                                     │
│                                                             │
└─────────────────────────────────────────────────────────────┘

1.2 为什么选择 Ink？

优势	说明
React 生态	复用 React 的组件化思想、状态管理、生命周期
Flexbox 布局	Yoga 引擎提供完整的 Flexbox 支持
跨平台	Windows/macOS/Linux 终端一致性
双缓冲	避免闪烁，平滑更新

二、核心组件设计

2.1 组件树结构


  
    </span><br><span class="line">    <StatusIndicator /></span><br><span class="line">  </Header></span><br><span class="line">  </span><br><span class="line">  <Main></span><br><span class="line">    <MessageList></span><br><span class="line">      <UserMessage /></span><br><span class="line">      <AssistantMessage></span><br><span class="line">        <ToolCall /></span><br><span class="line">        <ToolResult /></span><br><span class="line">      </AssistantMessage></span><br><span class="line">    </MessageList></span><br><span class="line">    </span><br><span class="line">    <ToolBar></span><br><span class="line">      <ToolButton tool="Read" /></span><br><span class="line">      <ToolButton tool="Edit" /></span><br><span class="line">      ...</span><br><span class="line">    </ToolBar></span><br><span class="line">    </span><br><span class="line">    <ContextPanel></span><br><span class="line">      <MemoryStatus /></span><br><span class="line">      <MCPStatus /></span><br><span class="line">      <TokenBudget /></span><br><span class="line">    </ContextPanel></span><br><span class="line">  </Main></span><br><span class="line">  </span><br><span class="line">  <Footer></span><br><span class="line">    <InputBox /></span><br><span class="line">    <Suggestions /></span><br><span class="line">  </Footer></span><br><span class="line"></App></span><br></pre></td></tr></table></figure><h3 id="2-2-基础组件实现"><a href="#2-2-基础组件实现" class="headerlink" title="2.2 基础组件实现"></a>2.2 基础组件实现</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br></pre></td><td class="code"><pre><span class="line">// src/components/App.tsx</span><br><span class="line">import { Box, Text, useInput, useApp } from 'ink'</span><br><span class="line"></span><br><span class="line">function App() {</span><br><span class="line">  const { exit } = useApp()</span><br><span class="line">  const [messages, setMessages] = useState<Message[]>([])</span><br><span class="line">  const [input, setInput] = useState('')</span><br><span class="line"></span><br><span class="line">  useInput((char, key) => {</span><br><span class="line">    if (key.escape) {</span><br><span class="line">      exit()</span><br><span class="line">    } else if (key.return) {</span><br><span class="line">      handleSubmit(input)</span><br><span class="line">      setInput('')</span><br><span class="line">    } else {</span><br><span class="line">      setInput(prev => prev + char)</span><br><span class="line">    }</span><br><span class="line">  })</span><br><span class="line"></span><br><span class="line">  return (</span><br><span class="line">    <Box flexDirection="column" height="100%"></span><br><span class="line">      <Header /></span><br><span class="line">      <Box flexGrow={1}></span><br><span class="line">        <MessageList messages={messages} /></span><br><span class="line">        <ContextPanel /></span><br><span class="line">      </Box></span><br><span class="line">      <Footer input={input} /></span><br><span class="line">    </Box></span><br><span class="line">  )</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="三、布局系统"><a href="#三、布局系统" class="headerlink" title="三、布局系统"></a>三、布局系统</h2><h3 id="3-1-Yoga-Flexbox"><a href="#3-1-Yoga-Flexbox" class="headerlink" title="3.1 Yoga Flexbox"></a>3.1 Yoga Flexbox</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line">// Flexbox 属性完全支持</span><br><span class="line"><Box </span><br><span class="line">  flexDirection="column"    // 垂直布局</span><br><span class="line">  justifyContent="center"   // 居中</span><br><span class="line">  alignItems="stretch"      // 拉伸</span><br><span class="line">  flexGrow={1}              // 占满剩余空间</span><br><span class="line">  padding={1}               // 1 字符边距</span><br><span class="line">  margin={2}                // 2 字符外边距</span><br><span class="line">  borderStyle="single"      // 单线边框</span><br><span class="line">></span><br><span class="line">  <Text>Content</Text></span><br><span class="line"></Box></span><br></pre></td></tr></table></figure><h3 id="3-2-文字测量"><a href="#3-2-文字测量" class="headerlink" title="3.2 文字测量"></a>3.2 文字测量</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// ink/lib/measureText.ts</span></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">measureText</span>(<span class="params">text: <span class="built_in">string</span></span>): </span>{ width: <span class="built_in">number</span>; height: <span class="built_in">number</span> } {</span><br><span class="line">  <span class="comment">// 1. 处理 ANSI 转义序列（不计入宽度）</span></span><br><span class="line">  <span class="keyword">const</span> cleanText = stripAnsi(text)</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 2. 处理多行文本</span></span><br><span class="line">  <span class="keyword">const</span> lines = cleanText.split(<span class="string">'\n'</span>)</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 3. 每行宽度 = 字符数（考虑宽字符）</span></span><br><span class="line">  <span class="keyword">const</span> widths = lines.map(<span class="function"><span class="params">line</span> =></span> {</span><br><span class="line">    <span class="comment">// 中文字符占 2 列</span></span><br><span class="line">    <span class="keyword">return</span> line.split(<span class="string">''</span>).reduce(<span class="function">(<span class="params">width, char</span>) =></span> {</span><br><span class="line">      <span class="keyword">return</span> width + (isFullWidth(char) ? <span class="number">2</span> : <span class="number">1</span>)</span><br><span class="line">    }, <span class="number">0</span>)</span><br><span class="line">  })</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> {</span><br><span class="line">    width: <span class="built_in">Math</span>.max(...widths),</span><br><span class="line">    height: lines.length,</span><br><span class="line">  }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="四、双缓冲渲染"><a href="#四、双缓冲渲染" class="headerlink" title="四、双缓冲渲染"></a>四、双缓冲渲染</h2><h3 id="4-1-渲染流程"><a href="#4-1-渲染流程" class="headerlink" title="4.1 渲染流程"></a>4.1 渲染流程</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br></pre></td><td class="code"><pre><span class="line">┌─────────────────────────────────────────────────────────────┐</span><br><span class="line">│                    双缓冲渲染流程                            │</span><br><span class="line">├─────────────────────────────────────────────────────────────┤</span><br><span class="line">│                                                             │</span><br><span class="line">│  State Update                                               │</span><br><span class="line">│       ↓                                                     │</span><br><span class="line">│  Reconciler 更新 Yoga Tree                                  │</span><br><span class="line">│       ↓                                                     │</span><br><span class="line">│  Layout 计算                                                │</span><br><span class="line">│       ↓                                                     │</span><br><span class="line">│  Render to Buffer A                                         │</span><br><span class="line">│       ├─ 遍历 Yoga Tree                                    │</span><br><span class="line">│       ├─ 生成 ANSI 序列                                    │</span><br><span class="line">│       └─ 写入 Buffer A                                     │</span><br><span class="line">│       ↓                                                     │</span><br><span class="line">│  Swap Buffers                                               │</span><br><span class="line">│       ├─ Buffer A → Previous Frame                         │</span><br><span class="line">│       ├─ Buffer B → Current Frame                          │</span><br><span class="line">│       ↓                                                     │</span><br><span class="line">│  Diff & Output                                              │</span><br><span class="line">│       ├─ 对比 Previous vs Current                          │</span><br><span class="line">│       ├─ 只输出变化的区域                                   │</span><br><span class="line">│       └─ ANSI 光标移动 + 更新                               │</span><br><span class="line">│                                                             │</span><br><span class="line">└─────────────────────────────────────────────────────────────┘</span><br></pre></td></tr></table></figure><h3 id="4-2-Diff-算法"><a href="#4-2-Diff-算法" class="headerlink" title="4.2 Diff 算法"></a>4.2 Diff 算法</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// ink/lib/diff.ts</span></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">diffScreens</span>(<span class="params">prev: <span class="built_in">string</span>[], curr: <span class="built_in">string</span>[]</span>): <span class="title">DiffOutput</span>[] </span>{</span><br><span class="line">  <span class="keyword">const</span> outputs: DiffOutput[] = []</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">for</span> (<span class="keyword">let</span> y = <span class="number">0</span>; y < <span class="built_in">Math</span>.max(prev.length, curr.length); y++) {</span><br><span class="line">    <span class="keyword">const</span> prevLine = prev[y] || <span class="string">''</span></span><br><span class="line">    <span class="keyword">const</span> currLine = curr[y] || <span class="string">''</span></span><br><span class="line">    </span><br><span class="line">    <span class="keyword">if</span> (prevLine !== currLine) {</span><br><span class="line">      <span class="comment">// 移动光标到该行</span></span><br><span class="line">      outputs.push({ <span class="keyword">type</span>: <span class="string">'move'</span>, x: <span class="number">0</span>, y })</span><br><span class="line">      </span><br><span class="line">      <span class="comment">// 清除该行</span></span><br><span class="line">      outputs.push({ <span class="keyword">type</span>: <span class="string">'clear_line'</span> })</span><br><span class="line">      </span><br><span class="line">      <span class="comment">// 写入新内容</span></span><br><span class="line">      outputs.push({ <span class="keyword">type</span>: <span class="string">'write'</span>, content: currLine })</span><br><span class="line">    }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> outputs</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="五、交互式组件"><a href="#五、交互式组件" class="headerlink" title="五、交互式组件"></a>五、交互式组件</h2><h3 id="5-1-InputBox-实现"><a href="#5-1-InputBox-实现" class="headerlink" title="5.1 InputBox 实现"></a>5.1 InputBox 实现</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br></pre></td><td class="code"><pre><span class="line">// src/components/InputBox.tsx</span><br><span class="line">import { Box, Text, useInput } from 'ink'</span><br><span class="line">import { useState } from 'react'</span><br><span class="line"></span><br><span class="line">function InputBox({ onSubmit }) {</span><br><span class="line">  const [value, setValue] = useState('')</span><br><span class="line">  const [cursorPosition, setCursorPosition] = useState(0)</span><br><span class="line"></span><br><span class="line">  useInput((char, key) => {</span><br><span class="line">    if (key.leftArrow) {</span><br><span class="line">      setCursorPosition(Math.max(0, cursorPosition - 1))</span><br><span class="line">    } else if (key.rightArrow) {</span><br><span class="line">      setCursorPosition(Math.min(value.length, cursorPosition + 1))</span><br><span class="line">    } else if (key.backspace) {</span><br><span class="line">      setValue(prev => prev.slice(0, cursorPosition - 1) + prev.slice(cursorPosition))</span><br><span class="line">      setCursorPosition(Math.max(0, cursorPosition - 1))</span><br><span class="line">    } else if (key.return) {</span><br><span class="line">      onSubmit(value)</span><br><span class="line">      setValue('')</span><br><span class="line">      setCursorPosition(0)</span><br><span class="line">    } else {</span><br><span class="line">      setValue(prev => prev.slice(0, cursorPosition) + char + prev.slice(cursorPosition))</span><br><span class="line">      setCursorPosition(cursorPosition + 1)</span><br><span class="line">    }</span><br><span class="line">  })</span><br><span class="line"></span><br><span class="line">  return (</span><br><span class="line">    <Box borderStyle="single" padding={1}></span><br><span class="line">      <Text bold>▶ </Text></span><br><span class="line">      <Text>{value.slice(0, cursorPosition)}</Text></span><br><span class="line">      <Text backgroundColor="cyan">{value[cursorPosition] || ' '}</Text></span><br><span class="line">      <Text>{value.slice(cursorPosition + 1)}</Text></span><br><span class="line">    </Box></span><br><span class="line">  )</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="5-2-SelectMenu-实现"><a href="#5-2-SelectMenu-实现" class="headerlink" title="5.2 SelectMenu 实现"></a>5.2 SelectMenu 实现</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br></pre></td><td class="code"><pre><span class="line">// src/components/SelectMenu.tsx</span><br><span class="line">import { Box, Text, useInput } from 'ink'</span><br><span class="line"></span><br><span class="line">function SelectMenu({ items, onSelect }) {</span><br><span class="line">  const [selectedIndex, setSelectedIndex] = useState(0)</span><br><span class="line"></span><br><span class="line">  useInput((char, key) => {</span><br><span class="line">    if (key.upArrow) {</span><br><span class="line">      setSelectedIndex(Math.max(0, selectedIndex - 1))</span><br><span class="line">    } else if (key.downArrow) {</span><br><span class="line">      setSelectedIndex(Math.min(items.length - 1, selectedIndex + 1))</span><br><span class="line">    } else if (key.return) {</span><br><span class="line">      onSelect(items[selectedIndex])</span><br><span class="line">    }</span><br><span class="line">  })</span><br><span class="line"></span><br><span class="line">  return (</span><br><span class="line">    <Box flexDirection="column"></span><br><span class="line">      {items.map((item, index) => (</span><br><span class="line">        <Box key={item.value}></span><br><span class="line">          <Text color={index === selectedIndex ? 'cyan' : 'gray'}></span><br><span class="line">            {index === selectedIndex ? '▶ ' : '  '}</span><br><span class="line">          </Text></span><br><span class="line">          <Text bold={index === selectedIndex}>{item.label}</Text></span><br><span class="line">        </Box></span><br><span class="line">      ))}</span><br><span class="line">    </Box></span><br><span class="line">  )</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="六、工具调用可视化"><a href="#六、工具调用可视化" class="headerlink" title="六、工具调用可视化"></a>六、工具调用可视化</h2><h3 id="6-1-ToolCall-组件"><a href="#6-1-ToolCall-组件" class="headerlink" title="6.1 ToolCall 组件"></a>6.1 ToolCall 组件</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br></pre></td><td class="code"><pre><span class="line">// src/components/ToolCall.tsx</span><br><span class="line">function ToolCall({ toolName, input, status }) {</span><br><span class="line">  const statusColor = {</span><br><span class="line">    pending: 'yellow',</span><br><span class="line">    running: 'blue',</span><br><span class="line">    success: 'green',</span><br><span class="line">    error: 'red',</span><br><span class="line">  }</span><br><span class="line"></span><br><span class="line">  return (</span><br><span class="line">    <Box flexDirection="column" borderStyle="single" borderColor={statusColor[status]}></span><br><span class="line">      <Box></span><br><span class="line">        <Text bold color={statusColor[status]}></span><br><span class="line">          ⚙ {toolName}</span><br><span class="line">        </Text></span><br><span class="line">        <Text dimColor> ({status})</Text></span><br><span class="line">      </Box></span><br><span class="line">      </span><br><span class="line">      {status === 'running' && (</span><br><span class="line">        <Box marginLeft={2}></span><br><span class="line">          <Text dimColor>Input: {JSON.stringify(input).slice(0, 100)}</Text></span><br><span class="line">        </Box></span><br><span class="line">      )}</span><br><span class="line">      </span><br><span class="line">      {status === 'success' && (</span><br><span class="line">        <Box marginLeft={2}></span><br><span class="line">          <Text color="green">✓ Completed in {duration}ms</Text></span><br><span class="line">        </Box></span><br><span class="line">      )}</span><br><span class="line">      </span><br><span class="line">      {status === 'error' && (</span><br><span class="line">        <Box marginLeft={2}></span><br><span class="line">          <Text color="red">✗ {error.message}</Text></span><br><span class="line">        </Box></span><br><span class="line">      )}</span><br><span class="line">    </Box></span><br><span class="line">  )</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="6-2-ToolResult-组件"><a href="#6-2-ToolResult-组件" class="headerlink" title="6.2 ToolResult 组件"></a>6.2 ToolResult 组件</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br></pre></td><td class="code"><pre><span class="line">// src/components/ToolResult.tsx</span><br><span class="line">function ToolResult({ output, truncated }) {</span><br><span class="line">  const [expanded, setExpanded] = useState(false)</span><br><span class="line">  </span><br><span class="line">  const displayOutput = expanded ? output : output.slice(0, 500)</span><br><span class="line">  </span><br><span class="line">  return (</span><br><span class="line">    <Box flexDirection="column"></span><br><span class="line">      <Box borderStyle="single" borderColor="gray"></span><br><span class="line">        <Text dimColor>Output:</Text></span><br><span class="line">      </Box></span><br><span class="line">      </span><br><span class="line">      <Box padding={1}></span><br><span class="line">        <Text>{displayOutput}</Text></span><br><span class="line">      </Box></span><br><span class="line">      </span><br><span class="line">      {truncated && !expanded && (</span><br><span class="line">        <Box></span><br><span class="line">          <Text dimColor>... ({output.length - 500} more characters)</Text></span><br><span class="line">          <Text color="cyan" bold> [Press Enter to expand]</Text></span><br><span class="line">        </Box></span><br><span class="line">      )}</span><br><span class="line">    </Box></span><br><span class="line">  )</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="七、权限对话框"><a href="#七、权限对话框" class="headerlink" title="七、权限对话框"></a>七、权限对话框</h2><h3 id="7-1-PermissionDialog-组件"><a href="#7-1-PermissionDialog-组件" class="headerlink" title="7.1 PermissionDialog 组件"></a>7.1 PermissionDialog 组件</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br><span class="line">44</span><br><span class="line">45</span><br><span class="line">46</span><br><span class="line">47</span><br><span class="line">48</span><br><span class="line">49</span><br><span class="line">50</span><br><span class="line">51</span><br><span class="line">52</span><br><span class="line">53</span><br><span class="line">54</span><br><span class="line">55</span><br><span class="line">56</span><br><span class="line">57</span><br><span class="line">58</span><br><span class="line">59</span><br><span class="line">60</span><br></pre></td><td class="code"><pre><span class="line">// src/components/PermissionDialog.tsx</span><br><span class="line">function PermissionDialog({ toolName, description, onAllow, onDeny }) {</span><br><span class="line">  const [selected, setSelected] = useState<'allow' | 'deny'>('deny')</span><br><span class="line"></span><br><span class="line">  useInput((char, key) => {</span><br><span class="line">    if (key.leftArrow || key.rightArrow) {</span><br><span class="line">      setSelected(prev => prev === 'allow' ? 'deny' : 'allow')</span><br><span class="line">    } else if (key.return) {</span><br><span class="line">      if (selected === 'allow') {</span><br><span class="line">        onAllow()</span><br><span class="line">      } else {</span><br><span class="line">        onDeny()</span><br><span class="line">      }</span><br><span class="line">    }</span><br><span class="line">  })</span><br><span class="line"></span><br><span class="line">  return (</span><br><span class="line">    <Box </span><br><span class="line">      flexDirection="column" </span><br><span class="line">      borderStyle="double" </span><br><span class="line">      borderColor="yellow"</span><br><span class="line">      padding={2}</span><br><span class="line">    ></span><br><span class="line">      <Box></span><br><span class="line">        <Text bold color="yellow">⚠ Permission Required</Text></span><br><span class="line">      </Box></span><br><span class="line">      </span><br><span class="line">      <Box marginTop={1}></span><br><span class="line">        <Text>Tool: <Text bold>{toolName}</Text></Text></span><br><span class="line">      </Box></span><br><span class="line">      </span><br><span class="line">      <Box marginTop={1}></span><br><span class="line">        <Text>{description}</Text></span><br><span class="line">      </Box></span><br><span class="line">      </span><br><span class="line">      <Box marginTop={2} justifyContent="space-around"></span><br><span class="line">        <Box></span><br><span class="line">          <Text </span><br><span class="line">            backgroundColor={selected === 'deny' ? 'red' : undefined}</span><br><span class="line">            bold={selected === 'deny'}</span><br><span class="line">          ></span><br><span class="line">            [Deny]</span><br><span class="line">          </Text></span><br><span class="line">        </Box></span><br><span class="line">        <Box></span><br><span class="line">          <Text </span><br><span class="line">            backgroundColor={selected === 'allow' ? 'green' : undefined}</span><br><span class="line">            bold={selected === 'allow'}</span><br><span class="line">          ></span><br><span class="line">            [Allow]</span><br><span class="line">          </Text></span><br><span class="line">        </Box></span><br><span class="line">      </Box></span><br><span class="line">      </span><br><span class="line">      <Box marginTop={1}></span><br><span class="line">        <Text dimColor>← → to select, Enter to confirm</Text></span><br><span class="line">      </Box></span><br><span class="line">    </Box></span><br><span class="line">  )</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="八、非交互模式"><a href="#八、非交互模式" class="headerlink" title="八、非交互模式"></a>八、非交互模式</h2><h3 id="8-1-模式切换"><a href="#8-1-模式切换" class="headerlink" title="8.1 模式切换"></a>8.1 模式切换</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/cli.ts</span></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">detectInteractiveMode</span>(<span class="params"></span>): <span class="title">boolean</span> </span>{</span><br><span class="line">  <span class="comment">// 1. 检查 stdout 是否是 TTY</span></span><br><span class="line">  <span class="keyword">if</span> (!process.stdout.isTTY) {</span><br><span class="line">    <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">  }</span><br><span class="line"></span><br><span class="line">  <span class="comment">// 2. 检查 CI 环境</span></span><br><span class="line">  <span class="keyword">if</span> (process.env.CI === <span class="string">'true'</span>) {</span><br><span class="line">    <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">  }</span><br><span class="line"></span><br><span class="line">  <span class="comment">// 3. 检查 --non-interactive 参数</span></span><br><span class="line">  <span class="keyword">if</span> (process.argv.includes(<span class="string">'--non-interactive'</span>)) {</span><br><span class="line">    <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">  }</span><br><span class="line"></span><br><span class="line">  <span class="keyword">return</span> <span class="literal">true</span></span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="8-2-非交互输出"><a href="#8-2-非交互输出" class="headerlink" title="8.2 非交互输出"></a>8.2 非交互输出</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/renderers/nonInteractive.ts</span></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">renderNonInteractive</span>(<span class="params">message: Message</span>): <span class="title">void</span> </span>{</span><br><span class="line">  <span class="keyword">switch</span> (message.type) {</span><br><span class="line">    <span class="keyword">case</span> <span class="string">'user'</span>:</span><br><span class="line">      <span class="built_in">console</span>.log(<span class="string">`\n> <span class="subst">${message.content}</span>`</span>)</span><br><span class="line">      <span class="keyword">break</span></span><br><span class="line">      </span><br><span class="line">    <span class="keyword">case</span> <span class="string">'assistant'</span>:</span><br><span class="line">      <span class="built_in">console</span>.log(<span class="string">`\n<span class="subst">${message.content}</span>`</span>)</span><br><span class="line">      <span class="keyword">break</span></span><br><span class="line">      </span><br><span class="line">    <span class="keyword">case</span> <span class="string">'tool_use'</span>:</span><br><span class="line">      <span class="built_in">console</span>.log(<span class="string">`\n[Tool: <span class="subst">${message.toolName}</span>]`</span>)</span><br><span class="line">      <span class="keyword">if</span> (message.input) {</span><br><span class="line">        <span class="built_in">console</span>.log(<span class="string">`  Input: <span class="subst">${<span class="built_in">JSON</span>.stringify(message.input)}</span>`</span>)</span><br><span class="line">      }</span><br><span class="line">      <span class="keyword">break</span></span><br><span class="line">      </span><br><span class="line">    <span class="keyword">case</span> <span class="string">'tool_result'</span>:</span><br><span class="line">      <span class="built_in">console</span>.log(<span class="string">`  Result: <span class="subst">${message.output.slice(<span class="number">0</span>, <span class="number">500</span>)}</span>`</span>)</span><br><span class="line">      <span class="keyword">break</span></span><br><span class="line">      </span><br><span class="line">    <span class="keyword">case</span> <span class="string">'error'</span>:</span><br><span class="line">      <span class="built_in">console</span>.error(<span class="string">`\n[Error] <span class="subst">${message.message}</span>`</span>)</span><br><span class="line">      <span class="keyword">break</span></span><br><span class="line">  }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="九、颜色和样式系统"><a href="#九、颜色和样式系统" class="headerlink" title="九、颜色和样式系统"></a>九、颜色和样式系统</h2><h3 id="9-1-ANSI-颜色映射"><a href="#9-1-ANSI-颜色映射" class="headerlink" title="9.1 ANSI 颜色映射"></a>9.1 ANSI 颜色映射</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/styles/colors.ts</span></span><br><span class="line"><span class="keyword">const</span> COLORS = {</span><br><span class="line">  <span class="comment">// 用户消息</span></span><br><span class="line">  user: <span class="string">'cyan'</span>,</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// AI 响应</span></span><br><span class="line">  assistant: <span class="string">'white'</span>,</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 工具调用</span></span><br><span class="line">  tool_pending: <span class="string">'yellow'</span>,</span><br><span class="line">  tool_running: <span class="string">'blue'</span>,</span><br><span class="line">  tool_success: <span class="string">'green'</span>,</span><br><span class="line">  tool_error: <span class="string">'red'</span>,</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 状态指示</span></span><br><span class="line">  status_active: <span class="string">'green'</span>,</span><br><span class="line">  status_idle: <span class="string">'gray'</span>,</span><br><span class="line">  status_error: <span class="string">'red'</span>,</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 强调</span></span><br><span class="line">  emphasis: <span class="string">'bold'</span>,</span><br><span class="line">  dim: <span class="string">'dim'</span>,</span><br><span class="line">}</span><br><span class="line"></span><br><span class="line"><span class="comment">// ANSI 转义序列</span></span><br><span class="line"><span class="keyword">const</span> ANSI_COLORS = {</span><br><span class="line">  cyan: <span class="string">'\x1b[36m'</span>,</span><br><span class="line">  green: <span class="string">'\x1b[32m'</span>,</span><br><span class="line">  red: <span class="string">'\x1b[31m'</span>,</span><br><span class="line">  yellow: <span class="string">'\x1b[33m'</span>,</span><br><span class="line">  blue: <span class="string">'\x1b[34m'</span>,</span><br><span class="line">  gray: <span class="string">'\x1b[90m'</span>,</span><br><span class="line">  bold: <span class="string">'\x1b[1m'</span>,</span><br><span class="line">  dim: <span class="string">'\x1b[2m'</span>,</span><br><span class="line">  reset: <span class="string">'\x1b[0m'</span>,</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="9-2-边框样式"><a href="#9-2-边框样式" class="headerlink" title="9.2 边框样式"></a>9.2 边框样式</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// ink/lib/borders.ts</span></span><br><span class="line"><span class="keyword">const</span> BORDERS = {</span><br><span class="line">  single: {</span><br><span class="line">    topLeft: <span class="string">'┌'</span>, top: <span class="string">'─'</span>, topRight: <span class="string">'┐'</span>,</span><br><span class="line">    left: <span class="string">'│'</span>, right: <span class="string">'│'</span>,</span><br><span class="line">    bottomLeft: <span class="string">'└'</span>, bottom: <span class="string">'─'</span>, bottomRight: <span class="string">'┘'</span>,</span><br><span class="line">  },</span><br><span class="line">  double: {</span><br><span class="line">    topLeft: <span class="string">'╔'</span>, top: <span class="string">'═'</span>, topRight: <span class="string">'╗'</span>,</span><br><span class="line">    left: <span class="string">'║'</span>, right: <span class="string">'║'</span>,</span><br><span class="line">    bottomLeft: <span class="string">'╚'</span>, bottom: <span class="string">'═'</span>, bottomRight: <span class="string">'╝'</span>,</span><br><span class="line">  },</span><br><span class="line">  rounded: {</span><br><span class="line">    topLeft: <span class="string">'╭'</span>, top: <span class="string">'─'</span>, topRight: <span class="string">'╮'</span>,</span><br><span class="line">    left: <span class="string">'│'</span>, right: <span class="string">'│'</span>,</span><br><span class="line">    bottomLeft: <span class="string">'╰'</span>, bottom: <span class="string">'─'</span>, bottomRight: <span class="string">'╯'</span>,</span><br><span class="line">  },</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="十、性能优化"><a href="#十、性能优化" class="headerlink" title="十、性能优化"></a>十、性能优化</h2><h3 id="10-1-渲染节流"><a href="#10-1-渲染节流" class="headerlink" title="10.1 渲染节流"></a>10.1 渲染节流</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// ink/lib/renderer.ts</span></span><br><span class="line"><span class="keyword">const</span> RENDER_INTERVAL = <span class="number">16</span>  <span class="comment">// ~60fps</span></span><br><span class="line"></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">scheduleRender</span>(<span class="params">callback: () => <span class="built_in">void</span></span>): <span class="title">void</span> </span>{</span><br><span class="line">  <span class="keyword">if</span> (renderScheduled) {</span><br><span class="line">    <span class="keyword">return</span></span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  renderScheduled = <span class="literal">true</span></span><br><span class="line">  setTimeout(<span class="function"><span class="params">()</span> =></span> {</span><br><span class="line">    callback()</span><br><span class="line">    renderScheduled = <span class="literal">false</span></span><br><span class="line">  }, RENDER_INTERVAL)</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="10-2-虚拟滚动"><a href="#10-2-虚拟滚动" class="headerlink" title="10.2 虚拟滚动"></a>10.2 虚拟滚动</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/components/VirtualList.tsx</span></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">VirtualList</span>(<span class="params">{ items, height }</span>) </span>{</span><br><span class="line">  <span class="keyword">const</span> [scrollTop, setScrollTop] = useState(<span class="number">0</span>)</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 只渲染可见区域</span></span><br><span class="line">  <span class="keyword">const</span> visibleStart = scrollTop</span><br><span class="line">  <span class="keyword">const</span> visibleEnd = scrollTop + height</span><br><span class="line">  <span class="keyword">const</span> visibleItems = items.slice(visibleStart, visibleEnd)</span><br><span class="line"></span><br><span class="line">  useInput(<span class="function">(<span class="params">char, key</span>) =></span> {</span><br><span class="line">    <span class="keyword">if</span> (key.upArrow) {</span><br><span class="line">      setScrollTop(<span class="built_in">Math</span>.max(<span class="number">0</span>, scrollTop - <span class="number">1</span>))</span><br><span class="line">    } <span class="keyword">else</span> <span class="keyword">if</span> (key.downArrow) {</span><br><span class="line">      setScrollTop(<span class="built_in">Math</span>.min(items.length - height, scrollTop + <span class="number">1</span>))</span><br><span class="line">    }</span><br><span class="line">  })</span><br><span class="line"></span><br><span class="line">  <span class="keyword">return</span> (</span><br><span class="line">    <Box flexDirection=<span class="string">"column"</span> height={height}></span><br><span class="line">      {visibleItems.map(<span class="function">(<span class="params">item, index</span>) =></span> (</span><br><span class="line">        <Box key={visibleStart + index}></span><br><span class="line">          <Text>{item.content}<<span class="regexp">/Text></span></span><br><span class="line"><span class="regexp">        </</span>Box></span><br><span class="line">      ))}</span><br><span class="line">    <<span class="regexp">/Box></span></span><br><span class="line"><span class="regexp">  )</span></span><br><span class="line"><span class="regexp">}</span></span><br></pre></td></tr></table></figure><hr><h2 id="十一、关键源文件索引"><a href="#十一、关键源文件索引" class="headerlink" title="十一、关键源文件索引"></a>十一、关键源文件索引</h2><div class="table-container"><table><thead><tr><th>文件</th><th>职责</th></tr></thead><tbody><tr><td><code>src/components/App.tsx</code></td><td>主应用入口</td></tr><tr><td><code>src/components/Header.tsx</code></td><td>标题栏和状态指示</td></tr><tr><td><code>src/components/MessageList.tsx</code></td><td>消息列表渲染</td></tr><tr><td><code>src/components/ToolCall.tsx</code></td><td>工具调用可视化</td></tr><tr><td><code>src/components/InputBox.tsx</code></td><td>输入框组件</td></tr><tr><td><code>src/components/PermissionDialog.tsx</code></td><td>权限对话框</td></tr><tr><td><code>src/renderers/nonInteractive.ts</code></td><td>非交互模式渲染</td></tr><tr><td><code>src/styles/colors.ts</code></td><td>颜色系统</td></tr><tr><td><code>ink/lib/renderer.ts</code></td><td>双缓冲渲染引擎</td></tr><tr><td><code>ink/lib/measureText.ts</code></td><td>文字测量</td></tr></tbody></table></div><hr><h2 id="十二、总结"><a href="#十二、总结" class="headerlink" title="十二、总结"></a>十二、总结</h2><p>Claude Code 的 Terminal UI 系统体现了几个核心设计原则：</p><ol><li><strong>React 组件化</strong>：复用 React 生态，组件化 UI 设计</li><li><strong>Flexbox 布局</strong>：Yoga 引擎提供完整的 Flexbox 支持</li><li><strong>双缓冲渲染</strong>：避免闪烁，只更新变化的区域</li><li><strong>交互式组件</strong>：InputBox、SelectMenu、PermissionDialog</li><li><strong>非交互模式</strong>：自动检测环境，降级为简单输出</li><li><strong>性能优化</strong>：渲染节流、虚拟滚动</li></ol><p>这个设计让终端应用拥有了 GUI 级别的交互体验，是 Terminal UI 开发的教科书级案例。</p><hr><p><strong>系列文章导航：</strong></p><ul><li>上一篇：<a href="/claude-code-computer-use/">Computer Use：桌面控制的九层安全关卡</a></li><li>系列完结</li></ul>
</article>
<article>
<h1>System Prompt 工程：动态组装与缓存优化</h1>
<p>2026-04-05T16:00:00.000Z</p>
<blockquote><p>Claude Code 的系统提示词不是一个静态字符串，而是一个动态组装的管道。通过分层构建、缓存边界、Section 类型等设计，实现了跨会话的缓存复用，大幅降低了延迟和成本。这是 Prompt 工程的教科书级案例。</p></blockquote><a id="more"></a><h2 id="导读：系统提示词的挑战"><a href="#导读：系统提示词的挑战" class="headerlink" title="导读：系统提示词的挑战"></a>导读：系统提示词的挑战</h2><p>系统提示词是 Agent 的”操作系统”——它定义了 Agent 的角色、规则、能力和约束。但系统提示词面临几个挑战：</p><p><strong>挑战一：长度</strong><br>Claude Code 的系统提示词约 20k tokens，每次 API 调用都要发送。</p><p><strong>挑战二：动态性</strong><br>系统提示词需要包含：</p><ul><li>当前日期</li><li>项目结构</li><li>Git 状态</li><li>MCP 服务器指令</li><li>用户自定义指令（CLAUDE.md）</li></ul><p>这些内容会变化，无法静态缓存。</p><p><strong>挑战三：优先级</strong><br>多个来源的指令需要按优先级合并：</p><ul><li>用户全局指令</li><li>项目级指令</li><li>本地私有指令</li></ul><p>Claude Code 的解决方案：<strong>分层管道 + 缓存边界 + Section 类型</strong>。</p><hr><h2 id="一、分层构建架构"><a href="#一、分层构建架构" class="headerlink" title="一、分层构建架构"></a>一、分层构建架构</h2><h3 id="1-1-提示词管道"><a href="#1-1-提示词管道" class="headerlink" title="1.1 提示词管道"></a>1.1 提示词管道</h3><p>系统提示词通过分层管道动态组装：</p><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line">┌─────────────────────────────────────────────────────────────┐</span><br><span class="line">│                    静态可缓存区域                              │</span><br><span class="line">│  ┌───────────────────────────────────────────────────────┐  │</span><br><span class="line">│  │ 角色定义  │  系统规则  │  任务指导  │  工具说明  │  风格  │  │</span><br><span class="line">│  └───────────────────────────────────────────────────────┘  │</span><br><span class="line">├─────────────────────── 缓存边界 ────────────────────────────┤</span><br><span class="line">│                    动态可变区域                                │</span><br><span class="line">│  ┌───────────────────────────────────────────────────────┐  │</span><br><span class="line">│  │ 会话指引 │ 记忆系统 │ 环境信息 │ MCP 指令 │ Token 预算 │  │</span><br><span class="line">│  └───────────────────────────────────────────────────────┘  │</span><br><span class="line">└─────────────────────────────────────────────────────────────┘</span><br></pre></td></tr></table></figure><h3 id="1-2-缓存边界"><a href="#1-2-缓存边界" class="headerlink" title="1.2 缓存边界"></a>1.2 缓存边界</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/constants/prompts.ts:114-116</span></span><br><span class="line"><span class="keyword">export</span> <span class="keyword">const</span> SYSTEM_PROMPT_DYNAMIC_BOUNDARY =</span><br><span class="line">  <span class="string">'__SYSTEM_PROMPT_DYNAMIC_BOUNDARY__'</span></span><br></pre></td></tr></table></figure><p><strong>缓存边界的作用</strong>：</p><ul><li><strong>边界之上</strong>：跨用户、跨组织通用的内容，使用 <code>scope: 'global'</code> 缓存</li><li><strong>边界之下</strong>：用户/会话特定的内容，使用 <code>scope: 'ephemeral'</code> 缓存</li></ul><p>这意味着 Claude Code 的系统提示词<strong>不需要每次都重新处理</strong>——静态部分在全球范围内共享缓存，大幅降低延迟和成本。</p><hr><h2 id="二、两种-Section-类型"><a href="#二、两种-Section-类型" class="headerlink" title="二、两种 Section 类型"></a>二、两种 Section 类型</h2><h3 id="2-1-缓存-Section"><a href="#2-1-缓存-Section" class="headerlink" title="2.1 缓存 Section"></a>2.1 缓存 Section</h3><p>计算一次，整个会话复用：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/constants/systemPromptSections.ts</span></span><br><span class="line">systemPromptSection(<span class="string">'memory'</span>, <span class="keyword">async</span> () => {</span><br><span class="line">  <span class="keyword">return</span> buildMemoryLines()  <span class="comment">// 读取 CLAUDE.md、记忆文件等</span></span><br><span class="line">}, { scope: <span class="string">'ephemeral'</span> })  <span class="comment">// 会话级缓存</span></span><br></pre></td></tr></table></figure><h3 id="2-2-缓存破坏-Section"><a href="#2-2-缓存破坏-Section" class="headerlink" title="2.2 缓存破坏 Section"></a>2.2 缓存破坏 Section</h3><p>每轮重新计算：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/constants/systemPromptSections.ts</span></span><br><span class="line">DANGEROUS_uncachedSystemPromptSection(<span class="string">'mcp_instructions'</span>, <span class="keyword">async</span> () => {</span><br><span class="line">  <span class="keyword">return</span> getMcpInstructions()  <span class="comment">// MCP 服务器可能中途连接/断开</span></span><br><span class="line">}, <span class="string">'MCP servers can connect/disconnect mid-session'</span>)</span><br></pre></td></tr></table></figure><p><strong>何时使用缓存破坏 Section</strong>：</p><ul><li>MCP 指令：服务器可能动态连接/断开</li><li>当前日期：每轮都不同</li><li>Git 状态：可能快速变化</li><li>Token 预算：每轮重新计算</li></ul><hr><h2 id="三、优先级解析链"><a href="#三、优先级解析链" class="headerlink" title="三、优先级解析链"></a>三、优先级解析链</h2><h3 id="3-1-系统提示词优先级"><a href="#3-1-系统提示词优先级" class="headerlink" title="3.1 系统提示词优先级"></a>3.1 系统提示词优先级</h3><p>最终的系统提示词通过 <code>buildEffectiveSystemPrompt()</code> 按优先级决定：</p><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line">Override System Prompt     ← 最高优先级，完全替换</span><br><span class="line">  ↓</span><br><span class="line">Coordinator System Prompt  ← 协调者模式专用</span><br><span class="line">  ↓</span><br><span class="line">Agent System Prompt        ← agentDefinition.getSystemPrompt()</span><br><span class="line">  ↓                          - proactive 模式：追加到默认</span><br><span class="line">  ↓                          - 其他：替换默认</span><br><span class="line">Custom System Prompt       ← --system-prompt 参数</span><br><span class="line">  ↓</span><br><span class="line">Default System Prompt      ← Claude Code 标准提示词</span><br><span class="line">  ↓</span><br><span class="line">Append System Prompt       ← 始终追加到末尾</span><br></pre></td></tr></table></figure><h3 id="3-2-代码实现"><a href="#3-2-代码实现" class="headerlink" title="3.2 代码实现"></a>3.2 代码实现</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/utils/systemPrompt.ts:41-123</span></span><br><span class="line"><span class="keyword">export</span> <span class="keyword">async</span> <span class="function"><span class="keyword">function</span> <span class="title">buildEffectiveSystemPrompt</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  options: BuildSystemPromptOptions,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Promise</span><<span class="title">SystemPrompt</span>> </span>{</span><br><span class="line">  <span class="keyword">const</span> sections: SystemPromptSection[] = []</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 1. 检查 Override</span></span><br><span class="line">  <span class="keyword">if</span> (options.overrideSystemPrompt) {</span><br><span class="line">    <span class="keyword">return</span> asSystemPrompt(options.overrideSystemPrompt)</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 2. 检查 Coordinator</span></span><br><span class="line">  <span class="keyword">if</span> (isCoordinatorMode() && options.coordinatorSystemPrompt) {</span><br><span class="line">    <span class="keyword">return</span> asSystemPrompt(options.coordinatorSystemPrompt)</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 3. 构建 Section 序列</span></span><br><span class="line">  <span class="keyword">const</span> defaultSections = <span class="keyword">await</span> buildDefaultSections()</span><br><span class="line">  sections.push(...defaultSections)</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 4. 处理 Agent 提示词</span></span><br><span class="line">  <span class="keyword">if</span> (options.agentDefinition?.getSystemPrompt) {</span><br><span class="line">    <span class="keyword">const</span> agentPrompt = <span class="keyword">await</span> options.agentDefinition.getSystemPrompt(options)</span><br><span class="line">    <span class="keyword">if</span> (options.agentDefinition.promptMode === <span class="string">'proactive'</span>) {</span><br><span class="line">      <span class="comment">// 追加到默认提示词后</span></span><br><span class="line">      sections.push({ <span class="keyword">type</span>: <span class="string">'text'</span>, text: agentPrompt })</span><br><span class="line">    } <span class="keyword">else</span> {</span><br><span class="line">      <span class="comment">// 替换默认提示词</span></span><br><span class="line">      <span class="keyword">return</span> asSystemPrompt(agentPrompt)</span><br><span class="line">    }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 5. 追加 Custom 和 Append</span></span><br><span class="line">  <span class="keyword">if</span> (options.customSystemPrompt) {</span><br><span class="line">    sections.push({ <span class="keyword">type</span>: <span class="string">'text'</span>, text: options.customSystemPrompt })</span><br><span class="line">  }</span><br><span class="line">  <span class="keyword">if</span> (options.appendSystemPrompt) {</span><br><span class="line">    sections.push({ <span class="keyword">type</span>: <span class="string">'text'</span>, text: options.appendSystemPrompt })</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> resolveSystemPromptSections(sections)</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="四、CLAUDE-md-加载机制"><a href="#四、CLAUDE-md-加载机制" class="headerlink" title="四、CLAUDE.md 加载机制"></a>四、CLAUDE.md 加载机制</h2><h3 id="4-1-加载优先级"><a href="#4-1-加载优先级" class="headerlink" title="4.1 加载优先级"></a>4.1 加载优先级</h3><p>CLAUDE.md 是用户自定义指令系统，按优先级从低到高加载：</p><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br></pre></td><td class="code"><pre><span class="line">/etc/claude-code/CLAUDE.md          ← 全局管理配置（最低优先级）</span><br><span class="line">  ↓</span><br><span class="line">~/.claude/CLAUDE.md                 ← 用户全局指令</span><br><span class="line">  ↓</span><br><span class="line">项目根目录/CLAUDE.md                 ← 项目级指令</span><br><span class="line">项目根目录/.claude/CLAUDE.md</span><br><span class="line">项目根目录/.claude/rules/*.md</span><br><span class="line">  ↓</span><br><span class="line">项目根目录/CLAUDE.local.md           ← 本地私有指令（最高优先级）</span><br></pre></td></tr></table></figure><h3 id="4-2-递归引用"><a href="#4-2-递归引用" class="headerlink" title="4.2 递归引用"></a>4.2 递归引用</h3><p>支持 <code>@path</code> 语法递归引用其他文件：</p><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># 项目配置</span></span><br><span class="line"></span><br><span class="line"><span class="section">## 编码规范</span></span><br><span class="line">@./docs/coding-standards.md</span><br><span class="line"></span><br><span class="line"><span class="section">## API 文档</span></span><br><span class="line">@./docs/api-spec.md</span><br></pre></td></tr></table></figure><h3 id="4-3-循环引用检测"><a href="#4-3-循环引用检测" class="headerlink" title="4.3 循环引用检测"></a>4.3 循环引用检测</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/utils/claudemd.ts</span></span><br><span class="line"><span class="keyword">async</span> <span class="function"><span class="keyword">function</span> <span class="title">loadClaudeMdFile</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  path: <span class="built_in">string</span>,</span></span></span><br><span class="line"><span class="function"><span class="params">  visited: Set<<span class="built_in">string</span>> = <span class="keyword">new</span> Set(),</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Promise</span><<span class="title">string</span>> </span>{</span><br><span class="line">  <span class="comment">// 检测循环引用</span></span><br><span class="line">  <span class="keyword">if</span> (visited.has(path)) {</span><br><span class="line">    <span class="built_in">console</span>.warn(<span class="string">`Circular reference detected: <span class="subst">${path}</span>`</span>)</span><br><span class="line">    <span class="keyword">return</span> <span class="string">''</span></span><br><span class="line">  }</span><br><span class="line">  visited.add(path)</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">let</span> content = <span class="keyword">await</span> readFile(path, <span class="string">'utf-8'</span>)</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 处理 @path 引用</span></span><br><span class="line">  <span class="keyword">const</span> references = extractReferences(content)</span><br><span class="line">  <span class="keyword">for</span> (<span class="keyword">const</span> ref of references) {</span><br><span class="line">    <span class="keyword">const</span> refPath = resolveReference(path, ref)</span><br><span class="line">    <span class="keyword">const</span> refContent = <span class="keyword">await</span> loadClaudeMdFile(refPath, visited)</span><br><span class="line">    content = content.replace(<span class="string">`@<span class="subst">${ref}</span>`</span>, refContent)</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> content</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="五、Agent-特有的提示词增强"><a href="#五、Agent-特有的提示词增强" class="headerlink" title="五、Agent 特有的提示词增强"></a>五、Agent 特有的提示词增强</h2><h3 id="5-1-环境详情注入"><a href="#5-1-环境详情注入" class="headerlink" title="5.1 环境详情注入"></a>5.1 环境详情注入</h3><p>子代理会额外注入环境详情：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/tools/AgentTool/runAgent.ts</span></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">getAgentSystemPrompt</span>(<span class="params">agentDef, toolUseContext</span>) </span>{</span><br><span class="line">  <span class="keyword">let</span> prompt = agentDef.getSystemPrompt({ toolUseContext })</span><br><span class="line">  prompt = enhanceSystemPromptWithEnvDetails(prompt)</span><br><span class="line">  <span class="comment">// 添加：工作目录、启用工具列表、模型信息、环境变量</span></span><br><span class="line">  <span class="keyword">return</span> prompt</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="5-2-Fork-约束注入"><a href="#5-2-Fork-约束注入" class="headerlink" title="5.2 Fork 约束注入"></a>5.2 Fork 约束注入</h3><p>Fork Agent 会注入行为约束：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">const</span> FORK_BOILERPLATE_TAG = <span class="string">`</span></span><br><span class="line"><span class="string">You are a forked worker process. Your job is to execute tasks efficiently.</span></span><br><span class="line"><span class="string"></span></span><br><span class="line"><span class="string">CRITICAL RULES:</span></span><br><span class="line"><span class="string">1. You are NOT the main agent. Do not engage in conversation or ask follow-up questions.</span></span><br><span class="line"><span class="string">2. Use tools directly (Bash, Read, Write, etc.) to complete your assigned task.</span></span><br><span class="line"><span class="string">3. If you modify files, commit your changes before reporting.</span></span><br><span class="line"><span class="string">4. Do NOT output text between tool calls - just use tools.</span></span><br><span class="line"><span class="string">5. Stay strictly within the scope of your directive.</span></span><br><span class="line"><span class="string">6. Keep your final report under 500 words.</span></span><br><span class="line"><span class="string">7. Your response MUST start with "Scope:" followed by what you accomplished.</span></span><br><span class="line"><span class="string">`</span></span><br></pre></td></tr></table></figure><hr><h2 id="六、缓存策略详解"><a href="#六、缓存策略详解" class="headerlink" title="六、缓存策略详解"></a>六、缓存策略详解</h2><h3 id="6-1-三级缓存"><a href="#6-1-三级缓存" class="headerlink" title="6.1 三级缓存"></a>6.1 三级缓存</h3><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br></pre></td><td class="code"><pre><span class="line">Global Cache（跨组织）    ← 静态系统提示词</span><br><span class="line">  ↓  scope: 'global'</span><br><span class="line">Ephemeral Cache（会话级） ← 动态系统提示词</span><br><span class="line">  ↓  scope: 'ephemeral'</span><br><span class="line">Section Cache（轮级）     ← systemPromptSection 记忆化</span><br><span class="line">     每个 Section 独立缓存</span><br></pre></td></tr></table></figure><h3 id="6-2-缓存失效"><a href="#6-2-缓存失效" class="headerlink" title="6.2 缓存失效"></a>6.2 缓存失效</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// 触发缓存的场景</span></span><br><span class="line"><span class="keyword">const</span> cacheTriggers = {</span><br><span class="line">  <span class="comment">// Global Cache</span></span><br><span class="line">  <span class="string">'static_system_prompt'</span>: <span class="string">'never'</span>,  <span class="comment">// 永不失效</span></span><br><span class="line">  </span><br><span class="line">  <span class="comment">// Ephemeral Cache</span></span><br><span class="line">  <span class="string">'memory_content'</span>: <span class="string">'on_claudemd_change'</span>,  <span class="comment">// CLAUDE.md 变化时</span></span><br><span class="line">  <span class="string">'mcp_instructions'</span>: <span class="string">'on_mcp_connection'</span>,  <span class="comment">// MCP 连接/断开时</span></span><br><span class="line">  </span><br><span class="line">  <span class="comment">// Section Cache</span></span><br><span class="line">  <span class="string">'user_context'</span>: <span class="string">'per_turn'</span>,  <span class="comment">// 每轮重新计算（但有 memoize）</span></span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="6-3-缓存命中优化"><a href="#6-3-缓存命中优化" class="headerlink" title="6.3 缓存命中优化"></a>6.3 缓存命中优化</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/services/api/claude.ts:3213-3237</span></span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">buildSystemPromptBlocks</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  systemPrompt: SystemPrompt,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">ContentBlockParam</span>[] </span>{</span><br><span class="line">  <span class="keyword">const</span> blocks: ContentBlockParam[] = []</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 在缓存边界处分割</span></span><br><span class="line">  <span class="keyword">const</span> [staticPart, dynamicPart] = splitAtBoundary(systemPrompt)</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 静态部分使用 global 缓存</span></span><br><span class="line">  <span class="keyword">if</span> (staticPart) {</span><br><span class="line">    blocks.push({</span><br><span class="line">      <span class="keyword">type</span>: <span class="string">'text'</span>,</span><br><span class="line">      text: staticPart,</span><br><span class="line">      cache_control: { <span class="keyword">type</span>: <span class="string">'ephemeral'</span> },  <span class="comment">// API 会自动识别为 global</span></span><br><span class="line">    })</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 动态部分使用 ephemeral 缓存</span></span><br><span class="line">  <span class="keyword">if</span> (dynamicPart) {</span><br><span class="line">    blocks.push({</span><br><span class="line">      <span class="keyword">type</span>: <span class="string">'text'</span>,</span><br><span class="line">      text: dynamicPart,</span><br><span class="line">      cache_control: { <span class="keyword">type</span>: <span class="string">'ephemeral'</span> },</span><br><span class="line">    })</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> blocks</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="七、提示词结构示例"><a href="#七、提示词结构示例" class="headerlink" title="七、提示词结构示例"></a>七、提示词结构示例</h2><h3 id="7-1-完整系统提示词结构"><a href="#7-1-完整系统提示词结构" class="headerlink" title="7.1 完整系统提示词结构"></a>7.1 完整系统提示词结构</h3><figure class="highlight markdown"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br><span class="line">40</span><br><span class="line">41</span><br><span class="line">42</span><br><span class="line">43</span><br></pre></td><td class="code"><pre><span class="line"><span class="section"># Claude Code System Prompt</span></span><br><span class="line"></span><br><span class="line"><span class="section">## Role</span></span><br><span class="line">You are an interactive agent that helps users with software engineering tasks.</span><br><span class="line"></span><br><span class="line"><span class="section">## System Rules</span></span><br><span class="line"><span class="bullet">- </span>All text you output is displayed to the user</span><br><span class="line"><span class="bullet">- </span>Tools are executed in a permission mode</span><br><span class="line"><span class="bullet">- </span>The conversation has unlimited context through automatic summarization</span><br><span class="line"></span><br><span class="line"><span class="section">## Doing Tasks</span></span><br><span class="line"><span class="bullet">- </span>Use tools available to you to assist the user</span><br><span class="line"><span class="bullet">- </span>When creating new code, follow the conventions of the existing codebase</span><br><span class="line"><span class="bullet">- </span>After completing a task, do not summarize what you did</span><br><span class="line"></span><br><span class="line"><span class="section">## Tools</span></span><br><span class="line">You have access to the following tools:</span><br><span class="line"><span class="bullet">- </span>Read: Read a file from the filesystem</span><br><span class="line"><span class="bullet">- </span>Edit: Make edits to a file</span><br><span class="line"><span class="bullet">- </span>Write: Write a new file</span><br><span class="line"><span class="bullet">- </span>Bash: Execute a bash command</span><br><span class="line"><span class="bullet">- </span>Grep: Search for patterns in files</span><br><span class="line"><span class="bullet">- </span>...</span><br><span class="line"></span><br><span class="line">--- SYSTEM_PROMPT_DYNAMIC_BOUNDARY ---</span><br><span class="line"></span><br><span class="line"><span class="section">## Current Date</span></span><br><span class="line">Today's date is 2026-04-06.</span><br><span class="line"></span><br><span class="line"><span class="section">## Project Context</span></span><br><span class="line">Working directory: /Users/dev/my-project</span><br><span class="line">Git branch: main</span><br><span class="line">Git status: 2 modified files</span><br><span class="line"></span><br><span class="line"><span class="section">## User Instructions</span></span><br><span class="line">(CLADE.md content here)</span><br><span class="line"></span><br><span class="line"><span class="section">## MCP Instructions</span></span><br><span class="line"><span class="bullet">- </span>Filesystem MCP: provides file operations</span><br><span class="line"><span class="bullet">- </span>GitHub MCP: provides issue and PR operations</span><br><span class="line"></span><br><span class="line"><span class="section">## Token Budget</span></span><br><span class="line">You have approximately 150,000 tokens available for this turn.</span><br></pre></td></tr></table></figure><hr><h2 id="八、关键源文件索引"><a href="#八、关键源文件索引" class="headerlink" title="八、关键源文件索引"></a>八、关键源文件索引</h2><div class="table-container"><table><thead><tr><th>文件</th><th>职责</th></tr></thead><tbody><tr><td><code>src/constants/prompts.ts</code></td><td>系统提示词组装</td></tr><tr><td><code>src/constants/systemPromptSections.ts</code></td><td>Section 定义和缓存</td></tr><tr><td><code>src/utils/systemPrompt.ts</code></td><td>优先级解析</td></tr><tr><td><code>src/utils/claudemd.ts</code></td><td>CLAUDE.md 加载</td></tr><tr><td><code>src/context.ts</code></td><td>系统和用户上下文</td></tr><tr><td><code>src/utils/api.ts</code></td><td>缓存边界分割</td></tr><tr><td><code>src/services/api/claude.ts</code></td><td>API 缓存块构建</td></tr></tbody></table></div><hr><h2 id="九、总结"><a href="#九、总结" class="headerlink" title="九、总结"></a>九、总结</h2><p>Claude Code 的 System Prompt 工程体现了几个核心设计原则：</p><ol><li><strong>分层构建</strong>：静态和动态分离，最大化缓存利用</li><li><strong>优先级解析</strong>：多来源指令按优先级合并</li><li><strong>缓存边界</strong>：明确的缓存策略，降低延迟和成本</li><li><strong>Section 类型</strong>：缓存和缓存破坏两种类型，适应不同需求</li><li><strong>递归引用</strong>：支持 @path 语法，模块化指令组织</li></ol><p>这个设计是 Prompt 工程的教科书级案例——既满足了动态性需求，又最大化了缓存效率。</p><hr><p><strong>系列文章导航：</strong></p><ul><li>上一篇：<a href="/claude-code-context-compression/">Context 管理：四级压缩与无限对话的秘密</a></li><li>下一篇：<a href="/claude-code-skills-system/">Skills 系统：条件激活与动态发现</a></li></ul>
</article>
<article>
<h1>工具系统设计：从定义到执行的七步管道</h1>
<p>2026-04-05T16:00:00.000Z</p>
<blockquote><p>Claude Code 有 48+ 个内置工具，每个工具都是一个完整的生命周期管理单元。从定义到执行，工具要经过七步管道：查找、解析、验证、钩子、权限、执行、后处理。这个设计使得每个工具都是自描述、自验证、自渲染的——框架不需要了解工具的内部逻辑，只需调用标准接口。</p></blockquote><a id="more"></a><h2 id="导读：工具不只是函数调用"><a href="#导读：工具不只是函数调用" class="headerlink" title="导读：工具不只是函数调用"></a>导读：工具不只是函数调用</h2><p>在很多 AI Agent 框架中，工具只是一个简单的函数：</p><figure class="highlight python"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br></pre></td><td class="code"><pre><span class="line"><span class="meta">@tool</span></span><br><span class="line"><span class="function"><span class="keyword">def</span> <span class="title">read_file</span><span class="params">(path: str)</span> -> str:</span></span><br><span class="line">    <span class="keyword">with</span> open(path) <span class="keyword">as</span> f:</span><br><span class="line">        <span class="keyword">return</span> f.read()</span><br></pre></td></tr></table></figure><p>但在 Claude Code 中，工具是一个<strong>完整的生命周期管理单元</strong>：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">type</span> Tool<Input, Output> = {</span><br><span class="line">  <span class="comment">// 身份</span></span><br><span class="line">  name: <span class="built_in">string</span></span><br><span class="line">  aliases?: <span class="built_in">string</span>[]</span><br><span class="line">  searchHint?: <span class="built_in">string</span></span><br><span class="line"></span><br><span class="line">  <span class="comment">// 能力声明</span></span><br><span class="line">  isEnabled(): <span class="built_in">boolean</span></span><br><span class="line">  isConcurrencySafe(input): <span class="built_in">boolean</span></span><br><span class="line">  isReadOnly(input): <span class="built_in">boolean</span></span><br><span class="line">  isDestructive(input): <span class="built_in">boolean</span></span><br><span class="line"></span><br><span class="line">  <span class="comment">// 生命周期</span></span><br><span class="line">  validateInput(input, context)</span><br><span class="line">  checkPermissions(input, context)</span><br><span class="line">  call(input, context, ...)</span><br><span class="line"></span><br><span class="line">  <span class="comment">// 输出与渲染</span></span><br><span class="line">  renderToolUseMessage(input)</span><br><span class="line">  renderToolResultMessage(content)</span><br><span class="line">  mapToolResultToToolResultBlockParam()</span><br><span class="line"></span><br><span class="line">  <span class="comment">// 智能特性</span></span><br><span class="line">  inputSchema: Zod schema</span><br><span class="line">  maxResultSizeChars: <span class="built_in">number</span></span><br><span class="line">  getToolUseSummary?(input): <span class="built_in">string</span></span><br><span class="line">}</span><br></pre></td></tr></table></figure><p>这种设计使得每个工具都是<strong>自描述、自验证、自渲染</strong>的——框架不需要了解工具的内部逻辑，只需调用标准接口。</p><hr><h2 id="一、工具的定义：不只是名称和函数"><a href="#一、工具的定义：不只是名称和函数" class="headerlink" title="一、工具的定义：不只是名称和函数"></a>一、工具的定义：不只是名称和函数</h2><h3 id="1-1-Tool-接口详解"><a href="#1-1-Tool-接口详解" class="headerlink" title="1.1 Tool 接口详解"></a>1.1 Tool 接口详解</h3><p><code>src/Tool.ts</code>（约 792 行）定义了工具的完整接口：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">export</span> <span class="keyword">type</span> Tool<Input, Output, P <span class="keyword">extends</span> ToolProgressData> = {</span><br><span class="line">  <span class="comment">// ===== 身份 =====</span></span><br><span class="line">  name: <span class="built_in">string</span>                    <span class="comment">// 工具名称</span></span><br><span class="line">  aliases?: <span class="built_in">string</span>[]              <span class="comment">// 向后兼容的旧名称</span></span><br><span class="line">  searchHint?: <span class="built_in">string</span>             <span class="comment">// ToolSearch 关键词匹配</span></span><br><span class="line"></span><br><span class="line">  <span class="comment">// ===== 能力声明 =====</span></span><br><span class="line">  isEnabled(): <span class="built_in">boolean</span>            <span class="comment">// 是否可用</span></span><br><span class="line">  isConcurrencySafe(input): <span class="built_in">boolean</span>   <span class="comment">// 是否可并行执行</span></span><br><span class="line">  isReadOnly(input): <span class="built_in">boolean</span>          <span class="comment">// 是否只读操作</span></span><br><span class="line">  isDestructive?(input): <span class="built_in">boolean</span>      <span class="comment">// 是否破坏性操作</span></span><br><span class="line"></span><br><span class="line">  <span class="comment">// ===== 生命周期 =====</span></span><br><span class="line">  validateInput?(input, context): <span class="built_in">Promise</span><ValidationResult>  <span class="comment">// 输入验证</span></span><br><span class="line">  checkPermissions?(input, context): <span class="built_in">Promise</span><PermissionResult>  <span class="comment">// 权限检查</span></span><br><span class="line">  call(input, context, canUseTool, parentMessage, onProgress): <span class="built_in">Promise</span><ToolResult<Output>>  <span class="comment">// 执行</span></span><br><span class="line"></span><br><span class="line">  <span class="comment">// ===== 输出与渲染 =====</span></span><br><span class="line">  renderToolUseMessage?(input): ReactNode     <span class="comment">// 渲染调用信息</span></span><br><span class="line">  renderToolResultMessage?(content): ReactNode  <span class="comment">// 渲染结果</span></span><br><span class="line">  renderToolUseProgressMessage?(...): ReactNode  <span class="comment">// 渲染进度</span></span><br><span class="line">  mapToolResultToToolResultBlockParam?(...): ToolResultBlockParam  <span class="comment">// 映射为 API 格式</span></span><br><span class="line"></span><br><span class="line">  <span class="comment">// ===== 智能特性 =====</span></span><br><span class="line">  inputSchema: Input                        <span class="comment">// Zod schema</span></span><br><span class="line">  outputSchema?: z.ZodType<Output>          <span class="comment">// 输出 schema</span></span><br><span class="line">  maxResultSizeChars?: <span class="built_in">number</span>               <span class="comment">// 结果大小阈值</span></span><br><span class="line">  getToolUseSummary?(input): <span class="built_in">string</span>         <span class="comment">// 工具使用摘要</span></span><br><span class="line">  shouldDefer?: <span class="built_in">boolean</span>                     <span class="comment">// 是否延迟加载</span></span><br><span class="line">  alwaysLoad?: <span class="built_in">boolean</span>                      <span class="comment">// 是否始终加载</span></span><br><span class="line">  toAutoClassifierInput?(input): <span class="built_in">string</span>     <span class="comment">// 安全分类器输入</span></span><br><span class="line">  preparePermissionMatcher?<span class="function">(<span class="params">input</span>): <span class="params">Promise</span><(<span class="params">pattern: <span class="built_in">string</span></span>) =></span> <span class="built_in">boolean</span>>  <span class="comment">// 权限匹配器</span></span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="1-2-buildTool-工厂函数"><a href="#1-2-buildTool-工厂函数" class="headerlink" title="1.2 buildTool 工厂函数"></a>1.2 buildTool 工厂函数</h3><p><code>buildTool()</code> 函数提供了工具定义的便捷方式：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br></pre></td><td class="code"><pre><span class="line"><span class="keyword">export</span> <span class="keyword">const</span> BashTool = buildTool({</span><br><span class="line">  name: <span class="string">'Bash'</span>,</span><br><span class="line">  description: <span class="keyword">async</span> (input) => <span class="string">`Execute command: <span class="subst">${input.command}</span>`</span>,</span><br><span class="line">  inputSchema: z.object({</span><br><span class="line">    command: z.string(),</span><br><span class="line">    timeout: z.number().optional(),</span><br><span class="line">  }),</span><br><span class="line">  isConcurrencySafe: <span class="function">(<span class="params">input</span>) =></span> <span class="literal">false</span>,  <span class="comment">// Bash 可能修改状态</span></span><br><span class="line">  isReadOnly: <span class="function">(<span class="params">input</span>) =></span> isReadOnlyCommand(input.command),</span><br><span class="line">  isDestructive: <span class="function">(<span class="params">input</span>) =></span> isDestructiveCommand(input.command),</span><br><span class="line">  validateInput: <span class="keyword">async</span> (input, context) => { <span class="comment">/* ... */</span> },</span><br><span class="line">  checkPermissions: <span class="keyword">async</span> (input, context) => { <span class="comment">/* ... */</span> },</span><br><span class="line">  call: <span class="keyword">async</span> (input, context, canUseTool, parentMessage, onProgress) => { <span class="comment">/* ... */</span> },</span><br><span class="line">  <span class="comment">// ...</span></span><br><span class="line">})</span><br></pre></td></tr></table></figure><hr><h2 id="二、工具注册：三阶段流水线"><a href="#二、工具注册：三阶段流水线" class="headerlink" title="二、工具注册：三阶段流水线"></a>二、工具注册：三阶段流水线</h2><p>工具的发现和注册分三个阶段（<code>src/tools.ts</code>）：</p><h3 id="2-1-阶段1：基础工具池"><a href="#2-1-阶段1：基础工具池" class="headerlink" title="2.1 阶段1：基础工具池"></a>2.1 阶段1：基础工具池</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br><span class="line">35</span><br><span class="line">36</span><br><span class="line">37</span><br><span class="line">38</span><br><span class="line">39</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/tools.ts:50-150</span></span><br><span class="line"><span class="keyword">export</span> <span class="function"><span class="keyword">function</span> <span class="title">getAllBaseTools</span>(<span class="params"></span>): <span class="title">Tools</span> </span>{</span><br><span class="line">  <span class="keyword">return</span> [</span><br><span class="line">    <span class="comment">// 文件操作</span></span><br><span class="line">    FileReadTool,</span><br><span class="line">    FileEditTool,</span><br><span class="line">    FileWriteTool,</span><br><span class="line">    GlobTool,</span><br><span class="line">    GrepTool,</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// Shell 执行</span></span><br><span class="line">    BashTool,</span><br><span class="line">    PowerShellTool,</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// 网络</span></span><br><span class="line">    WebFetchTool,</span><br><span class="line">    WebSearchTool,</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// Agent 编排</span></span><br><span class="line">    AgentTool,</span><br><span class="line">    TeamCreateTool,</span><br><span class="line">    SendMessageTool,</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// 任务管理</span></span><br><span class="line">    TaskCreateTool,</span><br><span class="line">    TaskOutputTool,</span><br><span class="line">    TodoWriteTool,</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// 其他...</span></span><br><span class="line">    AskUserQuestionTool,</span><br><span class="line">    SkillTool,</span><br><span class="line">    SleepTool,</span><br><span class="line">    <span class="comment">// ... 共 48+ 个</span></span><br><span class="line">  ].filter(<span class="function"><span class="params">tool</span> =></span> {</span><br><span class="line">    <span class="comment">// Feature Flag 过滤</span></span><br><span class="line">    <span class="keyword">if</span> (tool.name === <span class="string">'Agent'</span> && !feature(<span class="string">'FORK_SUBAGENT'</span>)) <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">    <span class="keyword">return</span> <span class="literal">true</span></span><br><span class="line">  })</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="2-2-阶段2：过滤"><a href="#2-2-阶段2：过滤" class="headerlink" title="2.2 阶段2：过滤"></a>2.2 阶段2：过滤</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/tools.ts:200-280</span></span><br><span class="line"><span class="keyword">export</span> <span class="function"><span class="keyword">function</span> <span class="title">getTools</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  baseTools: Tools,</span></span></span><br><span class="line"><span class="function"><span class="params">  permissionContext: ToolPermissionContext,</span></span></span><br><span class="line"><span class="function"><span class="params">  options: GetToolsOptions,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Tools</span> </span>{</span><br><span class="line">  <span class="keyword">return</span> baseTools.filter(<span class="function"><span class="params">tool</span> =></span> {</span><br><span class="line">    <span class="comment">// 1. 权限模式过滤</span></span><br><span class="line">    <span class="keyword">if</span> (permissionContext.mode === <span class="string">'dontAsk'</span> && !tool.isReadOnly?.()) {</span><br><span class="line">      <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">    }</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// 2. REPL 模式过滤</span></span><br><span class="line">    <span class="keyword">if</span> (options.isReplMode && !isReplCompatible(tool)) {</span><br><span class="line">      <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">    }</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// 3. isEnabled 检查</span></span><br><span class="line">    <span class="keyword">if</span> (!tool.isEnabled()) {</span><br><span class="line">      <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">    }</span><br><span class="line">    </span><br><span class="line">    <span class="keyword">return</span> <span class="literal">true</span></span><br><span class="line">  })</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="2-3-阶段3：MCP-合并"><a href="#2-3-阶段3：MCP-合并" class="headerlink" title="2.3 阶段3：MCP 合并"></a>2.3 阶段3：MCP 合并</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/tools.ts:300-350</span></span><br><span class="line"><span class="keyword">export</span> <span class="function"><span class="keyword">function</span> <span class="title">assembleToolPool</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  baseTools: Tools,</span></span></span><br><span class="line"><span class="function"><span class="params">  mcpClients: MCPServerConnection[],</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Tools</span> </span>{</span><br><span class="line">  <span class="keyword">const</span> mcpTools: Tools = []</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">for</span> (<span class="keyword">const</span> client of mcpClients) {</span><br><span class="line">    <span class="keyword">if</span> (client.type !== <span class="string">'connected'</span>) <span class="keyword">continue</span></span><br><span class="line">    </span><br><span class="line">    <span class="keyword">for</span> (<span class="keyword">const</span> mcpTool of client.tools) {</span><br><span class="line">      <span class="comment">// MCP 工具命名：mcp__{serverName}__{toolName}</span></span><br><span class="line">      <span class="keyword">const</span> name = <span class="string">`mcp__<span class="subst">${normalizeNameForMCP(client.name)}</span>__<span class="subst">${mcpTool.name}</span>`</span></span><br><span class="line">      mcpTools.push(convertMcpToolToTool(name, mcpTool, client))</span><br><span class="line">    }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 合并：内置优先，去重，排序（缓存稳定性）</span></span><br><span class="line">  <span class="keyword">return</span> mergeAndDeduplicate(baseTools, mcpTools)</span><br><span class="line">}</span><br></pre></td></tr></table></figure><p><strong>工具池构建流程图：</strong></p><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br></pre></td><td class="code"><pre><span class="line">getAllBaseTools()</span><br><span class="line">  │  48+ 个内置工具</span><br><span class="line">  │  + Feature Flag 过滤</span><br><span class="line">  │</span><br><span class="line">  ▼</span><br><span class="line">getTools()</span><br><span class="line">  │  权限模式过滤</span><br><span class="line">  │  REPL 模式过滤</span><br><span class="line">  │  isEnabled() 过滤</span><br><span class="line">  │</span><br><span class="line">  ▼</span><br><span class="line">assembleToolPool()</span><br><span class="line">  │  + MCP 工具</span><br><span class="line">  │  去重（内置优先）</span><br><span class="line">  │  排序（缓存稳定性）</span><br><span class="line">  │</span><br><span class="line">  ▼</span><br><span class="line">最终工具池</span><br></pre></td></tr></table></figure><hr><h2 id="三、七步执行管道"><a href="#三、七步执行管道" class="headerlink" title="三、七步执行管道"></a>三、七步执行管道</h2><p>一次工具调用要经过<strong>7 步管道</strong>（<code>src/services/tools/toolExecution.ts</code>）：</p><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br></pre></td><td class="code"><pre><span class="line">┌─────────────────────────────────────────────────────────────┐</span><br><span class="line">│                    工具执行管道                              │</span><br><span class="line">├─────────────────────────────────────────────────────────────┤</span><br><span class="line">│                                                             │</span><br><span class="line">│  Step 1: 工具查找                                           │</span><br><span class="line">│    └─ findToolByName(name) → 支持别名回退                   │</span><br><span class="line">│                                                             │</span><br><span class="line">│  Step 2: 输入解析（Zod）                                     │</span><br><span class="line">│    └─ inputSchema.safeParse(input) → 类型验证               │</span><br><span class="line">│                                                             │</span><br><span class="line">│  Step 3: 自定义验证                                         │</span><br><span class="line">│    └─ tool.validateInput?(input, context)                   │</span><br><span class="line">│                                                             │</span><br><span class="line">│  Step 4: Pre-Tool 钩子                                      │</span><br><span class="line">│    └─ runPreToolUseHooks(tool, input, context)              │</span><br><span class="line">│       ├─ 退出码 0: 成功，继续                               │</span><br><span class="line">│       ├─ 退出码 2: 阻塞，展示错误                           │</span><br><span class="line">│       └─ 其他: 展示给用户                                   │</span><br><span class="line">│                                                             │</span><br><span class="line">│  Step 5: 权限检查                                           │</span><br><span class="line">│    └─ hasPermissionsToUseTool(tool, input, context)         │</span><br><span class="line">│       ├─ behavior: 'allow' → 继续                           │</span><br><span class="line">│       ├─ behavior: 'deny' → 返回拒绝                        │</span><br><span class="line">│       └─ behavior: 'ask' → 弹出确认对话框                   │</span><br><span class="line">│                                                             │</span><br><span class="line">│  Step 6: 实际执行                                           │</span><br><span class="line">│    └─ tool.call(input, context, canUseTool, ...)            │</span><br><span class="line">│       ├─ 成功 → ToolResult                                  │</span><br><span class="line">│       └─ 失败 → ToolError                                   │</span><br><span class="line">│                                                             │</span><br><span class="line">│  Step 7: Post-Tool 钩子                                     │</span><br><span class="line">│    └─ runPostToolUseHooks(tool, input, result)              │</span><br><span class="line">│                                                             │</span><br><span class="line">└─────────────────────────────────────────────────────────────┘</span><br></pre></td></tr></table></figure><h3 id="3-1-Step-1-工具查找"><a href="#3-1-Step-1-工具查找" class="headerlink" title="3.1 Step 1: 工具查找"></a>3.1 Step 1: 工具查找</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/Tool.ts:500-530</span></span><br><span class="line"><span class="keyword">export</span> <span class="function"><span class="keyword">function</span> <span class="title">findToolByName</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  name: <span class="built_in">string</span>,</span></span></span><br><span class="line"><span class="function"><span class="params">  tools: Tools,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Tool</span><<span class="title">unknown</span>, <span class="title">unknown</span>, <span class="title">ToolProgressData</span>> | <span class="title">undefined</span> </span>{</span><br><span class="line">  <span class="comment">// 1. 精确匹配</span></span><br><span class="line">  <span class="keyword">const</span> exact = tools.find(<span class="function"><span class="params">t</span> =></span> t.name === name)</span><br><span class="line">  <span class="keyword">if</span> (exact) <span class="keyword">return</span> exact</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 2. 别名匹配（向后兼容）</span></span><br><span class="line">  <span class="keyword">for</span> (<span class="keyword">const</span> tool of tools) {</span><br><span class="line">    <span class="keyword">if</span> (tool.aliases?.includes(name)) {</span><br><span class="line">      <span class="keyword">return</span> tool</span><br><span class="line">    }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 3. MCP 工具特殊处理</span></span><br><span class="line">  <span class="keyword">if</span> (name.startsWith(<span class="string">'mcp__'</span>)) {</span><br><span class="line">    <span class="keyword">return</span> findMcpTool(name, tools)</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> <span class="literal">undefined</span></span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="3-2-Step-2-输入解析"><a href="#3-2-Step-2-输入解析" class="headerlink" title="3.2 Step 2: 输入解析"></a>3.2 Step 2: 输入解析</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/services/tools/toolExecution.ts:200-230</span></span><br><span class="line"><span class="keyword">const</span> parseResult = tool.inputSchema.safeParse(input)</span><br><span class="line"><span class="keyword">if</span> (!parseResult.success) {</span><br><span class="line">  <span class="keyword">const</span> formattedError = formatZodValidationError(parseResult.error)</span><br><span class="line">  <span class="keyword">return</span> {</span><br><span class="line">    <span class="keyword">type</span>: <span class="string">'tool_result'</span>,</span><br><span class="line">    content: formattedError,</span><br><span class="line">    is_error: <span class="literal">true</span>,</span><br><span class="line">    tool_use_id: toolUseId,</span><br><span class="line">  }</span><br><span class="line">}</span><br><span class="line"><span class="keyword">const</span> validatedInput = parseResult.data</span><br></pre></td></tr></table></figure><h3 id="3-3-Step-3-自定义验证"><a href="#3-3-Step-3-自定义验证" class="headerlink" title="3.3 Step 3: 自定义验证"></a>3.3 Step 3: 自定义验证</h3><p>某些工具需要额外的验证逻辑：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/tools/FileEditTool/FileEditTool.ts:150-200</span></span><br><span class="line"><span class="keyword">async</span> validateInput(input, context): <span class="built_in">Promise</span><ValidationResult> {</span><br><span class="line">  <span class="comment">// 1. 文件存在性检查</span></span><br><span class="line">  <span class="keyword">if</span> (!<span class="keyword">await</span> fileExists(input.file_path)) {</span><br><span class="line">    <span class="keyword">return</span> { result: <span class="literal">false</span>, message: <span class="string">'File does not exist'</span>, errorCode: <span class="number">1</span> }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 2. 文件大小限制</span></span><br><span class="line">  <span class="keyword">const</span> stats = <span class="keyword">await</span> stat(input.file_path)</span><br><span class="line">  <span class="keyword">if</span> (stats.size > <span class="number">1</span>_000_000_000) {  <span class="comment">// 1 GiB</span></span><br><span class="line">    <span class="keyword">return</span> { result: <span class="literal">false</span>, message: <span class="string">'File too large'</span>, errorCode: <span class="number">2</span> }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 3. 必须先读取</span></span><br><span class="line">  <span class="keyword">const</span> readState = context.readFileState.get(input.file_path)</span><br><span class="line">  <span class="keyword">if</span> (!readState) {</span><br><span class="line">    <span class="keyword">return</span> { result: <span class="literal">false</span>, message: <span class="string">'Must read file before editing'</span>, errorCode: <span class="number">3</span> }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 4. 文件未被修改</span></span><br><span class="line">  <span class="keyword">const</span> currentMtime = (<span class="keyword">await</span> stat(input.file_path)).mtimeMs</span><br><span class="line">  <span class="keyword">if</span> (currentMtime > readState.timestamp) {</span><br><span class="line">    <span class="keyword">return</span> { result: <span class="literal">false</span>, message: <span class="string">'File was modified after reading'</span>, errorCode: <span class="number">4</span> }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> { result: <span class="literal">true</span> }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="3-4-Step-4-Pre-Tool-钩子"><a href="#3-4-Step-4-Pre-Tool-钩子" class="headerlink" title="3.4 Step 4: Pre-Tool 钩子"></a>3.4 Step 4: Pre-Tool 钩子</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/services/tools/toolHooks.ts:50-100</span></span><br><span class="line"><span class="keyword">export</span> <span class="keyword">async</span> <span class="function"><span class="keyword">function</span> <span class="title">runPreToolUseHooks</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  tool: Tool,</span></span></span><br><span class="line"><span class="function"><span class="params">  input: unknown,</span></span></span><br><span class="line"><span class="function"><span class="params">  context: ToolUseContext,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Promise</span><<span class="title">HookResult</span>> </span>{</span><br><span class="line">  <span class="keyword">const</span> hooks = getHooksForTool(tool.name, context)</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">for</span> (<span class="keyword">const</span> hook of hooks) {</span><br><span class="line">    <span class="keyword">const</span> result = <span class="keyword">await</span> executeHook(hook, {</span><br><span class="line">      tool_name: tool.name,</span><br><span class="line">      tool_input: input,</span><br><span class="line">    })</span><br><span class="line">    </span><br><span class="line">    <span class="keyword">if</span> (result.exitCode === <span class="number">2</span>) {</span><br><span class="line">      <span class="comment">// 阻塞：展示错误给模型</span></span><br><span class="line">      <span class="keyword">return</span> {</span><br><span class="line">        blocked: <span class="literal">true</span>,</span><br><span class="line">        message: result.stderr,</span><br><span class="line">        modifiedInput: parseModifiedInput(result.stdout),</span><br><span class="line">      }</span><br><span class="line">    }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> { blocked: <span class="literal">false</span> }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="3-5-Step-5-权限检查"><a href="#3-5-Step-5-权限检查" class="headerlink" title="3.5 Step 5: 权限检查"></a>3.5 Step 5: 权限检查</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br><span class="line">29</span><br><span class="line">30</span><br><span class="line">31</span><br><span class="line">32</span><br><span class="line">33</span><br><span class="line">34</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/utils/permissions/permissions.ts:200-300</span></span><br><span class="line"><span class="keyword">export</span> <span class="keyword">async</span> <span class="function"><span class="keyword">function</span> <span class="title">hasPermissionsToUseTool</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  tool: Tool,</span></span></span><br><span class="line"><span class="function"><span class="params">  input: unknown,</span></span></span><br><span class="line"><span class="function"><span class="params">  context: ToolUseContext,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Promise</span><<span class="title">PermissionResult</span>> </span>{</span><br><span class="line">  <span class="comment">// 1. 检查 deny 规则（最高优先级）</span></span><br><span class="line">  <span class="keyword">const</span> denyResult = checkDenyRules(tool.name, input, context)</span><br><span class="line">  <span class="keyword">if</span> (denyResult) <span class="keyword">return</span> { behavior: <span class="string">'deny'</span>, ...denyResult }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 2. 检查工具特定权限</span></span><br><span class="line">  <span class="keyword">if</span> (tool.checkPermissions) {</span><br><span class="line">    <span class="keyword">const</span> toolResult = <span class="keyword">await</span> tool.checkPermissions(input, context)</span><br><span class="line">    <span class="keyword">if</span> (toolResult.behavior !== <span class="string">'passthrough'</span>) {</span><br><span class="line">      <span class="keyword">return</span> toolResult</span><br><span class="line">    }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 3. 检查 bypass 模式</span></span><br><span class="line">  <span class="keyword">if</span> (context.permissionContext.mode === <span class="string">'bypassPermissions'</span>) {</span><br><span class="line">    <span class="keyword">return</span> { behavior: <span class="string">'allow'</span>, decisionReason: { <span class="keyword">type</span>: <span class="string">'mode'</span> } }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 4. 检查 allow 规则</span></span><br><span class="line">  <span class="keyword">const</span> allowResult = checkAllowRules(tool.name, input, context)</span><br><span class="line">  <span class="keyword">if</span> (allowResult) <span class="keyword">return</span> { behavior: <span class="string">'allow'</span>, ...allowResult }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 5. 默认：询问用户</span></span><br><span class="line">  <span class="keyword">return</span> {</span><br><span class="line">    behavior: <span class="string">'ask'</span>,</span><br><span class="line">    message: generatePermissionMessage(tool, input),</span><br><span class="line">    suggestions: generateSuggestions(tool, input),</span><br><span class="line">  }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="3-6-Step-6-实际执行"><a href="#3-6-Step-6-实际执行" class="headerlink" title="3.6 Step 6: 实际执行"></a>3.6 Step 6: 实际执行</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br><span class="line">27</span><br><span class="line">28</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/services/tools/toolExecution.ts:400-500</span></span><br><span class="line"><span class="keyword">const</span> startTime = <span class="built_in">Date</span>.now()</span><br><span class="line"><span class="keyword">try</span> {</span><br><span class="line">  <span class="keyword">const</span> result = <span class="keyword">await</span> tool.call(</span><br><span class="line">    validatedInput,</span><br><span class="line">    context,</span><br><span class="line">    canUseTool,</span><br><span class="line">    parentMessage,</span><br><span class="line">    onProgress,</span><br><span class="line">  )</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">const</span> durationMs = <span class="built_in">Date</span>.now() - startTime</span><br><span class="line">  addToToolDuration(durationMs)</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> {</span><br><span class="line">    <span class="keyword">type</span>: <span class="string">'tool_result'</span>,</span><br><span class="line">    content: result.content,</span><br><span class="line">    tool_use_id: toolUseId,</span><br><span class="line">  }</span><br><span class="line">} <span class="keyword">catch</span> (error) {</span><br><span class="line">  <span class="keyword">const</span> classifiedError = classifyToolError(error)</span><br><span class="line">  <span class="keyword">return</span> {</span><br><span class="line">    <span class="keyword">type</span>: <span class="string">'tool_result'</span>,</span><br><span class="line">    content: <span class="string">`Error: <span class="subst">${classifiedError}</span>`</span>,</span><br><span class="line">    is_error: <span class="literal">true</span>,</span><br><span class="line">    tool_use_id: toolUseId,</span><br><span class="line">  }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="3-7-Step-7-Post-Tool-钩子"><a href="#3-7-Step-7-Post-Tool-钩子" class="headerlink" title="3.7 Step 7: Post-Tool 钩子"></a>3.7 Step 7: Post-Tool 钩子</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/services/tools/toolHooks.ts:150-200</span></span><br><span class="line"><span class="keyword">export</span> <span class="keyword">async</span> <span class="function"><span class="keyword">function</span> <span class="title">runPostToolUseHooks</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  tool: Tool,</span></span></span><br><span class="line"><span class="function"><span class="params">  input: unknown,</span></span></span><br><span class="line"><span class="function"><span class="params">  result: ToolResult,</span></span></span><br><span class="line"><span class="function"><span class="params">  context: ToolUseContext,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Promise</span><<span class="title">void</span>> </span>{</span><br><span class="line">  <span class="keyword">const</span> hooks = getPostToolUseHooks(tool.name, context)</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">for</span> (<span class="keyword">const</span> hook of hooks) {</span><br><span class="line">    <span class="keyword">await</span> executeHook(hook, {</span><br><span class="line">      tool_name: tool.name,</span><br><span class="line">      tool_input: input,</span><br><span class="line">      tool_result: result.content,</span><br><span class="line">      tool_result_is_error: result.is_error,</span><br><span class="line">    })</span><br><span class="line">  }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="四、工具延迟加载"><a href="#四、工具延迟加载" class="headerlink" title="四、工具延迟加载"></a>四、工具延迟加载</h2><p>Claude Code 有 48+ 个内置工具。如果每次 API 调用都把所有工具定义发给模型，会浪费大量 token。</p><h3 id="4-1-延迟加载设计"><a href="#4-1-延迟加载设计" class="headerlink" title="4.1 延迟加载设计"></a>4.1 延迟加载设计</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// 工具可以标记为"延迟加载"</span></span><br><span class="line">{</span><br><span class="line">  shouldDefer: <span class="literal">true</span>,       <span class="comment">// 只在 ToolSearch 中列出名称</span></span><br><span class="line">  alwaysLoad: <span class="literal">false</span>,       <span class="comment">// 不在初始提示词中包含完整 schema</span></span><br><span class="line">  searchHint: <span class="string">"notebook"</span>   <span class="comment">// 搜索关键词</span></span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="4-2-ToolSearch-工具"><a href="#4-2-ToolSearch-工具" class="headerlink" title="4.2 ToolSearch 工具"></a>4.2 ToolSearch 工具</h3><p>当模型需要使用延迟加载的工具时：</p><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br></pre></td><td class="code"><pre><span class="line">模型看到:</span><br><span class="line">  "The following tools are available but deferred: NotebookEdit, ..."</span><br><span class="line"></span><br><span class="line">模型调用:</span><br><span class="line">  ToolSearch({ query: "notebook" })</span><br><span class="line"></span><br><span class="line">返回:</span><br><span class="line">  NotebookEdit 的完整 schema 和使用说明</span><br><span class="line"></span><br><span class="line">模型调用:</span><br><span class="line">  NotebookEdit({ ... })</span><br></pre></td></tr></table></figure><p><strong>Token 节省</strong>：</p><ul><li>默认情况下，48 个工具的 schema 约 15000 tokens</li><li>延迟加载后，初始提示词只包含核心工具，约 5000 tokens</li><li>节省约 66% 的工具相关 token</li></ul><hr><h2 id="五、工具结果处理"><a href="#五、工具结果处理" class="headerlink" title="五、工具结果处理"></a>五、工具结果处理</h2><h3 id="5-1-结果大小限制"><a href="#5-1-结果大小限制" class="headerlink" title="5.1 结果大小限制"></a>5.1 结果大小限制</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/utils/toolResultStorage.ts</span></span><br><span class="line"><span class="keyword">const</span> TOOL_RESULT_PERSIST_THRESHOLD_CHARS = <span class="number">20</span>_000</span><br><span class="line"></span><br><span class="line"><span class="keyword">async</span> <span class="function"><span class="keyword">function</span> <span class="title">processToolResultBlock</span>(<span class="params"></span></span></span><br><span class="line"><span class="function"><span class="params">  tool: Tool,</span></span></span><br><span class="line"><span class="function"><span class="params">  result: <span class="built_in">string</span>,</span></span></span><br><span class="line"><span class="function"><span class="params">  toolUseID: <span class="built_in">string</span>,</span></span></span><br><span class="line"><span class="function"><span class="params"></span>): <span class="title">Promise</span><<span class="title">ToolResultBlockParam</span>> </span>{</span><br><span class="line">  <span class="keyword">if</span> (result.length > TOOL_RESULT_PERSIST_THRESHOLD_CHARS) {</span><br><span class="line">    <span class="comment">// 保存到磁盘</span></span><br><span class="line">    <span class="keyword">const</span> filePath = getToolResultPath(toolUseID)</span><br><span class="line">    <span class="keyword">await</span> writeFile(filePath, result)</span><br><span class="line">    </span><br><span class="line">    <span class="comment">// 返回预览</span></span><br><span class="line">    <span class="keyword">const</span> preview = result.slice(<span class="number">0</span>, <span class="number">4096</span>)</span><br><span class="line">    <span class="keyword">return</span> {</span><br><span class="line">      content: <span class="string">`<span class="subst">${preview}</span>\n\n[Output saved to <span class="subst">${filePath}</span>. Use Read tool to view full output.]`</span>,</span><br><span class="line">      tool_use_id: toolUseID,</span><br><span class="line">    }</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">return</span> { content: result, tool_use_id: toolUseID }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h3 id="5-2-文件读取缓存"><a href="#5-2-文件读取缓存" class="headerlink" title="5.2 文件读取缓存"></a>5.2 文件读取缓存</h3><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br><span class="line">10</span><br><span class="line">11</span><br><span class="line">12</span><br><span class="line">13</span><br><span class="line">14</span><br><span class="line">15</span><br><span class="line">16</span><br><span class="line">17</span><br><span class="line">18</span><br><span class="line">19</span><br><span class="line">20</span><br><span class="line">21</span><br><span class="line">22</span><br><span class="line">23</span><br><span class="line">24</span><br><span class="line">25</span><br><span class="line">26</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// src/utils/fileStateCache.ts</span></span><br><span class="line"><span class="keyword">class</span> FileStateCache {</span><br><span class="line">  <span class="keyword">private</span> cache = <span class="keyword">new</span> Map<<span class="built_in">string</span>, {</span><br><span class="line">    timestamp: <span class="built_in">number</span></span><br><span class="line">    content: <span class="built_in">string</span></span><br><span class="line">    offset?: <span class="built_in">number</span></span><br><span class="line">    limit?: <span class="built_in">number</span></span><br><span class="line">  }>()</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">get</span>(path: <span class="built_in">string</span>) {</span><br><span class="line">    <span class="keyword">return</span> <span class="keyword">this</span>.cache.get(path)</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="keyword">set</span>(path: <span class="built_in">string</span>, state: { timestamp: <span class="built_in">number</span>, content: <span class="built_in">string</span> }) {</span><br><span class="line">    <span class="keyword">this</span>.cache.set(path, state)</span><br><span class="line">  }</span><br><span class="line">  </span><br><span class="line">  <span class="comment">// 用于检测并发修改</span></span><br><span class="line">  validate(path: <span class="built_in">string</span>): <span class="built_in">boolean</span> {</span><br><span class="line">    <span class="keyword">const</span> cached = <span class="keyword">this</span>.cache.get(path)</span><br><span class="line">    <span class="keyword">if</span> (!cached) <span class="keyword">return</span> <span class="literal">false</span></span><br><span class="line">    </span><br><span class="line">    <span class="keyword">const</span> currentMtime = statSync(path).mtimeMs</span><br><span class="line">    <span class="keyword">return</span> currentMtime <= cached.timestamp</span><br><span class="line">  }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="六、关键设计原则"><a href="#六、关键设计原则" class="headerlink" title="六、关键设计原则"></a>六、关键设计原则</h2><h3 id="6-1-自描述工具"><a href="#6-1-自描述工具" class="headerlink" title="6.1 自描述工具"></a>6.1 自描述工具</h3><p>每个工具通过接口暴露所有必要信息，框架无需了解内部：</p><figure class="highlight typescript"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// 框架只知道接口，不知道实现</span></span><br><span class="line"><span class="keyword">const</span> isReadOnly = tool.isReadOnly?.(input)</span><br><span class="line"><span class="keyword">const</span> isDestructive = tool.isDestructive?.(input)</span><br><span class="line"></span><br><span class="line"><span class="comment">// 工具自己决定</span></span><br><span class="line">tool.checkPermissions(input, context)</span><br></pre></td></tr></table></figure><h3 id="6-2-验证前置"><a href="#6-2-验证前置" class="headerlink" title="6.2 验证前置"></a>6.2 验证前置</h3><p>输入验证在权限检查之前：</p><figure class="highlight plain"><table><tr><td class="gutter"><pre><span class="line">1</span><br></pre></td><td class="code"><pre><span class="line">输入 → Zod 解析 → 自定义验证 → Pre-Tool 钩子 → 权限检查 → 执行</span><br></pre></td></tr></table></figure><p>这确保了权限检查不会因为无效输入而触发。</p><h3 id="6-3-钩子可扩展"><a href="#6-3-钩子可扩展" class="headerlink" title="6.3 钩子可扩展"></a>6.3 钩子可扩展</h3><p>钩子系统允许用户在任何阶段注入自定义逻辑：</p><figure class="highlight json"><table><tr><td class="gutter"><pre><span class="line">1</span><br><span class="line">2</span><br><span class="line">3</span><br><span class="line">4</span><br><span class="line">5</span><br><span class="line">6</span><br><span class="line">7</span><br><span class="line">8</span><br><span class="line">9</span><br></pre></td><td class="code"><pre><span class="line"><span class="comment">// settings.json</span></span><br><span class="line">{</span><br><span class="line">  <span class="attr">"hooks"</span>: {</span><br><span class="line">    <span class="attr">"PreToolUse"</span>: [{</span><br><span class="line">      <span class="attr">"matcher"</span>: <span class="string">"Bash"</span>,</span><br><span class="line">      <span class="attr">"hooks"</span>: [{ <span class="attr">"type"</span>: <span class="string">"command"</span>, <span class="attr">"command"</span>: <span class="string">"echo 'Bash called'"</span> }]</span><br><span class="line">    }]</span><br><span class="line">  }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><hr><h2 id="七、关键源文件索引"><a href="#七、关键源文件索引" class="headerlink" title="七、关键源文件索引"></a>七、关键源文件索引</h2><div class="table-container"><table><thead><tr><th>文件</th><th>行数</th><th>职责</th></tr></thead><tbody><tr><td><code>src/Tool.ts</code></td><td>~792</td><td>Tool 类型定义和构建器</td></tr><tr><td><code>src/tools.ts</code></td><td>~389</td><td>工具发现和注册</td></tr><tr><td><code>src/services/tools/toolExecution.ts</code></td><td>~1500</td><td>执行管道</td></tr><tr><td><code>src/services/tools/toolOrchestration.ts</code></td><td>~200</td><td>并行/串行策略</td></tr><tr><td><code>src/services/tools/toolHooks.ts</code></td><td>~300</td><td>钩子执行</td></tr><tr><td><code>src/utils/toolResultStorage.ts</code></td><td>~200</td><td>结果存储</td></tr><tr><td><code>src/utils/fileStateCache.ts</code></td><td>~100</td><td>文件状态缓存</td></tr></tbody></table></div><hr><h2 id="八、总结"><a href="#八、总结" class="headerlink" title="八、总结"></a>八、总结</h2><p>Claude Code 的工具系统设计体现了几个核心原则：</p><ol><li><strong>接口驱动</strong>：统一的 Tool 接口，框架无需了解实现</li><li><strong>管道模式</strong>：七步执行管道，每步职责清晰</li><li><strong>延迟加载</strong>：减少初始 token 消耗</li><li><strong>钩子扩展</strong>：用户可在任意阶段注入逻辑</li><li><strong>结果管理</strong>：自动处理大型结果</li></ol><p>这个设计使得添加新工具变得简单——只需实现 Tool 接口，框架会自动处理验证、权限、执行和结果处理。</p><hr><p><strong>系列文章导航：</strong></p><ul><li>上一篇：<a href="/claude-code-async-generator-state-machine/">打破 ReAct 迷思：Async Generator 状态机</a></li><li>下一篇：<a href="/claude-code-multi-agent/">多 Agent 编排：四种代理类型与协作机制</a></li></ul>
</article>
</main></body></html>