Anthropic 如何构建最广泛使用的
AI 编程智能体
当 Claude Code 通过 npm 发布时,source map 也随之公开。我们读完了每个文件。本书把其中的架构、设计决策和可迁移模式提炼为 18 章 供你学习,并应用到自己的系统中。
开始阅读你将学到什么
智能体循环
异步生成器如何驱动整个系统:流式生成模型输出、执行工具、错误恢复,并通过 4 层机制压缩上下文。
大规模工具执行
从模型请求到工具结果的 14 步流水线:权限解析、推测执行,以及按安全性分类的并发批处理。
多智能体编排
子智能体如何共享提示缓存前缀,把成本降低约 95%。分叉智能体、协调器模式,以及带邮箱消息的智能体集群。
没有数据库的记忆
基于文件的记忆与 LLM 驱动的召回系统:四类记忆、陈旧性警告,以及优于 embedding 搜索的 Sonnet 旁路查询。
性能工程
通过并行 I/O 实现 240ms 启动;槽位预留在 99% 请求中节省上下文;用 bitmap 预过滤器加速模糊搜索。每一毫秒都有归属。
可扩展性与安全
两阶段技能加载(启动时只加载元数据,按需加载内容);27 个生命周期钩子,以及启动时冻结配置快照以防注入。
探索架构
六个核心抽象支撑 Claude Code。拖动节点重新排列,悬停查看细节,点击阅读对应章节。
本书适合谁
正在构建智能体系统的工程师。 每章都以“应用到你的系统”收尾,提炼 5 个可迁移模式和具体适配建议。借鉴架构,避开坑。
正在评估架构的技术负责人。 即使不阅读每个代码块,也能跟上叙事。理解为什么这样设计,而不只是知道构建了什么。
任何好奇生产级 AI 工具如何工作的人。 Claude Code 被大量开发者使用。本书解释它在底层如何运转。
目录
基础
在智能体开始思考之前,进程必须先存在。
核心循环
智能体的心跳:流式生成、行动、观察,然后重复。
多智能体编排
一个智能体很强大。多个智能体协同工作,则会带来质变。
持久化与智能
没有记忆的智能体会永远犯同样的错误。
连接性
智能体的触角伸向 localhost 之外。
性能工程
让系统足够快,让人类感受不到机器的存在。
本书是如何完成的
原始材料来自 npm source map——Claude Code 发布包中的 .js.map 文件在 sourcesContent 字段里包含了完整原始 TypeScript。近两千个文件组成了完整架构。
36 个 AI 智能体 分四个阶段完成了分析与写作:
从源码提取到最终修订成书,整个过程大约耗时 6 小时。最后一轮审计确保没有保留任何逐字源码——所有代码块都被重写为使用不同变量名的伪代码。
让它成立的 10 个模式
如果你只读一部分,读这里:这些是定义 Claude Code 的架构押注。
仅用于教育目的。 本书不包含 Claude Code 的任何源码——所有代码块都是用于说明架构模式的原创伪代码。目标是帮助工程师理解生产级 AI 智能体如何构建,而不是复现专有软件。“NO'REILLY” 封面只是用于说明的戏仿/meme,与 O'Reilly Media 无关。