Agents Series — 阅读索引
围绕"agent harness、LLM 底层、多 agent 协作"三条主线整理的双语笔记。每个主题通常有 .en.md(原文整理版)和 .zh.md(中译版)两个文件;论文性质的整理(如 Generative Agents)则只有一份中文整理稿,原文链接在文档开头。
推荐阅读顺序
按"先建心智模型 → 奠基论文 → 单 agent 解剖 → prompt 层次 → 多 agent 协作 → 大规模实证 → 回到 LLM 底层"的演化线:
| 顺序 | 文件 | 来源 | 核心 |
|---|---|---|---|
| 1 | scaffolded-llms-nlc | Beren 2023 长博客 | LLM 是 NLPU、context window 是 RAM、harness 是 OS、prompt 是自然语言编程语言 |
| 2 | generative-agents-smallville | Park et al. UIST '23(Stanford) | 25 个 agent 的 Smallville 小镇:memory stream + reflection + planning 三件套,d=8.16 完胜 baseline |
| 3 | agent-harness | @akshay_pachaar X 推文 | Anatomy of Agent Harness:12 组件 + 7 步编排循环 + 框架对比 |
| 4 | 4-layer-prompt | @0xCodez X 推文 | 4 层 prompt 结构:role / context / task / examples,含 5 张图 + 5 段 plaintext |
| 5 | claude-agent-team | @0x_rody X 推文 | Claude Agent Team 7 步搭建法 |
| 6 | agent-swarm-5k | @t1anyufan X 推文(HKU) | 5000 agent 实证实验:competition / cooperation / hybrid / control 四组对照 |
| 7 | llm-architecture | @shabnam_774 X 推文 | 从零搭建 LLM:tokenization → Transformer → 训练 → RLHF → 推理优化 → MoE |
阅读线索
scaffolded-llms-nlc 给整套词汇表(NLPU / NLOP / scaffolded LLM),是后面每篇的概念地基。
generative-agents-smallville 是这套理论的首个完整实例化——也是现代 LLM agent 架构的奠基论文。memory stream + retrieval(recency × importance × relevance)+ reflection + planning 这三件套基本定义了之后所有 agent 系统的范式。
agent-harness 是把奠基论文里的实践经验抽象成可工程化的组件清单——12 大模块逐一拆,包括 context manager、tool registry、scheduler、observability。
4-layer-prompt 收窄到组件之一:prompt。把 prompt 从"一段文本"升级成"4 层结构化输入"。
claude-agent-team 把 harness + prompt 用最小可行的方式串起来——7 步给一个能跑的 Claude agent team。
agent-swarm-5k 把上面这条思路在 5000 agent 的尺度上做对照实验,看协作 vs 竞争 vs 混合策略下的真实表现差异——本质是 Generative Agents 的 200x 规模化版。
llm-architecture 回到 scaffolded-llms-nlc 留下的引子:NLPU 内部到底长啥样。从数据工程一路走到 alignment 与推理优化,串起整条 LLM 流水线。
读完这 7 篇能形成一个相对自洽的 mental model:
- LLM 是底层硬件(llm-architecture)
- agent harness 是包在 LLM 外的 OS(scaffolded-llms-nlc、agent-harness)
- generative agents 是首个可信的应用层范式(generative-agents-smallville)
- prompt 是写给 NLPU 的程序(4-layer-prompt)
- agent team 是多进程并发模型(claude-agent-team)
- agent swarm 是分布式系统(agent-swarm-5k)
翻译策略
每篇 .zh.md 共用一套规则:
- 章节、自然段、列表结构与原文一对一
- 图片按原位
嵌入;ASCII 图、代码块、JSON 配置保留英文(要直接复制粘贴跑的) - 专有名词首次出现给中文译名 + 英文原词;harness / agent / subagent / swarm / orchestrator / Codex / CC / Sonnet / MCP / context rot / tokenization / Transformer / KV cache / RLHF / DPO / LoRA / QLoRA 等社区通用术语保留英文
- 引用原文金句保留英文双引号原句
- ASCII 流程图(pipeline、transformer block、训练循环、RLHF、RAG)整块保留英文
- 注意力公式
Attention(Q,K,V) = softmax(QKᵀ / √dₖ)V等公式原样保留
学术论文整理(如 generative-agents-smallville)走另一套:以中文叙述为主,保留 prompt 原文、对话样本、关键术语英文,并在文档顶部列出 arXiv / 代码 / 演示链接。