Agents Series — 阅读索引

围绕"agent harness、LLM 底层、多 agent 协作"三条主线整理的双语笔记。每个主题通常有 .en.md（原文整理版）和 .zh.md（中译版）两个文件；论文性质的整理（如 Generative Agents）则只有一份中文整理稿，原文链接在文档开头。

推荐阅读顺序

按"先建心智模型 → 奠基论文 → 单 agent 解剖 → prompt 层次 → 多 agent 协作 → 大规模实证 → 回到 LLM 底层"的演化线：

顺序	文件	来源	核心
1	scaffolded-llms-nlc	Beren 2023 长博客	LLM 是 NLPU、context window 是 RAM、harness 是 OS、prompt 是自然语言编程语言
2	generative-agents-smallville	Park et al. UIST '23（Stanford）	25 个 agent 的 Smallville 小镇：memory stream + reflection + planning 三件套，d=8.16 完胜 baseline
3	agent-harness	@akshay_pachaar X 推文	Anatomy of Agent Harness：12 组件 + 7 步编排循环 + 框架对比
4	4-layer-prompt	@0xCodez X 推文	4 层 prompt 结构：role / context / task / examples，含 5 张图 + 5 段 plaintext
5	claude-agent-team	@0x_rody X 推文	Claude Agent Team 7 步搭建法
6	agent-swarm-5k	@t1anyufan X 推文（HKU）	5000 agent 实证实验：competition / cooperation / hybrid / control 四组对照
7	llm-architecture	@shabnam_774 X 推文	从零搭建 LLM：tokenization → Transformer → 训练 → RLHF → 推理优化 → MoE

阅读线索

scaffolded-llms-nlc 给整套词汇表（NLPU / NLOP / scaffolded LLM），是后面每篇的概念地基。

generative-agents-smallville 是这套理论的首个完整实例化——也是现代 LLM agent 架构的奠基论文。memory stream + retrieval（recency × importance × relevance）+ reflection + planning 这三件套基本定义了之后所有 agent 系统的范式。

agent-harness 是把奠基论文里的实践经验抽象成可工程化的组件清单——12 大模块逐一拆，包括 context manager、tool registry、scheduler、observability。

4-layer-prompt 收窄到组件之一：prompt。把 prompt 从"一段文本"升级成"4 层结构化输入"。

claude-agent-team 把 harness + prompt 用最小可行的方式串起来——7 步给一个能跑的 Claude agent team。

agent-swarm-5k 把上面这条思路在 5000 agent 的尺度上做对照实验，看协作 vs 竞争 vs 混合策略下的真实表现差异——本质是 Generative Agents 的 200x 规模化版。

llm-architecture 回到 scaffolded-llms-nlc 留下的引子：NLPU 内部到底长啥样。从数据工程一路走到 alignment 与推理优化，串起整条 LLM 流水线。

读完这 7 篇能形成一个相对自洽的 mental model：

LLM 是底层硬件（llm-architecture）
agent harness 是包在 LLM 外的 OS（scaffolded-llms-nlc、agent-harness）
generative agents 是首个可信的应用层范式（generative-agents-smallville）
prompt 是写给 NLPU 的程序（4-layer-prompt）
agent team 是多进程并发模型（claude-agent-team）
agent swarm 是分布式系统（agent-swarm-5k）

翻译策略

每篇 .zh.md 共用一套规则：

章节、自然段、列表结构与原文一对一
图片按原位 ![](url) 嵌入；ASCII 图、代码块、JSON 配置保留英文（要直接复制粘贴跑的）
专有名词首次出现给中文译名 + 英文原词；harness / agent / subagent / swarm / orchestrator / Codex / CC / Sonnet / MCP / context rot / tokenization / Transformer / KV cache / RLHF / DPO / LoRA / QLoRA 等社区通用术语保留英文
引用原文金句保留英文双引号原句
ASCII 流程图（pipeline、transformer block、训练循环、RLHF、RAG）整块保留英文
注意力公式 Attention(Q,K,V) = softmax(QKᵀ / √dₖ)V 等公式原样保留

学术论文整理（如 generative-agents-smallville）走另一套：以中文叙述为主，保留 prompt 原文、对话样本、关键术语英文，并在文档顶部列出 arXiv / 代码 / 演示链接。