Agents Series — 阅读索引

Agents Series — 阅读索引

围绕"agent harness、LLM 底层、多 agent 协作"三条主线整理的双语笔记。每个主题通常有 .en.md(原文整理版)和 .zh.md(中译版)两个文件;论文性质的整理(如 Generative Agents)则只有一份中文整理稿,原文链接在文档开头。

推荐阅读顺序

按"先建心智模型 → 奠基论文 → 单 agent 解剖 → prompt 层次 → 多 agent 协作 → 大规模实证 → 回到 LLM 底层"的演化线:

顺序 文件 来源 核心
1 scaffolded-llms-nlc Beren 2023 长博客 LLM 是 NLPU、context window 是 RAM、harness 是 OS、prompt 是自然语言编程语言
2 generative-agents-smallville Park et al. UIST '23(Stanford) 25 个 agent 的 Smallville 小镇:memory stream + reflection + planning 三件套,d=8.16 完胜 baseline
3 agent-harness @akshay_pachaar X 推文 Anatomy of Agent Harness:12 组件 + 7 步编排循环 + 框架对比
4 4-layer-prompt @0xCodez X 推文 4 层 prompt 结构:role / context / task / examples,含 5 张图 + 5 段 plaintext
5 claude-agent-team @0x_rody X 推文 Claude Agent Team 7 步搭建法
6 agent-swarm-5k @t1anyufan X 推文(HKU) 5000 agent 实证实验:competition / cooperation / hybrid / control 四组对照
7 llm-architecture @shabnam_774 X 推文 从零搭建 LLM:tokenization → Transformer → 训练 → RLHF → 推理优化 → MoE

阅读线索

scaffolded-llms-nlc 给整套词汇表(NLPU / NLOP / scaffolded LLM),是后面每篇的概念地基。

generative-agents-smallville 是这套理论的首个完整实例化——也是现代 LLM agent 架构的奠基论文。memory stream + retrieval(recency × importance × relevance)+ reflection + planning 这三件套基本定义了之后所有 agent 系统的范式。

agent-harness 是把奠基论文里的实践经验抽象成可工程化的组件清单——12 大模块逐一拆,包括 context manager、tool registry、scheduler、observability。

4-layer-prompt 收窄到组件之一:prompt。把 prompt 从"一段文本"升级成"4 层结构化输入"。

claude-agent-team 把 harness + prompt 用最小可行的方式串起来——7 步给一个能跑的 Claude agent team。

agent-swarm-5k 把上面这条思路在 5000 agent 的尺度上做对照实验,看协作 vs 竞争 vs 混合策略下的真实表现差异——本质是 Generative Agents 的 200x 规模化版。

llm-architecture 回到 scaffolded-llms-nlc 留下的引子:NLPU 内部到底长啥样。从数据工程一路走到 alignment 与推理优化,串起整条 LLM 流水线。

读完这 7 篇能形成一个相对自洽的 mental model:

翻译策略

每篇 .zh.md 共用一套规则:

学术论文整理(如 generative-agents-smallville)走另一套:以中文叙述为主,保留 prompt 原文、对话样本、关键术语英文,并在文档顶部列出 arXiv / 代码 / 演示链接。