L12. 用 Pi 做可靠 Harness
学习目标
- 把 Pi 的机制组合成可靠工作系统。
- 设计适合真实项目的最小 Harness。
- 用证据判断 agent 是否真的完成任务。
背景解释
可靠 Harness 的核心不是“让模型更聪明”,而是让工作可恢复、可验证、可审查。Pi 提供了搭建这套系统的积木:
AGENTS.md:项目规则和完成定义。- Sessions:长任务的历史和分支。
- Compaction:上下文预算管理。
- Extensions:运行时拦截、工具和 UI。
- Skills:任务级流程和参考资料。
- Prompt Templates:固定提示结构。
- Pi Packages:共享上述资源。
最小 Harness 组合
在一个真实项目里,首版可以只做这四件事:
- 根目录
AGENTS.md:写清启动、测试、边界、完成定义。 .pi/prompts/review.md:固定代码审查提示。.pi/skills/project-handoff/SKILL.md:固定交接格式。- 一个验证清单:记录任务、命令、证据、未解决风险。
如果项目开始进入多角色或长周期协作,再加:
- Extension:危险命令确认、质量文档读取、上下文注入。
- Project-level packages:共享团队扩展、技能、主题和模板。
- Session 命名规范:每条长任务都命名并阶段性交接。
常见坑
- 一开始搭太多组件。Harness 应从最小闭环开始,按失败模式补组件。
- 只看 agent 最终总结,不看证据。完成必须有命令输出、截图、测试、diff 或可复现步骤。
- 没有交接文件。长任务不能只依赖 session 记忆。
验收标准
- 你能为一个项目写出最小 Harness 清单。
- 你能把失败模式映射到 Pi 机制:遗忘用 session/compaction,越界用 AGENTS/extension,重复提示用 templates/skills。
- 你能定义“完成”的证据,而不是只接受 agent 的自述。
下一步
完成 P06. 综合 Agent Harness,把本课程的内容串成一次完整演练。