从零实现 Harness Agent:飞书审批 Adapter 设计
本文讲解飞书审批 Adapter,如何把审批通知、approve、reject 命令接入通用审批流程,同时保持工具系统不依赖平台 SDK。
从零实现 Harness Agent:审批 Checkpoint 暂停与恢复
本文讲解审批 checkpoint 暂停与恢复机制,如何持久化原始 messages、pending tool call 和运行参数,并在人工决策后 fail closed 地继续。
从零实现 Harness Agent:高危工具调用人工审批
本文讲解 HumanApprovalMiddleware,如何在高危工具参数命中风险策略时暂停 Agent 运行,把真实副作用交给人工审批。
从零实现 Harness Agent:运行时工具 Allowlist/Denylist 策略
本文讲解运行时工具 allowlist 和 denylist 策略,区分模型可见工具与执行时二次拦截,避免不同环境下工具权限失控。
从零实现 Harness Agent:Tool Middleware 链式执行
本文讲解通用 Tool Middleware 链式执行,把审批、策略、日志和真实工具调用拆成可组合边界,避免工具执行器继续膨胀。
从零实现 Harness Agent:真实 Provider 编辑演示
本文用真实 Provider 演示 Agent 编辑链路,验证模型生成工具调用、EditTool 执行局部修改以及最终结果回流主循环的完整路径。
从零实现 Harness Agent:Edit 工具的降级匹配管线
本文讲解 EditTool 的分层降级匹配管线,如何在换行、缩进和首尾空白存在差异时仍安全定位唯一 old_text。
从零实现 Harness Agent:Agent CLI 测试策略
本文讲解 tiny-claw 的测试分层,用单元测试、FakeProvider、CLI 测试、集成测试和 live demo 分别约束 Agent runtime 的不稳定性。
从零实现 Harness Agent:工具错误 SOP 兜底机制
本文讲解工具错误 SOP 兜底机制,如何把 read、edit、bash 等工具失败转换为模型可理解、用户可观测、测试可断言的反馈。
从零实现 Harness Agent:上下文压缩器设计
本文讲解 ContextCompactor 的设计,如何在不改写原始历史和 session memory 的前提下,为过长工具输出生成临时压缩视图。









