验收

流水线中的每个环节**不必**是「智能体」:可以是人工作业、传统服务、批处理脚本或混合形态。平台**不强制**环节之间必须使用 MCP;环节间通信可采用 MCP、HTTP(S)、消息总线、Webhook、共享存储等任意组合,只要在 manifest.detail 与各环节 IO(input_data_format / output_data_format)中约定清楚即可。以下按 stage_type 给出**验收说明建议**(可按任务裁剪并写入 acceptance_criteria)。

  • **0 Reviewer**:逐项对照 acceptance_criteria 与 harness_policy;结论需有证据(日志、对比结果或抽检记录);禁止无依据「一票通过」。
  • **1 Agent(编排)**:检查任务拆解是否覆盖目标、依赖是否无环、交接给下游的结构化输出是否可被解析且符合 output_data_format;违规调用 forbidden_actions 视为不通过。
  • **2 Software**:代码/构建产物可复现(提交哈希、标签或制品版本);测试与静态检查策略符合约定;公开 API/配置与 schema 一致;安全基线(密钥、依赖漏洞)按任务要求处理。
  • **3 Hardware**:固件/接线/版本号与 BOM 一致;必要日志或遥测可导出;应力/环境测试或规格核对按任务清单执行。
  • **4 Data**:数据来源与授权合规;schema、样本量与脱敏策略符合说明;保留周期与删除流程可追溯。
  • **5 DevOps**:流水线可重复执行;发布工件与回滚方案可用;密钥与配置注入符合最小权限;监控/告警阈值与 Runbook 到位。
  • **100 Workflow Designer**:流程/状态机与异常分支定义完整;与下游 stage_name 的触发条件、超时与补偿路径写清。
  • **101 Context Optimizer**:压缩或裁剪策略可复现;关键字段保留抽检通过;成本与延迟符合约定。
  • **102 MCP Provisioner**:MCP 端点可用、鉴权有效;工具/资源清单与文档一致;变更可审计。
  • **103 GUI Operator**:关键路径可复现(脚本、录屏或截图证据);异常 UI 状态有处理约定。
  • **104 Prompt Architect**:提示词/模板版本可追踪;变量表完整;边界案例抽检结果符合预期。
  • **105 Memory Retriever**:检索命中率或抽样质检达标;引用片段可溯源;过期/淘汰策略生效。
  • **106 Compliance / Guardrail**:策略命中日志完整;误报/漏报抽检在阈值内;审计链路可追踪。
  • **107 Multimodal Parser**:各模态解析准确率或错误率符合约定;格式容错与失败回退路径验证。
  • **108 Model Router**:路由规则与 SLA(延迟、成本、可用性)达标;降级策略可验证。
  • **1000 Custom**:以任务 manifest.detail 与自定义 acceptance_criteria 为准;补充可量化指标(性能、准确率、可用性等)后再验收。