Use Case

Agent 质量评分

公开解释用于控制交付质量的门槛,确保流程可运行、可测试、可维护。

评分检查什么

  • 目标与范围清晰度
  • 输入输出定义
  • 工作流完整度与异常处理
  • 风险边界与人工审核点
  • 测试覆盖与部署准备度

门槛逻辑

  • 当前交付使用 24/30 的发布门槛
  • 关键维度不能靠模糊描述过关
  • 即使总分勉强通过,关键项失守也会被拦下

什么情况会判定失败

  • 升级逻辑未定义
  • 高风险输入没有对应测试
  • 只有 Prompt,没有可执行 Workflow
  • 把应由人工审核的场景写成自动化承诺

验收如何进行

  • 验收看交付物和可测试性
  • 客户应能在没有隐含前提的情况下审阅交付包
  • 不可维护的流程,不算可交付

Next Step