Copilot Rubber Duck 支持更多模型:代码评审先做交叉复核
Copilot CLI 的 Rubber Duck 能用不同模型做第二意见后,复杂改动应先跑交叉复核再合并。
Copilot CLI 的 Rubber Duck 能用不同模型做第二意见后,复杂改动应先跑交叉复核再合并。
- 栏目
- AI 编程
- 发布时间
- 2026-06-01
- 来源
- GitHub Changelog / Rubber Duck in Copilot CLI supports more models / 2026-05-07 https://github.blog/changelog/2026-05-07-rubber-duck-in-github-copilot-cli-now-supports-more-models
这篇解决什么
单一模型容易沿着自己的假设继续修。交叉复核可以发现架构冲突、边界条件和跨文件副作用,但也会带来更多成本和噪声。
适合谁
适合把 Copilot CLI、Codex 或 Claude Code 用在 PR 级改动的开发者。
操作步骤
- 只对跨文件、高风险或生产路径改动启用第二意见
- 让主模型先输出改动摘要、测试结果和已知风险
- 让复核模型只检查架构、边界条件、安全和遗漏测试
- 把复核意见分成必须修、建议修、记录但不修三类
- 修复后重新运行原测试和针对性回归测试
- 在 PR 描述里记录使用了交叉复核和采纳情况
可复制模板
PR:
主模型:
复核模型:
复核范围:架构 / 边界 / 安全 / 测试
必须修:
建议修:
采纳记录:
验收清单
- 只在高风险改动启用
- 复核范围明确
- 意见已分类处理
- 修复后测试重跑
- PR 中记录采纳情况
常见错误
- 只收藏产品更新,没有改成自己的任务卡、权限表和验收证据。
- 直接在生产账号、生产仓库或公开页面试新功能,没有先跑低风险样本。
- 只看工具能力,不记录成本、失败率、人工接管次数和恢复动作。
- 把外部链接当正文主体,读者离开页面后才知道怎么做。
30 分钟小样本
前 5 分钟写清输入、目标和风险边界;中间 15 分钟按步骤跑一个低风险样本;最后 10 分钟记录输出、失败点、人工修改量和下一次复用条件。样本不通过时,只修失败点,不扩大范围。
发布建议
第一次执行时把它当成个人操作卡;第二次复用时沉淀为团队模板;第三次仍然稳定后,再升级为固定 SOP、Skill 或工具导航页。涉及账号、发布、删除、付费、生产代码和客户数据的动作,必须保留人工确认点。
资料依据
标签
GitHub CopilotRubber Duck代码评审AI 编程质量门禁