Microsoft Blog / Microsoft Build 2026: Be yourself at work / 2026-06-02 https://blogs.microsoft.com/blog/2026/06/02/microsoft-build-2026-be-yourself-at-work/

Frontier Tuning:先用小样本教 Agent 公司规则

Frontier Tuning 强调用企业规则训练 Agent 前,团队要先准备合规边界内的小样本和验收表。

教程 · 2026-06-03
Frontier Tuning:先用小样本教 Agent 公司规则 配图
摘要

Frontier Tuning 强调用企业规则训练 Agent 前,团队要先准备合规边界内的小样本和验收表。

栏目
教程
发布时间
2026-06-03
来源
Microsoft Blog / Microsoft Build 2026: Be yourself at work / 2026-06-02 https://blogs.microsoft.com/blog/2026/06/02/microsoft-build-2026-be-yourself-at-work/

这篇解决什么

让 Agent 学会公司做事方式很有价值,但没有样本门禁时,训练会把旧错误、个人习惯和不可公开数据一起固化进去。

Frontier Tuning:先用小样本教 Agent 公司规则 流程图

适合谁

适合准备做内部 Agent 微调、偏好学习、流程学习和部门模板自动化的团队。

操作步骤

  1. 选择一个高频但低风险的业务流程
  2. 收集 20 条合规样本,删除客户隐私和内部敏感字段
  3. 把好输出、坏输出和拒绝条件分别标注
  4. 定义模型通过标准:准确性、格式、证据和人工修改量
  5. 先在隔离环境评估,再接入真实系统
  6. 每次规则变化后重新抽样复测

可复制模板

流程:
样本数量:
敏感字段处理:
好输出标准:
拒绝条件:
通过阈值:
复测周期:
Frontier Tuning:先用小样本教 Agent 公司规则 检查清单

验收清单

  • 流程低风险高频
  • 样本已去敏
  • 好坏输出已标注
  • 通过阈值明确
  • 规则变化会复测

常见错误

  • 只收藏产品更新,没有改成自己的任务卡、权限表和验收证据。
  • 直接在生产账号、生产仓库或公开页面试新功能,没有先跑低风险样本。
  • 只看工具能力,不记录成本、失败率、人工接管次数和恢复动作。
  • 把外部链接当正文主体,读者离开页面后才知道怎么做。

30 分钟小样本

前 5 分钟写清输入、目标和风险边界;中间 15 分钟按步骤跑一个低风险样本;最后 10 分钟记录输出、失败点、人工修改量和下一次复用条件。样本不通过时,只修失败点,不扩大范围。

Frontier Tuning:先用小样本教 Agent 公司规则 输出示意

下一步怎么用

第一次执行时把它当成个人操作卡;第二次复用时沉淀为团队模板;第三次仍然稳定后,再升级为固定 SOP、Skill 或工具导航页。涉及账号、发布、删除、付费、生产代码和客户数据的动作,必须保留人工确认点。

资料依据

标签

Frontier TuningAgent 训练企业规则评估Microsoft