Anthropic Engineering / How we contain Claude across products / 2026-05-25 https://www.anthropic.com/engineering/how-we-contain-claude

Agent 权限变大后:用爆炸半径表约束 Claude 类产品

Anthropic 公开 Claude 产品隔离经验后,普通团队也应把 Agent 风险写成爆炸半径表。

安全 · 2026-06-01
Agent 权限变大后:用爆炸半径表约束 Claude 类产品 配图
摘要

Anthropic 公开 Claude 产品隔离经验后,普通团队也应把 Agent 风险写成爆炸半径表。

栏目
安全
发布时间
2026-06-01
来源
Anthropic Engineering / How we contain Claude across products / 2026-05-25 https://www.anthropic.com/engineering/how-we-contain-claude

这篇解决什么

Agent 越能执行真实工作,单次失败的影响范围也越大。只评估模型是否聪明不够,还要评估它能碰到哪些系统、数据和发布入口。

Agent 权限变大后:用爆炸半径表约束 Claude 类产品 流程图

适合谁

适合准备把 AI Agent 接入代码库、内部系统、客服后台、内容发布和浏览器自动化的团队。

操作步骤

  1. 列出 Agent 可访问的文件、账号、API、浏览器和部署系统
  2. 把每个资源标记为只读、可写、可发布、可删除或可付费
  3. 为可写以上资源设置沙箱、审批或回滚方案
  4. 对跨系统动作建立单独审计日志
  5. 用低风险样本测试失败时能否停止、撤销和恢复
  6. 每次新增工具前先更新爆炸半径表

可复制模板

资源:
权限等级:只读 / 可写 / 可发布 / 可删除 / 可付费
隔离方式:
审批人:
回滚动作:
审计日志位置:
Agent 权限变大后:用爆炸半径表约束 Claude 类产品 检查清单

验收清单

  • 全部工具资源已登记
  • 高风险动作有审批
  • 沙箱和回滚已测试
  • 日志能串起完整链路
  • 新增工具前先更新表格

常见错误

  • 只收藏产品更新,没有改成自己的任务卡、权限表和验收证据。
  • 直接在生产账号、生产仓库或公开页面试新功能,没有先跑低风险样本。
  • 只看工具能力,不记录成本、失败率、人工接管次数和恢复动作。
  • 把外部链接当正文主体,读者离开页面后才知道怎么做。

30 分钟小样本

前 5 分钟写清输入、目标和风险边界;中间 15 分钟按步骤跑一个低风险样本;最后 10 分钟记录输出、失败点、人工修改量和下一次复用条件。样本不通过时,只修失败点,不扩大范围。

Agent 权限变大后:用爆炸半径表约束 Claude 类产品 输出示意

发布建议

第一次执行时把它当成个人操作卡;第二次复用时沉淀为团队模板;第三次仍然稳定后,再升级为固定 SOP、Skill 或工具导航页。涉及账号、发布、删除、付费、生产代码和客户数据的动作,必须保留人工确认点。

资料依据

标签

Agent 安全Claude权限隔离沙箱企业安全