Agent 权限变大后：用爆炸半径表约束 Claude 类产品

摘要

Anthropic 公开 Claude 产品隔离经验后，普通团队也应把 Agent 风险写成爆炸半径表。

栏目: 安全
发布时间: 2026-06-01
来源: Anthropic Engineering / How we contain Claude across products / 2026-05-25 https://www.anthropic.com/engineering/how-we-contain-claude

这篇解决什么

Agent 越能执行真实工作，单次失败的影响范围也越大。只评估模型是否聪明不够，还要评估它能碰到哪些系统、数据和发布入口。

适合准备把 AI Agent 接入代码库、内部系统、客服后台、内容发布和浏览器自动化的团队。

资源：
权限等级：只读 / 可写 / 可发布 / 可删除 / 可付费
隔离方式：
审批人：
回滚动作：
审计日志位置：

前 5 分钟写清输入、目标和风险边界；中间 15 分钟按步骤跑一个低风险样本；最后 10 分钟记录输出、失败点、人工修改量和下一次复用条件。样本不通过时，只修失败点，不扩大范围。

第一次执行时把它当成个人操作卡；第二次复用时沉淀为团队模板；第三次仍然稳定后，再升级为固定 SOP、Skill 或工具导航页。涉及账号、发布、删除、付费、生产代码和客户数据的动作，必须保留人工确认点。