Deep Agents v0.6:用开源模型跑 Agent 前先建路由表
Deep Agents v0.6 强调 open-weight 模型和 harness profiles,团队应先把任务路由和验收标准写清楚。
Deep Agents v0.6 强调 open-weight 模型和 harness profiles,团队应先把任务路由和验收标准写清楚。
- 栏目
- Agent
- 发布时间
- 2026-06-01
- 来源
- LangChain Blog / New in Deep Agents v0.6 / 2026-05-13 https://www.langchain.com/blog/deep-agents-0-6
这篇解决什么
开源模型进入 Agent 生产链路后,成本可能显著降低,但不同模型在工具调用、长上下文、代码和中文任务上的表现差异很大。
适合谁
适合希望用 Kimi、Qwen、DeepSeek 等开源模型替代部分闭源 Agent 任务的开发团队。
操作步骤
- 把 Agent 任务分成检索、写作、代码、表格、工具调用和长记忆
- 为每类任务选择候选开源模型与闭源基准模型
- 用同一套真实样本比较完成率、重试率、成本和人工修改量
- 把低风险高频任务优先路由给开源模型
- 复杂跨文件和高影响发布任务保留更强模型或人工复核
- 每次模型升级后重跑样本,不沿用旧分数
可复制模板
任务类型:
候选模型:
基准模型:
完成率:
成本:
人工修改量:
路由规则:
验收清单
- 任务按类型路由
- 有闭源基准对照
- 低风险任务先迁移
- 高影响任务保留复核
- 模型升级后重测
常见错误
- 只收藏产品更新,没有改成自己的任务卡、权限表和验收证据。
- 直接在生产账号、生产仓库或公开页面试新功能,没有先跑低风险样本。
- 只看工具能力,不记录成本、失败率、人工接管次数和恢复动作。
- 把外部链接当正文主体,读者离开页面后才知道怎么做。
30 分钟小样本
前 5 分钟写清输入、目标和风险边界;中间 15 分钟按步骤跑一个低风险样本;最后 10 分钟记录输出、失败点、人工修改量和下一次复用条件。样本不通过时,只修失败点,不扩大范围。
发布建议
第一次执行时把它当成个人操作卡;第二次复用时沉淀为团队模板;第三次仍然稳定后,再升级为固定 SOP、Skill 或工具导航页。涉及账号、发布、删除、付费、生产代码和客户数据的动作,必须保留人工确认点。
资料依据
标签
LangChainDeep Agents开源模型Agent成本优化