Cloudflare Changelog / Call any AI model through AI Gateway's new REST API / 2026-05-21 https://developers.cloudflare.com/changelog/post/2026-05-21-rest-api/

AI Gateway 新 REST API:多模型调用先统一供应商策略

Cloudflare AI Gateway 可用统一 REST API 调 OpenAI、Anthropic、Google 和 Workers AI,应用需要先写路由、缓存和成本策略。

Agent · 2026-05-27
AI Gateway 新 REST API:多模型调用先统一供应商策略 配图
摘要

Cloudflare AI Gateway 可用统一 REST API 调 OpenAI、Anthropic、Google 和 Workers AI,应用需要先写路由、缓存和成本策略。

栏目
Agent
发布时间
2026-05-27
来源
Cloudflare Changelog / Call any AI model through AI Gateway's new REST API / 2026-05-21 https://developers.cloudflare.com/changelog/post/2026-05-21-rest-api/

这篇解决什么

多模型调用如果直接散在业务代码里,后续很难统一限流、日志、缓存、护栏、账单和故障切换。

AI Gateway 新 REST API:多模型调用先统一供应商策略 流程图

适合谁

适合构建 AI 应用、企业 Agent 网关、RAG 服务和多供应商模型路由的开发者。

操作步骤

1. 列出当前直接调用的模型供应商和端点
2. 把供应商、模型、用途和成本写成路由表
3. 通过 AI Gateway 统一日志、缓存、限流和护栏
4. 为 Workers AI 模型记录 @cf 前缀和 gateway header
5. 给每类任务设置主模型和备用模型
6. 每周复查失败率、缓存命中率和账单

可复制模板

任务:
主模型:
备用模型:
供应商:
Gateway:
缓存策略:
限流:
成本上限:
AI Gateway 新 REST API:多模型调用先统一供应商策略 检查清单

验收清单

  • 模型清单完整
  • Gateway 路由统一
  • 缓存限流启用
  • 备用模型已写
  • 账单每周复查

常见错误

  • 只收藏产品更新,没有把它改成当天能执行的工作卡。
  • 只看发布标题,没有确认账号权限、适用版本、成本和数据边界。
  • 把 AI 自动化结果直接当结论,没有保留人工复核和失败恢复动作。
  • 外部链接散落在聊天记录里,后续复查时找不到来源和日期。

30 分钟小样本

先选一个真实但低风险的任务。前 5 分钟写清输入材料和目标产物;中间 15 分钟按本文步骤执行一次;最后 10 分钟记录输出、人工修改量、失败点和下一次复用条件。小样本通过后,再扩展到团队模板或固定 SOP。

AI Gateway 新 REST API:多模型调用先统一供应商策略 输出示意

复用方式

第一次执行时,把它当成个人操作卡;第二次执行时,把成功步骤整理成团队模板;第三次执行时,再判断是否值得升级成固定 SOP、工具页或培训材料。每次复查都要看官方页面是否改版、权限或价格是否变化、原来的示例是否还能跑通。

资料依据

标签

CloudflareAI Gateway多模型REST API成本治理