🚀 快速安装

复制以下命令并运行,立即安装此 Skill:

npx @anthropic-ai/skills install microsoft/azure-skills/azure-aigateway

💡 提示:需要 Node.js 和 NPM

Azure AI 网关

将 Azure API 管理 (APIM) 配置为 AI 网关,用于管理 AI 模型、MCP 工具和智能体。

要部署 APIM,请使用 azure-prepare 技能。请参阅 APIM 部署指南

何时使用此技能

类别 触发条件
模型治理 “语义缓存”、“令牌限制”、“AI 负载均衡”、“跟踪令牌使用量”
工具治理 “MCP 速率限制”、“保护我的工具”、“配置我的工具”、“将 API 转换为 MCP”
智能体治理 “内容安全”、“越狱检测”、“过滤有害内容”
配置 “添加 Azure OpenAI 后端”、“配置我的模型”、“添加 AI Foundry 模型”
测试 “测试 AI 网关”、“通过网关调用 OpenAI”

快速参考

策略 用途 详情
azure-openai-token-limit 成本控制 模型策略
azure-openai-semantic-cache-lookup/store 节省 60-80% 成本 模型策略
azure-openai-emit-token-metric 可观测性 模型策略
llm-content-safety 安全与合规 智能体策略
rate-limit-by-key MCP/工具保护 工具策略

获取网关详情

# 获取网关 URL
az apim show --name <apim名称> --resource-group <资源组> --query "gatewayUrl" -o tsv

# 列出后端(AI 模型)
az apim backend list --service-name <apim名称> --resource-group <资源组> \
  --query "[].{id:name, url:url}" -o table

# 获取订阅密钥
az apim subscription keys list \
  --service-name <apim名称> --resource-group <资源组> --subscription-id <订阅ID>

测试 AI 端点

GATEWAY_URL=$(az apim show --name <apim名称> --resource-group <资源组> --query "gatewayUrl" -o tsv)

curl -X POST "${GATEWAY_URL}/openai/deployments/<部署名称>/chat/completions?api-version=2024-02-01" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: <密钥>" \
  -d '{"messages": [{"role": "user", "content": "你好"}], "max_tokens": 100}'

常见任务

添加 AI 后端

完整步骤请参阅 references/patterns.md

# 发现 AI 资源
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table

# 创建后端
az apim backend create --service-name <apim名称> --resource-group <资源组> \
  --backend-id openai-backend --protocol http --url "https://<aoai名称>.openai.azure.com/openai"

# 授予访问权限(托管标识)
az role assignment create --assignee <apim主体ID> \
  --role "Cognitive Services User" --scope <aoai资源ID>

应用 AI 治理策略

<inbound> 部分中推荐的策略顺序:

  1. 身份验证 – 使用托管标识连接到后端
  2. 语义缓存查找 – 在调用 AI 前检查缓存
  3. 令牌限制 – 成本控制
  4. 内容安全 – 过滤有害内容
  5. 后端选择 – 负载均衡
  6. 指标 – 跟踪令牌使用量

完整示例请参阅 references/policies.md


故障排除

问题 解决方案
令牌限制返回 429 增加 tokens-per-minute 或添加负载均衡
无缓存命中 score-threshold 降低到 0.7
内容误报 提高类别阈值(5-6)
后端认证返回 401 授予 APIM “Cognitive Services User” 角色

详情请参阅 references/troubleshooting.md


参考资料

SDK 快速参考

📄 原始文档

完整文档(英文):

https://skills.sh/microsoft/azure-skills/azure-aigateway

💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。