🚀 快速安装
复制以下命令并运行,立即安装此 Skill:
npx @anthropic-ai/skills install microsoft/azure-skills/azure-aigateway
💡 提示:需要 Node.js 和 NPM
Azure AI 网关
将 Azure API 管理 (APIM) 配置为 AI 网关,用于管理 AI 模型、MCP 工具和智能体。
要部署 APIM,请使用 azure-prepare 技能。请参阅 APIM 部署指南。
何时使用此技能
| 类别 | 触发条件 |
|---|---|
| 模型治理 | “语义缓存”、“令牌限制”、“AI 负载均衡”、“跟踪令牌使用量” |
| 工具治理 | “MCP 速率限制”、“保护我的工具”、“配置我的工具”、“将 API 转换为 MCP” |
| 智能体治理 | “内容安全”、“越狱检测”、“过滤有害内容” |
| 配置 | “添加 Azure OpenAI 后端”、“配置我的模型”、“添加 AI Foundry 模型” |
| 测试 | “测试 AI 网关”、“通过网关调用 OpenAI” |
快速参考
| 策略 | 用途 | 详情 |
|---|---|---|
azure-openai-token-limit |
成本控制 | 模型策略 |
azure-openai-semantic-cache-lookup/store |
节省 60-80% 成本 | 模型策略 |
azure-openai-emit-token-metric |
可观测性 | 模型策略 |
llm-content-safety |
安全与合规 | 智能体策略 |
rate-limit-by-key |
MCP/工具保护 | 工具策略 |
获取网关详情
# 获取网关 URL
az apim show --name <apim名称> --resource-group <资源组> --query "gatewayUrl" -o tsv
# 列出后端(AI 模型)
az apim backend list --service-name <apim名称> --resource-group <资源组> \
--query "[].{id:name, url:url}" -o table
# 获取订阅密钥
az apim subscription keys list \
--service-name <apim名称> --resource-group <资源组> --subscription-id <订阅ID>
测试 AI 端点
GATEWAY_URL=$(az apim show --name <apim名称> --resource-group <资源组> --query "gatewayUrl" -o tsv)
curl -X POST "${GATEWAY_URL}/openai/deployments/<部署名称>/chat/completions?api-version=2024-02-01" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <密钥>" \
-d '{"messages": [{"role": "user", "content": "你好"}], "max_tokens": 100}'
常见任务
添加 AI 后端
完整步骤请参阅 references/patterns.md。
# 发现 AI 资源
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table
# 创建后端
az apim backend create --service-name <apim名称> --resource-group <资源组> \
--backend-id openai-backend --protocol http --url "https://<aoai名称>.openai.azure.com/openai"
# 授予访问权限(托管标识)
az role assignment create --assignee <apim主体ID> \
--role "Cognitive Services User" --scope <aoai资源ID>
应用 AI 治理策略
<inbound> 部分中推荐的策略顺序:
- 身份验证 – 使用托管标识连接到后端
- 语义缓存查找 – 在调用 AI 前检查缓存
- 令牌限制 – 成本控制
- 内容安全 – 过滤有害内容
- 后端选择 – 负载均衡
- 指标 – 跟踪令牌使用量
完整示例请参阅 references/policies.md。
故障排除
| 问题 | 解决方案 |
|---|---|
| 令牌限制返回 429 | 增加 tokens-per-minute 或添加负载均衡 |
| 无缓存命中 | 将 score-threshold 降低到 0.7 |
| 内容误报 | 提高类别阈值(5-6) |
| 后端认证返回 401 | 授予 APIM “Cognitive Services User” 角色 |
详情请参阅 references/troubleshooting.md。
参考资料
- 详细策略 – 完整的策略示例
- 配置模式 – 分步模式
- 故障排除 – 常见问题
- AI-Gateway 示例
- GenAI 网关文档
SDK 快速参考
- 内容安全:Python | TypeScript
- API 管理:Python | .NET
📄 原始文档
完整文档(英文):
https://skills.sh/microsoft/azure-skills/azure-aigateway
💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)