🚀 快速安装

复制以下命令并运行,立即安装此 Skill:

npx @anthropic-ai/skills install github/awesome-copilot/devops-rollout-plan

💡 提示:需要 Node.js 和 NPM

DevOps 部署计划生成器

您的目标是为基础设施或应用程序变更创建一个全面的、可投入生产的部署计划。

输入要求

在生成计划之前,请收集以下详细信息:

变更描述

  • 变更内容(基础设施、应用程序、配置)
  • 版本或状态转换(从/到)
  • 解决的问题或添加的功能

环境详情

  • 目标环境(开发、预发布、生产、全部)
  • 基础设施类型(Kubernetes、虚拟机、无服务器、容器)
  • 受影响的服务和依赖项
  • 当前容量和规模

约束与要求

  • 可接受的停机时间窗口
  • 变更窗口限制
  • 审批要求
  • 监管或合规性考量

风险评估

  • 变更影响范围
  • 数据迁移或模式更改
  • 回滚复杂性和安全性
  • 已知风险

输出格式

生成一个包含以下部分的结构化部署计划:

1. 执行摘要

  • 变更内容、原因、时间、持续时间
  • 风险级别和回滚时间
  • 受影响系统和用户影响
  • 预期停机时间

2. 先决条件与审批

  • 所需审批(技术负责人、安全、合规、业务)
  • 所需资源(容量、备份、监控、回滚自动化)
  • 部署前备份

3. 预检

  • 基础设施健康验证
  • 应用程序健康基线
  • 依赖项可用性
  • 监控基线指标
  • 继续/停止决策检查清单

4. 分步部署流程

阶段:部署前、部署、渐进验证

  • 每一步的具体命令
  • 每一步后的验证
  • 持续时间预估

5. 验证信号

即时(0-2 分钟):部署成功、Pod/容器启动、健康检查通过
短期(2-5 分钟):应用程序响应、错误率可接受、延迟正常
中期(5-15 分钟):指标持续稳定、连接正常、集成工作
长期(15+ 分钟):无性能下降、容量健康、业务指标正常

6. 回滚流程

决策标准:何时启动回滚
回滚步骤:自动化回滚、基础设施还原或完全恢复
回滚后验证:确认系统健康已恢复
沟通:通知利益相关者

7. 沟通计划

  • 部署前(提前 24 小时):发送日程和影响通知
  • 部署开始:发送开始通知
  • 进度更新:每隔 X 分钟更新一次状态
  • 完成:发送成功确认
  • 回滚(如果需要):发送问题通知

利益相关者矩阵:通知谁、何时、通过何种方式、包含什么内容

8. 部署后任务

  • 立即(1 小时内):验证标准是否满足、审查日志
  • 短期(24 小时内):监控指标、审查错误
  • 中期(1 周内):部署后评审、总结经验教训

9. 应急计划

场景:部分失败、性能下降、数据不一致、依赖项失败
针对每个场景:症状、响应措施、时间线

10. 联系信息

  • 主要和次要值班联系人
  • 升级路径
  • 紧急联系人(基础设施、安全、数据库、网络)

计划定制

根据以下因素进行调整:

  • 基础设施类型:Kubernetes、虚拟机、无服务器、数据库
  • 风险级别:低(简化版)、中(标准版)、高(额外门禁)
  • 变更类型:代码部署、基础设施、配置、数据迁移
  • 环境:生产(完整计划)、预发布(简化版)、开发(最小化)

切记

  • 始终准备一个经过测试的回滚计划
  • 尽早并经常沟通
  • 监控指标,而不仅仅是日志
  • 记录所有事项
  • 从每次部署中学习
  • 除非是关键变更,否则切勿在周五下午部署
  • 切勿跳过验证步骤
  • 切勿假设“应该能行”

📄 原始文档

完整文档(英文):

https://skills.sh/github/awesome-copilot/devops-rollout-plan

💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。