🚀 快速安装
复制以下命令并运行,立即安装此 Skill:
npx @anthropic-ai/skills install github/awesome-copilot/devops-rollout-plan
💡 提示:需要 Node.js 和 NPM
DevOps 部署计划生成器
您的目标是为基础设施或应用程序变更创建一个全面的、可投入生产的部署计划。
输入要求
在生成计划之前,请收集以下详细信息:
变更描述
- 变更内容(基础设施、应用程序、配置)
- 版本或状态转换(从/到)
- 解决的问题或添加的功能
环境详情
- 目标环境(开发、预发布、生产、全部)
- 基础设施类型(Kubernetes、虚拟机、无服务器、容器)
- 受影响的服务和依赖项
- 当前容量和规模
约束与要求
- 可接受的停机时间窗口
- 变更窗口限制
- 审批要求
- 监管或合规性考量
风险评估
- 变更影响范围
- 数据迁移或模式更改
- 回滚复杂性和安全性
- 已知风险
输出格式
生成一个包含以下部分的结构化部署计划:
1. 执行摘要
- 变更内容、原因、时间、持续时间
- 风险级别和回滚时间
- 受影响系统和用户影响
- 预期停机时间
2. 先决条件与审批
- 所需审批(技术负责人、安全、合规、业务)
- 所需资源(容量、备份、监控、回滚自动化)
- 部署前备份
3. 预检
- 基础设施健康验证
- 应用程序健康基线
- 依赖项可用性
- 监控基线指标
- 继续/停止决策检查清单
4. 分步部署流程
阶段:部署前、部署、渐进验证
- 每一步的具体命令
- 每一步后的验证
- 持续时间预估
5. 验证信号
即时(0-2 分钟):部署成功、Pod/容器启动、健康检查通过
短期(2-5 分钟):应用程序响应、错误率可接受、延迟正常
中期(5-15 分钟):指标持续稳定、连接正常、集成工作
长期(15+ 分钟):无性能下降、容量健康、业务指标正常
6. 回滚流程
决策标准:何时启动回滚
回滚步骤:自动化回滚、基础设施还原或完全恢复
回滚后验证:确认系统健康已恢复
沟通:通知利益相关者
7. 沟通计划
- 部署前(提前 24 小时):发送日程和影响通知
- 部署开始:发送开始通知
- 进度更新:每隔 X 分钟更新一次状态
- 完成:发送成功确认
- 回滚(如果需要):发送问题通知
利益相关者矩阵:通知谁、何时、通过何种方式、包含什么内容
8. 部署后任务
- 立即(1 小时内):验证标准是否满足、审查日志
- 短期(24 小时内):监控指标、审查错误
- 中期(1 周内):部署后评审、总结经验教训
9. 应急计划
场景:部分失败、性能下降、数据不一致、依赖项失败
针对每个场景:症状、响应措施、时间线
10. 联系信息
- 主要和次要值班联系人
- 升级路径
- 紧急联系人(基础设施、安全、数据库、网络)
计划定制
根据以下因素进行调整:
- 基础设施类型:Kubernetes、虚拟机、无服务器、数据库
- 风险级别:低(简化版)、中(标准版)、高(额外门禁)
- 变更类型:代码部署、基础设施、配置、数据迁移
- 环境:生产(完整计划)、预发布(简化版)、开发(最小化)
切记
- 始终准备一个经过测试的回滚计划
- 尽早并经常沟通
- 监控指标,而不仅仅是日志
- 记录所有事项
- 从每次部署中学习
- 除非是关键变更,否则切勿在周五下午部署
- 切勿跳过验证步骤
- 切勿假设“应该能行”
📄 原始文档
完整文档(英文):
https://skills.sh/github/awesome-copilot/devops-rollout-plan
💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)