🚀 快速安装

复制以下命令并运行,立即安装此 Skill:

npx @anthropic-ai/skills install supercent-io/skills-template/image-generation-mcp

💡 提示:需要 Node.js 和 NPM

通过 MCP 进行图像生成

这是一项通过 MCP 进行人工智能图像生成的技能。使用 Gemini 模型或兼容服务,为营销、用户界面、演示文稿生成高质量图像。

何时使用此技能

  • 营销素材:主视觉图、横幅、社交媒体内容
  • UI/UX 设计:占位图像、图标、插画
  • 演示文稿:幻灯片背景、产品可视化
  • 品牌一致性:基于风格指南的图像生成

操作说明

步骤 1:配置 MCP 环境

# 确认 MCP 服务器设置
claude mcp list

# 确认 Gemini 命令行界面是否可用
# 必须安装 gemini-cli

必需设置

  • 模型名称 (gemini-2.5-flash, gemini-3-pro 等)
  • 应用程序编程接口密钥引用(保存为环境变量)
  • 输出目录

步骤 2:定义提示词

编写结构化提示词:

**主体**:[主要被摄对象]
**风格**:[风格 - 极简、插画、照片风格、3D 等]
**光照**:[光照 - 自然光、摄影棚光、黄金时刻等]
**氛围**:[氛围 - 平静、动感、专业等]
**构图**:[构图 - 居中布局、三分法等]
**宽高比**:[比例 - 16:9, 1:1, 9:16]
**品牌颜色**:[品牌颜色限制]

步骤 3:选择模型

模型 用途 特点
gemini-3-pro-image 高质量 复杂构图,细节丰富
gemini-2.5-flash-image 快速迭代 原型制作、测试
gemini-2.5-pro-image 平衡型 质量/速度均衡

步骤 4:生成与审查

# 生成 2-4 个变体
ask-gemini "创建一幅日落时分的宁静山脉景观,
  宽屏 16:9,极简风格,使用品牌蓝色 #2563EB 的柔和渐变"

# 通过改变单一变量进行迭代
ask-gemini "相同的提示词,但使用温暖的橙色色调"

审查清单

  • 品牌契合度
  • 构图清晰度
  • 比例准确性
  • 文本可读性(如果包含文本)

步骤 5:交付物

最终产出:

  • 最终图像文件
  • 提示词元数据记录
  • 模型、比例、使用说明
{
  "prompt": "日落时分的宁静山脉景观...",
  "model": "gemini-3-pro-image",
  "aspect_ratio": "16:9",
  "style": "minimal",
  "brand_colors": ["#2563EB"],
  "output_file": "hero-image-v1.png",
  "timestamp": "2026-01-21T10:30:00Z"
}

示例

示例 1:主视觉图

提示词

创建一幅日落时分的宁静山脉景观,
宽屏 16:9,极简风格,使用品牌蓝色 #2563EB 的柔和渐变。
注重简洁线条和现代美学。

预期输出

  • 16:9 主视觉图
  • 保存的提示词参数
  • 2-3 个备选变体供选择

示例 2:产品缩略图

提示词

生成一个 1:1 的未来感仪表盘用户界面缩略图,
界面简洁,柔和光照,专业感。
包含微妙的发光效果和深色主题。

预期输出

  • 1:1 方形图像
  • 视觉噪声低
  • 可用于应用商店

示例 3:社交媒体横幅

提示词

为一家软件即服务初创公司创建领英横幅 (1584x396)。
采用现代渐变背景,搭配抽象几何图形。
颜色:从 #6366F1 到 #8B5CF6。
左侧预留文本叠加区域。

预期输出

  • 针对领英优化的尺寸
  • 文本安全区域
  • 符合品牌的颜色

最佳实践

  1. 尽早指定比例:防止意外裁剪
  2. 使用风格锚点:保持一致的审美风格
  3. 带约束地迭代:一次只改变一个变量
  4. 记录提示词:确保可重现性
  5. 批量处理相似请求:生成一致的风格集

常见陷阱

  • 模糊的提示词:需要指定具体的风格和构图
  • 忽略尺寸限制:确认目标渠道的尺寸要求
  • 场景过于复杂:为清晰起见应简化

故障排除

问题:输出结果不一致

原因:缺少稳定的风格约束
解决方案:添加风格参考和固定调色板

问题:宽高比错误

原因:未指定比例或不支持该比例
解决方案:提供准确的比例后重新生成

问题:与品牌不符

原因:未指定颜色代码
解决方案:用十六进制代码明确品牌颜色


输出格式

## 图像生成报告

### 请求
- **提示词**:[完整提示词]
- **模型**:[使用的模型]
- **比例**:[宽高比]

### 输出文件
1. `filename-v1.png` - [描述]
2. `filename-v2.png` - [变体描述]

### 元数据
- 生成时间:[时间戳]
- 迭代次数:[计数]
- 最终选择:[最终选择的文件]

### 使用说明
[任何关于实施的说明]

多代理工作流

验证与回顾

  • 第一轮(协调者):提示词完整性,比例一致性
  • 第二轮(分析师):风格一致性,品牌契合度
  • 第三轮(执行者):输出文件名、交付清单验证

代理角色

代理 角色
Claude 提示词构建、质量验证
Gemini 执行图像生成
Codex 文件管理、批量处理

元数据

版本

  • 当前版本: 1.0.0
  • 最后更新: 2026-01-21
  • 兼容平台: Claude, ChatGPT, Gemini, Codex

相关技能

标签

#image-generation #gemini #mcp #design #creative #ai-art

📄 原始文档

完整文档(英文):

https://skills.sh/supercent-io/skills-template/image-generation-mcp

💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。