🚀 快速安装
复制以下命令并运行,立即安装此 Skill:
npx @anthropic-ai/skills install supercent-io/skills-template/image-generation-mcp
💡 提示:需要 Node.js 和 NPM
通过 MCP 进行图像生成
这是一项通过 MCP 进行人工智能图像生成的技能。使用 Gemini 模型或兼容服务,为营销、用户界面、演示文稿生成高质量图像。
何时使用此技能
- 营销素材:主视觉图、横幅、社交媒体内容
- UI/UX 设计:占位图像、图标、插画
- 演示文稿:幻灯片背景、产品可视化
- 品牌一致性:基于风格指南的图像生成
操作说明
步骤 1:配置 MCP 环境
# 确认 MCP 服务器设置
claude mcp list
# 确认 Gemini 命令行界面是否可用
# 必须安装 gemini-cli
必需设置:
- 模型名称 (gemini-2.5-flash, gemini-3-pro 等)
- 应用程序编程接口密钥引用(保存为环境变量)
- 输出目录
步骤 2:定义提示词
编写结构化提示词:
**主体**:[主要被摄对象]
**风格**:[风格 - 极简、插画、照片风格、3D 等]
**光照**:[光照 - 自然光、摄影棚光、黄金时刻等]
**氛围**:[氛围 - 平静、动感、专业等]
**构图**:[构图 - 居中布局、三分法等]
**宽高比**:[比例 - 16:9, 1:1, 9:16]
**品牌颜色**:[品牌颜色限制]
步骤 3:选择模型
| 模型 | 用途 | 特点 |
|---|---|---|
gemini-3-pro-image |
高质量 | 复杂构图,细节丰富 |
gemini-2.5-flash-image |
快速迭代 | 原型制作、测试 |
gemini-2.5-pro-image |
平衡型 | 质量/速度均衡 |
步骤 4:生成与审查
# 生成 2-4 个变体
ask-gemini "创建一幅日落时分的宁静山脉景观,
宽屏 16:9,极简风格,使用品牌蓝色 #2563EB 的柔和渐变"
# 通过改变单一变量进行迭代
ask-gemini "相同的提示词,但使用温暖的橙色色调"
审查清单:
- 品牌契合度
- 构图清晰度
- 比例准确性
- 文本可读性(如果包含文本)
步骤 5:交付物
最终产出:
- 最终图像文件
- 提示词元数据记录
- 模型、比例、使用说明
{
"prompt": "日落时分的宁静山脉景观...",
"model": "gemini-3-pro-image",
"aspect_ratio": "16:9",
"style": "minimal",
"brand_colors": ["#2563EB"],
"output_file": "hero-image-v1.png",
"timestamp": "2026-01-21T10:30:00Z"
}
示例
示例 1:主视觉图
提示词:
创建一幅日落时分的宁静山脉景观,
宽屏 16:9,极简风格,使用品牌蓝色 #2563EB 的柔和渐变。
注重简洁线条和现代美学。
预期输出:
- 16:9 主视觉图
- 保存的提示词参数
- 2-3 个备选变体供选择
示例 2:产品缩略图
提示词:
生成一个 1:1 的未来感仪表盘用户界面缩略图,
界面简洁,柔和光照,专业感。
包含微妙的发光效果和深色主题。
预期输出:
- 1:1 方形图像
- 视觉噪声低
- 可用于应用商店
示例 3:社交媒体横幅
提示词:
为一家软件即服务初创公司创建领英横幅 (1584x396)。
采用现代渐变背景,搭配抽象几何图形。
颜色:从 #6366F1 到 #8B5CF6。
左侧预留文本叠加区域。
预期输出:
- 针对领英优化的尺寸
- 文本安全区域
- 符合品牌的颜色
最佳实践
- 尽早指定比例:防止意外裁剪
- 使用风格锚点:保持一致的审美风格
- 带约束地迭代:一次只改变一个变量
- 记录提示词:确保可重现性
- 批量处理相似请求:生成一致的风格集
常见陷阱
- 模糊的提示词:需要指定具体的风格和构图
- 忽略尺寸限制:确认目标渠道的尺寸要求
- 场景过于复杂:为清晰起见应简化
故障排除
问题:输出结果不一致
原因:缺少稳定的风格约束
解决方案:添加风格参考和固定调色板
问题:宽高比错误
原因:未指定比例或不支持该比例
解决方案:提供准确的比例后重新生成
问题:与品牌不符
原因:未指定颜色代码
解决方案:用十六进制代码明确品牌颜色
输出格式
## 图像生成报告
### 请求
- **提示词**:[完整提示词]
- **模型**:[使用的模型]
- **比例**:[宽高比]
### 输出文件
1. `filename-v1.png` - [描述]
2. `filename-v2.png` - [变体描述]
### 元数据
- 生成时间:[时间戳]
- 迭代次数:[计数]
- 最终选择:[最终选择的文件]
### 使用说明
[任何关于实施的说明]
多代理工作流
验证与回顾
- 第一轮(协调者):提示词完整性,比例一致性
- 第二轮(分析师):风格一致性,品牌契合度
- 第三轮(执行者):输出文件名、交付清单验证
代理角色
| 代理 | 角色 |
|---|---|
| Claude | 提示词构建、质量验证 |
| Gemini | 执行图像生成 |
| Codex | 文件管理、批量处理 |
元数据
版本
- 当前版本: 1.0.0
- 最后更新: 2026-01-21
- 兼容平台: Claude, ChatGPT, Gemini, Codex
相关技能
标签
#image-generation #gemini #mcp #design #creative #ai-art
📄 原始文档
完整文档(英文):
https://skills.sh/supercent-io/skills-template/image-generation-mcp
💡 提示:点击上方链接查看 skills.sh 原始英文文档,方便对照翻译。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)