Image-Gen

技能概述

Image-Gen 是一个强大的 Claude 技能，让您通过对话直接调用多个 AI 图片生成 API，支持文本生成图片、参考图片编辑、批量生成等功能。

适用场景

1. 内容创作配图生成

快速为博客文章、社交媒体内容生成配图和封面图，支持多种宽高比和尺寸，适配不同平台需求。

2. 产品原型与素材制作

使用参考图片功能，基于现有素材生成变体或进行风格修改，快速迭代产品设计和营销物料。

3. 批量图片生产

一次性生成多张图片，适合需要大量视觉素材的场景，如批量生成商品展示图或测试数据图片。

核心功能

多提供商 API 集成

统一接口支持 OpenAI、Google Imagen、阿里通义万象（DashScope）和 Replicate 四大图片生成服务，根据需求灵活切换，无需分别学习各平台的调用方式。

智能图片配置

支持自定义宽高比（16:9、9:16、1:1 等）和质量预设（normal、2k），自动处理不同平台的尺寸差异，让生成的图片精确符合使用场景。

参考图片编辑

支持上传参考图片进行修改和再创作，兼容 Google 多模态模型和 OpenAI 编辑功能，适合需要对现有图片进行微调或风格迁移的场景。

常见问题

image-gen 支持哪些图片生成 API？

Image-Gen 集成了四个主流 AI 图片生成服务：OpenAI 的 GPT Image 模型、Google 的 Imagen 和 Gemini 多模态模型、阿里云的通义万象（DashScope），以及 Replicate 的开源模型生态。使用前需要配置相应的 API 密钥。

如何使用参考图片生成新图片？

使用 --ref 参数指定参考图片路径即可。例如：--ref source.png。参考图片功能支持 Google 的多模态模型（如 gemini-3-pro-image-preview）和 OpenAI 的图片编辑功能。系统会自动选择兼容的提供商，也可手动指定 --provider google 或 --provider openai。

怎么配置默认的图片生成模型？

通过创建 EXTEND.md 配置文件来设置默认选项。支持配置默认提供商、默认模型、默认质量、默认宽高比等。配置文件优先级为：CLI 参数 > EXTEND.md > 环境变量。首次使用时会引导完成配置流程，之后生成的图片会自动使用预设的模型和参数。

作者

分类

安装

Image-Gen - Claude AI 图片生成技能