image-gen

使用 OpenAI、Google、DashScope 和 Replicate API 的 AI 图像生成。支持文本到图像、参考图像和纵横比。默认按顺序生成;如有需要可并行生成。用户请求生成、创建或绘制图像时使用。

安装

热度:50

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=ginobefun-skills-image-gen&locale=zh&source=copy

Image-Gen - Claude AI 图片生成技能

技能概述


Image-Gen 是一个强大的 Claude 技能,让您通过对话直接调用多个 AI 图片生成 API,支持文本生成图片、参考图片编辑、批量生成等功能。

适用场景

1. 内容创作配图生成


快速为博客文章、社交媒体内容生成配图和封面图,支持多种宽高比和尺寸,适配不同平台需求。

2. 产品原型与素材制作


使用参考图片功能,基于现有素材生成变体或进行风格修改,快速迭代产品设计和营销物料。

3. 批量图片生产


一次性生成多张图片,适合需要大量视觉素材的场景,如批量生成商品展示图或测试数据图片。

核心功能

多提供商 API 集成


统一接口支持 OpenAI、Google Imagen、阿里通义万象(DashScope)和 Replicate 四大图片生成服务,根据需求灵活切换,无需分别学习各平台的调用方式。

智能图片配置


支持自定义宽高比(16:9、9:16、1:1 等)和质量预设(normal、2k),自动处理不同平台的尺寸差异,让生成的图片精确符合使用场景。

参考图片编辑


支持上传参考图片进行修改和再创作,兼容 Google 多模态模型和 OpenAI 编辑功能,适合需要对现有图片进行微调或风格迁移的场景。

常见问题

image-gen 支持哪些图片生成 API?

Image-Gen 集成了四个主流 AI 图片生成服务:OpenAI 的 GPT Image 模型、Google 的 Imagen 和 Gemini 多模态模型、阿里云的通义万象(DashScope),以及 Replicate 的开源模型生态。使用前需要配置相应的 API 密钥。

如何使用参考图片生成新图片?

使用 --ref 参数指定参考图片路径即可。例如:--ref source.png。参考图片功能支持 Google 的多模态模型(如 gemini-3-pro-image-preview)和 OpenAI 的图片编辑功能。系统会自动选择兼容的提供商,也可手动指定 --provider google--provider openai

怎么配置默认的图片生成模型?

通过创建 EXTEND.md 配置文件来设置默认选项。支持配置默认提供商、默认模型、默认质量、默认宽高比等。配置文件优先级为:CLI 参数 > EXTEND.md > 环境变量。首次使用时会引导完成配置流程,之后生成的图片会自动使用预设的模型和参数。