image-gen
使用 OpenAI、Google、DashScope 和 Replicate API 的 AI 图像生成。支持文本到图像、参考图像和纵横比。默认按顺序生成;如有需要可并行生成。用户请求生成、创建或绘制图像时使用。
分类
图像处理安装
热度:50
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=ginobefun-skills-image-gen&locale=zh&source=copy
Image-Gen - Claude AI 图片生成技能
技能概述
Image-Gen 是一个强大的 Claude 技能,让您通过对话直接调用多个 AI 图片生成 API,支持文本生成图片、参考图片编辑、批量生成等功能。
适用场景
1. 内容创作配图生成
快速为博客文章、社交媒体内容生成配图和封面图,支持多种宽高比和尺寸,适配不同平台需求。
2. 产品原型与素材制作
使用参考图片功能,基于现有素材生成变体或进行风格修改,快速迭代产品设计和营销物料。
3. 批量图片生产
一次性生成多张图片,适合需要大量视觉素材的场景,如批量生成商品展示图或测试数据图片。
核心功能
多提供商 API 集成
统一接口支持 OpenAI、Google Imagen、阿里通义万象(DashScope)和 Replicate 四大图片生成服务,根据需求灵活切换,无需分别学习各平台的调用方式。
智能图片配置
支持自定义宽高比(16:9、9:16、1:1 等)和质量预设(normal、2k),自动处理不同平台的尺寸差异,让生成的图片精确符合使用场景。
参考图片编辑
支持上传参考图片进行修改和再创作,兼容 Google 多模态模型和 OpenAI 编辑功能,适合需要对现有图片进行微调或风格迁移的场景。
常见问题
image-gen 支持哪些图片生成 API?
Image-Gen 集成了四个主流 AI 图片生成服务:OpenAI 的 GPT Image 模型、Google 的 Imagen 和 Gemini 多模态模型、阿里云的通义万象(DashScope),以及 Replicate 的开源模型生态。使用前需要配置相应的 API 密钥。
如何使用参考图片生成新图片?
使用 --ref 参数指定参考图片路径即可。例如:--ref source.png。参考图片功能支持 Google 的多模态模型(如 gemini-3-pro-image-preview)和 OpenAI 的图片编辑功能。系统会自动选择兼容的提供商,也可手动指定 --provider google 或 --provider openai。
怎么配置默认的图片生成模型?
通过创建 EXTEND.md 配置文件来设置默认选项。支持配置默认提供商、默认模型、默认质量、默认宽高比等。配置文件优先级为:CLI 参数 > EXTEND.md > 环境变量。首次使用时会引导完成配置流程,之后生成的图片会自动使用预设的模型和参数。