🎨
图片生成工具
AI 工具📦 安装使用
$ npx skills add @cjh0509code-png/skills --skill image-gen-skill
安装后在 Claude Code 中输入 /image-gen-skill 即可激活该 Skill。
📋 详细说明
image-gen — Claude Code 图片生成 Skill
在 Claude Code 中直接生成 AI 图片。支持火山引擎、阿里百炼、Google Gemini、Azure OpenAI 四大供应商,自动将任意描述/文档内容转为适合图片模型的详细英文提示词。
前置要求
- Claude Code 已安装
- Node.js 18+(
node --version确认) - 至少一个供应商的 API Key
安装
1. 安装 Skill
npx skills add cjh0509code-png/Skills --skill image-gen-skill
2. 配置 API Key(至少一个,可以同时配置多个)
编辑 ~/.claude/settings.json:
{
"env": {
"ARK_API_KEY": "your-volcengine-key",
"DASHSCOPE_API_KEY": "sk-your-dashscope-key",
"GEMINI_API_KEY": "AIza-your-gemini-key",
"AZURE_OPENAI_KEY": "your-azure-key",
"AZURE_OPENAI_ENDPOINT": "https://your-resource.openai.azure.com"
}
}
配置多个 Key 后,可用 --provider 随时切换供应商,无需改配置。
3. 重启 Claude Code
供应商与 API Key 获取
| 供应商 | 环境变量 | 获取地址 |
|---|---|---|
| 火山引擎(volcengine_maas) | ARK_API_KEY | console.volcengine.com/ark |
| 阿里百炼(tongyi) | DASHSCOPE_API_KEY | bailian.console.aliyun.com |
| Google Gemini(vertex_ai) | GEMINI_API_KEY | aistudio.google.com/apikey |
| Azure OpenAI(azure_openai) | AZURE_OPENAI_KEY + AZURE_OPENAI_ENDPOINT | portal.azure.com |
使用方法
基础生成
/image-gen 一只在草地上奔跑的柯基犬
Claude 会自动将中文描述转为详细的英文提示词,再调用图片模型生成。
从文件内容生成配图
/image-gen --from src/posts/react-performance.md
Claude 读取文件内容,分析主题和风格,自动生成适合该内容的配图提示词,再生成图片。
指定供应商
/image-gen a futuristic city --provider tongyi
指定保存位置
/image-gen 科技感十足的程序员 --save-dir public/images --filename programmer
查看配置状态
/image-gen --config
输出示例:
=== image-gen 配置状态 ===
[volcengine_maas] ✅ 已配置
Key: ARK_API_KEY | Endpoint: https://ark.cn-beijing.volces.com
[tongyi] ❌ 未配置
Key: DASHSCOPE_API_KEY | Endpoint: https://dashscope.aliyuncs.com
...
参数说明
| 参数 | 默认值 | 说明 |
|---|---|---|
<描述> | 必填 | 自然语言描述,支持中英文 |
--from <路径> | — | 读取文件内容作为生成依据 |
--provider | 自动(首个已配置) | volcengine_maas / tongyi / vertex_ai / azure_openai |
--model | 供应商默认 | 见下表 |
--size | 供应商默认 | volcengine_maas 最小 2048×2048 |
--save-dir | 当前目录 | 相对或绝对路径,自动创建 |
--filename | image-{时间戳} | 不含扩展名 |
各供应商默认值
| 供应商 | 默认模型 | 默认尺寸 | 最小尺寸 |
|---|---|---|---|
| volcengine_maas | Doubao-Seedream-3.0 | 2048×2048 | 2048×2048 |
| tongyi | wanx2.1-t2i-turbo | 1024×1024 | 512×512 |
| vertex_ai | gemini-2.0-flash-preview-image-generation | 模型自适应 | — |
| azure_openai | gpt-image-1 | 1024×1024 | 256×256 |
提示词自动优化
无论用户输入什么(简单描述、文档内容、中文),skill 都会先将其转为结构化的详细英文提示词:
[风格/质量] [主体] [动作/状态] [场景/背景] [光线/色彩] [构图] [技术参数]
示例:
- 输入:
一只猫 - 优化后:
a fluffy orange tabby cat sitting gracefully on a wooden windowsill, warm afternoon sunlight, shallow depth of field, photorealistic, 8k detail, no text, no watermark
常见问题
Q:多个供应商 Key 都配置了,哪个会被使用?
未指定 --provider 时,按 volcengine_maas → tongyi → vertex_ai → azure_openai 顺序选第一个已配置的。
Q:火山引擎生成报错"尺寸太小"?
火山引擎最小 2048×2048,skill 会自动调整,无需手动设置。
Q:图片保存在哪里?
默认保存到 Claude Code 的当前工作目录(你打开的项目根目录)。用 --save-dir 指定其他位置。
Q:--from 支持什么格式的文件?
任意文本文件(.md、.txt、.html 等),Claude 读取后分析内容生成配图。
文件说明
image-gen-skill/
├── SKILL.md # Claude Code skill,复制到 ~/.claude/skills/image-gen/ 使用
└── README.md # 本文档
