Qwen-Image 是一个拥有 20B 参数的 MMDiT(多模态扩散变换器)模型,基于 Apache 2.0 许可证开源。
使用模型 | VRAM Usage | 首次生成 | 第二次生成 |
---|---|---|---|
fp8_e4m3fn | 86% | ≈ 94s | ≈ 71s |
fp8_e4m3fn 使用 lightx2v 8步 LoRA | 86% | ≈ 55s | ≈ 34s |
蒸馏版 fp8_e4m3fn | 86% | ≈ 69s | ≈ 36s |
下载官方版 JSON 格式工作流
蒸馏版下载蒸馏版JSON 格式工作流
Load Diffusion Model
节点加载了qwen_image_fp8_e4m3fn.safetensors
Load CLIP
节点中加载了qwen_2.5_vl_7b_fp8_scaled.safetensors
Load VAE
节点中加载了qwen_image_vae.safetensors
EmptySD3LatentImage
节点中设置好了图片的尺寸CLIP Text Encoder
节点中设置好提示词,目前经过测试目前至少支持:英语、中文、韩语、日语、意大利语等Ctrl + B
启用该节点,并按 序号8
处的设置参数修改 Ksampler 的设置设置Queue
按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车)
来运行工作流