2026/5/18 13:46:07
网站建设
项目流程
宁夏网站建设中,广西住建厅八大员报名网站,线上营销的优势,网络工程师免费教程Qwen-Image-Layered快速入门#xff1a;一张图变多个可编辑图层
1. 简介
我们很高兴推出 Qwen-Image-Layered 模型#xff0c;该模型能够将图像分解为多个 RGBA 图层。这种分层表示方式解锁了内在可编辑性#xff1a;每个图层可以独立操作而不会影响其他内容。通过将语义或…Qwen-Image-Layered快速入门一张图变多个可编辑图层1. 简介我们很高兴推出Qwen-Image-Layered模型该模型能够将图像分解为多个 RGBA 图层。这种分层表示方式解锁了内在可编辑性每个图层可以独立操作而不会影响其他内容。通过将语义或结构组件物理隔离到不同图层中我们的方法实现了高保真且一致的图像编辑。与传统图像编辑依赖于蒙版、图层猜测或全局修改不同Qwen-Image-Layered 提供了一种自动生成、语义感知的图层分解机制使得图像中的对象在像素层面被分离从而支持精准、无损的操作。无论是重新着色、移动、缩放还是替换对象所有操作都可在独立图层上完成避免对背景或其他元素造成干扰。此外该模型天然支持多种基础图像操作✅重新着色Recoloring✅重新定位Repositioning✅调整大小Resizing✅对象删除与替换这一能力为设计工具、内容创作平台和自动化视觉生成系统提供了强大的底层支持。2. 快速开始2.1 环境准备在使用 Qwen-Image-Layered 前请确保满足以下环境要求Python ≥ 3.10PyTorch ≥ 2.3Transformers ≥ 4.51.3支持 Qwen2.5-VLDiffusers 最新版本需从源码安装执行以下命令安装依赖pip install githttps://github.com/huggingface/diffusers pip install python-pptx注意由于Qwen-Image-Layered尚未发布至 PyPI必须从 Hugging Face Hub 加载预训练权重。2.2 启动 ComfyUI可选若您希望通过可视化界面操作可启动内置的 ComfyUI 服务cd /root/ComfyUI/ python main.py --listen 0.0.0.0 --port 8080访问http://your-server-ip:8080即可进入图形化工作流界面支持拖拽式图层处理与实时预览。3. 核心功能实现3.1 图像分解为多图层使用QwenImageLayeredPipeline可轻松将输入图像分解为指定数量的 RGBA 图层。以下是完整代码示例from diffusers import QwenImageLayeredPipeline import torch from PIL import Image # 加载模型 pipeline QwenImageLayeredPipeline.from_pretrained(Qwen/Qwen-Image-Layered) pipeline pipeline.to(cuda, torch.bfloat16) pipeline.set_progress_bar_config(disableNone) # 输入图像 image Image.open(asserts/test_images/1.png).convert(RGBA) # 配置参数 inputs { image: image, generator: torch.Generator(devicecuda).manual_seed(777), true_cfg_scale: 4.0, negative_prompt: , num_inference_steps: 50, num_images_per_prompt: 1, layers: 4, # 分解为4个图层 resolution: 640, # 推荐使用640分辨率桶 cfg_normalize: True, # 启用CFG归一化 use_en_prompt: True, # 自动生英文提示词 } # 执行推理 with torch.inference_mode(): output pipeline(**inputs) layered_images output.images[0] # List[PIL.Image] # 保存各图层 for i, layer_img in enumerate(layered_images): layer_img.save(flayer_{i}.png)参数说明参数说明layers指定输出图层数量建议3~8resolution输入分辨率影响细节保留程度true_cfg_scale控制生成保真度值越高越贴近原图cfg_normalize是否启用条件引导归一化提升稳定性use_en_prompt若未提供 prompt是否自动补全英文描述3.2 图层编辑实践一旦获得分离后的图层即可进行精细化编辑。以下展示几个典型应用场景。场景一独立重着色假设第0层为人脸皮肤区域我们希望将其肤色调整为暖色调from PIL import ImageEnhance # 加载目标图层 skin_layer Image.open(layer_0.png).convert(RGBA) # 增强饱和度与色相偏移 enhancer ImageEnhance.Color(skin_layer) warm_skin enhancer.enhance(1.5) # 提升饱和度 # 保存并用于合成 warm_skin.save(edited_layer_0.png)其余图层保持不变最终通过 Alpha 混合重新合成即可得到自然结果。场景二对象替换结合 Qwen-Image-Edit若第二层为文本“Hello”我们想替换为“Qwen-Image”from diffusers import QwenImageEditPipeline edit_pipeline QwenImageEditPipeline.from_pretrained(Qwen/Qwen-Image-Edit) edited_text_layer edit_pipeline( imageImage.open(layer_2.png), promptchange text to Qwen-Image, ).images[0]替换后仍保留原始透明通道信息无缝集成回整体画面。场景三自由移动与缩放利用 PIL 或 OpenCV 对单个图层进行仿射变换from PIL import Image, ImageTransform # 移动图层平移 dx50, dy30 translated layer_img.transform(layer_img.size, Image.AFFINE, (1, 0, 50, 0, 1, 30), resampleImage.BILINEAR)由于图层已分离变换过程不会破坏背景纹理或边缘融合效果。4. 应用案例详解4.1 分层解构效果展示给定一张复杂场景图像Qwen-Image-Layered 能自动识别并分离出主要语义对象模型输出四个图层分别对应Layer 0前景人物Layer 1背景文字Layer 2装饰图案Layer 3阴影与渐变底纹每个图层均为带 Alpha 通道的 PNG 文件支持透明叠加。4.2 编辑一致性保障传统编辑常因遮挡关系或光照不一致导致拼接痕迹明显。而基于图层分解的方法从根本上解决了这一问题。例如仅对首层进行重新着色可见颜色变化仅作用于目标区域且边缘过渡自然无色彩溢出或边界断裂现象。再如将女孩替换为男孩使用 Qwen-Image-Edit 编辑第二层尽管主体发生变化但光照方向、投影角度和背景融合依然保持高度一致。4.3 基础操作支持删除不需要的对象直接丢弃某个图层即可实现无痕删除# 删除第2层装饰图案 final_composite Image.alpha_composite( Image.alpha_composite(background, layer0), layer1 ) # 跳过 layer2结果如下图所示无失真缩放对图层单独放大/缩小避免插值模糊影响整体质量自由移动对象在画布内任意拖动图层位置实现布局重构5. 高级特性灵活与递归分层5.1 可变图层数支持Qwen-Image-Layered 支持动态设置图层数量适应不同复杂度需求简单图像 → 3 层足够复杂海报 → 可设为 8 层以上inputs[layers] 8 output pipeline(**inputs)更多图层意味着更细粒度的控制但也可能增加合成复杂度。5.2 递归分解机制任何已分解的图层本身也可作为输入再次分解实现“图层中的图层”sub_pipeline QwenImageLayeredPipeline.from_pretrained(Qwen/Qwen-Image-Layered) sub_input {image: Image.open(layer_0.png), layers: 3} sub_layers sub_pipeline(**sub_input).images[0]此机制适用于需要深度编辑的局部区域如人脸五官拆分、车辆部件细化等。可视化效果如下6. 许可与引用6.1 开源许可Qwen-Image-Layered 采用Apache 2.0开源许可证允许商业用途、修改与分发无需支付版权费用。更多详情请查阅 LICENSE6.2 学术引用如果您在研究工作中使用了本模型建议引用以下论文misc{yin2025qwenimagelayered, title{Qwen-Image-Layered: Towards Inherent Editability via Layer Decomposition}, author{Shengming Yin, Zekai Zhang, Zecheng Tang, Kaiyuan Gao, Xiao Xu, Kun Yan, Jiahao Li, Yilei Chen, Yuxiang Chen, Heung-Yeung Shum, Lionel M. Ni, Jingren Zhou, Junyang Lin, Chenfei Wu}, year{2025}, eprint{2512.15603}, archivePrefix{arXiv}, primaryClass{cs.CV}, url{https://arxiv.org/abs/2512.15603}, }7. 总结Qwen-Image-Layered 代表了图像编辑范式的一次重要演进——从“全局修改”走向“分层可控”。其核心价值体现在三个方面内在可编辑性通过语义驱动的图层分解实现对象级独立操作。高保真基础操作支持无损缩放、自由移动、精准重着色显著提升编辑质量。工程友好性提供标准 Pipeline 接口易于集成至现有 AI 绘画、设计软件或自动化流程中。未来随着递归分解、跨图层约束传播等能力的完善Qwen-Image-Layered 有望成为下一代智能图像编辑系统的基础设施。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。