楼主: 月21
1903 0

[其他] Z-Image在windows系统中部署方法(精要总结教程) [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

80%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
1.6897
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
130 点
帖子
2
精华
0
在线时间
0 小时
注册时间
2018-5-30
最后登录
2018-5-30

楼主
月21 发表于 2025-12-8 16:31:07 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Z-Image模型部署与使用指南

Z-Image是由阿里最新推出的开源文生图大模型,具备较高的图像生成质量,同时对显存占用相对较低。本人使用的设备为搭载NVIDIA RTX 5060 Ti(16G)显卡的电脑,在采用z_image_turbo_bf16模型的情况下,生成分辨率为1024*1024的图像耗时约为30秒。本文末尾附有Z-Image生成图与商业级生图模型的效果对比图。

整体技术架构由以下三部分构成:

  • Anaconda:作为Python环境管理平台
  • ComfyUI:提供可视化操作界面
  • Z-Image模型:承担核心图像生成逻辑

安装与配置流程

1. Anaconda 安装(可选)

此步骤非强制要求,主要用于更高效地管理Python运行环境。若不打算使用Anaconda,可跳过本步。

如需安装,请前往Anaconda官网下载对应操作系统的安装包。安装过程较为直观,若遇问题可通过搜索引擎查询解决方案。

2. CUDA 驱动配置

CUDA版本说明:此前我尝试安装了CUDA 13.1版本,但在运行时发现PyTorch无法识别GPU,始终报错且未找到根本原因。最终卸载后重装为CUDA 12.8版本,问题得以解决。

建议直接下载并安装CUDA 12.8:

访问CUDA官网,定位至CUDA 12.8下载页面,选择匹配的操作系统和硬件环境进行安装包获取。安装流程简单,如有疑问可参考网络教程。此处已准备跳转链接:

下载cuda 12.8程序

验证安装结果:执行如下命令检查CUDA是否正确安装并被系统识别:

nvcc --version

3. ComfyUI 下载与解压

从GitHub获取ComfyUI压缩包,并将其解压至本地指定目录。由于后续模型文件也将存放于此路径下,建议预留充足存储空间。

项目文件体积较小,通常网络条件下下载顺畅,无需特殊工具。亦可通过下方链接快速获取:

ComfyUI压缩包

4. 模型文件下载

需准备以下三个关键模型文件。主模型推荐使用高精度版本以获得更优画质;若追求速度,也可选用低精度版本。

文件名 功能说明 存放路径(相对于ComfyUI根目录) 下载地址
qwen_3_4b.safetensors 文本编码器(CLIP) ComfyUI/
├── models/
│ ├── text_encoders/
下载链接
ae.safetensors VAE 解码器 ComfyUI/
├── models/
│ ├── vae/
下载链接
z_image_turbo_bf16.safetensors 主模型(diffusion_models) ComfyUI/
├── models/
│ ├── diffusion_models
下载链接

5. Conda 环境配置

配置国内镜像源:因国际网络限制,conda默认源下载组件较慢。建议进入conda后配置清华镜像源以提升效率。

conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
# 设置搜索时显示通道地址
conda config --set show_channel_urls yes

创建独立Python环境:在conda中依次执行以下命令以建立专属运行环境。

conda create -n zImage python=3.10
conda activate zImage

安装ComfyUI依赖库:将终端路径切换至ComfyUI所在目录,通过requirements.txt安装所需依赖包。建议提前编辑该文件,移除其中的torch、torchvision和torchaudio条目,以便后续手动安装指定版本。

示例:假设ComfyUI位于E盘根目录,则在名为zImage的conda环境中执行相应指令。

cd E:\ComfyUI
pip install -r requirements.txt

安装PyTorch及相关组件:截至2025年12月7日,pytorch.org官网访问稳定,相关组件可在5分钟内完成下载与安装。继续执行以下命令:

pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu128

检测PyTorch是否成功调用CUDA:该步骤至关重要,若失败则后续所有操作均无法正常运行。

#在conda窗口中输入:python,进入到python编辑界面。

import torch
print("CUDA 可用:", torch.cuda.is_available())

#查看执行结果,如果为TRUE,则torch和cuda安装成功,为FALSE,则安装失败,需检查安装步骤。
#退出python编辑界面命令:exit()

6. 启动与使用 ComfyUI

启动服务:在conda环境中运行指定命令,待程序加载完成后,打开浏览器访问以下地址即可进入操作界面:

http://127.0.0.1:8188/

python main.py

加载预设工作流:在ComfyUI界面中选择“z-image-Turbo文生图”工作流。若提示缺少模型文件,请核对各模型是否放置于正确的子目录中,或考虑重新下载缺失文件。

开始生成图像:在工作流输入框中填写提示词(prompt),点击“运行”按钮即可生成图像。如需批量输出多张图片,可修改运行按钮旁的数值设定。

7. Z-Image 与 商业模型生图效果对比

以下是使用相同提示词条件下,Z-Image与某商业生图模型的输出效果对比(附带所用提示词):

《疯狂动物城》原版3D动画风格,狐狸尼克与兔子朱迪并肩趴在积雪的青绿色栅栏上: - 动物动作:尼克歪头看向朱迪,嘴角带笑(耳尖、鼻尖落着雪花),前爪搭在栅栏上;朱迪仰头睁着圆眼和尼克对视,表情雀跃,前爪也搭在栅栏上; - 发饰/首饰:朱迪头戴蓝色针织帽,帽顶有蓝橙格纹蝴蝶结+毛球装饰;无额外首饰; - 服装:尼克穿黄色上衣,搭配黄绿格纹围巾;朱迪穿蓝色上衣,搭配蓝红格纹围巾; - 背景:冬日雪夜,天空飘着清晰的雪花,后方是行驶的黄色动物城巴士(车身带灯光),右侧有绿底白字的“Saint”路牌(路牌杆落雪),远处可见覆雪的树木与暖黄色街灯光斑; - 氛围感:温馨治愈的冬日街头风,色调以蓝(天空/服饰)、黄(巴士/上衣)、青(栅栏)、白(雪花)为主,暖光街灯增添柔和感; - 风格:迪士尼《疯狂动物城》官方3D动画质感,角色建模1:1还原(尼克毛发蓬松带雪粒光泽、朱迪面部微表情生动),细节细腻(雪花纹理、围巾褶皱、巴士车窗反光),光影是动画电影级的柔和暖调。
大面积留白,极简风格,鲜明色彩,反差感,极致视觉冲击力,远景,最佳艺术构图,设计感极强,大师作品,景深,远景视角里一个小小的人举着萤火灯在夏夜穿梭,蓝色、荧黄,渐变晕染,动态,渐变,神秘感,捕捉丰富的空间细节,精准的光影调度,创意手写文字“只有你才是自己的引路人”,小字内容“Only you can be your own guide.”,电影海报设计,大师级排版!
帮我生成图片:写真风,质感光照,自然光线,质感十足,摄影风格,现代写实的高清手绘线条插画,仿真人效果,笔触细腻,线条柔和流畅,线条轮廓清晰可见,人物渲染立体,32k超高清画质。夜晚城市街道,女孩梳着精致的发髻,风起头发飘动,皮肤白皙,水嫩光感透亮且富有光泽,细长的眉毛,大而明亮的眼睛带着忧郁伤感的眼神,高挺的鼻梁,红润饱满的帆船唇,佩戴银色耳钉和项链,穿着穿着浅红色珊瑚绒绒睡袍,长相甜美,优雅漂亮,气质超人,天生丽质,高级脸,五官精致,绝世美女,女子脸上挂着泪痕,和对面黑色外套男子在说话,俩人稍微远一点,为人物上半身照。写实精致风,仿电影真实质感,比例 9:16。

总结

Z-Image作为一款开源文生图模型,已展现出强大的基础绘图能力与良好的实用性。尽管在某些特定场景下的表现略逊于成熟的商业模型,但推测这一差距主要源于提示词设计的精细化程度不足——本次测试所使用的提示词源自商业模型已有配置,并未针对Z-Image做专门优化。未来可通过深入调整提示词结构与细节描述,进一步释放其潜在性能。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Windows Window image wind ima

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群
GMT+8, 2026-1-10 18:35