6B参数跑出Flux效果?Z-Image让我卸载了Midjourney

封面
封面

上周三凌晨1点,我在Discord看到有人发了一张图。

一个红发女孩坐在雪地里,阳光打在她脸上,皮肤的质感、头发的光泽、背景的虚化——我以为是Flux生成的。

然后那人说:”这是Z-Image,6B参数,8步就出图,我的3060跑的。”

我当时就愣住了。

被Midjourney”审核”到崩溃

我必须承认,过去半年我对在线AI工具的耐心已经耗尽了。

不是因为它们效果不好——Midjourney的效果确实惊艳。问题是,我永远不知道哪个提示词会触发它的”内容政策”。

上个月我想生成一组人体艺术参考图,用来做3D建模的姿态参考。结果呢?

“Your request has been blocked due to content policy violations.”

我甚至没写任何敏感词。就是”woman, sitting pose, studio lighting”这种最基础的描述。

我数了一下,过去三个月我被Midjourney拒绝了38次。平均每周3次。

每次被拒绝,我都要花10分钟猜测到底是哪个词触发了审核,然后像做阅读理解一样反复修改提示词。

这太荒谬了。

为什么是Z-Image?

那天晚上看到那张图之后,我花了20分钟下载模型,配置环境。

然后生成了第一张图。

8秒。

从点击”生成”到看到完整图片,8秒。

我以为是出bug了,放大一看——卧槽,质量完全不输Flux。

Z-Image生成效果1

皮肤的毛孔、头发的细节、眼睛的反光,全都有。而且更重要的是——

它完全运行在我的本地电脑上。

没有云端审核,没有使用记录,没有”内容政策”。

我可以生成任何我想生成的东西。

你懂的。

技术上凭什么这么强?

说实话,我一开始是不信的。6B参数就能打Flux?Flux可是12B啊。

于是我去查了技术论文。

原来Z-Image用了一个叫S3-DiT的架构——全称是Scalable Single-Stream Diffusion Transformer。

说人话就是:传统的扩散模型把”文本理解”和”图像生成”分成两个模块来处理,而Z-Image把它们合成了一个。

这样做的好处是:

  1. 1. 参数利用率更高——同样的计算量,能学到更多东西
  2. 2. 推理速度更快——因为不用在两个模块之间来回传数据
  3. 3. 对显存更友好——16GB就能跑

最让我震惊的是训练成本:整个模型只花了31.4万H800 GPU小时就训练完了,换算成钱大概63万美元。

要知道Stable Diffusion 3光训练就花了几千万美元。

Z-Image团队证明了一件事:不是模型越大越好,架构设计才是关键。

实际效果到底怎么样?

我用Z-Image跑了一周,生成了大概200多张图。

说说我的真实感受:

优点

  • • 人像质量极高,皮肤质感碾压Stable Diffusion
  • • 中英文提示词都支持,而且效果都很好
  • • 8步出图,速度是其他模型的3-5倍
  • • 16GB显存就能跑,我的3060完全够用

缺点

  • • 复杂场景的构图有时候会崩
  • • 多人图的手指偶尔还是会有问题(但比SD好多了)
  • • 对非常细节的指令理解有时候不够精确

Z-Image生成效果2

总体来说,日常用来生成人像、风景、产品图,Z-Image完全够用。

最重要的是——没人管你生成什么。

关于那个问题

说到这里,我知道你想问什么。

“这个模型…有什么限制吗?”

答案是:没有。

Z-Image是完全开源的,Apache 2.0协议,商用也没问题。模型权重、代码、训练流程全都公开。

而且它运行在你自己的电脑上。

没有云端服务器,没有使用日志,没有内容审核系统。

你的创作,你自己决定。

至于你打算用它来创作什么…你懂的。

Z-Image生成效果3

配置要求和部署

说说配置要求:

  • 显卡:16GB显存及以上(3060 12GB勉强能跑,但推荐3080/4060Ti以上)
  • 内存:32GB(推荐)
  • 硬盘:模型文件约12GB

部署非常简单,我已经把一键部署包准备好了,下载解压就能用。

包括:

  • • ComfyUI工作流
  • • 优化过的配置文件
  • • 详细的使用说明

最后

在这个AI审核越来越严格的时代,能够拥有一款完全运行在本地的、没有任何限制的图像生成工具,是一种奢侈。

也是一种自由。

如果你也受够了”内容政策违规”的提示,如果你也想要一个属于自己的创作空间——

你知道该怎么做。

下载链接:https://xueshu.fun/


技术是中立的。关键在于使用它的人。

 

会员分体验会员和永久会员,都可以免费下载本站所有课程软件等资源。

体验会员状态的刷新时间为北京时间上午8:00。AI软件下载后可以永久使用,与会员有效期无关。

本站所有资源支持免费更新,具体规则如下:

  • 登录后单独购买的资源,可以永久免费更新,无时间限制
  • 购买体验会员的用户,在会员到期后,下载的内容将无法继续获得更新
  • 购买永久会员的用户,可以永久免费更新,无时间限制

由于商品的特殊性,本站不支持退款,所以在开通会员之前,请确认你的需求。如果不放心,可以开通体验会员体验,满意再升级其他会员套餐。

从2019年开始已经运行3年多时间,诚信经营,会员过万,所有数据均有3级容灾备份,不存在安全问题。

碰到问题可优先查看文章教程。AI软件相关问题,请先检查自己机器是否为N卡,除非特别注明支持A卡或者CPU,一般默认只支持N卡运行,有些软件需要安装 CUDA 才能运行,请参考CUDA安装教程。其他售前售后问题请添加学术Fun公众号,站长每天上午8-9点,晚上7-8点时间段统一回复解决问题,其他时间看到留言也会第一时间解决。