这几天刚推出的模型“flux”被热烈讨论,因为它的画质效果很好,并且是免费开源的,所以很多人都在考虑,是否要退订Midjourney。本文就来实测一下,看看这个flux,到底有没有传说的那么强?和Midjourney的V6 版本对比,表现如何?
这是flux官方推出的效果图展示。
人物质感细腻,画质精美。
画手特别强,多人,多脸,多手,都完美还原结构。
整体画面质感、创意,都在水准之上。
flux是由一个“名不见经传”的团队“黑森林”组成,相信大家都没有听说这个名字,但是他们实际上大有来头。他们就是之前从sd团队出走的核心成员再组建的新团队,因此技术实力非常强劲,flux模型一经推出,就引起AIGC圈内的热烈讨论。
flux目前推出了 3 种版本。分别是pro专业版、dev开发版(标准版)、schnell(高速版)。
其中专业版是不开源的,只能通过api访问,也不能下载到本地使用。开发版开源、可下载,但是不能商用。而高速版可以理解为是开发版的简化,在Apache2 的许可下,可以商用。
本次测试,用的是开发版,平台使用的是LIbLibAI(在线出图已支持flux)。
本次测试主要从 3 个维度切入:画面质感、画手能力、提示词还原度(文本还原度)。
测试案例:摄影图、森林中的猞猁。
左边是flux的效果,右边是MJ的V6. 1 效果。flux的效果还是相当惊艳的,画面质感、美学程度都相当成熟。几乎到了可以和Midjourney扳一扳手腕的程度。
flux宣称在人体结构(也就是画手能力)上做出了突破。众所周知,画手一直是AI绘画的痛点,手部结构的复杂和变化,经常让AI“露馅”,也是MJ的一大短板。我们用同一组提示词,分别在flux和MJ-V6 都出 4 张图,来实际对比一下效果。
从结果上来看,flux出的 4 张图,除了图三没有出现手,剩余三张,只要出现了手,手的结构都很准确,没有出现任何问题,这点还是非常厉害的。但也有一个问题,就是对提示词的遵从度不够,明明要求画面中是 3 个人,并且对着镜头,但都没有做到。
用MJ的V6 出图,画面整体是比较准确的,三个人,对着镜头。但是细节就不太行了,尤其是手的细节。
多指、错乱,这些问题,还是比较高发的。
最后测试一下文字还原能力,目标是让“doo”的字样,出现在显示屏上。
flux的正确率差不多落在一半。
MJ的正确率明显更高一些。
flux的视觉效果还是相当惊艳的,甚至看上去有希望追平MJ。flux的画手能力也着实厉害,似乎对于手的修正已经在现实层面上得到了突破,这点是超越MJ的。最后对于文字的还原上,还是老大哥MJ更加优秀。
黑森林团队这一步放出模型,确实让人眼前一亮,未来的动向值得关注。
0
文章目录
前言
先看效果
flux的背后团队:原sd核心成员组成
目前释出的三种版本
3 个测试维度
视觉审美维度
画手能力
文字还原能力
总结
AI教程交流群
扫描二维码加入群聊
与同行学习交流&资源共通
© CopyRight 2002-2024 ,CHINAZ.COM , Inc.All Rights Reserved.