v6. 1 版本在“画面准确性”、“画质”、“速度”、“个性化”这 4 个方面有所更新。其下,又有一些小点细分出来。每个小点我们都会结合一个实际案例来看具体效果。
画面准确性的提升,具体体现在:图像更连贯、小图细节更多、文字展示更准确,这三方面。
图像连贯性主要测试的是画面中人物的四肢、手脚、和复杂环境的表现。我们用下方案例在测试:一个年轻男子在森林小径跑步,穿着短裤背心,手臂和腿露出,环境是茂密的树木,前方有低头喝水的小鹿,和几只鸟。
左侧是V6 的效果,右侧是V6. 1 的效果。可以看到整体画质都挺好,整体质感差距也不明显。但从细节还原的角度上来说,左侧v6 小鹿是抬头状态,而右侧v6. 1 把小鹿低头的状态还原了,同时也把“小鸟”元素展示了出来。从细节还原的层面来说,6. 1 模式会略好一些。
prompt:Early morning run in the forest with a young man jogging on a trail, wearing shorts and a tank top, revealing his arms and legs, with a smartwatch on his wrist. Dense trees and bushes line the path, sunlight filtering through the leaves. A deer is drinking water by the river ahead, and birds are perched on branches. The ground is covered with fallen leaves and small flowers, full of life.
这个主要测试的是,当画面中的人物占比很小(一般是多人或者远景情况),对于人物面部细节、手指等内容的还原程度。
案例:多个好友一起欢庆,举杯,满面笑容。
V6 模式下,整体效果还是很不错的,氛围什么的都比较到位。但是仔细看,手指的部分还是有点问题的。这也是AI绘画长期以来一直难以攻克的问题,画手还是比较随机,需要不断抽卡。
相比于V6,在这个案例中,V6. 1 的细节表现会更加好一点,在画面中几乎看不到明显错误。
prompt:Some friends are celebrating a birthday together. They are cheering, raising their glasses, and their faces are lit up with happy smiles.
顾名思义,文字准确度测试,是为了测试文字(目前只支持西文)在画面中的还原正确率。
左侧是用V6 出图的结果,正确率在50%左右。右侧是用V6. 1 出图的结果,在本案例中,正确率达到了100%,进步还是比较明显的。
prompt:a black notebook with the word "doo" written on it, sitting atop an elegant wooden desk surrounded by potted plants and delicate trinkets, bathed in soft natural light filtering through large windows, creating a cozy atmosphere, product photography
画质的提升体现在:1、增强纹理更细腻,2、“--q 2”后缀的回归,让画面更多细节。
我们用一个特写镜头下的老人为案例,用“充满皱纹的皮肤”作为“质感”测试的参考。
左侧是V6 结果,右侧是V6. 1 结果。个人感觉,从V6 版本起,画面质感已经非常逼真细腻,即使官方宣称这次6. 1 模型又一次推进了画质提升,但从直观体感上来说,我觉得其实并不明显。
prompt:A close-up shot of an elderly man with a weathered face, looking directly at the camera. His face is full of wrinkles, with a strong skin texture, creating a powerful visual impact.
在v5 系列的时代,我们会用--q来控制画质的高低程度。而在v6 版本中,--q已经不再被需要。而这次更新的v6. 1 版本又把“--q 2”后缀重新加回来,给人一种“回滚”到v5. 2 的错觉。
不知道是不是我的主观原因,我觉得加了“--q 2”后缀的图像,确实在质感上会更加细腻一些,没有那么AI照片那么的“制式化”。
我们可以在Midjourney网站上,点击左侧的“tasks”,然后选择“rank images”,对图片进行二选一的喜好选择。
当我们做出的选择越多,我们提供给系统的判断素材就越多,我们的喜好就越能被“评估”出来。
回到discord中,输入“/info”指令并发送。我们就可以看到一共做出的“评价”的数量。
在正常生图时,我们可以在输入框的最后输入“--p”并发送,来直接调用我们自己的个性化代码。
发送之后,我们能看到“--p”后面自动填充了一条个性化代码。
随着我们在Midjourney网站中不断进行图片评价,我们的个性化代码也会发生改变。也就是说,我们可以同时拥有多条不同的个性化代码。具体的查看方式,可以在discord中输入“/list_personalize_codes”指令,进行查看和调用。
最后,v6. 1 的出图速度提升了25%左右。
本次的V6. 1 版本更新,个人觉得并没有什么惊艳表现,似乎只是在性能上做了一些加强,而在功能上,没有明显突破。
0
文章目录
更新1:准确性
图像连贯性测试
小图细节度测试
文字准确的还原测试
更新2:画质
纹理肤质测试
--q2 后缀的回归
个性化后缀(--p)的改进
速度提升
总结
AI教程交流群
扫描二维码加入群聊
与同行学习交流&资源共通
© CopyRight 2002-2024 ,CHINAZ.COM , Inc.All Rights Reserved.