大佬自制JoyCaption打标神器,10G低显存可用,支持批量打标!

10/10/2024, 10:07:42 AM | 热度:472 | 阅读本文需 2 分钟

点赞

上次介绍了 JoyCaption 在线更新了版本 2,提供了更多的打标选项

JoyCaption Alpha Two:可定制化的在线反推工具,反推模式更自由 (chinaz.com)

这次汤团猪大佬根据最新的 JoyCaption Alpha Two开发了新的打标神器,低显存也可使用,想训练模型的小伙伴一定要试试这款打标神器哦

使用方法

进入后会让你选择模型加载精度,分别由标准,8-bit和4-bit具体占用显存请看下面说明。

image.png

选择需要打标的目录进行操作,目前支持的图片有bmp, jpg, jpeg和png,不支持 webp 格式,所以如果你的训练集中有 webp 格式的文件需要先修改一下文件格式哦

image.png

Caption type:

可以选择不同的打标方法,常见的有descriptive和training prompt都是自然语言,都可以作为打标的类型

你如果喜欢1. 5 那种可以用booru

image.png

Caption length:

支持输入long. short,以及各种数字长度,比如90,100, 120 等来控制打标长度,效果很好。

打标控制

增加打标控制,大家可以选择性的勾上

image.png

其中注意一个替换名字的功能需要和下面输入角色名字一同使用,具体为勾选这个功能后,下面输入你要替换的角色名字,只要有人物在图片里,就会被替换成你需要的名字

image.png

自定义提示词就是你可用让它反推出你想要的内容,比如你可用这样写:请只描述画面的画风

加载模型:

首次加载会需要一定时间,加载完毕后每个批次刷新一次log。如果你是 4090 就很快不用太在意

以下是batch数量推荐:

根据汤团猪大佬的测试:

对于空载的4090,推荐bs 6

对于接了显示器非空载4090 推荐bs 5

---------对于非 4090 以上显卡,参考下面-------

标准模式,最低batch= 1 的情况下,内存需求是19GB

8-bit模式,最低batch= 1 的情况下,内存需求是13GB

4-bit模式,最低batch= 1 的情况下,内存需求是10GB

每个Batch图片数量每增加1,显存需求增加大约1GB

爆显存后会很慢,所以请自己调试适合自己的batch数量

训练时间

我这里使用 4090 batch 为 2 速度还是挺快的,平均 4s 一张,大概 3 分钟左右就打完了

image.png

训练模式下的标签也是非常准确的,详略得当

image.png

工具获取

该工具只能在汤团猪大佬的交流群里获取,并且第一次下载还要找汤团猪大佬领取激活码,

大家可以在大佬视频评论区查看详情:https://www.bilibili.com/video/BV1T71eYbE1W/?spm_id_from=333.337.search-card.all.click&vd_source=6faee83238a66d16d13867c79b3386a0

2

继续阅读本文相关话题

本文收录于专题

SD教程

共收录篇

查看本专题

文章目录

使用方法

工具获取

AI教程交流群

扫描二维码加入群聊

与同行学习交流&资源共通