【MiniCPM】仅次于JoyCaption的超强提示词反推神器安装使用教程

9/14/2024, 9:49:11 AM | 热度:147 | 阅读本文需 1 分钟

点赞

MiniCPM-V 2.6 是 MiniCPM-V 系列中最新、性能最佳的模型。该模型基于 SigLip-400M 和 Qwen2-7B 构建,共 8B 参数。与 MiniCPM-Llama3-V 2.5 相比,MiniCPM-V 2.6 性能提升显著,并引入了多图和视频理解的新功能

在我看来MiniCPM应该是强于Florence2 弱于JoyCaption的

使用方法

方法一:在线使用:https://huggingface.co/spaces/openbmb/MiniCPM-V-2_6

image.png

方法二:Ollama安装:Ollama更新支持了MiniCPM V2.6,如果你安装了Ollama可以直接在命令行窗口中输入

ollama run minicpm-v

然后就像下图一样自动帮我们下载,不过大家网络要好,不然就会如下图出现网络错误安装不上

image.png

不过没关系,我们还有方法3

方法三:我们在管理器中安装后缀int4的,安装完后重启

image.png

然后双击搜索该节点,链接一张加载图片后运行,后台就会自动帮我们下载模型

image.png

除了反推还支持文本扩写

image.png

测试效果

我这里以一张海报作为测试,使用Flux生成图片

image.png

MiniCPM效果:耗时是52秒

image.png

Florence2的效果:速度24s最快但是最不像原图

image.png

JoyCaption反推效果:从加载反推模型到生图也是50多秒

image.png

单看这组效果,MiniCPM还好于JoyCaption

在来一张人像测试

image.png

MiniCPM:

image.png

Florence2:

image.png

Joy:

image.png

这组看下来人物的还原是Joy最像,年龄发型都差不多,Mini其次(广告牌的效果比较还原),Florence一般

不过Mini的反推时间也挺久的,大家还是按需选择一个就可以


0

继续阅读本文相关话题

本文收录于专题

ComfyUI教程

共收录篇

查看本专题

文章目录

使用方法

测试效果

AI教程交流群

扫描二维码加入群聊

与同行学习交流&资源共通