9/14/2024, 9:49:11 AM | 热度:147 | 阅读本文需 1 分钟
点赞
MiniCPM-V 2.6 是 MiniCPM-V 系列中最新、性能最佳的模型。该模型基于 SigLip-400M 和 Qwen2-7B 构建,共 8B 参数。与 MiniCPM-Llama3-V 2.5 相比,MiniCPM-V 2.6 性能提升显著,并引入了多图和视频理解的新功能
在我看来MiniCPM应该是强于Florence2 弱于JoyCaption的
方法一:在线使用:https://huggingface.co/spaces/openbmb/MiniCPM-V-2_6
方法二:Ollama安装:Ollama更新支持了MiniCPM V2.6,如果你安装了Ollama可以直接在命令行窗口中输入
ollama run minicpm-v
然后就像下图一样自动帮我们下载,不过大家网络要好,不然就会如下图出现网络错误安装不上
不过没关系,我们还有方法3
方法三:我们在管理器中安装后缀int4的,安装完后重启
然后双击搜索该节点,链接一张加载图片后运行,后台就会自动帮我们下载模型
除了反推还支持文本扩写
我这里以一张海报作为测试,使用Flux生成图片
MiniCPM效果:耗时是52秒
Florence2的效果:速度24s最快但是最不像原图
JoyCaption反推效果:从加载反推模型到生图也是50多秒
单看这组效果,MiniCPM还好于JoyCaption
在来一张人像测试
MiniCPM:
Florence2:
Joy:
这组看下来人物的还原是Joy最像,年龄发型都差不多,Mini其次(广告牌的效果比较还原),Florence一般
不过Mini的反推时间也挺久的,大家还是按需选择一个就可以
0
© CopyRight 2002-2024 ,CHINAZ.COM , Inc.All Rights Reserved.