Omost是一个创新项目,旨在通过将大型语言模型(LLM)的编码能力转化为高级图像合成技能来增强其图像生成能力。发音为“几乎”,Omost这个名字象征着两个关键思想:首先,使用Omost后,图像将“几乎”完美;其次,“O”代表“omni”(多模态),“most”表示从技术中挖掘最大潜力。
Omost 使 LLM 能够编写代码,在虚拟 Canvas 代理上编写可视内容。然后,可以使用图像生成器的特定实现来渲染此 Canvas 以创建实际图像。
您可以在hugging face上在线体验:https://huggingface.co/spaces/lllyasviel/Omost
或者,您可以使用以下方法本地部署(需要 8GB Nvidia VRAM):
git clone https://github.com/lllyasviel/Omost.git cd Omost conda create -n omost python=3.10 conda activate omost pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121 pip install -r requirements.txt python gradio_app.py
(请注意,quant LLM 需要 - 某些 9XX 或 10XX 或 20XX GPU 在运行时可能会遇到问题。如果发生这种情况,只需使用我们的官方拥抱空间。bitsandbytes
示例
十九世纪一个衣衫褴褛的男人穿着一件破烂的夹克:
世界末日后最伟大的逃生,全人类的希望:
侏罗纪恐龙大战:
在哥特式王座上拥有无尽魔法的最高统治者,跪着亡灵军队:
一个有趣的卡通蝙蝠侠与小丑战斗:
0
© CopyRight 2002-2024 ,CHINAZ.COM , Inc.All Rights Reserved.