之前试了一下很火的diffuse disco,图1-3是diffuse disco生成,4-6是waifu labs生成,7-9是chaotica生成,可以看出diffuse disco目前版本的质量还不是很高,我猜测是算法的原因,waifu labs和chaotica都是根据算法先生成一个基础画像,然后在20%,40%,60%,80%,100%的时候各选择一次派生图像,而diffuse disco应该是从灰色图开始,像素点级别的迭代,然后ai自动选择接近关键词的派生图像,经过几十次的派生ai选择,最终生成了图像,相当于是把以前ai生成图像的人工选择步骤交给了ai,这样做的优缺点也很明显,他可以做出相比人工选择更多的选择(因为人工选择一般是10张派生内选一张,或者再随机出现几十张选择,但ai的选择量可以无限大),缺点是很难理解人为的目的(ai依靠人设定的关键句和词进行选择,但是ai很难理解自然语言中的抽象意味),官方推荐也是尽量使用描述性语言,同时风格参考上也尽量选择油画风格的画家效果较好,还有一点就是配置要求较高,我用jupyter部署到本地渲染,12G的显存都能直接顶满并且只能渲染500+px,再高就报错了,50step的迭代要十多分钟(用线上的免费电脑就要几个小时),如果能快速出图可以当前期情绪版的工具,如果质量高可以直接出高质量图就更没问题了,目前来说是有点鸡肋的,但是未来可期


diffuse disco





waifu labs



chaotica