AI画图技术交流

dodolee · 发表于 2023-12-7 16:29

AI画图虽然早有耳闻，而且泥潭上也零零散散看了一些帖子，但苦于没有高性能GPU，一直没能亲身尝试。
前两天看了B站「林亦LYi」的视频，发现首发买的顶配 Macbook Pro M1 Max 似乎也能一战了，于是下了个 Draw Things 开始鼓捣起C站上的各种模型。

说实话这玩意真的自己上手即使不搞R18也挺有意思的，没两天下载的模型就上百GB了……
从二次元动漫角色玩到三次元偶像声优，三次元画成二次元，摆姿势凹造型捏表情换衣服，玩的不亦乐乎

一个人自己摸索尝试毕竟容易踩坑，就想上泥潭和各位前辈大佬学习学习各种模型参数，正反提示用法什么的。

PS：樱小姐的模型还原度还不错的样子，就是似乎训练数据不够，姿势表情有点单一

t222 · 发表于 2023-12-7 16:39

鼻子有够还原的

处男鉴黄师 · 发表于 2023-12-7 17:43

自从LCM和SD Turbo出来后，单纯AI画图对GPU速度要求已经不高了，不用GPU单纯用CPU速度也可以接受。

dodolee · 发表于 2023-12-7 18:14

处男鉴黄师发表于 2023-12-7 17:43
自从LCM和SD Turbo出来后，单纯AI画图对GPU速度要求已经不高了，不用GPU单纯用CPU速度也可以接受。 ...

我看c站上好像大部分模型还是老的SD1版本，是不是只能等作者重训模型了？

处男鉴黄师 · 发表于 2023-12-7 18:21

dodolee 发表于 2023-12-7 18:14
我看c站上好像大部分模型还是老的SD1版本，是不是只能等作者重训模型了？

SD Turbo需要专门的模型，LCM不需要，只需要一个lora和配套的LCM采样器就行。但效率差点，无法像SD Turbo那样1步就出图（LCM需要大约5步）

dodolee · 发表于 2023-12-7 18:27

我看好多作者推荐30步以上，原来只要5步就可以了么

nekomimimode · 发表于 2023-12-7 20:23

算法问题，看你选哪个算法，不同算法有不同的结果
早年还有人专门测试过不同算法具体在哪个步骤效果好，现在人类的贪欲全部都指向谁多快好省谁就是最优

Fuero · 发表于 2023-12-7 20:52

之前尝鲜买了一年midjourney但是已经半年多没开了，心疼年费

—— 来自 S1Fun

topgamer · 发表于 2023-12-7 20:55

dodolee 发表于 2023-12-7 18:27
我看好多作者推荐30步以上，原来只要5步就可以了么

SD1.5的要20～30步，turbo 要3～5步。我基本没用过xl和turbo 模型，不知道实际出图效果如何，是不是还是要高清修复。

—— 来自 S1Fun

dodolee · 发表于 2023-12-7 21:26

Fuero 发表于 2023-12-7 20:52
之前尝鲜买了一年midjourney但是已经半年多没开了，心疼年费

—— 来自 S1Fun

我理解midjourney和现在这些单机跑的SD模型还不太一样，midjourney应该已经是和GPT一个时代的东西了，可以正常说人话出图，SD相比起来就像上个世代的产物，没有大语言模型只能正反念咒碰运气……，不过正因为这样，反而折腾起来比较有意思

Fuero · 发表于 2023-12-7 21:51

dodolee 发表于 2023-12-7 21:26
我理解midjourney和现在这些单机跑的SD模型还不太一样，midjourney应该已经是和GPT一个时代的东西了，可以 ...

midjourney其实不大灵的，语言理解能力极低，只认词组，优势可能就是傻瓜出图了。。。

SinoWarrior · 发表于 2023-12-7 22:02

楼主没用过midjourney吧，midjourney可控性极差

目前可控性最强的是DALL E

dodolee · 发表于 2023-12-7 22:07

SinoWarrior 发表于 2023-12-7 22:02
楼主没用过midjourney吧，midjourney可控性极差

目前可控性最强的是DALL E

我以为midjourney至少能达到另一个AI画图帖子里那种程度的语言理解呢……

seki_m · 发表于 2023-12-7 22:21

本帖最后由 seki_m 于 2023-12-7 22:30 编辑

不用买显卡，现在云都有帮你部署好的镜像，我用的是揽睿，在autodl充的一百还不知道怎么花……
我目前在炼做设计的lora，碰到的困难是预处理素材后打出来的标对不上画面内容，正在研究sd模型的原理

dodolee · 发表于 2023-12-7 22:39

seki_m 发表于 2023-12-7 22:21
不用买显卡，现在云都有帮你部署好的镜像，我用的是揽睿，在autodl充的一百还不知道怎么花……
我目前在炼 ...

我在autodl也充了100，但发现autodl明确写了不让搭WebUI……

seki_m · 发表于 2023-12-7 22:59

本帖最后由 seki_m 于 2023-12-7 23:04 编辑

dodolee 发表于 2023-12-7 22:39
我在autodl也充了100，但发现autodl明确写了不让搭WebUI……

还有这种说法？我都是直接用社区镜像的，不让搭webui是什么意思，autodl主要是打开webui太麻烦，而且还要抢卡

dodolee · 发表于 2023-12-7 23:03

本帖最后由 dodolee 于 2023-12-7 23:05 编辑

seki_m 发表于 2023-12-7 22:59
还有这种说法？我都是直接用社区镜像的，不让搭webui是什么意思autodl主要是打开webui太麻烦，而且还要抢 ...

大概是怕用来出涩图吧，但是SD这东西有时候突然就莫名出几张涩图，天知道那些模型用的是什么训练数据

需要抢卡确实是有点坑，虽然说是按时长计费，但如果不是日常用的话，一关机卡就被回收了……

少年的深渊 · 发表于 2023-12-8 12:34

大江户被砍头之后，这论坛都没什么人聊ai作图了

dodolee · 发表于 2023-12-8 12:38

请教一下，模型作者推荐的图像大小必须严格遵守吗？把size改大似乎也没什么问题……

孤狼arcueid · 发表于 2023-12-8 12:57

dodolee 发表于 2023-12-8 12:38
请教一下，模型作者推荐的图像大小必须严格遵守吗？把size改大似乎也没什么问题…… ...

直出大图容易出鬼图，因为训练素材的关系
想要大图二次放大就行了

win8 · 发表于 2023-12-8 12:59

size改大还不如超分辨率再缩小…

dodolee · 发表于 2023-12-8 13:13

孤狼arcueid 发表于 2023-12-8 12:57
直出大图容易出鬼图，因为训练素材的关系
想要大图二次放大就行了

一般多大比较合适呢？小图会不会缺少细节导致后面upscaling也不补回来？

酸菜泡面 · 发表于 2023-12-8 14:22

提示: 作者被禁止或删除内容自动屏蔽

dodolee · 发表于 2023-12-8 14:31

酸菜泡面发表于 2023-12-8 14:22
聊的少主要是因为最近没啥爆点，并且玩腻了

LCM对性能改善好像还挺大的

酸菜泡面 · 发表于 2023-12-8 14:33

提示: 作者被禁止或删除内容自动屏蔽

处男鉴黄师 · 发表于 2023-12-8 14:35

dodolee 发表于 2023-12-8 13:13
一般多大比较合适呢？小图会不会缺少细节导致后面upscaling也不补回来？

具体要看模型。早期的SD1.5原版和当时的社区模型基本上只能512x512，更高分辨率就开始崩了。后来的社区模型可能加入了更高尺寸的素材进行训练，像chilloutmixNi，虽然也是基于SD1.5但已经可以用640x960出图。
现在基于SDXL的模型可以直接1024x1024/1280x720/1500x900

projectplan · 发表于 2023-12-9 07:33

话说4070的12G显存现在跑AI图有没有问题？还是说等新的16G显存版本更好

codecloud · 发表于 2023-12-9 10:10

dodolee 发表于 2023-12-7 21:26
我理解midjourney和现在这些单机跑的SD模型还不太一样，midjourney应该已经是和GPT一个时代的东西了，可以 ...

我很怀疑你用的midjourney是不是3032年的版本,那几乎毫无可控性的玩意叫gpt?gpt1.5吧.
就不说dall e,甚至都不用说全方位吊打它的controlnet,连个局部重绘功能都直到前几个月才发布的东西,吹吹下限高就行了吧.
至于什么人工智能,用自然语言描述内容....sd一样能做到,也和mj也一样是gpt1.5版的人工智障,就都明智点别提这玩意算了

codecloud · 发表于 2023-12-9 10:14

projectplan 发表于 2023-12-9 07:33
话说4070的12G显存现在跑AI图有没有问题？还是说等新的16G显存版本更好

只跑图不跑动画,那么12g显存绰绰有余,反正现在sd的主流模型方案依然是小尺寸出图,再重绘放大提升细节精度.
速度也足够快,几秒出图.

12g显存跑1024*1024左右的尺寸一点问题都没有,但跑2k尺寸的图就比较危险,很容易爆.

个人自用或者小公司商用一点问题都没有,但你想要直出2k级大图或者直接全图重绘而不是拼接重绘,那确实至少16g起步.

dodolee · 发表于 2023-12-9 10:49

codecloud 发表于 2023-12-9 10:10
我很怀疑你用的midjourney是不是3032年的版本,那几乎毫无可控性的玩意叫gpt?gpt1.5吧.
就不说dall e,甚至 ...

之前一直以为dall e被mj吊打，现实原来是这样

codecloud · 发表于 2023-12-9 10:57

本帖最后由 codecloud 于 2023-12-9 11:00 编辑

dodolee 发表于 2023-12-9 10:49
之前一直以为dall e被mj吊打，现实原来是这样

虽然用4090甚至专业卡的大厂能无所畏惧的尺寸拉爆自己炼丹,直接sd走全流程..但现在一般个人或者小厂都是mj和sd配合使用.毕竟自己炼丹的成本不低.
因为mj足够傻瓜化,且跑在云端,所以如果要求不太高的话,一般都是先用mj快速批量出初稿.然后挑合适的在sd里精细加工.

不过如果有特殊的需求,或者非常具体的需求,那基本都是直接在sd里面做全套流程.

lcm加速其实现在并不算好用,因为快那么点的代价是出图质量肉眼降低了.

现在的热点是turbo实时绘画.comfyUI+turbo映射投屏,在ps上直接所见即所得的涂鸦即可出图.就是模型来没普及.但未来ai绘画应用如果想成功落地且避免版权,那估计必然是这个趋势了.推荐你去尝试一下turbo工作流,这个ai绘画方案,别说工作,即使个人娱乐玩,也比现有的文字出图或者图生图的乐趣高得多,毕竟已经非常接近真正意义上的绘画流程了,真正意义上的神笔马良

囧Smith · 发表于 2023-12-9 12:40

本帖最后由囧Smith 于 2023-12-9 12:45 编辑

1.sd本来就可以用自然语言出图，tag念咒是novelai带起来的，而后续的社区二次猿模型基本都是基于nai的，所以都这么搞了。
2.mj的语言理解不强，现在最强的应该还是dalle3。
3.lcm是在质量损失不大的前提下提高出图速度，你有大量抽卡需求或者设备很差的话意义比较大，不然其实用不太到
4.出图尺寸可以随便来，不用管模型作者推荐。sd1.5的在1024以上容易多人或者鬼图，想大的话就先出小的再高清修复

wolfwood · 发表于 2023-12-9 14:01

老百姓也能玩的SD WEBUI已经大半年没啥底层技术和应用上的突破了，现在融模做LORA的人也少了，没啥人玩了

处男鉴黄师 · 发表于 2023-12-9 21:37

因为现在流行玩的是AI动画了。久远一点的deforum，前几个月的animatediff，现在的SVD，效果越来越好

dayuii · 发表于 2023-12-9 22:02

处男鉴黄师发表于 2023-12-9 21:37
因为现在流行玩的是AI动画了。久远一点的deforum，前几个月的animatediff，现在的SVD，效果越来越好
...

不会动啊

—— 来自 Xiaomi 22041211AC, Android 12上的 S1Next-鹅版 v2.5.4

处男鉴黄师 · 发表于 2023-12-9 22:07

dayuii 发表于 2023-12-9 22:02
不会动啊

—— 来自 Xiaomi 22041211AC, Android 12上的 S1Next-鹅版 v2.5.4

webp动图，下载下来拖进浏览器应该就可以动了

dodolee · 发表于 2023-12-9 22:39

处男鉴黄师发表于 2023-12-9 21:37
因为现在流行玩的是AI动画了。久远一点的deforum，前几个月的animatediff，现在的SVD，效果越来越好
...

这种对GPU有啥要求吗？

处男鉴黄师 · 发表于 2023-12-9 22:44

dodolee 发表于 2023-12-9 22:39
这种对GPU有啥要求吗？

默认设置显存16G才够，但据说强制fp16模式的话8G也可以

mcq_2 · 发表于 2023-12-9 23:40

处男鉴黄师发表于 2023-12-9 21:37
因为现在流行玩的是AI动画了。久远一点的deforum，前几个月的animatediff，现在的SVD，效果越来越好
...

总觉得透视有问题，有说不出哪里不对

seki_m · 发表于 2023-12-9 23:50

codecloud 发表于 2023-12-9 10:10
我很怀疑你用的midjourney是不是3032年的版本,那几乎毫无可控性的玩意叫gpt?gpt1.5吧.
就不说dall e,甚至 ...

sd自然语言出图需要用什么插件？

		自动登录	找回密码
密码			立即注册

酸菜泡面酸菜泡面当前离线禁止发言精华 \| 战斗力鹅 \| 帖子注册时间 2011-4-6 头像被屏蔽	23^# 发表于 2023-12-8 14:22 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

酸菜泡面酸菜泡面当前离线禁止发言精华 \| 战斗力鹅 \| 帖子注册时间 2011-4-6 头像被屏蔽	25^# 发表于 2023-12-8 14:33 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

[软件] AI画图技术交流