Stage1st

 找回密码
 立即注册
搜索
查看: 6283|回复: 48
打印 上一主题 下一主题

[软件] AI画图技术交流

[复制链接]
     
跳转到指定楼层
楼主
发表于 2023-12-7 16:29 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
AI画图虽然早有耳闻,而且泥潭上也零零散散看了一些帖子,但苦于没有高性能GPU,一直没能亲身尝试。
前两天看了B站「林亦LYi」的视频,发现首发买的顶配 Macbook Pro M1 Max 似乎也能一战了,于是下了个 Draw Things 开始鼓捣起C站上的各种模型。

说实话这玩意真的自己上手即使不搞R18也挺有意思的,没两天下载的模型就上百GB了……
从二次元动漫角色玩到三次元偶像声优,三次元画成二次元,摆姿势凹造型捏表情换衣服,玩的不亦乐乎

一个人自己摸索尝试毕竟容易踩坑,就想上泥潭和各位前辈大佬学习学习各种模型参数,正反提示用法什么的。

PS:樱小姐的模型还原度还不错的样子,就是似乎训练数据不够,姿势表情有点单一

回复

使用道具 举报

     
2#
发表于 2023-12-7 16:39 | 只看该作者
鼻子有够还原的
回复

使用道具 举报

     
3#
发表于 2023-12-7 17:43 | 只看该作者
自从LCM和SD Turbo出来后,单纯AI画图对GPU速度要求已经不高了,不用GPU单纯用CPU速度也可以接受。
回复

使用道具 举报

     
4#
 楼主| 发表于 2023-12-7 18:14 | 只看该作者
处男鉴黄师 发表于 2023-12-7 17:43
自从LCM和SD Turbo出来后,单纯AI画图对GPU速度要求已经不高了,不用GPU单纯用CPU速度也可以接受。 ...

我看c站上好像大部分模型还是老的SD1版本,是不是只能等作者重训模型了?


回复

使用道具 举报

     
5#
发表于 2023-12-7 18:21 | 只看该作者
dodolee 发表于 2023-12-7 18:14
我看c站上好像大部分模型还是老的SD1版本,是不是只能等作者重训模型了?

SD Turbo需要专门的模型,LCM不需要,只需要一个lora和配套的LCM采样器就行。但效率差点,无法像SD Turbo那样1步就出图(LCM需要大约5步)
回复

使用道具 举报

     
6#
 楼主| 发表于 2023-12-7 18:27 | 只看该作者
我看好多作者推荐30步以上,原来只要5步就可以了么
回复

使用道具 举报

     
7#
发表于 2023-12-7 20:23 | 只看该作者
算法问题,看你选哪个算法,不同算法有不同的结果
早年还有人专门测试过不同算法具体在哪个步骤效果好,现在人类的贪欲全部都指向谁多快好省谁就是最优
回复

使用道具 举报

     
8#
发表于 2023-12-7 20:52 | 只看该作者
之前尝鲜买了一年midjourney但是已经半年多没开了,心疼年费

—— 来自 S1Fun
回复

使用道具 举报

     
9#
发表于 2023-12-7 20:55 | 只看该作者
dodolee 发表于 2023-12-7 18:27
我看好多作者推荐30步以上,原来只要5步就可以了么

SD1.5的要20~30步,turbo 要3~5步。我基本没用过xl和turbo 模型,不知道实际出图效果如何,是不是还是要高清修复。

—— 来自 S1Fun
回复

使用道具 举报

     
10#
 楼主| 发表于 2023-12-7 21:26 | 只看该作者
Fuero 发表于 2023-12-7 20:52
之前尝鲜买了一年midjourney但是已经半年多没开了,心疼年费

—— 来自 S1Fun

我理解midjourney和现在这些单机跑的SD模型还不太一样,midjourney应该已经是和GPT一个时代的东西了,可以正常说人话出图,SD相比起来就像上个世代的产物,没有大语言模型只能正反念咒碰运气……,不过正因为这样,反而折腾起来比较有意思
回复

使用道具 举报

     
11#
发表于 2023-12-7 21:51 | 只看该作者
dodolee 发表于 2023-12-7 21:26
我理解midjourney和现在这些单机跑的SD模型还不太一样,midjourney应该已经是和GPT一个时代的东西了,可以 ...

midjourney其实不大灵的,语言理解能力极低,只认词组,优势可能就是傻瓜出图了。。。
回复

使用道具 举报

     
12#
发表于 2023-12-7 22:02 | 只看该作者
楼主没用过midjourney吧,midjourney可控性极差

目前可控性最强的是DALL E
回复

使用道具 举报

     
13#
 楼主| 发表于 2023-12-7 22:07 | 只看该作者
SinoWarrior 发表于 2023-12-7 22:02
楼主没用过midjourney吧,midjourney可控性极差

目前可控性最强的是DALL E

我以为midjourney至少能达到另一个AI画图帖子里那种程度的语言理解呢……
回复

使用道具 举报

14#
发表于 2023-12-7 22:21 | 只看该作者
本帖最后由 seki_m 于 2023-12-7 22:30 编辑

不用买显卡,现在云都有帮你部署好的镜像,我用的是揽睿,在autodl充的一百还不知道怎么花……
我目前在炼做设计的lora,碰到的困难是预处理素材后打出来的标对不上画面内容,正在研究sd模型的原理
回复

使用道具 举报

     
15#
 楼主| 发表于 2023-12-7 22:39 | 只看该作者
seki_m 发表于 2023-12-7 22:21
不用买显卡,现在云都有帮你部署好的镜像,我用的是揽睿,在autodl充的一百还不知道怎么花……
我目前在炼 ...

我在autodl也充了100,但发现autodl明确写了不让搭WebUI……
回复

使用道具 举报

16#
发表于 2023-12-7 22:59 | 只看该作者
本帖最后由 seki_m 于 2023-12-7 23:04 编辑
dodolee 发表于 2023-12-7 22:39
我在autodl也充了100,但发现autodl明确写了不让搭WebUI……

还有这种说法?我都是直接用社区镜像的,不让搭webui是什么意思,autodl主要是打开webui太麻烦,而且还要抢卡


回复

使用道具 举报

     
17#
 楼主| 发表于 2023-12-7 23:03 | 只看该作者
本帖最后由 dodolee 于 2023-12-7 23:05 编辑
seki_m 发表于 2023-12-7 22:59
还有这种说法?我都是直接用社区镜像的,不让搭webui是什么意思autodl主要是打开webui太麻烦,而且还要抢 ...

大概是怕用来出涩图吧,但是SD这东西有时候突然就莫名出几张涩图,天知道那些模型用的是什么训练数据
需要抢卡确实是有点坑,虽然说是按时长计费,但如果不是日常用的话,一关机卡就被回收了……
回复

使用道具 举报

     
18#
发表于 2023-12-8 12:34 | 只看该作者
大江户被砍头之后,这论坛都没什么人聊ai作图了
回复

使用道具 举报

     
19#
 楼主| 发表于 2023-12-8 12:38 | 只看该作者
请教一下,模型作者推荐的图像大小必须严格遵守吗?把size改大似乎也没什么问题……
回复

使用道具 举报

     
20#
发表于 2023-12-8 12:57 | 只看该作者
dodolee 发表于 2023-12-8 12:38
请教一下,模型作者推荐的图像大小必须严格遵守吗?把size改大似乎也没什么问题…… ...

直出大图容易出鬼图,因为训练素材的关系
想要大图二次放大就行了
回复

使用道具 举报

     
21#
发表于 2023-12-8 12:59 来自手机 | 只看该作者
size改大还不如超分辨率再缩小…
回复

使用道具 举报

     
22#
 楼主| 发表于 2023-12-8 13:13 | 只看该作者
孤狼arcueid 发表于 2023-12-8 12:57
直出大图容易出鬼图,因为训练素材的关系
想要大图二次放大就行了

一般多大比较合适呢?小图会不会缺少细节导致后面upscaling也不补回来?
回复

使用道具 举报

头像被屏蔽
     
23#
发表于 2023-12-8 14:22 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
24#
 楼主| 发表于 2023-12-8 14:31 | 只看该作者
酸菜泡面 发表于 2023-12-8 14:22
聊的少主要是因为最近没啥爆点,并且玩腻了

LCM对性能改善好像还挺大的
回复

使用道具 举报

头像被屏蔽
     
25#
发表于 2023-12-8 14:33 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
26#
发表于 2023-12-8 14:35 | 只看该作者
dodolee 发表于 2023-12-8 13:13
一般多大比较合适呢?小图会不会缺少细节导致后面upscaling也不补回来?

具体要看模型。早期的SD1.5原版和当时的社区模型基本上只能512x512,更高分辨率就开始崩了。后来的社区模型可能加入了更高尺寸的素材进行训练,像chilloutmixNi,虽然也是基于SD1.5但已经可以用640x960出图。
现在基于SDXL的模型可以直接1024x1024/1280x720/1500x900
回复

使用道具 举报

     
27#
发表于 2023-12-9 07:33 | 只看该作者
话说4070的12G显存现在跑AI图有没有问题?还是说等新的16G显存版本更好
回复

使用道具 举报

     
28#
发表于 2023-12-9 10:10 | 只看该作者
dodolee 发表于 2023-12-7 21:26
我理解midjourney和现在这些单机跑的SD模型还不太一样,midjourney应该已经是和GPT一个时代的东西了,可以 ...

我很怀疑你用的midjourney是不是3032年的版本,那几乎毫无可控性的玩意叫gpt?gpt1.5吧.
就不说dall e,甚至都不用说全方位吊打它的controlnet,连个局部重绘功能都直到前几个月才发布的东西,吹吹下限高就行了吧.
至于什么人工智能,用自然语言描述内容....sd一样能做到,也和mj也一样是gpt1.5版的人工智障,就都明智点别提这玩意算了
回复

使用道具 举报

     
29#
发表于 2023-12-9 10:14 | 只看该作者
projectplan 发表于 2023-12-9 07:33
话说4070的12G显存现在跑AI图有没有问题?还是说等新的16G显存版本更好

只跑图不跑动画,那么12g显存绰绰有余,反正现在sd的主流模型方案依然是小尺寸出图,再重绘放大提升细节精度.
速度也足够快,几秒出图.

12g显存跑1024*1024左右的尺寸一点问题都没有,但跑2k尺寸的图就比较危险,很容易爆.

个人自用或者小公司商用一点问题都没有,但你想要直出2k级大图或者直接全图重绘而不是拼接重绘,那确实至少16g起步.
回复

使用道具 举报

     
30#
 楼主| 发表于 2023-12-9 10:49 | 只看该作者
codecloud 发表于 2023-12-9 10:10
我很怀疑你用的midjourney是不是3032年的版本,那几乎毫无可控性的玩意叫gpt?gpt1.5吧.
就不说dall e,甚至 ...

之前一直以为dall e被mj吊打,现实原来是这样
回复

使用道具 举报

     
31#
发表于 2023-12-9 10:57 | 只看该作者
本帖最后由 codecloud 于 2023-12-9 11:00 编辑
dodolee 发表于 2023-12-9 10:49
之前一直以为dall e被mj吊打,现实原来是这样

虽然用4090甚至专业卡的大厂能无所畏惧的尺寸拉爆自己炼丹,直接sd走全流程..但现在一般个人或者小厂都是mj和sd配合使用.毕竟自己炼丹的成本不低.
因为mj足够傻瓜化,且跑在云端,所以如果要求不太高的话,一般都是先用mj快速批量出初稿.然后挑合适的在sd里精细加工.

不过如果有特殊的需求,或者非常具体的需求,那基本都是直接在sd里面做全套流程.

lcm加速其实现在并不算好用,因为快那么点的代价是出图质量肉眼降低了.

现在的热点是turbo实时绘画.comfyUI+turbo映射投屏,在ps上直接所见即所得的涂鸦即可出图.就是模型来没普及.但未来ai绘画应用如果想成功落地且避免版权,那估计必然是这个趋势了.推荐你去尝试一下turbo工作流,这个ai绘画方案,别说工作,即使个人娱乐玩,也比现有的文字出图或者图生图的乐趣高得多,毕竟已经非常接近真正意义上的绘画流程了,真正意义上的神笔马良
回复

使用道具 举报

     
32#
发表于 2023-12-9 12:40 来自手机 | 只看该作者
本帖最后由 囧Smith 于 2023-12-9 12:45 编辑

1.sd本来就可以用自然语言出图,tag念咒是novelai带起来的,而后续的社区二次猿模型基本都是基于nai的,所以都这么搞了。
2.mj的语言理解不强,现在最强的应该还是dalle3。
3.lcm是在质量损失不大的前提下提高出图速度,你有大量抽卡需求或者设备很差的话意义比较大,不然其实用不太到
4.出图尺寸可以随便来,不用管模型作者推荐。sd1.5的在1024以上容易多人或者鬼图,想大的话就先出小的再高清修复
回复

使用道具 举报

     
33#
发表于 2023-12-9 14:01 | 只看该作者
老百姓也能玩的SD WEBUI已经大半年没啥底层技术和应用上的突破了,现在融模做LORA的人也少了,没啥人玩了
回复

使用道具 举报

     
34#
发表于 2023-12-9 21:37 | 只看该作者
因为现在流行玩的是AI动画了。久远一点的deforum,前几个月的animatediff,现在的SVD,效果越来越好
回复

使用道具 举报

     
35#
发表于 2023-12-9 22:02 来自手机 | 只看该作者
处男鉴黄师 发表于 2023-12-9 21:37
因为现在流行玩的是AI动画了。久远一点的deforum,前几个月的animatediff,现在的SVD,效果越来越好
...

不会动啊

—— 来自 Xiaomi 22041211AC, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
36#
发表于 2023-12-9 22:07 | 只看该作者
dayuii 发表于 2023-12-9 22:02
不会动啊

—— 来自 Xiaomi 22041211AC, Android 12上的 S1Next-鹅版 v2.5.4

webp动图,下载下来拖进浏览器应该就可以动了
回复

使用道具 举报

     
37#
 楼主| 发表于 2023-12-9 22:39 | 只看该作者
处男鉴黄师 发表于 2023-12-9 21:37
因为现在流行玩的是AI动画了。久远一点的deforum,前几个月的animatediff,现在的SVD,效果越来越好
...

这种对GPU有啥要求吗?
回复

使用道具 举报

     
38#
发表于 2023-12-9 22:44 | 只看该作者
dodolee 发表于 2023-12-9 22:39
这种对GPU有啥要求吗?

默认设置显存16G才够,但据说强制fp16模式的话8G也可以
回复

使用道具 举报

     
39#
发表于 2023-12-9 23:40 | 只看该作者
处男鉴黄师 发表于 2023-12-9 21:37
因为现在流行玩的是AI动画了。久远一点的deforum,前几个月的animatediff,现在的SVD,效果越来越好
...

总觉得透视有问题,有说不出哪里不对
回复

使用道具 举报

40#
发表于 2023-12-9 23:50 | 只看该作者
codecloud 发表于 2023-12-9 10:10
我很怀疑你用的midjourney是不是3032年的版本,那几乎毫无可控性的玩意叫gpt?gpt1.5吧.
就不说dall e,甚至 ...

sd自然语言出图需要用什么插件?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-5-7 01:56 , Processed in 0.051849 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表