Stage1st

 找回密码
 立即注册
搜索
查看: 1339|回复: 18
打印 上一主题 下一主题

[硬件] 视频转码成10bit 422,ARC770搭配13700K可以提高效率吗?

[复制链接]
     
跳转到指定楼层
楼主
发表于 2024-3-20 15:53 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
如题。给旧电脑换了主板重炮手B760M PLUS D4和CPU13700K。
主要用来渲染和转码。格式主要是H265的10BIT 422,4K25P压成码率140mb/s,8K25P压成码率200mb/s。

一般我是达芬奇交付无损MOV后在HANDBRAKE转码。
目前使用的显卡是旧电脑的2080TI,在渲染8K无损MOV的时候非常慢,2分钟视频大概要50分钟。
查看一下资源占用率,显卡3D资源和现存一直满载。其他CPU、内存(48GB)和SSD(M2硬盘)使用率都没有满载。

所以在想能否找个便宜的解决方案。
看到INTEL的ARC显卡说是有DEEPLINK功能,
和核显联动加速渲染,支持达芬奇和HANDBRAKE,但没细说具体情况,所以请教各位:

①达芬奇下渲染10bit 422交付,显卡从2080TI换成ARC770能否加速交付?

②ARC770和13700K的DEEPLINK可以缩短HANDBRAKE的10bit 422转码速度吗?
(目前HANDBRAKE的H265 10BIT 422好像只能调用CPU转码,INTEL QSV模式没有10bit 422的选项)

有哪位可以指点一下,谢谢啊!


回复

使用道具 举报

     
2#
发表于 2024-3-20 16:13 | 只看该作者
我办公电脑是amd zen3+a770,而且日常我用Adobe Premiere,也没法帮你测啊。。。。。
回复

使用道具 举报

     
3#
 楼主| 发表于 2024-3-20 17:30 来自手机 | 只看该作者
netplaying 发表于 2024-3-20 16:13
我办公电脑是amd zen3+a770,而且日常我用Adobe Premiere,也没法帮你测啊。。。。。 ...

可恶!好不容易看到个可能可以便宜解决的方案但不知道有没有用啊!
回复

使用道具 举报

4#
发表于 2024-3-20 19:05 | 只看该作者
本帖最后由 日日夜夜 于 2024-3-20 20:38 编辑

有的软件就是不支持qsv编码422 hevc的,尽管它(12代以后的intel核显)实际上应该支持(但真不知道8k行不行)
回复

使用道具 举报

5#
发表于 2024-3-20 20:05 来自手机 | 只看该作者
无损这玩意儿不是把图片按序列渲染一遍吗?显卡根本不需要参与啊。422这种非主流格式,做成品鸡肋(大部分硬解方案还是420的),做中间态不如调整范围恒大的444。属于某些DV性能制约下的妥协物
回复

使用道具 举报

     
6#
 楼主| 发表于 2024-3-20 20:37 | 只看该作者
日日夜夜 发表于 2024-3-20 19:05
有的软件就是不支持qsv编码422 hevc的,尽管它(12代以后的intel核显)实际上应该支持(但真不知道8k行不行) ...

这是交付无损MOV的资源使用状况



另外达芬奇下面的H265的编码,可选INTEL QUICK SYNC,下面的编码配置文件还能选MAIN 4:2:2 10
但那个是骗人的,转出来后是10bit420
而且,这个QSV渲染其实资源占用最多的还是主显卡非核显
回复

使用道具 举报

7#
发表于 2024-3-20 20:38 | 只看该作者
Lookpapa 发表于 2024-3-20 20:37
这是交付无损MOV的资源使用状况

找了下说法,根据intel自己的说法它11、12、13代核显是的hevc 10bit 4:2:2最高只能到4k:
https://www.intel.com/content/ww ... s.html#ENCODE-11-12
A系列 hevc 10bit 4:2:2可以到16k
https://www.intel.com/content/ww ... tml#ENCODE-DISCRETE

不能保证你用的handbrake一定支持,实在不行可以试试保底ffmpeg

至于渲染到无损输出还是显卡shader性能瓶颈,和显卡的渲染速度和编码速度大概率没什么联系
回复

使用道具 举报

     
8#
 楼主| 发表于 2024-3-20 20:47 | 只看该作者
日日夜夜 发表于 2024-3-20 19:05
有的软件就是不支持qsv编码422 hevc的,尽管它(12代以后的intel核显)实际上应该支持(但真不知道8k行不行) ...

原来如此,难怪我在达芬奇下交付H265,选QSV main422 10的8k视频给我来个10bit420

问题来了:
①换ARC770,在达芬奇交付MOV 无损渲染会比2080TI快不?(如下图)


②换ARC770,在HANDBRAKE下的H265 10-bit(x265)编码下会比单纯CPU编码快么?
(我摸索过HANDBRAKE只有选这个H265 10BIT(X265),下面的编码器选项才会有422 main10,其他都只能选main或者main10)




回复

使用道具 举报

9#
发表于 2024-3-20 20:58 | 只看该作者
本帖最后由 日日夜夜 于 2024-3-20 21:01 编辑
Lookpapa 发表于 2024-3-20 20:47
原来如此,难怪我在达芬奇下交付H265,选QSV main422 10的8k视频给我来个10bit420

问题来了:

1.这个问题回答不了,因为硬件加速看intel和nvidia有没有实现 “你选择的效果需要支持的算法” 进行硬件加速,intel同样给了表格Video Processing Features for Intel® Discrete Graphics
各个人用的算法不同,只能实测,并且不同视频处理的结论也很可能不一样

2. 这里的“x265”就是指一个叫x265的纯cpu软件,当然,handbrake是可能会调用一些显卡功能去吧数据喂给这个x265程序的(比如像素数据格式的转换,像是RGB->Y210这种过程,并不算视频编码),但是最主要最耗时的编码功能只靠cpu,所以你用x265的话选什么显卡都一样
鉴于intel官方说13700的核显应该支持4k 4:2:2 10bit hevc编码,你可以试试搞一个4k甚至1080p的看看handbrake会不会显示qsv的4:2:2,搞不好是因为超过参数导致不开启选项呢
如果用小视频依然不给qsv的4:2:2,那搞不好你买了a770依然不给你用qsv 4:2:2,那终究还是错付了
回复

使用道具 举报

     
10#
 楼主| 发表于 2024-3-20 21:26 | 只看该作者
日日夜夜 发表于 2024-3-20 20:58
1.这个问题回答不了,因为硬件加速看intel和nvidia有没有实现 “你选择的效果需要支持的算法” 进行硬件加 ...

其实第二点我也不大在意。但达芬奇下的渲染速度还是很看重的。
我一号机4090D同样的渲染成无损MOV视频只要7分钟,这台二号机2080TI要50分钟

难道要去买一张4070或80
回复

使用道具 举报

11#
发表于 2024-3-20 21:42 | 只看该作者
Lookpapa 发表于 2024-3-20 21:26
其实第二点我也不大在意。但达芬奇下的渲染速度还是很看重的。
我一号机4090D同样的渲染成无损MOV视频只 ...

要是2倍左右的区别我觉得还差不多,你确定这7倍的差距是2080->4090硬件迭代的差距吗,这也太离谱了,是我的话会试试两台机器换下显卡,排除一下软件设置问题
回复

使用道具 举报

     
12#
 楼主| 发表于 2024-3-20 21:53 | 只看该作者
日日夜夜 发表于 2024-3-20 21:42
要是2倍左右的区别我觉得还差不多,你确定这7倍的差距是2080->4090硬件迭代的差距吗,这也太离谱了,是我 ...

这个不大清楚啊。
2080TI驱动正常,打了一会儿战争机器5,4K下特效全开也没啥问题。

可能是8K的无损渲染比较难搞?看2080TI的资源使用,3D性能和显存都是一直满载

考虑到2080TI和4090显存差了2倍,CUDA数差了3倍多,再加上其他性能差异
会不会是相乘的关系
回复

使用道具 举报

13#
发表于 2024-3-20 22:05 | 只看该作者
本帖最后由 日日夜夜 于 2024-3-20 22:08 编辑
Lookpapa 发表于 2024-3-20 21:53
这个不大清楚啊。
2080TI驱动正常,打了一会儿战争机器5,4K下特效全开也没啥问题。

一般来说我会预期4090应该是2080ti的220-250%性能,显存未满的话
如你所说应该是显存满了,那耗时区别指数级上涨都不奇怪

你要不看看4090在渲染时耗了多少显存,预估一下a770显存够不够,显存够的话再多也不会比显存爆了的2080ti慢吧(这个属于瞎猜了
哦我看到你图里已经有了,gpu总内存消耗最大值约在20G左右,那a770的16G来了一样爆啊兄弟,显存爆了就得去搞慢吞吞的内存交换了
回复

使用道具 举报

     
14#
 楼主| 发表于 2024-3-20 22:17 | 只看该作者
本帖最后由 Lookpapa 于 2024-3-20 22:19 编辑
日日夜夜 发表于 2024-3-20 22:05
一般来说我会预期4090应该是2080ti的220-250%性能,显存未满的话
如你所说应该是显存满了,那耗时区别指数 ...

听你这么说赶紧去用一号机在达芬奇渲染了一下。
你看我这显存使用量只有14.6G,是不是用ARC770的16G还能拯救一下


回复

使用道具 举报

15#
发表于 2024-3-20 22:27 | 只看该作者
本帖最后由 日日夜夜 于 2024-3-20 22:29 编辑
Lookpapa 发表于 2024-3-20 22:17
听你这么说赶紧去用一号机在达芬奇渲染了一下。
你看我这显存使用量只有14.6G,是不是用ARC770的16G还能拯 ...

是我估计错了,大概是因为你这个应用场景可以交换到内存闲置的显存比较多,真正工作的时候15G也够了那好像是可以救一下的,虽然不一定能保证,现在比较大的变数是intel的算法会不会与nvidia有较大的区别,是否a770的显存用量也在这个范围。
总之得留意一下这个事情


回复

使用道具 举报

     
16#
 楼主| 发表于 2024-3-20 22:46 | 只看该作者
日日夜夜 发表于 2024-3-20 22:27
是我估计错了,大概是因为你这个应用场景可以交换到内存闲置的显存比较多,真正工作的时候15G也够了[f:220 ...

谢谢兄弟指点

从达芬奇渲染无损MOV时,一号机的CPU使用率只有7%来看,
大概率INTEL吹的DEEPLINK在这里是不会有啥效果的。
另外,从4090D的3D也是满载来看,3D也是影响渲染的要素之一。
3D算力这方面ARC770和2080TI估计也是半斤八两。

但2000块可以有16G显存而且从只有INTEL支持10bit422解码来看
至少编辑和渲染前预览这一块应该也有点帮助。

等我明天咸鱼淘的万兆网卡到了,测一下异地转码是否可行。
再看看是否把要添一块770,把交付这一步交给二号机
回复

使用道具 举报

     
17#
 楼主| 发表于 2024-3-20 22:49 | 只看该作者
日日夜夜 发表于 2024-3-20 22:27
是我估计错了,大概是因为你这个应用场景可以交换到内存闲置的显存比较多,真正工作的时候15G也够了[f:220 ...

另外追问一下,既然渲染需要3D算力和大容量显存,
是否加一块20G显存的7900XT也可以?
看了一下显卡天梯图,5000块左右差不多是4070的水平,但显存有20G
回复

使用道具 举报

18#
发表于 2024-3-20 22:55 | 只看该作者
Lookpapa 发表于 2024-3-20 22:49
另外追问一下,既然渲染需要3D算力和大容量显存,
是否加一块20G显存的7900XT也可以?
看了一下显卡天梯 ...

如果你只在意视频渲染这一步的话,是的,7900xt可能比a770更合适,至少兼容性不会有问题,性能和显存都超过a770,唯独后续的编码拉了
回复

使用道具 举报

     
19#
 楼主| 发表于 2024-3-20 22:59 | 只看该作者
日日夜夜 发表于 2024-3-20 22:55
如果你只在意视频渲染这一步的话,是的,7900xt可能比a770更合适,至少兼容性不会有问题,性能和显存都超 ...

但是要多3000多块,容我再想想
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-4-28 14:00 , Processed in 0.051074 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表