Stage1st

 找回密码
 立即注册
搜索
查看: 2520|回复: 21
打印 上一主题 下一主题

[硬件] 准备装一台县城撕裂者7970X的HEDT跑仿真,配置单求意见

[复制链接]
     
跳转到指定楼层
楼主
发表于 2024-2-22 14:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
主要用途是拿来跑全波电磁仿真(FEKO,HFSS等等),主频优先的情况下核心数量越多越好,所以没有选择9000系EPYC,目前敲定的配置单如下:
CPU 7970X盒装 美亚进口 20500元(含运费关税)
GPU RTX4080或RTX A2000 已经有了 0元
RAM 美光 DDR5 RDIMM 5600MT/s 32GB*4 淘宝集运到日本 2700元
主板 TRX50 AERO D 日亚行货 6280元
电源 Thermaltake TOUGHPOWER GRAND RGB 850W 已经有了 0元
散热器 猫头鹰NH-U14S TR5-SP6 淘宝集运 735元
机箱 Thermaltake H570(待定,也可以换别的) 日亚 637元

大半都已经敲定了,但是唯一有一点担心的就是电源要不要换,因为现在已经有一个850W的电源在带13700F+4080了,想着能不换就不换。因为预计跟4080一起使用,7970X的PBO峰值500W烤鸡稳定385W左右,然后4080满载也是350W左右,虽然不会遇到双烤的极端情况,但还是想问问大家的意见是不是应该换一个1000W或者1200W的电源

然后今天顺便搜了一下7000系线程撕裂者的4K游戏测试,发现根本没有,顶多就做到1440P,我知道分辨率低才能体现出CPU瓶颈,但4K是不是真的帧数差不多我是真没看到有任何人做。
会想知道这个主要还是因为虽然主要目的是跑仿真,但其实还是想着放家里平时再干点别的事比如压制视频,再打打游戏什么的。
如果4K下差距真的跟MSDT平台差距很大,那我就要再考虑一下这个机器放哪的问题了,因为如果打不了游戏我就准备装A2000放到工位去嫖电(毕竟跑仿真这个算工作,必不可能吃自己家的电),能打游戏就装4080然后放家里这样(可以顺便干点别的),不知道大家有没有什么可供参考的信息
回复

使用道具 举报

     
2#
发表于 2024-2-22 15:04 来自手机 | 只看该作者
可以打游戏的放宽心,我曾经拿3970x打游戏和当时新的zen3旗舰5950x在4k分辨率下并不差太多。电源肯定要换,当时用3970x+3090 海盗船内置的功耗计 双烤鸡最高测得1100多w
回复

使用道具 举报

     
3#
发表于 2024-2-22 15:55 | 只看该作者
县城:什么仇什么怨
回复

使用道具 举报

     
4#
发表于 2024-2-22 15:57 | 只看该作者
大县城瑟瑟发抖
回复

使用道具 举报

5#
发表于 2024-2-22 16:03 | 只看该作者
仿真的时间长,还是游戏的时间长?如果天天跑仿真,即便能4K游戏,也丢单位吃电。
回复

使用道具 举报

     
6#
发表于 2024-2-22 17:08 来自手机 | 只看该作者
自己掏钱买threadripper也太壕了
回复

使用道具 举报

     
7#
 楼主| 发表于 2024-2-22 18:04 | 只看该作者
muderx 发表于 2024-2-22 17:03
仿真的时间长,还是游戏的时间长?如果天天跑仿真,即便能4K游戏,也丢单位吃电。 ...

我这边是博士在读,工作肯定是比游戏多的,但整个工作流程其实是一阵一阵的:做仿真出结果,去做实验,写论文,再进下一步改模型继续这样,所以不仿真的时间其实也大把。我是想要是可以的话就放家里,方便自己管理,顺便还能看看能不能在本地提供一下点对点的算力出租,我们当地有个留学生居多的互助二手群,里面肯定有理工科和医学的同学需要这样的服务,算是赚点外快这样。放学校工位可以,但是我们学校防火墙非常严格,禁用了非常用端口和所有的UDP流量,所以一旦放过去就相当于只能跑仿真了,这又是我不太愿意的,说实话有点烦恼
回复

使用道具 举报

     
8#
 楼主| 发表于 2024-2-22 18:07 | 只看该作者
香港记者巴拉森 发表于 2024-2-22 18:08
自己掏钱买threadripper也太壕了

其实我这一方面算自己好奇,另一方面是快点出结果确实能加快科研进度,最大的原因是我们导师其实不太了解电脑性能,特别是代际之间的差距,属于那种3代酷睿但是只要是i7那就牛逼的那种,完全不考虑代差。我觉得其实老师也清楚,就是不想花经费,因为我们底下学生水平有点菜,买了也是吃灰,很合理的省钱心理,所以就想着自己买回来试试看了
回复

使用道具 举报

     
9#
发表于 2024-2-23 13:33 | 只看该作者
王牛子 发表于 2024-2-22 18:07
其实我这一方面算自己好奇,另一方面是快点出结果确实能加快科研进度,最大的原因是我们导师其实不太了解 ...

如果你相信我的话,不要买任何不好出二手的配件做工作机,诸如线程撕裂者、金牌处理器之类的

除非你很有钱,或者不在乎钱

按照我的经历

先确定仿真软件吃处理器还是吃显卡

然后进行配置侧重

比如说我那个需求,就是需求cpu,然后软件手册里说明了超线程效率不高,于是乎我就购买了9700K,64g内存,其它也就一个固态,显卡和电源按照总功耗和玩游戏的需求配了一个600w的白金电源

后来发现8个大核心比16线的8700慢

于是只购买了9900k,就这么套配置,显卡根据游戏换了若干次,但是处理器一直陪着我到最后

然后这套配置二手好出,今年又升级了板和U

以上
回复

使用道具 举报

     
10#
发表于 2024-2-23 14:14 | 只看该作者
借楼问下,公司想买台新服务器跑计算(老集群太慢了),预算不是很足,大概5w的预算经销商给我们推荐了双路EPYC7702的服务器,但是这个u有点老吧。经销商那边说新款服务器缺货,需要等还得加钱,经销商这个说法靠谱吗
回复

使用道具 举报

     
11#
发表于 2024-2-23 14:28 | 只看该作者
本帖最后由 icer 于 2024-2-23 14:32 编辑

个人经验:异构或者吃显卡的计算不如intel平台,i7就够;吃CPU的建议买双路CPU,最近准备买双路7b13,估计三万多
补充一下:双路7r32性价比也挺好的
回复

使用道具 举报

     
12#
 楼主| 发表于 2024-2-23 14:45 | 只看该作者
本帖最后由 王牛子 于 2024-2-23 15:59 编辑
imissrain 发表于 2024-2-23 14:33
如果你相信我的话,不要买任何不好出二手的配件做工作机,诸如线程撕裂者、金牌处理器之类的

除非你很有 ...

其实我在装之前就已经发ticket去问过FEKO软件的工程师了,对方给了我很明确的答复,我也是基于此进行的选择,全文我就不贴了,说几个要点吧:
问1:在相同价位或内核数量的情况下,英特尔至强是否比 AMD EPYC 更具优势?
答1:这取决于处理器系列。英特尔很早就支持 AVX512,而 AMD 最近在 2022 年才加入(Zen4 架构的一部分)。根据算法的不同,Feko 从 AVX512 指令中获得的收益也有大有小:对于 MoM,最终求解时间几乎相差 2 倍;对于 MLFMM,相差约 20%;对于其他求解器,相差甚至更小。
补充:根据我自己使用7950X进行的测算,对于16核的规模来说,AVX512和超线程的影响非常轻微,即便是工程师宣称影响最大的MoM法解算器,我测出来的时间差也仅有几秒的差距,可能需要更大的问题规模和更强大的硬件才能体现出来
问题 2:我做了一些研究,发现 Feko 使用的 MoM 是频域方法,而且是隐式方法。这是否意味着对于 Feko 求解器来说,当它使用 MoM 方法时,提高 CPU 的时钟速度比增加内核数量更有效?
答 2:如果我们比较两个硬件,一个硬件的内核数多两倍,另一个硬件的 CPU 速度快两倍,那么第二个硬件解决 MoM 问题的速度会更快。原因很明显:使用的内核越多,执行的进程就越多,它们之间需要进行的通信也就越多。每个 MPI 通信都有一定的延迟,这会降低总性能。

问题 3:接着上一个问题,由于 Feko 求解器在求解之前需要剖析和细化模型(网格),而这一过程似乎是由单核心完成的,那么服务器 CPU 的单核心时钟速度普遍较低,是否会影响大型模型的网格划分速度?
答 3:我们使用第三方来进行实际网格划分,还没有对时钟速度的实际影响进行深入研究,但我们预计较慢的单核时钟种子会降低网格划分速度。所以是的,一般来说,低单核时钟速度会降低网格划分速度。

问 4:在具有多个 NUMA 节点的系统中运行 Feko 求解器时,是否会出现重大性能损失?
答 4:通常情况下,多个 NUMA 节点意味着内核和内存之间的总通道带宽更大,这对 Feko 是有利的。但必须指出的是,对于 Feko 使用的大多数算法而言,只要算法的计算密集度很高,内存带宽就不会成为瓶颈。值得一提的是,到目前为止,Feko 还没有任何特定的 NUMA 优化。

问 5:内存吞吐量是否会明显影响 Feko 求解器的求解速度,例如双通道、四通道、八通道,增加内存通道是否会对求解速度有任何帮助?
答 5:我们没有做这样的具体测试,但如上所述,内存并不是主要瓶颈,我们预计不会产生巨大影响(比方说,如果通道数量较少,速度可能会慢几十个百分点,但不会慢几倍)。

问 6:接着上一个问题,我知道 Feko 求解器希望并行计算时所有内核的时钟速度和性能相近,但由于我仍在使用消费平台上的第 13 代英特尔 CPU 13700F,它有 8 个性能内核和 8 个效率内核,为了优化求解器的速度,我是否应该关闭 8 个时钟速度较低的效率内核以及 CPU 的超线程功能?
答 6 : 是的,只要内部工作负载尽可能均匀地分配给所有计算实体,计算能力不均匀的系统的 Feko 总效率就会降低。考虑到这一点,最好使用同构系统进行计算,但就最终计算时间而言,使用 16 个内核仍然是有益的(但肯定比只使用 8 个高性能内核要快一点)。

所以总的来说就跟我在帖子开头说的一样,我根据FEKO官方工程师和其他服务器工作站专业人士的意见,以主频优先于核心的指导思想选择了HEDT平台的线程撕裂者,有着明确的需求,并不是什么头疼脑热想出来的昏招,顺便算电磁场是一个纯CPU负载,FEKO有CUDA加速的功能,但并不能跟CPU并行一起使用,平时几乎用不到,如果想加快速度,一方面是提高单机的CPU性能,到顶了就构建MPI集群这样。而且讲真的,你用的多应该了解过,对于全核满载的计算场景,超线程都是需要关闭的,核心越多越应该关,理由很简单,进程越多沟通延迟就越大,反而降低性能,并不是因为“软件不吃超线程就去买不支持超线程的CPU”,而是因为超线程功能会影响并行性能所以需要关闭,先后顺序就错了。


回复

使用道具 举报

     
13#
 楼主| 发表于 2024-2-23 14:53 | 只看该作者
icer 发表于 2024-2-23 15:28
个人经验:异构或者吃显卡的计算不如intel平台,i7就够;吃CPU的建议买双路CPU,最近准备买双路7b13,估计 ...

我已经问过官方工程师了,建议看我上面的回复,EPYC我早有考量,要买就用9000系因为有半宽AVX512,但是主频太低,故不做考虑
回复

使用道具 举报

     
14#
发表于 2024-2-23 15:31 | 只看该作者
每次说intel小核纯辣鸡总有人不信
回复

使用道具 举报

     
15#
发表于 2024-2-23 16:02 来自手机 | 只看该作者
imissrain 发表于 2024-2-23 13:33
如果你相信我的话,不要买任何不好出二手的配件做工作机,诸如线程撕裂者、金牌处理器之类的

除非你很有 ...

其实你玩过就知道线撕和铂金高端的型号比普通的u还更好出手,和显卡一样很多贩子不看成色卷着收的点亮就打款,都不用和普通用户扯皮。
回复

使用道具 举报

     
16#
发表于 2024-2-23 16:14 来自手机 | 只看该作者
按照上面的说法来看似乎7950x就是最好的选择
回复

使用道具 举报

     
17#
 楼主| 发表于 2024-2-23 16:22 | 只看该作者
香港记者巴拉森 发表于 2024-2-23 17:14
按照上面的说法来看似乎7950x就是最好的选择

其实我也考虑过7950X集群,一方面是买那么多配件装起来麻烦,软件配置也要捣鼓,而且买多了也摆不下,一个集群除了运算也干不了别的,我在这方面私心比较重,毕竟用的是自己的钱,肯定是希望用来干点别的事的,那肯定是想试试单体无敌的撕裂者的,而且我感觉sTR5和AM5一样都是AMD刚换的新平台,现在入指不定还能换用到接下来的三代线撕,当然是我的一厢情愿就是了
回复

使用道具 举报

     
18#
发表于 2024-2-23 16:29 | 只看该作者
大县城居民看到标题心头一凛
回复

使用道具 举报

     
19#
发表于 2024-2-23 18:19 | 只看该作者
本帖最后由 天神十三煞 于 2024-2-23 18:31 编辑

买了十几年HEDT第一次知道其二手不好出。
四代县城撕裂者都用过,除了NUMA那代体验很差以外,其他三代都长期使用过
目前5995wx表示玩游戏2160p一开都没啥区别,
都是一帧吊打两帧秒杀的水平。
要干重负载活总是核越多越好的,不要信什么多少线程核心多少水平的优化买什么最划算
只要预算足就是虽然占不到但是我得有,暴论就是一切少核吹的人都是预算不足罢了
浪费的地方也许是浪费了,但是不够的时候你少核的却没法临时补。
核到用时方恨少,再不济作为码农有些东西还能多切几份一起跑。
回复

使用道具 举报

     
20#
 楼主| 发表于 2024-2-23 18:33 来自手机 | 只看该作者
天神十三煞 发表于 2024-2-23 19:19
买了十几年HEDT第一次知道其二手不好出。
四代县城撕裂者都用过,除了NUMA那代体验很差以外,其他三代都长 ...

我是最近一年天线模型慢慢做大了才发现消费级算的是真慢,然后跑东西要关SMT,那MSDT核少的本质就一下被暴露出来了,强如7950X关掉SMT也就16个物理核心,英特尔那边甚至还是万恶的大小核,这次上7970X主要还是入门,新平台以后有预算了准备把CPU慢慢往上升,当然这个就跟我的模型大小挂钩了,如果有需求再说

—— 来自 Sony 901SO, Android 10上的 S1Next-鹅版 v2.1.2
回复

使用道具 举报

     
21#
发表于 2024-2-23 19:37 来自手机 | 只看该作者
干活的话 同容量内存插槽记得塞满

—— 来自 samsung SM-N9860, Android 13上的 S1Next-鹅版 v2.5.2-play
回复

使用道具 举报

22#
发表于 2024-2-23 19:40 | 只看该作者
之前算高精度都是学校租超算跑的,普通电脑再高也不太行
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-5-4 08:15 , Processed in 0.037609 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表