Stage1st

 找回密码
 立即注册
搜索
12
返回列表 发新帖
楼主: nemo_snowman
打印 上一主题 下一主题

[硬件] 龙芯6600架构超越Zen3

[复制链接]
     
41#
发表于 2024-3-26 02:03 | 只看该作者
卖哥 发表于 2024-3-25 14:26
龙架构指令集里有800条是拿来提高转译效率的。

翻译指令200条不到
700多条128位向量指令+700多条256位向量指令
回复

使用道具 举报

     
42#
发表于 2024-3-26 02:09 | 只看该作者
Midnight.Coup 发表于 2024-3-22 23:33
龙芯的SPEC06成绩不是定向优化的嘛

定向优化个啥啊,造谣0成本么
gcc上游已经合并一年多了,复现成绩发出来的人两只手指都数不过来了
3a6000我都用了快一年了,以龙芯的舆论环境,真要是有啥巨大差异,早被刷了几百万次头条了

回复

使用道具 举报

     
43#
发表于 2024-3-26 02:19 | 只看该作者
kuleisite1992 发表于 2024-3-23 09:57
3A6000那个SPEC17分数帖子还是我转的。

问题是20分,我看有些人还要吹22分/G

3a6000其实还是有些地方搓烂了的
比如hardware page walker,烂了
现在卖的3a6000这项功能都是固件关闭的
向量指令有些延迟和吞吐比i/a还有差距,load/store 超线程环境下性能下降

就这样还有17/GHz, 而且穷逼龙芯为了省钱,这些都不修,就直接卖了(修还得重新流片)

老胡自己说的是20分,但是最新ppt显示老胡又打算省钱了
老胡又搓了一个8发射的la864内核,就是不知道是3b6600 流片两种,还是 4+4(4xla664改+4xla864)

回复

使用道具 举报

     
44#
发表于 2024-3-26 08:17 | 只看该作者

是我消息落后了
回复

使用道具 举报

     
45#
发表于 2024-3-26 09:04 来自手机 | 只看该作者

印象里邮件列表还在搞编译服务器,这就已经成了?
回复

使用道具 举报

     
46#
发表于 2024-3-26 09:24 来自手机 | 只看该作者
phorcys02 发表于 2024-3-26 02:09
定向优化个啥啊,造谣0成本么
gcc上游已经合并一年多了,复现成绩发出来的人两只手指都数不过来了
3a6000 ...

所以很想问一下
现在到底水平如何?
以后可以的话打算买一个放客厅里当机顶盒看b站用

—— 来自 OnePlus GM1900, Android 10上的 S1Next-鹅版 v2.5.2-play
回复

使用道具 举报

     
47#
发表于 2024-3-26 09:48 | 只看该作者
geeky_kappa 发表于 2024-3-26 09:04
印象里邮件列表还在搞编译服务器,这就已经成了?

debian现在
amd64/arm64/rv64/loong64 包数量分别是
174xx/172xx/163xx/153xx

rv64比loong64先搞了好几年呢
回复

使用道具 举报

     
48#
发表于 2024-3-26 09:50 | 只看该作者
7776169 发表于 2024-3-26 09:24
所以很想问一下
现在到底水平如何?
以后可以的话打算买一个放客厅里当机顶盒看b站用

目前不适合当机顶盒,因为集显没搓出来解码ip
得挂一个 a卡或者 intel的卡

回复

使用道具 举报

     
49#
发表于 2024-3-26 10:29 | 只看该作者
phorcys02 发表于 2024-3-26 02:09
定向优化个啥啊,造谣0成本么
gcc上游已经合并一年多了,复现成绩发出来的人两只手指都数不过来了
3a6000 ...

这个官方说的怎么就是我造谣了
回复

使用道具 举报

50#
发表于 2024-3-26 10:50 | 只看该作者
Midnight.Coup 发表于 2024-3-26 10:29
这个官方说的怎么就是我造谣了

编译器增加了新指令集支持所以分数提高了,很正常啊,这是常规优化。
回复

使用道具 举报

     
51#
发表于 2024-3-26 10:56 | 只看该作者
Midnight.Coup 发表于 2024-3-26 10:29
这个官方说的怎么就是我造谣了

定向优化是指这个编译器只有spec提高了。
你证明一下
回复

使用道具 举报

     
52#
发表于 2024-3-26 10:59 | 只看该作者
本帖最后由 Midnight.Coup 于 2024-3-26 11:00 编辑
卖哥 发表于 2024-3-26 10:56
定向优化是指这个编译器只有spec提高了。
你证明一下

你说的这叫“只对spec06定向优化”,怎么比隔壁海军果粉还魔怔人
回复

使用道具 举报

     
53#
发表于 2024-3-26 11:05 | 只看该作者
本帖最后由 卖哥 于 2024-3-26 11:10 编辑
Midnight.Coup 发表于 2024-3-26 10:59
你说的这叫“只对spec06定向优化”,怎么比隔壁海军果粉还魔怔人

很奇怪么,这事情又不少见。
https://news.mydrivers.com/1/963/963773.htm

英特尔往编译器里塞了预先写好了一些二进制代码,在编译SPEC cpu2017的523.xalancbmk_r、623.xalancbmk_s项目时不走流程直接用现成的。
回复

使用道具 举报

     
54#
发表于 2024-3-26 11:14 | 只看该作者
本帖最后由 Midnight.Coup 于 2024-3-26 11:15 编辑

我看了下这个 oneAPI DPC++/C++ Compiler 就是 ICC 的后继版本,ICC 作弊这么多年了大家都知道,但真有需要的用 IU 也会去 ICC 编译,虽然问题一大堆,而且同为 x86 的 AU 都吃不到这个加成
回复

使用道具 举报

     
55#
发表于 2024-3-26 11:17 | 只看该作者
Midnight.Coup 发表于 2024-3-26 11:14
我看了下这个 oneAPI DPC++/C++ Compiler 就是 ICC 的后继版本,ICC 作弊这么多年了大家都知道,但真有需 ...

被封不是性能优化无法应用于AU,是
The compiler used for this result was performing a compilation that specifically improves the performance of the 523.xalancbmk_r / 623.xalancbmk_s benchmarks using a priori knowledge

而是针对特定源代码内置了预先写好的二进制代码,估计是英特尔老师傅手搓优化的。
回复

使用道具 举报

     
56#
发表于 2024-3-26 11:51 | 只看该作者
卖哥 发表于 2024-3-26 11:17
被封不是性能优化无法应用于AU,是

而是针对特定源代码内置了预先写好的二进制代码,估计是英特尔老师傅 ...

只能说 Sapphire Rapids-SP 这代实在太拉了,后面的 Emerald Rapids-SP 就没有这个问题
回复

使用道具 举报

     
57#
发表于 2024-3-26 11:53 | 只看该作者
Midnight.Coup 发表于 2024-3-26 10:29
这个官方说的怎么就是我造谣了

"定向优化“
像icc或者掏钱买几个对spec有加成的库,叫做”定向优化“

龙芯无论新旧世界,gcc代码都是公开的
只有全面优化,没有”定向优化“
你关注gcc maillist就会发现每周每月都在慢慢修

甚至现在的优化程度和自动向量化,还不配给x86提鞋
但就这垃圾gcc,也有17分/GHz了

回复

使用道具 举报

     
58#
发表于 2024-3-26 12:26 | 只看该作者
本帖最后由 Midnight.Coup 于 2024-3-26 12:34 编辑
phorcys02 发表于 2024-3-26 11:53
"定向优化“
像icc或者掏钱买几个对spec有加成的库,叫做”定向优化“

https://zhuanlan.zhihu.com/p/654721485
Loongnix 的 GCC 8.3.0 其实是开源的,可以从源里面下载源码(http://www.loongnix.cn/zh/toolchain/GNU/),但里面是一堆 patch,很多修改没有贡献到上游。
现在这些 patch 已经上游化了?龙芯官方微信号上那些成绩是在新世界还是旧世界上跑出来的
回复

使用道具 举报

     
59#
发表于 2024-3-26 12:38 | 只看该作者
Midnight.Coup 发表于 2024-3-26 12:26
https://zhuanlan.zhihu.com/p/654721485
现在这些 patch 已经上游化了?龙芯官方微信号上那些成绩是在新 ...

官方成绩是loongnix跑的
新世界的成绩也很多,比官方的低10%(去年),5%(今年),你用的gcc越新,成绩越高
那些patch正在慢慢上游化,毕竟gcc review还是很严格的
不像龙芯自己搓的时候爱怎么写都行

回复

使用道具 举报

     
60#
发表于 2024-3-26 12:44 来自手机 | 只看该作者
卖哥 发表于 2024-3-26 11:17
被封不是性能优化无法应用于AU,是

而是针对特定源代码内置了预先写好的二进制代码,估计是英特尔老师傅 ...

不是预制二进制代码,而是改了benchmark代码里的buffer size。
回复

使用道具 举报

     
61#
发表于 2024-3-26 12:53 | 只看该作者
W.K0n9 发表于 2024-3-25 13:25
龙芯要进消费级市场,性能反倒是影响最小的那一环吧LoongArch架构下只能用Linux系统就足够劝退很大 ...

现在有liblol (loongarch on loongarch)

旧世界应用 直接拿过来二进制新世界就能无痛无损耗跑
迁移不迁移其实短期内已经不重要了
回复

使用道具 举报

     
62#
发表于 2024-3-26 13:28 | 只看该作者
本帖最后由 Midnight.Coup 于 2024-3-26 13:30 编辑
phorcys02 发表于 2024-3-26 12:53
现在有liblol (loongarch on loongarch)

旧世界应用 直接拿过来二进制新世界就能无痛无损耗跑
为何新世界程序加载旧世界库不可实现?
由于 libLoL 打包的 glibc 并未替换新世界系统的 glibc, 新世界的可执行程序与库都完全没有必要,也不会感知到 libLoL 的存在。 因此,新世界的可执行程序无法载入旧世界提供的动态链接库:宿主系统的 libc 不存在旧世界的 ELF 符号版本。
该需求较为罕见,但存在一种典型场景:输入法。 按照目前 Linux 常见的输入法支持架构,应用程序支持输入法的方式是由其图形界面工具库(GUI toolkit), 如 GTK、Qt 等,按照一定规则,搜索并加载由输入法软件提供的动态链接库。 因此对于旧世界的输入法软件,其提供的动态链接库是旧世界的,无法被新世界的应用程序载入。 由于 libLoL 采用非侵入宿主系统的设计,无法支持在新世界系统上使用旧世界的输入法; 只能呼吁相关厂商适配新世界。
libLoL 运行时的发行目前,libLoL 项目的运行时部分实质上是 patchelf 工具和 glibc 的补丁合集。在构建时,首先构建 glibc,然后构建修改版的 patchelf,最后以此 patchelf 给编译出的glibc 的动态链接库文件进行后处理。这一构建过程较为复杂,并且难以用发行版无关的方式描述,因此 libLoL 项目难以简单地被打包到其它发行版中,用户也很难自行构建。目前,libLoL 项目提供适配 AOSC OS 和 Debian 的发行包。其他需要打包 libLoL 的发行版开发人员需要根据本发行版对 glibc 的处理方式,以及目录布局等相关情况,按照上述基本流程为本发行版定制 libLoL 构建方式。

截至 2024 年 2 月,已经发售的龙芯 3A5000 和龙芯 3A6000 系列等龙架构办公终端类产品,出厂或交付时默认搭载的都是「旧世界」的操作系统和软件。如果您使用过这类终端,相信您很可能使用过 WPS、腾讯会议、微信、QQ、炒股软件、龙芯浏览器等软件。您的组织也可能为其购买或开发了一些商业软件。到目前为止,这些都是基于「旧世界」的软件。「新世界」是龙架构发布后,龙芯中科与社区协作开发的软件生态。目前已经有社区支持的「新世界」操作系统,但是尚未有商业操作系统迁移至「新世界」。

https://areweloongyet.com/docs/world-compat-details/liblol/
这个方案也不是那么万能的,龙芯官方能早日迁移还是早日迁移吧,旧世界反正已经不再会有大的更新了,系统库要更新到最新主流版本也比较麻烦
WP7 当年走过路的,就不要再走了一遍了。其实龙芯完全可以把 loongnix 做成基于 BSD 全部自己开发的一个完整的系统,然后社区版从这个系统的开源版本上改,类似 AOSP 的玩法
回复

使用道具 举报

     
63#
发表于 2024-3-26 13:33 | 只看该作者
Midnight.Coup 发表于 2024-3-26 13:28
https://areweloongyet.com/docs/world-compat-details/liblol/
能早日迁移还是早日迁移吧,旧世界反正已 ...

和wp7 迁移差别还是很大的
基本上绝大部分应用只是需要重新make一下就行,有部分需要升级下三方库版本

旧版本可以不用管直接用liblol运行
等龙芯/uos/deepin 发布新版系统以后,在新版系统上额外构建一次就行了

wp7当年变动可太大了,简直翻天覆地,新旧世界 只有 几个syscall 和 sig_t的变动,还有glibc封了一层
对于绝大部分软件来说基本无感
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-4-28 23:43 , Processed in 0.042139 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表