天行内存性能测试

 

 

 

 

 

 

保密级别:

E

撰写人:

王明涛

编制日期:

2026.4.20

最后修改日期:

2026.4.20

内部资料

注意保密

 

 

 

 

 

 

 

 

一、硬件配置环境

 

7250网闸

华硕C236

2

G4560

2

CPU 散热器 1155

2

康舒550W单电

1

机箱风扇凯美8025

3

三星 16G DDR4 3200

2

定制机箱

1

定制隔离卡带芯片

2

2.2寸淘晶驰液晶屏

1

EAGET忆捷固态硬盘SSD 128G

2

辅料

1

 

二 软件配置

7250网闸配置参见如下

操作系统及

内核版本

CentOS Stream 9

内核 5.14.0-316.el9.x86_64

BIOS版本

00.01

BMC版本

3.04

测试相关工具

Intel MLC(内存延迟检查器)stream测试

 

二 测试结论

三星 (32GB) vs InnoDisk (8GB)数据对比

三星 (32GB) vs InnoDisk (8GB) 内存带宽极限对比表

流量测试模式

三星 32GBMB/s

InnoDisk 8GB (MB/s)

宜鼎领先优势

纯读取 (ALL Reads)

31,873.20

33,123.10

+1,249.90 (+3.92%)

纯非写入(所有 NT 写入)

33,859.00

35,086.00

+1,227.00 (+3.62%)

3:1 读写混合

27,083.00

28,160.70

+1,077.70 (+3.98%)

2:1 读写混合

26,654.70

27,398.20

+743.50 (+2.79%)

1:1 读写混合

25,879.70

26,896.90

+1,017.20 (+3.93%)

1:1读取与非同步读取

26,557.00

27,758.00

+1,201.00 (+4.52%)

流三元组模拟 (Stream-triad)

27,193.40

27,915.10

+721.70 (+2.65%)

 

三星 (32GB) vs InnoDisk (8GB) 延迟指标对比表

延迟指标项

三星 32GB

ns

InnoDisk 8GB (ns)

宜鼎领先优势

内存基础架构延迟 (Numa 节点 0)

57.9

54.5

3.4纳秒

L2 L2 缓存计划延迟 (HIT)

20.9

21

0.1 ns (目视)

L2 修改为 L2 缓存计划延迟 (HITM)

25.1

24.8

0.3 ns (目视)

 

三星 (32GB) vs InnoDisk (8GB) 压力表现对比表

压力状态(注入延迟指令)

三星 32GB(延迟/带宽)

宜鼎 8GB(延迟/带宽)

性能差距(延迟)

最高负载(延迟 0

71.7 ns / 25,678.4 MB/s

68.56 ns/ 26,719.2 MB/s

宜鼎快 4.4%

中等负载 (Delay 50)

63.25 ns / 11,987.5 MB/s

60.16 ns / 12,534.1 MB/s

宜鼎快 4.9%

中低负载(延迟200

59.13 ns / 4,987.8 MB/s

56.45 ns / 5,075.9 MB/s

宜鼎快 4.5%

低负载(延迟 1000

57.94 ns / 1,972.6 MB/s

55.10 ns / 2,029.9 MB/s

宜鼎快 4.9%

系统空闲(延迟20000

58.96 ns / 1,129.6 MB/s

54.59 ns / 1,216.9 MB/s

宜鼎快 7.4%

 

STREAM 单线程内存带宽对比表

测试功能

三星 32GB

宜鼎8GB

宜鼎领先优势

复制

26,920.00

28,017.50

+1,097.5 (+4.08%)

缩放

17,852.60

18,603.00

+750.4 (+4.20%)

添加

20,358.40

21,188.40

+830.0 (+4.08%)

三元组

20,387.00

21,220.50

+833.5 (+4.09%)

STREAM 多线程内存带宽对比表

测试功能

三星 32GB

宜鼎8GB

宜鼎领先优势

复制

25,256.40

26,429.90

+1,173.5 (+4.65%)

缩放

18,084.30

18,778.30

+694.0 (+3.84%)

添加

20,041.30

20,882.30

+841.0 (+4.20%)

三元组

20,086.30

20,861.00

+774.7 (+3.86%)

STREAM 连续压力测试对比表

测试功能

三星 32GB

(第1次)

三星 32GB(第100次)

宜鼎 8GB (1)

宜鼎 8GB (100)

宜鼎领先幅度(以第100次计算)

复制

26,913.50

26,938.40

27,975.70

28,009.90

+1,071.5 (+3.97%)

缩放

17,853.70

17,878.70

18,603.50

18,612.30

+733.6 (+4.10%)

添加

20,362.20

20,361.40

21,172.00

21,189.70

+828.3 (+4.06%)

综合

20,369.20

20,367.50

21,192.90

21,245.60

+878.1 (+4.31%)

结论

根据文档数据,尽管三星内存的标称规格更高(32GB、3200MHz),但在涵盖了极限带宽、基础延迟、负载压力以及多/单线程等全方位测试中,其性能表现确实全面落后于宜鼎(InnoDisk 8GB、2400MHz)。导致这种反直觉现象的核心原因,并非三星内存的质量颗粒不佳,而是硬件平台的限制与主板调度策略造成的。具体原因分析如下:1.该测试平台使用的是Intel G4560 处理器和华硕 C236 主板 这是一套经典的服务器/工作站级组合,其物理硬件最高仅支持内存运行在2400MHz。因此,三星标称的3200MHz高频实力完全无法发挥,被系统强制“降频”并锁定在与宜鼎的2400MHz相同的起跑线上。2.服务器主板求稳导致的“彼此(CL值)极大松散”这是三星落后的最致命原因。华硕C236作为服务器主板,其第一优先级是“绝对稳定”。当其识别到被降频运行的三星高端条时,为了防止蓝屏死机,主板BIOS会自动给三星内存分配一套高度的、全面的保护性措施(就像让一台主板挂档低开)。

这直接反映在文档的《基础与缓存延迟对比表》中:三星的内存基础架构延迟高达57.9ns,而大约2400MHz的鼎宜工业条由于结构更连续,延迟延迟54.5ns(快了3.4纳秒)。(补充证据:文档中的 L2 缓存延迟(HIT)分别为 20.9ns 和 21ns,几乎完全一致L2缓存是CPU内部的数据,这说明了CPU核心的磨损速度没有变,三星同步慢,部分是因为外部内存条的响应变迟钝了。)3.“起步慢”引发的吞吐量(带宽)全面缩水由于三星内存同步松散,CPU缓慢向其索要数据时,它就要比宜鼎多愣神几个时钟周期。在同样频率最高(车速相同)的情况下,“起步慢”直接导致了总体运输效率的下降。在文档的《内存带宽极限对比表》中,宜鼎在多元读写混合测试中领先三星约2.65%到4.52% 。在《STREAM多线程内存带宽对比表》中,宜鼎在复制、缩放、相加和三元组测试中,同样保持了3.84%到4.65%的领先优势。

最终结论说明三星内存限制同步在所有跑分数据中均不如宜鼎,是因为它在华硕C236主板和G4560处理器的双重下,不仅被强制降频至2400MHz,更被套上了相当严酷的松散现象。这导致三星内存每一次的数据响应速度都慢于不久于2400MHz、正好吻合的宜鼎工业条。这种非线性劣势在千万次的读写器中被不断放大,最终体现为整体吞吐短路短水约4%。这不是硬件速度故障或质量差,而是服务器平台为了追求系统“极限稳定性”而刻意牺牲了几纳秒的性能。尽管跑分略输,但三星提供的 32GB 庞大容量,依然是该设备应对高性能或大型任务时不可替代的优势。

Intel官方英特尔® 奔腾® 处理器 G4560相关信息

根据Intel官方芯片规格书,测试机装载的G4560处理器其内存控制器(IMC)硬件物理上限被锁定在2400MHz,因此无论插入多高频的内存,系统都会自动将其降频至2400MHz运行。

image

三 测试项目

内存延时测试 (Intel MLC)

 

三星内存 DDR4 3200 UIDMM 32GB

 

内存最高带宽(Peak Injection Memory Bandwidths)

流量测试模式

原始数据(MB/s

(GB/s)

纯读取 (ALL Reads)

31,873.20

31.87

纯非写入 (All NT writes)

33,859.00

33.86

3:1 读写混合

27,083.00

27.08

2:1 读写混合

26,654.70

26.65

1:1 读写混合

25,879.70

25.88

1:1 读取与非同步读取

26,557.00

26.56

流三元组模拟

27,193.40

27.19

节点间纯读取 (Numa)

31,766.00

31.77

 

 

 

 

基础与缓存延迟(Idle & Cache Latency)

 

延迟指标项

响应时间(ns)

内存基础架构延迟(Numa 节点 0)

57.9

L2 到 L2 缓存计划延迟 (HIT)

20.9

L2 修改到 L2 缓存计划延迟 (HITM)

25.1

     

 

负载与延迟压力矩阵(Loaded Latency)

注入延迟指令(Delay

实际测得延迟(Latency, ns

对应实测带宽(Bandwidth, MB/s)

状态参考

0

71.7

25,678.40

极高负载

2

71.72

25,706.90

 

8

71.6

25,701.40

 

15

70.78

24,482.50

 

50

63.25

11,987.50

中等负载率

100

61.08

7,518.90

 

200

59.13

4,987.80

 

300

58.76

3,798.60

 

400

62.03

3,094.40

 

500

58.43

2,782.10

 

700

58.04

2,324.10

闲置回落

1000

57.94

1,972.60

 

1300

57.79

1,778.30

 

1700

57.73

1,624.50

 

2500

57.73

1,458.10

 

3500

57.75

1,360.90

 

5000

57.73

1,285.80

 

9000

57.73

1,207.30

 

20000

58.96

1,129.60

系统休闲

 

 

内存性能—带宽—单线程

image

 

内存性能—带宽—多线程

 

image

 

内存压力–Linux下内存渐变压力测试

 

image

 

image

 

 

 

 

InnoDisk 宜鼎 DDR4 2400 16G

内存最高带宽(Peak Injection Memory Bandwidths)

流量测试模式

原始数据(MB/s

(GB/s)

纯读取 (ALL Reads)

33,123.10

33.12

纯非写入 (All NT writes)

35,086.00

35.09

3:1 读写混合

28,160.70

28.16

2:1 读写混合

27,398.20

27.4

1:1 读写混合

26,896.90

26.9

1:1 读取与非同步读取

27,758.00

27.76

流三元组模拟

27,915.10

27.92

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

基础与缓存延迟(Idle & Cache Latency)

 

延迟指标项

响应时间(ns)

内存基础架构延迟(Numa 节点 0

54.5

L2 L2 缓存计划延迟 (HIT)

21

L2 修改到 L2 缓存计划延迟 (HITM)

24.8

 

 

 

 

 

 

 

 

 

负载与延迟压力矩阵(Loaded Latency)

 

注入延迟指令(Delay

实际测得延迟(Latency, ns

对应实测带宽(Bandwidth, MB/s)

00000(最高负载)

68.56

26,719.20

00050(中等负载)

60.16

12,534.10

00200(中低负载)

56.45

5,075.90

01000(低负载)

55.1

2,029.90

20000(系统空闲)

54.59

1,216.90

 

 

内存性能—带宽—单线程

image

 

内存性能—带宽—多线程

image

 

内存压力–Linux下内存渐变压力测试

image

image

 

 

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容