|
保密级别: |
E |
|
撰写人: |
陈旺 |
|
编制日期: |
2026.03.21 |
|
最后修改日期: |
2026.03.21 |
一、硬件配置环境
因未接受邮件,硬件配置无法详细明确
二 软件配置
|
软件配置参见如下 |
|||
|
显卡驱动版本 |
BMC版本 |
cuda版本 |
系统版本 |
|
NVIDIA-Linux-x86_64-580.65.06.run |
0.02 |
NVIDIA CUDA Toolkit 13.0 |
Ubuntu 22.04.5 LTS |
三测试结论
故障设备 (SN):HH4090B202602280040 故障定义:驱动层初始化偶发性失效 (Intermittent Driver Initialization Failure)
- 技术表现 (Technical Symptoms)
- 链路层 (PCIe Layer):
- BMC 状态:Slot Presence 信号正常,硬件物理在位。
- 系统识别:执行 lspci 可正常枚举 Vendor ID 及 Device ID。
- 结论:PCIe 配置空间(Configuration Space)访问正常,底层链路层握手成功。
- 驱动/应用层 (Software Layer):
- 工具反馈:执行 nvidia-smi 报 No devices were found。
- 内核状态:NVIDIA 内核模块(Kernel Module)未能成功初始化该硬件实例,硬件处于“链路存活、功能层失效”的逻辑断层状态。
- 物理干预验证 (Physical Validation):
- 恢复路径:执行 AC Power Cycle(完全断电放电 3min)并重新执行 Reseat(物理插拔)操作后,驱动加载恢复正常,设备节点重新建立。
四测试项目
1识别测试
|
测试项目 |
SN |
BMC下显卡固件版本 |
系统下显卡固件版本 |
显卡外观颜色 |
|
固件版本识别测试 |
HH4090B202512010020 |
95.02.3C.00.02 |
95.02.3C.00.02 |
白板 |
|
固件版本识别测试 |
409020260300202 |
95.02.3C.C0.7B |
95.02.3C.C0.7B |
黑板 |
|
固件版本识别测试 |
409020260300205 |
95.02.3C.C0.7B |
95.02.3C.C0.7B |
黑板 |
|
固件版本识别测试 |
HH4090B202602280037 |
95.02.3C.00.02 |
95.02.3C.00.03 |
白板 |
|
固件版本识别测试 |
HH4090B202602280039 |
95.02.3C.00.02 |
95.02.3C.00.02 |
白板 |
|
固件版本识别测试 |
HH4090B202512010018 |
95.02.3C.00.02 |
95.02.3C.00.02 |
白板 |
|
固件版本识别测试 |
HH4090B202512010019 |
95.02.3C.00.02 |
95.02.3C.00.02 |
白板 |
|
固件版本识别测试 |
HH4090B202602280040 (时有时无) |
95.02.3C.00.02 |
95.02.3C.00.02 |
白板 |
|
固件版本识别测试 |
409020260300031 |
95.02.3C.C0.7B |
95.02.3C.C0.7B |
黑板 |
2实测显卡实图
1、HH4090B202512010020(白)
系统下查看显卡固件版本

BMC下查看显卡固件版本


2、409020260300202(黑)
系统下查看显卡固件版本

BMC下查看显卡固件版本


3、409020260300205(黑)
系统下查看显卡固件版本

BMC下查看显卡固件版本


4、HH4090B202602280037(白)
系统下查看显卡固件版本

BMC下查看显卡固件版本


5、HH4090B202602280039(白)
系统下查看显卡固件版本

BMC下查看显卡固件版本


6、HH4090B202512010018(白)
系统下查看显卡固件版本

BMC下查看显卡固件版本


7、HH4090B202512010019(白)
系统下查看显卡固件版本

BMC下查看显卡固件版本


8、HH4090B202602280040(白)
系统下查看显卡固件版本

BMC下查看显卡固件版本


其错误报告:

9、409020260300031(黑)
系统下查看显卡固件版本

BMC下查看显卡固件版本


BMC版本:

Cuda版本:

显卡驱动版本:

系统版本:












暂无评论内容