更新时间:2023.04.27 17:12:07
您可结合实际情况,直接创建已安装GPU驱动的实例,或在已有实例上自行安装GPU驱动:
nvidia-smi
命令无效,显示驱动未安装,该如何排查? 问题分析:可能是kernel-devel和kernel版本不一致,导致在安装RPM包过程中驱动程序编译出错。
解决方案:在实例内运行rpm -qa | grep $(uname -r)
命令查看kernel和kernel-devel的版本号,检测版本是否一致。若不一致,请从正规渠道下载对应的kernel-devel包,再重新安装驱动。
nvidia-smi
命令查看的CUDA版本和实际的安装版本为何不一致? 执行nvidia-smi
命令查询到的CUDA版本代表您的GPU实例可以支持的最高CUDA版本,并不代表您实际安装的CUDA版本。
不同操作系统的GPU实例,查看GPU显卡信息的操作如下:
Linux操作系统,您可以执行nvidia-smi
命令,查看GPU显卡的详细信息。
Windows操作系统,您可以在设备管理器中查看GPU显卡的详细信息。
如果您想了解GPU卡的运行和使用情况,请参考云监控概述查看。
搭载A100显卡的实例需要安装NVIDIA-Fabric Manager软件包实现多A100显卡间的网络互通。
支持。GRID驱动用于获得GPU卡的图形加速能力,适用于OpenGL等图形计算的场景。您需通过NVIDIA官方渠道购买NVIDIA GRID License后安装,具体操作请参见安装NVIDIA GRID驱动。
Windows系统的GPU实例安装GRID驱动后,VM的显示输出将由GRID驱动管理,VNC无法再获取到集成显卡的画面,因此,VNC显示会变成黑屏状态,属于正常现象。建议您使用ECS Terminal方式登录GPU实例,具体操作请参见通过控制台登录Windows实例。
若安装的GRID驱动版本无法满足您的业务需求,您可以: