硬件:联想的双3090显卡 总共 48GB显存 4TB 刀片式服务器。
软件:只安装了nvidia的驱动,能用nvidia-smi查看显卡信息,但是 nvcc -V看不到东西。
镜像包是 nvidia_cu11_tf15.tar,里面包含
- tensorflow 1.15.2+nv
- tensorflow-estimator 1.15.1
- tensorrt 7.1.2.8
- torch 1.9.0
- torchvision 0.10.0
公司nvidia驱动和环境里的TensorFlow,torch 是不一样的。一开始担心 是不是 要 降级 Ubuntu下的显卡驱动。
背景: