先吐槽一下tensorflow,好久没用tf了,忘了tf2和tf1相差很大,而且对cuda和cudnn版本对应有严格要求,如下:
https://raychiu.blog.csdn.net/article/details/121649361
https://raychiu.blog.csdn.net/article/details/119598132
https://www.tensorflow.org/install/source#common_installation_problems
实在是不如pytorch好用,但是今天避不开要用tf1.15,因此目前我的CUDA11和cudnn8就用不了了,但是平时其他环境要用也不能随便卸载了再装,考虑配置一个多CUDA环境
https://blog.csdn.net/zhy_27/article/details/123648419
安装了CUDA10.0后,默认安装位置 /usr/local 目录下,默认会建立软链接:
/usr/local/cuda --> /usr/local/cuda-10.0
配置环境变量 ~/.bashrc :
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
可以看到环境变量里配置的是软链接的地址,其实我现在有两套环境:
可以通过切换软链接来控制版本:
sudo rm -f /usr/local/cuda
sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda
sudo rm -f /usr/local/cuda
sudo ln -s /usr/local/cuda-11.0 /usr/local/cuda
相关命令:
查看cuda版本 : nvcc -V
查看位置 : which nvcc
查看NVIDIA动态使用情况: watch -n 1 nvidia-smi
cuda 版本 : cat /usr/local/cuda/version.txt
cudnn 版本 : cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
NVIDIA 驱动版本 : cat /proc/driver/nvidia/version