可以在终端输入nvidia-smi来看自己的显卡信息。
然后就是关于GPU的一些操作。这里要提醒的一点就是,程序的计算一定要选好是使用GPU进行计算还是使用CPU,因为本来CPU往GPU传输数据的时间就长,所以假如你没有设置好计算的设备,或者设置乱了的话,就会导致你设置出来的东西性能没有那么好。所以要三思。
- #计算设备
- import torch
- from torch import nn
- print(torch.device('cpu'), torch.cuda.device('cuda'), torch.cuda.device('cuda:1'))
- #查询可用gpu的数量
- print(torch.cuda.device_count())
- #这两个函数允许我们在请求的GPU不存在的情况下运行代码
- def try_gpu(i=0):
- """如果存在,则返回gpu(i),否则返回cpu()。"""
- if torch.cuda.device_count() >= i + 1:
- return torch.device(f'cuda:{i}')
- return torch.device('cpu')
- def try_all_gpus():
- """返回所有可用的GPU,如果没有GPU,则返回[cpu(),]。"""
- devices = [
- torch.device(f'cuda:{i}') for i in range(torch.cuda.device_count())]
- return devices if devices else [torch.device('cpu')]
- print(try_gpu(), try_gpu(10), try_all_gpus())
- #查询张量所在的设备
- x = torch.tensor([1, 2, 3])
- print(x.device)
- #存储在GPU上
- X = torch.ones(2, 3, device=try_gpu())
- print(X)
- #第二个GPU上创建一个随机张量
- Y = torch.rand(2, 3, device=try_gpu(0))
- print(Y)
- #要计算X + Y,我们需要决定在哪里执行这个操作
- Z = X.cuda(0)
- print(X)
- print(Z)
- #现在数据在同一个GPU上(Z和Y都在),我们可以将它们相加
- print(Y + Z)
- print(Z.cuda(0) is Z)
- #神经网络与GPU
- net = nn.Sequential(nn.Linear(3, 1))
- net = net.to(device=try_gpu())
- print(net(X))
- #确认模型参数存储在同一个GPU上
- print(net[0].weight.data.device)
输出:
cpu
1
cuda:0 cpu [device(type='cuda', index=0)]
cpu
tensor([[1., 1., 1.],
[1., 1., 1.]], device='cuda:0')
tensor([[0.9217, 0.0568, 0.5230],
[0.0626, 0.0854, 0.6800]], device='cuda:0')
tensor([[1., 1., 1.],
[1., 1., 1.]], device='cuda:0')
tensor([[1., 1., 1.],
[1., 1., 1.]], device='cuda:0')
tensor([[1.9217, 1.0568, 1.5230],
[1.0626, 1.0854, 1.6800]], device='cuda:0')
True
tensor([[-0.2915],
[-0.2915]], device='cuda:0', grad_fn=)
cuda:0
沐神还教了如何购买GPU,有想了解的同学可以自行查看b站视频。