例如下面的代码,b的维度低一些,所以和a相加的时候b的维度就会先扩充为[1,1,5,6]。
- a = torch.ones([8, 4, 5, 6])
- b = torch.ones([5, 6])
- c = a+b
- print('c =',c.size())
- # c = torch.Size([8, 4, 5, 6])
对齐后就可以跳转到规律2了。
相加时,把所有为1的轴进行复制扩充,从而得到两个维度完全相同的张量。然后对应位置相加即可。
可以相加的例子:
1、由于对应的每个轴要么相等,要么一方是1,因此可以相加。否则不可以相加。
- a = torch.ones([8, 4, 5, 6])
- b = torch.ones([1, 1, 5, 6])
- c = a+b
- # c = torch.Size([8, 4, 5, 6])
进一步:
- a = torch.ones([5, 1, 1, 5])
- b = torch.ones([5, 5])
- c = a+b
- print('c =', c.size())
- # c = torch.Size([5, 1, 5, 5])
这里 a 维度是(5,1,1,5),b 的维度是(5,5), 最终结果的 c 维度为(5,1,5,5),这里相加操作对 a 和 b 都进行了维度扩充
运算时首先按规则1,将 b 从右边与 a 对齐,b 的维度变为(1,1,5,5),
然后按规则2,a 和 b 的维度相同了,可以运算了,实际运算的时候 a 和 b 都会将维度为1的轴再进行复制扩充,维度都变为(5,1,5,5),因此可以进行加法运算了
2、一方维度全是1,可以相加
- a = torch.ones([8, 4, 5, 6])
- print('a =',a.size())
- b = torch.ones([1, 1, 1, 1])
- print('b =',b.size())
- c = a+b
- print('c =',c.size())
- # c = torch.Size([8, 4, 5, 6])
3、维度完全相等,可以相加
- a = torch.ones([8, 4, 5, 6])
- print('a =',a.size())
- b = torch.ones([8, 4, 5, 6])
- print('b =',b.size())
- c = a+b
- print('c =',c.size())
- # c = torch.Size([8, 4, 5, 6])
不可以相加的例子:
1、由于4不等于2,因此不可以相加
- a = torch.ones([8, 4, 5, 6])
- print('a =',a.size())
- b = torch.ones([1, 2, 1, 6])
- print('b =',b.size())
- c = a+b
- print('c =',c.size())
2、由于3不等于6,不可以相加
- a = torch.ones([8, 4, 5, 6])
- print('a =',a.size())
- b = torch.ones([1, 4, 1, 3])
- print('b =',b.size())
- c = a+b
- print('c =',c.size())