Pytorch内置函数代码解释深度学习中的转置是什么

机智客 2021-12-10 22:14:21

我们在学习深度学习或者线性代数数学的时候,肯定会听到转置这个概念。百科上的解释是,直观来看,将A的所有元素绕着一条从第1行第1列元素出发的右下方45度的射线作镜面反转,即得到A的转置。这个直观看起来就不那么直观,不过还有一句话简单扼要,行列互换。

文字描述特别是数学上的定义描述,往往给我们的感觉是把原来我们可以明白的东西整得不明白了。正好创建了Pytorch的虚拟环境,所以我们不妨借着学习深度学习的名义来把玩一下Pytorch的功能。

我们之前安装了Pytorch,也测试成功了。所以我们可以创建Tensor了,打开Ubuntu的终端,然后切换到虚拟环境,进入Python环境,开动。比如我想创建一个5*3的未初始化Tensor,命令就是x = torch.empty(5, 3)。当然我们还是创建一个有点方便的Tensor,比如创建一个随机的x = torch.rand(5, 3),这样看着舒服。也方便我们观察。

有了Tensor,我们就可以对它进行各种操作了。比如深度学习里经常用到大名鼎鼎的转置,就已经被内置到Pytorch函数了。我们可以通过t函数。上面我们创建了x的Tensor,那么想转置下,可以z_t = x.t()命令,将转置后的Tensor赋给z_t,然后打印出z_t就能看到不同了,列变行,行转列,原来是4*3,现在是3*4。就跟转个角度翻了个个一样。

另外我们要知道,转置是针对2D张量而言的,如果你创建了一个高于二维的,比如你设置x = torch.rand(5,4,6),再想x_t = x.t(),那么就会报错。系统不允许你高维转置。

当然这个只是一个非常简单的常识。不过以小见大,很多线性代数函数都已经被内置到深度学习框架Pytorch里了。比如我们可以inverse求逆矩阵。顾名思义需要是矩阵。这个对Tensor也有要求,必须是方形矩阵。比如我们可以用diag获取对角线元素。这是对单个Tensor的操作,还有的线性代数函数,则是两种Tensor的二元操作。比如内积(点积)。这个需要两个Tensor,不过它也有要求,就是必须是1D的。所以我们之前那些2D的矩阵就不能用了。我们可以创建1D的Tensor,而且个数要相同,比如创建x = torch.rand(3)和y = torch.rand(3)这样才能运行x_y = x.dot(y)命令执行内积计算,也就是a1b1+a2b2+...+anbn的计算了。

0 阅读:31

机智客

简介:始于计算机;陷于AI机器人等现代科技;终于,学傻了吧