2022.3.17 debug过程中,一些pytorch函数:

cat函数:是将两个张量(tensor)拼接在一起,cat是concatnate的意思,即拼接,联系在一起。


>>> C=torch.cat((A,B),0)  #按维数0(行)拼接  1就是按列拼接的。这是二维张量一起拼接。

大部分我们要处理的是图像,不同的,具体查。

判断是几维的张量,用数[]这个的个数,四维度就算四个张量

>>> permute函数:这个函数:

outputRs = outputR.permute(0,2,3,1)

把outputR的图像(10,3,96,128)(tensor)转成 (128,96,3)即图像形式

>>>iconsr在basicsr基础上,利用EDVR的pcd模块,先来一个提取处理,之后,跟光流一起给双向传播的output。

所以我看能不能找到一个模块提取特征信息,也直接加到这个双向传播过程中
 

>>>pytorch的张量操作一定要看看去。

>>图像处理的一些基础知识:在神经网络中的,

为了存储图像,计算机要存储三个独立的矩阵(矩阵可以理解成二维数组),这三个矩阵分别与此图像的红色、绿色和蓝色相对应(世界上的所有颜色都可以通过红绿蓝三种颜色调配出来)。如果图像的大小是64 * 64个像素(一个像素就是一个颜色点,一个颜色点由红绿蓝三个值来表示,例如,红绿蓝为255,255,255,那么这个颜色点就是白色),所以3个64 * 64大小的矩阵在计算机中就代表了这张图像,矩阵里面的数值就对应于图像的红绿蓝强度值。

                                    2022.3.17 debug过程中,一些pytorch函数:_第1张图片

了更加方便后面的处理,我们一般把上面那3个矩阵转化成1个向量x(向量可以理解成1 * n或n * 1的数组,前者为行向量,后者为列向量,向量也会在后面的文章专门讲解)。那么这个向量x的总维数就是64 * 64 * 3,结果是12288。在人工智能领域中,每一个输入到神经网络的数据都被叫做一个特征,那么上面的这张图像中就有12288个特征。这个12288维的向量也被叫做特征向量。神经网络接收这个特征向量x作为输入,并进行预测,然后给出相应的结果。

具体的二维巻积怎么处理图像数据还不太清晰,三维的就更不用说了。

 

你可能感兴趣的:(pytorch,深度学习,机器学习)