深度学习 - 现实世界中的数据张量的理解

深度学习 - 现实世界中的数据张量的理解

向量数据:2D张量

时间序列数据或序列数据:3D张量

图像数据:4D张量

视频数据:5D张量

其实很好理解,向量本身的1D张量,加上序号就多了1个轴,所以把多个向量集合在一起的向量数据自然就是二维的。

同理,时间序列或序列本身就是2D张量,比如表示股价的时间序列:[[1,80], [2, 100], [3, 800]],显然是2D的,加上序号同样多了1个轴,因此时间序列数据或序列数据就是3D张量了。

有了前面这两个铺垫图像就更好理解了,先看下面这张图
深度学习 - 现实世界中的数据张量的理解_第1张图片

我们选取某个时间点的数据,显然这是个时间序列,而整张图如果按时间一点一点分割开的话,就成了一组时间序列,也就是上面的时间序列数据了,是3D张量,然后在这个基础上再加上序号,就成了4D张量了。或者这样理解:单张图像有(长度,高度,RGB)这三个轴(3D张量),加上序号就是4D张量了。

视频同理,相当于图像加上了序号这个轴,自然是5D张量了。

以上只是个人对张量的理解,欢迎讨论。

你可能感兴趣的:(深度学习,深度学习)