pytorch读取数据集问题

  1. 当用自己的图数据跑别人的图神经网络代码时出现的问题,数据集的数据不同,结果出错。
    错误:
    # size [batch_size, cHeads, centrs, graphsize]
    dist = torch.sum(torch.abs(points - batch_centroids_broad) ** 2, 4)

     RuntimeError: The size of tensor a (450) must match the size of tensor b (5) at non-singleton dimension 0
    

语法原因:torch.sum的两个tensor的维度不对应,不能进行求和处理。

import torch 
x = torch.FloatTensor(5,3,4,2)
y = torch.FloatTensor(3,1,1)
(x + y ).size()  # 正确的例子,y的第2,3,维度为1,可以匹配
torch.Size([5, 3, 4, 2])
y = torch.FloatTensor(3,1,5)
(x + y ).size() # 错误的例子,y的第3维,维度为3,与x的第三维不对。
# RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 3

应用原因:读取batch数据时,当最后一批数据量小于batch_size时出错。

解决办法:将torch.utils.data.DataLoader的参数drop_last =True就行,当最后数据不满足batch_size时扔掉数据。

2.torch.utils.data.DataLoader的参数num_workers代表的是读取数据时多钱程的数量,数值越大占用内存越大,在读取数据时就会出现一系列的黄色提示,停止运行。

解决:一般内存的设备设置 num_workers = 0 就好,最多跑慢点。

3.pytest的调试错误。
第一步:在终端安装pytest包

pip install pytest

如果还不行,运行也不行。就在设置里改调试为下面的设置
pytorch读取数据集问题_第1张图片
还有就是改配置为python模板,用默认的就可以。
pytorch读取数据集问题_第2张图片

你可能感兴趣的:(工具使用,机器学习,深度学习,神经网络)