GAT代码更换Text_gcn数据集实验记录

我选的是gcn里R52数据集,由于数据量太大,笔记本内存有限,所以需要删一些数据让数据变小,主要是想看到完整的实验过程。首先,找到原始文档也就是gcn里面的corpus下R52数据集,这里面都是文档一行是一条数据,我保留了60条,然后更改data下的R52.text,这里面数据也是保留60条,但是要注意里面有test和train两种数据,我train保留了50条,test是10条,如果不注意把test全删掉会出现以下错误,ty的矩阵会出现问题。

GAT代码更换Text_gcn数据集实验记录_第1张图片

删好后 运行text_gcn,x,y,tx,ty,allx,ally,shape结果如下:

运行后生成 ind.R52.adj文件和ind.R52.x,ind.R52.y,,ind.R52.tx,ind.R52.ty,ind.R52.allx,ind.R52.ally文件,处理完数据后把这些文件还有 R52.test.index粘到GAT项目data文件夹下,先要修改数据集路径,

找到test.index文件,然后运行提示我没有ind.R52.graph文件,ind.R52.adj文件是gcn里建图最后生成的,里面是每条边的权重,应该就是要找的graph文件,修改后调试代码,

这句应该直接赋值graph,改为:adj=graph,因为在gcn里就已经是邻接矩阵了,不需要转换了。

然后数据集路径就应该修改完了,运行以后报错:

GAT代码更换Text_gcn数据集实验记录_第2张图片

他报错的地方是验证集越界,应该修改一下代码

论文里验证集是训练集的百分之十,原始代码+500,我的50条train,10条test应修改为+5,再进行运行,终于成功了

实验结果如下:

GAT代码更换Text_gcn数据集实验记录_第3张图片

GAT代码更换Text_gcn数据集实验记录_第4张图片

你可能感兴趣的:(GAT代码更换Text_gcn数据集实验记录)