2022-12-27怀疑word中插入了重复的引文怎么办

如果利用endnote插入文献时,发现endnote 组中的文献数量和word中不一致时,word中更多,就会想第一:是不是endnote 组中重复插入,但是很好对比,就直接删除了,而word中还没删除,插重复了。第二:endnote 组中少了word中插入的文献,忘记将文献添加进入endnote 组。而人工看,费时费力。

image.png

因此,可以将word中的参考文献部分存为.txt文件,endnote 组根据作者排序后,输出.txt文件。然后进入R

#将数据读入r ,每一个引用最后都是以换行符结尾,因此读入的表格是一列
word  <-  read.table("/word.txt",sep ="\t")
endnote <-   read.table("/endnote.txt",sep ="\t")

#去掉行号
word$V1 <- gsub("\\[.*?]\\","",word$V1)
endnote $V1 <- gsub("\\[.*?]\\","",endnote $V1)


#判断是否有重复行
du <- word[duplicated(word),]

#根据, 空格等将1列分为多列
out <- strsplit(as.character(word $V1),' ')
word <- do.call(rbind,out)

out <- strsplit(as.character(endnote $V1),' ')
endnote <- do.call(rbind,out)

#转为数据框
word <- as.data.frame(word)
endnote <- as.data.frame(endnote)

#根据第一个作者的名字判断不在endbote中的条目
word_out  <- word[! word $V2  %in%  endnote $V2,]

#根据第一个作者的名字判断重复

du_1  <- word[duplicated(word$V2),]
du_2 <- word[duplicated(endnote $V2),]

最后我的问题出现在endnote中少了一个,重新将其归入endnote,就对得上了。

你可能感兴趣的:(2022-12-27怀疑word中插入了重复的引文怎么办)