R语言 生成DocumentTermMatrix矩阵报错:Error in nchar(Terms(x), type = "chars") : invalid multibyte string
前段时间利用R语言做文本主题分析时,想要生成DTM矩阵,遇到了如下错误报上述错误的R语言代码如下samgov.segmentText<-read.csv('samgov_segment.csv',header=TRUE,fill=TRUE,stringsAsFactors=F)d.corpus<-Corpus(VectorSource(samgov.segmentText$x),readerCon