R语言可视化作图笔记(5)文本可视化

文本可视化(Text Visualization)

词云(Word Cloud)

本例中Five.txt是一个包含对CASIO某一手表的所有五星好评,分别用到了tmwordcloudRColorBrewer建立词云

data<-read.table("Five.txt",header=F, sep='\n') #读取文档
library(tm)
library(wordcloud)
library(RColorBrewer)
data$doc_id=1:nrow(data)
colnames(data)[1]<-"text"

#把data中的每一行当成单独的文档
mycorpus <- Corpus(DataframeSource(data)) #生成语料库(Corpus,词汇数据的集合)
mycorpus <- tm_map(mycorpus, removePunctuation)
mycorpus <- tm_map(mycorpus, function(x) removeWords(x, stopwords("english")))
tdm <- TermDocumentMatrix(mycorpus) #生成Term-document矩阵
m <- as.matrix(tdm)

#归并所有行
v <- sort(rowSums(m),decreasing=TRUE) #求得各词的频数
d <- data.frame(word = names(v),freq=v) 
pal <- brewer.pal(6,"Dark2")
pal <- pal[-(1:2)] #生成调色板(palette)
wordcloud(d$word,d$freq,
          scale=c(6,.3), #词大小范围
          min.freq=4,   #最小频率
       

你可能感兴趣的:(R的数据可视化笔记,R编程)