为了使用文本分析挖掘,必须要先安装一些R包,比如Rwordseg包常用于分词、tmcn用于词频统计、wordcloud用于绘制文字云。在R中,有些包是需要额外设置安装的,且设置起挺麻烦的,因此,以下总结并共享了一些解决方法,以供大家参考。
系统测试环境:
0.前置操作:
首先,要安装R软件,下载地址:https://www.r-project.org/
其次,需设定scan镜像,安装完成后打开R软件,在程序包-设定scan镜像菜单中选择镜像设定地址
比如可以选择为:China Beijing4 [https],它是R设在中国北京的第4台服务器。
然后,可以开始以下的安装了,当界面中有提示“ 程序包‘XXX’打开成功,MD5和检查也通过”或者“DONE (XX)”时表示安装成功
1、Rweibo包的安装
由于Rweibo依赖于RCurl、XML、rjson、digest这四个包,需要先装上后再装Rweibo包,执行代码如下:
install.packages("bitops") #RCurl的依赖
install.packages("RCurl")
install.packages("XML")install.packages("Rweibo",repos="http://R-Forge.R-project.org")
执行完成后加载library就可以用哒,代码如下:
library(Rweibo)
2、wordcloud包的安装
wordcloud包R自带,执行代码如下:
install.packages("wordcloud")
执行完成后同样需要加载library才能使用此包,代码如下:
library(wordcloud)
3、tm包的安装
与wordcloud包的安装方法相同,代码如下:
install.packages("tm")
library(tm)
4、tmcn包的安装
下载源码.zip文件,在R中采用本地安装方式进行安装
Rwordseg.zip下载地址:https://r-forge.r-project.org/R/?group_id=1571
注意:”install.packages("tmcn", repos="http://R-Forge.R-project.org",type="source")“及jar包无法直接解析
5、Rwordseg包的安装
第一步:安装好Java环境及rJava包,并确定rJava包的可用性
先要安装和配置Java环境,参考方法:http://jingyan.baidu.com/article/e75aca85b29c3b142edac6a8.html
jdk下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
然后执行以下命令:
install.packages("rJava") #Rwordseg的依赖
rJava包的测试:
如遇到rJava包的错误,一般是java安装版本问题或者环境变量设置问题
相关测试可以参考:http://blog.fens.me/r-rjava-java/
第二步:下载源码.zip文件,在R中采用本地安装方式进行安装Rwordseg.zip下载地址:https://r-forge.r-project.org/R/?group_id=1054
注意:“install.packages("Rwordseg",repos="http://R-Forge.R-project.org")”及jar包均无法直接解析
Rwordseg包的测试:
> library(Rwordseg)
6、Rcharts包的安装:
方法一:从本地安装,需要先下载好RJSONIO包和Rcharts包后
在工具栏里面“程序包”--》“从本地文件安装程序包”,
之后,选择本地下载好的两个文件进行安装,先安装依赖包RJSONIO包,再安装Rcharts包。
Rcharts包的测试:
library(Rcharts)
方法二:从GitHub上安装。
由于rCharts包目前并没有收录进scan中,而是托管在GitHub上,所以需要先安装devtools包:
另外,rCharts包的绘图函数类似lattice包,通过formula、data指定数据源和绘图方式,并通过type指定图表类型。其基本格式如下:
Rcharts包交互可视化学习参考地址如下:https://zhuanlan.zhihu.com/p/24042457
7、xlsx包的安装(XLConnect包类似于xlsx包)
第一步:安装好Java环境及rJava包,并确定rJava包的可用性,同第5点第一步所述,需将Java与R安装在同一位置,否则会报错;
第二部:安装xlsx包。如果提示xlsxjars包未自动装上也需要先手动安装一下。
> install.packages(" xlsxjars")
8、XLConnect包的安装
XLConnect包类似于xlsx包的安装,但XLConnet包需要在xlsx包OK的前提下使用,因此应先装好xlsx包再安装XLConnect包,否则使用时可能出错。
第一步:按照第7点先装好xlsx包。
第二步:安装XLConnect包。如果提示xlsxjars包未自动装上也需要先手动安装一下。
> install.packages("XLConnectJars")
PS: 本文中所提到的相关软件包已分享至百度云盘,包括文件分析R包、R安装包、Java安装包
分享地址:http://pan.baidu.com/s/1c1142Gg
提取密码:i15u