硕士常用工具包


网络数据获取 :web Crawler  heritrix(JAVA)

网页数据净化工具: 

htmlparser 

 Jsoup  Jsoup是基于Java的开源程序,可以直接解析出网页中的URL地址和其中的文本

你可能感兴趣的:(硕士常用工具包)