发现一个很好的博客,主要讲R与hadoop的结合的文章
网址为http://blog.fens.me/series-rhadoop/
以下为主要内容:
RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据1G, 10G, 100G, TB, PB。 由于大数据所带来的单机性能问题,可能会一去不复返了。
RHadoop实践是一套系列文章,主要包括”Hadoop环境搭建”,”RHadoop安装与使用”,”R实现MapReduce的协同过滤算法”,”HBase和rhbase的安装与使用”。对于单独的R语言爱好者,Java爱好者,或者Hadoop爱好者来说,同时具备三种语言知识并不容 易。此文虽为入门文章,但R,Java,Hadoop基础知识还是需要大家提前掌握。
R语言为Hadoop注入统计血脉
读书笔记 Big Data Analytics with R and Hadoop
用R解析Mahout用户推荐协同过滤算法(UserCF)
RHadoop实践系列之一:Hadoop环境搭建
RHadoop实践系列之二:RHadoop安装与使用
RHadoop实践系列之三 R实现MapReduce的协同过滤算法
RHadoop实践系列之四 rhbase安装与使用
RHadoop实验 – 统计邮箱出现次数
解决RHadoop错误:PipeMapRed.waitOutputThreads(): subprocess failed with code 1
COS沙龙第九期:RHadoop分享会来袭
ChinaHadoop大会 2103: R语言为Hadoop注入统计血脉
RHadoop培训 之 Linux基础课
RHadoop培训 之 Java基础课
RHadoop培训 之 R基础课
R利剑NoSQL系列文章 之 Hive
用RHive从历史数据中提取逆回购信息