Windows Azure HDInsight - 使用Hadoop 做数据分析

上一个章节介绍了Azure HDInsight的基本概念,初步了解了HDInsight是基于Hadoop的服务。那如何创建Hadoop群集,如何使用Hadoop群集做数据分析呢?

1.创建Hadoop群集

1)登陆Azure门户

Windows Azure HDInsight - 使用Hadoop 做数据分析_第1张图片

2)创建Hadoop群集

Windows Azure HDInsight - 使用Hadoop 做数据分析_第2张图片

3.进入查询控制台

Windows Azure HDInsight - 使用Hadoop 做数据分析_第3张图片

4.案例

1)网站日志分析案例

Windows Azure HDInsight - 使用Hadoop 做数据分析_第4张图片

2)按照步骤操作

Windows Azure HDInsight - 使用Hadoop 做数据分析_第5张图片

3)安装Microsoft Hive ODBC Driver

http://www.microsoft.com/en-us/download/details.aspx?id=40886

根据Office的64bit或者32bit,下载安装

4)导入数据到Excel

Windows Azure HDInsight - 使用Hadoop 做数据分析_第6张图片


Windows Azure HDInsight - 使用Hadoop 做数据分析_第7张图片

Windows Azure HDInsight - 使用Hadoop 做数据分析_第8张图片

Windows Azure HDInsight - 使用Hadoop 做数据分析_第9张图片


Windows Azure HDInsight - 使用Hadoop 做数据分析_第10张图片


4.注意

如果使用Office2010,需要自己配置Hive ODBC,这时候点击键盘“微软”徽标,然后输入“数据源”,选择32bit或者64bit

具体请参考

https://azure.microsoft.com/en-us/documentation/articles/hdinsight-connect-excel-hive-odbc-driver/?rnd=1

另外可以参考:

1.Hadoop Data Process With Power Query

Connect Excel to Hadoop by using Power Query

https://azure.microsoft.com/en-us/documentation/articles/hdinsight-connect-excel-power-query/

2. Use Hive and HiveQL with Hadoop in HDInsight to analyze a sample Apache log4j file

https://azure.microsoft.com/en-us/documentation/articles/hdinsight-use-hive/?rnd=1


你可能感兴趣的:(Windows,Azure)