上一个章节介绍了Azure HDInsight的基本概念,初步了解了HDInsight是基于Hadoop的服务。那如何创建Hadoop群集,如何使用Hadoop群集做数据分析呢?
1.创建Hadoop群集
1)登陆Azure门户
2)创建Hadoop群集
3.进入查询控制台
4.案例
1)网站日志分析案例
2)按照步骤操作
3)安装Microsoft Hive ODBC Driver
http://www.microsoft.com/en-us/download/details.aspx?id=40886
根据Office的64bit或者32bit,下载安装
4)导入数据到Excel
4.注意
如果使用Office2010,需要自己配置Hive ODBC,这时候点击键盘“微软”徽标,然后输入“数据源”,选择32bit或者64bit
具体请参考
https://azure.microsoft.com/en-us/documentation/articles/hdinsight-connect-excel-hive-odbc-driver/?rnd=1
另外可以参考:
1.Hadoop Data Process With Power Query
Connect Excel to Hadoop by using Power Query
https://azure.microsoft.com/en-us/documentation/articles/hdinsight-connect-excel-power-query/
2. Use Hive and HiveQL with Hadoop in HDInsight to analyze a sample Apache log4j file
https://azure.microsoft.com/en-us/documentation/articles/hdinsight-use-hive/?rnd=1