hadoop日志分析系统二 第二部分利用hadoop平台进行数据处理 第三种方式 hive+sqoop+zookeeper方式

Hive 是建立在 Hadoop  上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL ),这是一种可以存储、查询和分析存储在 Hadoop  中的大规模数据的机制。Hive 定义了简单的类 SQL  查询语言,称为 QL ,它允许熟悉 SQL  的用户查询数据。同时,这个语言也允许熟悉 MapReduce  开发者的开发自定义的 mapper  reducer  来处理内建的 mapper reducer  无法完成的复杂的分析工作。

具体实现:

publicvoid test() throws Exception{

      Class.forName("org.apache.hadoop.hive.jdbc.HiveDriver");

      Connection con = DriverManager.getConnection("jdbc:hive://192.168.1.102:10000/wlan_dw", "", "");

      Statement stmt = con.createStatement();

      String querySQL="SELECT * FROM wlan_dw.dim_m order by flux desc limit 10";

 

      ResultSet res = stmt.executeQuery(querySQL); 

 

      while (res.next()) {

         System.out.println(res.getString(1) +"\t" +res.getLong(2)+"\t" +res.getLong(3)+"\t" +res.getLong(4)+"\t" +res.getLong(5));

      }

   }

 

你可能感兴趣的:(自我领悟)