在Spring中配置Spark hive-thriftserver的连接DataSource与配置其他数据源连接方式是一样的,如一般Oracle数据源配置,使用如下必须的Jar包:

Spring中使用Spark连接的DataSource_第1张图片


使用JDBC程序示例:

package com.hadoop.test;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;

public class ThreadSql extends  Thread  {

	@Override
	public void run() {
		
		excSparkSql();
	}
	
	public  void  excSparkSql() {
		String result = "";
    	Connection conn = null;
    	Statement stmt = null;
		try {
			Class.forName("org.apache.hadoop.hive.jdbc.HiveDriver");
			conn = DriverManager.getConnection(
					"jdbc:hive://10.20.12.214:10000/test_db", "hduser001", "");
			stmt = conn.createStatement();
			String sql = " select count(1) from test_data ";	
			long start = System.currentTimeMillis();
			
			ResultSet res = stmt.executeQuery(sql);
			
			long cost = System.currentTimeMillis() - start;
			
			result = Thread.currentThread().getName() + ": " + cost/1000.0f + "s";
			System.out.println(result);
			stmt.close();
			conn.close();
		} catch (Exception e) {
			
			try {
				stmt.close();
				conn.close();
			} catch (SQLException e1) {
				// TODO Auto-generated catch block
				e1.printStackTrace();
			}
			e.printStackTrace();
			
		}
		
	}
	

}


在Spring中配置如下,类似oracle的datasource配置,并在其他的ServiceBean中将其注入即可