本文主要分享 JDBC 与 读写分离 的实现。为什么会把这两个东西放在一起讲呢?客户端直连数据库的读写分离主要通过获取读库和写库的不同连接来实现,和 JDBC Connection 刚好放在一块。
OK,我们先来看一段 Sharding-JDBC 官方对自己的定义和定位
Sharding-JDBC定位为轻量级java框架,使用客户端直连数据库,以jar包形式提供服务,未使用中间层,无需额外部署,无其他依赖,DBA也无需改变原有的运维方式,可理解为增强版的JDBC驱动,旧代码迁移成本几乎为零。
可以看出,Sharding-JDBC 通过实现 JDBC规范,对上层提供透明化数据库分库分表的访问。 黑科技?实际我们使用的数据库连接池也是通过这种方式实现对上层无感知的提供连接池。甚至还可以通过这种方式实现对 Lucene、MongoDB 等等的访问。
扯远了,下面来看看 Sharding-JDBC jdbc
包的结构:
unsupported
:声明不支持的数据操作方法adapter
:适配类,实现和分库分表无关的方法core
:核心类,实现和分库分表相关的方法根据 core
包,可以看出分到四种我们超级熟悉的对象
实现层级如下:JDBC 接口 <=(继承)== unsupported
抽象类 <=(继承)== unsupported
抽象类 <=(继承)== core
类。
本文内容顺序
unspported
包adapter
包Sharding-JDBC 正在收集使用公司名单:传送门。
你的登记,会让更多人参与和使用 Sharding-JDBC。传送门
Sharding-JDBC 也会因此,能够覆盖更多的业务场景。传送门
登记吧,骚年!传送门
unspported
包内的抽象类,声明不支持操作的数据对象,所有方法都是 throw new SQLFeatureNotSupportedException()
方式。
public abstract class AbstractUnsupportedGeneratedKeysResultSet extends AbstractUnsupportedOperationResultSet {
@Override
public boolean getBoolean(final int columnIndex) throws SQLException {
throw new SQLFeatureNotSupportedException("getBoolean");
}
// .... 省略其它类似方法
}
public abstract class AbstractUnsupportedOperationConnection extends WrapperAdapter implements Connection {
@Override
public final CallableStatement prepareCall(final String sql) throws SQLException {
throw new SQLFeatureNotSupportedException("prepareCall");
}
// .... 省略其它类似方法
}
adapter
包内的抽象类,实现和分库分表无关的方法。
考虑到第4、5两小节更容易理解,本小节贴的代码会相对多
WrapperAdapter,JDBC Wrapper 适配类。
对 Wrapper 接口实现如下两个方法:
@Override
public final T unwrap(final Class iface) throws SQLException {
if (isWrapperFor(iface)) {
return (T) this;
}
throw new SQLException(String.format("[%s] cannot be unwrapped as [%s]", getClass().getName(), iface.getName()));
}
@Override
public final boolean isWrapperFor(final Class> iface) throws SQLException {
return iface.isInstance(this);
}
提供子类 #recordMethodInvocation()
记录方法调用,#replayMethodsInvocation()
回放记录的方法调用:
/**
* 记录的方法数组
*/
private final Collection jdbcMethodInvocations = new ArrayList<>();
/**
* 记录方法调用.
*
* @param targetClass 目标类
* @param methodName 方法名称
* @param argumentTypes 参数类型
* @param arguments 参数
*/
public final void recordMethodInvocation(final Class> targetClass, final String methodName, final Class>[] argumentTypes, final Object[] arguments) {
try {
jdbcMethodInvocations.add(new JdbcMethodInvocation(targetClass.getMethod(methodName, argumentTypes), arguments));
} catch (final NoSuchMethodException ex) {
throw new ShardingJdbcException(ex);
}
}
/**
* 回放记录的方法调用.
*
* @param target 目标对象
*/
public final void replayMethodsInvocation(final Object target) {
for (JdbcMethodInvocation each : jdbcMethodInvocations) {
each.invoke(target);
}
}
#setAutoCommit()
,当它无数据库连接时,先记录;等获得到数据连接后,再回放: // AbstractConnectionAdapter.java
@Override
public final void setAutoCommit(final boolean autoCommit) throws SQLException {
this.autoCommit = autoCommit;
if (getConnections().isEmpty()) { // 无数据连接时,记录方法调用
recordMethodInvocation(Connection.class, "setAutoCommit", new Class[] {boolean.class}, new Object[] {autoCommit});
return;
}
for (Connection each : getConnections()) {
each.setAutoCommit(autoCommit);
}
}
public class JdbcMethodInvocation {
/**
* 方法
*/
@Getter
private final Method method;
/**
* 方法参数
*/
@Getter
private final Object[] arguments;
/**
* 调用方法.
*
* @param target 目标对象
*/
public void invoke(final Object target) {
try {
method.invoke(target, arguments); // 反射调用
} catch (final IllegalAccessException | InvocationTargetException ex) {
throw new ShardingJdbcException("Invoke jdbc method exception", ex);
}
}
}
提供子类 #throwSQLExceptionIfNecessary()
抛出异常链:
protected void throwSQLExceptionIfNecessary(final Collection exceptions) throws SQLException {
if (exceptions.isEmpty()) { // 为空不抛出异常
return;
}
SQLException ex = new SQLException();
for (SQLException each : exceptions) {
ex.setNextException(each); // 异常链
}
throw ex;
}
AbstractDataSourceAdapter,数据源适配类。
直接点击链接查看源码。
AbstractConnectionAdapter,数据库连接适配类。
我们来瞅瞅大家最关心的事务相关方法的实现。
/**
* 是否自动提交
*/
private boolean autoCommit = true;
/**
* 获得链接
*
* @return 链接
*/
protected abstract Collection getConnections();
@Override
public final boolean getAutoCommit() throws SQLException {
return autoCommit;
}
@Override
public final void setAutoCommit(final boolean autoCommit) throws SQLException {
this.autoCommit = autoCommit;
if (getConnections().isEmpty()) { // 无数据连接时,记录方法调用
recordMethodInvocation(Connection.class, "setAutoCommit", new Class[] {boolean.class}, new Object[] {autoCommit});
return;
}
for (Connection each : getConnections()) {
each.setAutoCommit(autoCommit);
}
}
#setAutoCommit()
调用时,实际会设置其所持有的 Connection 的 autoCommit
属性#getConnections()
和分库分表相关,因而仅抽象该方法,留给子类实现@Override
public final void commit() throws SQLException {
for (Connection each : getConnections()) {
each.commit();
}
}
@Override
public final void rollback() throws SQLException {
Collection exceptions = new LinkedList<>();
for (Connection each : getConnections()) {
try {
each.rollback();
} catch (final SQLException ex) {
exceptions.add(ex);
}
}
throwSQLExceptionIfNecessary(exceptions);
}
#commit()
、#rollback()
调用时,实际调用其所持有的 Connection 的方法
异常情况下,#commit()
和 #rollback()
处理方式不同,笔者暂时不知道答案,求证后会进行更新
#commit()
处理方式需要改成和 #rollback()
一样。代码如下:@Override
public final void commit() throws SQLException {
Collection exceptions = new LinkedList<>();
for (Connection each : getConnections()) {
try {
each.commit();
} catch (final SQLException ex) {
exceptions.add(ex);
}
}
throwSQLExceptionIfNecessary(exceptions);
}
事务级别和是否只读相关代码如下:
/**
* 只读
*/
private boolean readOnly = true;
/**
* 事务级别
*/
private int transactionIsolation = TRANSACTION_READ_UNCOMMITTED;
@Override
public final void setReadOnly(final boolean readOnly) throws SQLException {
this.readOnly = readOnly;
if (getConnections().isEmpty()) {
recordMethodInvocation(Connection.class, "setReadOnly", new Class[] {boolean.class}, new Object[] {readOnly});
return;
}
for (Connection each : getConnections()) {
each.setReadOnly(readOnly);
}
}
@Override
public final void setTransactionIsolation(final int level) throws SQLException {
transactionIsolation = level;
if (getConnections().isEmpty()) {
recordMethodInvocation(Connection.class, "setTransactionIsolation", new Class[] {int.class}, new Object[] {level});
return;
}
for (Connection each : getConnections()) {
each.setTransactionIsolation(level);
}
}
AbstractStatementAdapter,静态语句对象适配类。
@Override
public final int getUpdateCount() throws SQLException {
long result = 0;
boolean hasResult = false;
for (Statement each : getRoutedStatements()) {
if (each.getUpdateCount() > -1) {
hasResult = true;
}
result += each.getUpdateCount();
}
if (result > Integer.MAX_VALUE) {
result = Integer.MAX_VALUE;
}
return hasResult ? Long.valueOf(result).intValue() : -1;
}
/**
* 获取路由的静态语句对象集合.
*
* @return 路由的静态语句对象集合
*/
protected abstract Collection extends Statement> getRoutedStatements();
#getUpdateCount()
调用持有的 Statement 计算更新数量#getRoutedStatements()
和分库分表相关,因而仅抽象该方法,留给子类实现AbstractPreparedStatementAdapter,预编译语句对象的适配类。
#recordSetParameter()
实现对占位符参数的设置:
/**
* 记录的设置参数方法数组
*/
private final List setParameterMethodInvocations = new LinkedList<>();
/**
* 参数
*/
@Getter
private final List
逻辑类似 WrapperAdapter
的 #recordMethodInvocation()
,#replayMethodsInvocation()
,请认真阅读代码注释
SetParameterMethodInvocation,继承 JdbcMethodInvocation,反射调用参数设置方法的工具类:
public final class SetParameterMethodInvocation extends JdbcMethodInvocation {
/**
* 位置
*/
@Getter
private final int index;
/**
* 参数值
*/
@Getter
private final Object value;
/**
* 设置参数值.
*
* @param value 参数值
*/
public void changeValueArgument(final Object value) {
getArguments()[1] = value;
}
}
AbstractResultSetAdapter,代理结果集适配器。
public abstract class AbstractResultSetAdapter extends AbstractUnsupportedOperationResultSet {
/**
* 结果集集合
*/
@Getter
private final List resultSets;
@Override
// TODO should return sharding statement in future
public final Statement getStatement() throws SQLException {
return getResultSets().get(0).getStatement();
}
@Override
public final ResultSetMetaData getMetaData() throws SQLException {
return getResultSets().get(0).getMetaData();
}
@Override
public int findColumn(final String columnLabel) throws SQLException {
return getResultSets().get(0).findColumn(columnLabel);
}
// .... 省略其它方法
}
插入使用分布式主键例子代码如下:
// 代码仅仅是例子,生产环境下请注意异常处理和资源关闭
String sql = "INSERT INTO t_order(uid, nickname, pid) VALUES (1, '2', ?)";
DataSource dataSource = new ShardingDataSource(shardingRule);
Connection conn = dataSource.getConnection();
PreparedStatement ps = conn.prepareStatement(sql, Statement.RETURN_GENERATED_KEYS); // 返回主键需要 Statement.RETURN_GENERATED_KEYS
ps.setLong(1, 100);
ps.executeUpdate();
ResultSet rs = ps.getGeneratedKeys();
if (rs.next()) {
System.out.println("id:" + rs.getLong(1));
}
调用 #executeUpdate()
方法,内部过程如下:
是不是对上层完全透明?!我们来看看内部是怎么实现的。
// ShardingPreparedStatement.java
@Override
public int executeUpdate() throws SQLException {
try {
Collection preparedStatementUnits = route();
return new PreparedStatementExecutor(
getShardingConnection().getShardingContext().getExecutorEngine(), getRouteResult().getSqlStatement().getType(), preparedStatementUnits, getParameters()).executeUpdate();
} finally {
clearBatch();
}
}
#route()
分库分表路由,获得预编译语句对象执行单元( PreparedStatementUnit )集合。
public final class PreparedStatementUnit implements BaseStatementUnit {
/**
* SQL 执行单元
*/
private final SQLExecutionUnit sqlExecutionUnit;
/**
* 预编译语句对象
*/
private final PreparedStatement statement;
}
#executeUpdate()
调用执行引擎并行执行多个预编译语句对象。执行时,最终调用预编译语句对象( PreparedStatement )。我们来看一个例子: // PreparedStatementExecutor.java
public int executeUpdate() {
Context context = MetricsContext.start("ShardingPreparedStatement-executeUpdate");
try {
List results = executorEngine.executePreparedStatement(sqlType, preparedStatementUnits, parameters, new ExecuteCallback() {
@Override
public Integer execute(final BaseStatementUnit baseStatementUnit) throws Exception {
// 调用 PreparedStatement#executeUpdate()
return ((PreparedStatement) baseStatementUnit.getStatement()).executeUpdate();
}
});
return accumulate(results);
} finally {
MetricsContext.stop(context);
}
}
// ShardingPreparedStatement.java
private Collection route() throws SQLException {
Collection result = new LinkedList<>();
// 路由
setRouteResult(routingEngine.route(getParameters()));
// 遍历 SQL 执行单元
for (SQLExecutionUnit each : getRouteResult().getExecutionUnits()) {
SQLType sqlType = getRouteResult().getSqlStatement().getType();
Collection preparedStatements;
// 创建实际的 PreparedStatement
if (SQLType.DDL == sqlType) {
preparedStatements = generatePreparedStatementForDDL(each);
} else {
preparedStatements = Collections.singletonList(generatePreparedStatement(each));
}
getRoutedStatements().addAll(preparedStatements);
// 回放设置占位符参数到 PreparedStatement
for (PreparedStatement preparedStatement : preparedStatements) {
replaySetParameter(preparedStatement);
result.add(new PreparedStatementUnit(each, preparedStatement));
}
}
return result;
}
/**
* 创建 PreparedStatement
*
* @param sqlExecutionUnit SQL 执行单元
* @return PreparedStatement
* @throws SQLException 当 JDBC 操作发生异常时
*/
private PreparedStatement generatePreparedStatement(final SQLExecutionUnit sqlExecutionUnit) throws SQLException {
Optional generatedKey = getGeneratedKey();
// 获得连接
Connection connection = getShardingConnection().getConnection(sqlExecutionUnit.getDataSource(), getRouteResult().getSqlStatement().getType());
// 声明返回主键
if (isReturnGeneratedKeys() || isReturnGeneratedKeys() && generatedKey.isPresent()) {
return connection.prepareStatement(sqlExecutionUnit.getSql(), RETURN_GENERATED_KEYS);
}
return connection.prepareStatement(sqlExecutionUnit.getSql(), getResultSetType(), getResultSetConcurrency(), getResultSetHoldability());
}
调用 #generatePreparedStatement()
创建 PreparedStatement,后调用 #replaySetParameter()
回放设置占位符参数到 PreparedStatement
当 声明返回主键 时,即 #isReturnGeneratedKeys()
返回 true
时,调用 connection.prepareStatement(sqlExecutionUnit.getSql(), RETURN_GENERATED_KEYS)
。为什么该方法会返回 true
?上文例子 conn.prepareStatement(sql, Statement.RETURN_GENERATED_KEYS)
// ShardingConnection.java
@Override
public PreparedStatement prepareStatement(final String sql, final String[] columnNames) throws SQLException {
return new ShardingPreparedStatement(this, sql, Statement.RETURN_GENERATED_KEYS);
}
// ShardingPreparedStatement.java
public ShardingPreparedStatement(final ShardingConnection shardingConnection, final String sql, final int autoGeneratedKeys) {
this(shardingConnection, sql);
if (RETURN_GENERATED_KEYS == autoGeneratedKeys) {
markReturnGeneratedKeys();
}
}
protected final void markReturnGeneratedKeys() {
returnGeneratedKeys = true;
}
声明返回主键后,插入执行完成,我们调用 #getGeneratedKeys()
可以获得主键 :
// ShardingStatement.java
@Override
public ResultSet getGeneratedKeys() throws SQLException {
Optional generatedKey = getGeneratedKey();
// 分布式主键
if (generatedKey.isPresent() && returnGeneratedKeys) {
return new GeneratedKeysResultSet(routeResult.getGeneratedKeys().iterator(), generatedKey.get().getColumn(), this);
}
// 数据库自增
if (1 == getRoutedStatements().size()) {
return getRoutedStatements().iterator().next().getGeneratedKeys();
}
return new GeneratedKeysResultSet();
}
ShardingConnection#getConnection()
方法获得该 PreparedStatement 对应的真实数据库连接( Connection ): // ShardingConnection.java
/**
* 根据数据源名称获取相应的数据库连接.
*
* @param dataSourceName 数据源名称
* @param sqlType SQL语句类型
* @return 数据库连接
* @throws SQLException SQL异常
*/
public Connection getConnection(final String dataSourceName, final SQLType sqlType) throws SQLException {
// 从连接缓存中获取连接
Optional connection = getCachedConnection(dataSourceName, sqlType);
if (connection.isPresent()) {
return connection.get();
}
Context metricsContext = MetricsContext.start(Joiner.on("-").join("ShardingConnection-getConnection", dataSourceName));
//
DataSource dataSource = shardingContext.getShardingRule().getDataSourceRule().getDataSource(dataSourceName);
Preconditions.checkState(null != dataSource, "Missing the rule of %s in DataSourceRule", dataSourceName);
String realDataSourceName;
if (dataSource instanceof MasterSlaveDataSource) {
dataSource = ((MasterSlaveDataSource) dataSource).getDataSource(sqlType);
realDataSourceName = MasterSlaveDataSource.getDataSourceName(dataSourceName, sqlType);
} else {
realDataSourceName = dataSourceName;
}
Connection result = dataSource.getConnection();
MetricsContext.stop(metricsContext);
// 添加到连接缓存
connectionMap.put(realDataSourceName, result);
// 回放 Connection 方法
replayMethodsInvocation(result);
return result;
}
private Optional getCachedConnection(final String dataSourceName, final SQLType sqlType) {
String key = connectionMap.containsKey(dataSourceName) ? dataSourceName : MasterSlaveDataSource.getDataSourceName(dataSourceName, sqlType);
return Optional.fromNullable(connectionMap.get(key));
}
#getCachedConnection()
尝试获得已缓存的数据库连接;如果缓存中不存在,获取到连接后会进行缓存#replayMethodsInvocation()
回放记录的 Connection 方法插入实现的代码基本分享完了,因为是不断代码下钻的方式分析,可以反向向上在理理,会更加清晰。
单纯从 core
包里的 JDBC 实现,查询流程 #executeQuery()
和 #execute()
基本一致,差别在于执行和多结果集归并。
@Override
public ResultSet executeQuery() throws SQLException {
ResultSet result;
try {
// 路由
Collection preparedStatementUnits = route();
// 执行
List resultSets = new PreparedStatementExecutor(
getShardingConnection().getShardingContext().getExecutorEngine(), getRouteResult().getSqlStatement().getType(), preparedStatementUnits, getParameters()).executeQuery();
// 结果归并
result = new ShardingResultSet(resultSets, new MergeEngine(
getShardingConnection().getShardingContext().getDatabaseType(), resultSets, (SelectStatement) getRouteResult().getSqlStatement()).merge());
} finally {
clearBatch();
}
// 设置结果集
setCurrentResultSet(result);
return result;
}
SQL执行 感兴趣的同学可以看:《Sharding-JDBC 源码分析 —— SQL 执行》
结果归并 感兴趣的同学可以看:《Sharding-JDBC 源码分析 —— 结果归并》
结果归并 #merge()
完后,创建分片结果集( ShardingResultSet )
public final class ShardingResultSet extends AbstractResultSetAdapter {
/**
* 归并结果集
*/
private final ResultSetMerger mergeResultSet;
@Override
public int getInt(final int columnIndex) throws SQLException {
Object result = mergeResultSet.getValue(columnIndex, int.class);
wasNull = null == result;
return (int) ResultSetUtil.convertValue(result, int.class);
}
@Override
public int getInt(final String columnLabel) throws SQLException {
Object result = mergeResultSet.getValue(columnLabel, int.class);
wasNull = null == result;
return (int) ResultSetUtil.convertValue(result, int.class);
}
// .... 隐藏其他类似 getXXXX() 方法
}
建议前置阅读:《官方文档 —— 读写分离》
当你有读写分离的需求时,将 ShardingRule 配置对应的数据源 从 ShardingDataSource 替换成 MasterSlaveDataSource。我们来看看 MasterSlaveDataSource 的功能和实现。
支持一主多从的读写分离配置,可配合分库分表使用
// MasterSlaveDataSourceFactory.java
public final class MasterSlaveDataSourceFactory {
/**
* 创建读写分离数据源.
*
* @param name 读写分离数据源名称
* @param masterDataSource 主节点数据源
* @param slaveDataSource 从节点数据源
* @param otherSlaveDataSources 其他从节点数据源
* @return 读写分离数据源
*/
public static DataSource createDataSource(final String name, final DataSource masterDataSource, final DataSource slaveDataSource, final DataSource... otherSlaveDataSources) {
return new MasterSlaveDataSource(name, masterDataSource, Lists.asList(slaveDataSource, otherSlaveDataSources));
}
}
// MasterSlaveDataSource.java
public final class MasterSlaveDataSource extends AbstractDataSourceAdapter {
/**
* 数据源名
*/
private final String name;
/**
* 主数据源
*/
@Getter
private final DataSource masterDataSource;
/**
* 从数据源集合
*/
@Getter
private final List slaveDataSources;
}
同一线程且同一数据库连接内,如有写入操作,以后的读操作均从主库读取,用于保证数据一致性。
// ShardingConnection.java
public Connection getConnection(final String dataSourceName, final SQLType sqlType) throws SQLException {
// .... 省略部分代码
String realDataSourceName;
if (dataSource instanceof MasterSlaveDataSource) { // 读写分离
dataSource = ((MasterSlaveDataSource) dataSource).getDataSource(sqlType);
realDataSourceName = MasterSlaveDataSource.getDataSourceName(dataSourceName, sqlType);
} else {
realDataSourceName = dataSourceName;
}
Connection result = dataSource.getConnection();
// .... 省略部分代码
}
// MasterSlaveDataSource.java
/**
* 当前线程是否是 DML 操作标识
*/
private static final ThreadLocal DML_FLAG = new ThreadLocal() {
@Override
protected Boolean initialValue() {
return false;
}
};
/**
* 从库负载均衡策略
*/
private final SlaveLoadBalanceStrategy slaveLoadBalanceStrategy = new RoundRobinSlaveLoadBalanceStrategy();
/**
* 获取主或从节点的数据源.
*
* @param sqlType SQL类型
* @return 主或从节点的数据源
*/
public DataSource getDataSource(final SQLType sqlType) {
if (isMasterRoute(sqlType)) {
DML_FLAG.set(true);
return masterDataSource;
}
return slaveLoadBalanceStrategy.getDataSource(name, slaveDataSources);
}
private static boolean isMasterRoute(final SQLType sqlType) {
return SQLType.DQL != sqlType || DML_FLAG.get() || HintManagerHolder.isMasterRouteOnly();
}
ShardingConnection 获取到的数据源是 MasterSlaveDataSource 时,调用 MasterSlaveDataSource#getConnection()
方法获取真实的数据源
通过 #isMasterRoute()
判断是否读取主库,以下三种情况会访问主库:
DML_FLAG
实现HintManager.getInstance().setMasterRouteOnly()
实现访问从库时,会通过负载均衡策略( SlaveLoadBalanceStrategy ) 选择一个从库
// SlaveLoadBalanceStrategy.java
public interface SlaveLoadBalanceStrategy {
/**
* 根据负载均衡策略获取从库数据源.
*
* @param name 读写分离数据源名称
* @param slaveDataSources 从库数据源列表
* @return 选中的从库数据源
*/
DataSource getDataSource(String name, List slaveDataSources);
}
// RoundRobinSlaveLoadBalanceStrategy.java
public final class RoundRobinSlaveLoadBalanceStrategy implements SlaveLoadBalanceStrategy {
private static final ConcurrentHashMap COUNT_MAP = new ConcurrentHashMap<>();
@Override
public DataSource getDataSource(final String name, final List slaveDataSources) {
AtomicInteger count = COUNT_MAP.containsKey(name) ? COUNT_MAP.get(name) : new AtomicInteger(0);
COUNT_MAP.putIfAbsent(name, count);
count.compareAndSet(slaveDataSources.size(), 0);
return slaveDataSources.get(count.getAndIncrement() % slaveDataSources.size());
}
}