这里使用的export/import这两个指令
主要的流程
在hive的配置目录中新建.hiverc文件,配置默认的数据库(即你需要导出的数据库)
vim /etc/alternatives/hive-conf/.hiverc
use export_db;
hdfs dfs -mkdir -p /tmp/export_db_export
hive -e "show tables;" | awk '{printf "export table %s to |/tmp/export_db_export/%s|;\n",$1,$1}' | sed "s/|/'/g" | grep -v tab_name > /home/export.hql
hive -f /home/export.hql
hdfs dfs -get /tmp/export_db_export /home/export_db
进去文件夹下相应的表文件夹下,可以看到数据文件夹和元数据文件
drwxr-xr-x. 2 root root 39 Jan 14 21:28 data
-rw-r--r--. 1 root root 1672 Jan 14 21:28 _metadata
hdfs dfs -put /home/export_db /tmp/export_db_export
这里的/tmp/export_db_export需要提前创建
我们将之前的export.hql脚本修改下就可以当做我们的import.hql脚本
cp /home/export.sql /home/import.sql
sed -i 's/export /import /g' /home/import.sql
sed -i 's/ to / from /g' /home/import.sql
vim /etc/alternatives/hive-conf/.hiverc
use import_db;
hive -f /home/import.sql
至此Hive数据的迁移就完成.
beeline -u jdbc:hive2://test01:10000 -e "use export_db;show tables;"| awk '{printf "export table %s to |/tmp/export_db_export/%s|;\n",$2,$2}' | sed "s/|/'/g"|sed '1,3d'|sed '$d' > /home/export.hql
sed -i '1i use export_db;' /home/export.hql
beeline -u jdbc:hive2://test01:10000 -n hdfs -f /home/export.hql
这里我在使用的时出现了文件权限的错误,这里建议直接使用hdfs用户进行操作
hadoop distcp hdfs://host01:8020/tmp/export_db_export/ hdfs://host02:8020/tmp/export_db_export
新的集群hdfs目录需要提前创建
cp /home/export.hql /home/import.hql
sed -i 's/export /import /g' /home/import.hql
sed -i 's/ to / from /g' /home/import.hql
sed -i '1d' /home/import.hql
sed -i '1i use import_db;' /home/import.hql
create database import_db;
beeline -u jdbc:hive2://test01:10000 -n hdfs -f /home/import.hql
至此数据迁移完成.请自行验证
select * from table_name limit 10;