--21.1 Data Pump工具
Data Pump
从oracledatabase 10g开始引入了data pump(数据泵)工具,它提供了一种基于服务器的数据导出导入使用程序。
所有的data pump都作为一个服务器进程,数据不再必须由一个客户程序处理。Data Pump工具的导出和导入实现
Oracle数据库之间数据的传输。
Data Pump工具中包含Data Pump Export和Data Pump Import,所使用的命令行客户程序为expdp和impdp。
【注意】
在10g之前,传统的导出导入分别使用exp工具和imp工具。从oracle database 10g开始,不仅保留了原有的
exp和imp工具,还提供了数据泵导出导入工具expdp和impdp。
从11g开始,在传统的export和import应用程序中可用的任何特性在data pump中都可用。
在使用expdp和impdp工具时,应该注意以下几点:
1 exp和imp是客户端工具程序,它们既可以在客户端使用,也可以在服务器端使用。
2 expdp和impdp是服务器工具程序,它们只能在oracle服务器端使用,不能再客户端使用。
3 imp只适用于exp导出的文件,不适用于expdp导出文件;impdp只适用与expdp导出的文
件,不适用于exp导出文件。data pump导出导入所得到的文件跟传统的import/export
应用程序导出导入的文件不兼容。
【pump特点】
与原有的export和import使用程序相比,oracle的data pump工具的功能特点如下:
1 在导出或者导入作业中,能够控制用于此作业的并行线程的数量。
2 支持在网络上进行导出导入,而不需要是使用转储文件集。
3 如果作业失败或者停止,能够重新启动一个data pump作业。并且能够挂起恢复导出导入作业。
4 通过一个客户端程序能够连接或者脱离一个运行的作业。
5 空间估算能力,而不需要实际执行导出。
6 可以指定导出导入对象的数据库版本。允许对导出导入对象进行版本控制,以便与低版本数据库兼容。
【pump数据字典】
数据字典 说明
dba_datapump_jobs 显示运行数据泵作业的信息,也可以使用user_datapump_jobs变量
dba_datapump_sessions 提供数据泵作业会话级别的信息
datapump_paths 提供一系列有效的对象类型,可以将其与export或者impdp的include或者exclude参数关联起来
dba_directories 提供一系列已定义的目录
--21.2 使用datapump工具的准备工作
1 在环境变量中队bin目录进行配置。默认情况下,安装oracle数据库时,将自动配置相应的环境变量,
例如D:/oracle/product/10.2.0/db_1/BIN
2 在oracle安装路径的bin文件夹中,确定expdp.exe和impdp.exe文件的存在。
3 创建一个外部目录。
data pump要求为将要创建和读取的数据文件和日志文件创建目录,用来指向
使用的外部目录。在oracle中创建目录对象时,可以使用 create directory
语句。
【实例】
1,检查,高级环境变量-pathpath里面有无bin目录
2,检查expdp.exe、impdp.exe文件是否存在。
3,建立目录
c:/> sqlplus /nolog
sql> conn sys/sys as sysdba
sql> create directory mypump as 'd:/app/temp';
sql> grant read, write on directory mypump to scott;
sql> select * from dba_directories; 查询所有目录
--21.3 数据泵导出选项
参数 说明
help 显示用于导出的联机帮助,默认为n
compress 指定要压缩的数据,可选值有:all、data_only、metadata_only和none
content 筛选导出的内容,可选值有:all、data_only和metadata_only
directory 指定用于日志文件和转储文件集的目的目录
dumpfile 为转储文件指定名称和目录
encryption 输出的加密级别,可选值有:all、data_only、encrypted_columns_only、etadata_only和none
exclude 排除导出的对象和数据
flashback_sch 用于数据库在导出过程中闪回的系统更改号
flashback_time 用于数据库在导出过程中闪回的时间戳
include 规定用于导出对象和数据的标准
logfile 导出日志的名字和可选的目录名字
parfile 指定参数文件名
query 在导出过程中从表中筛选行
reuse_dmupfiles 覆盖已有的转储文件
status 显示data pump作业的详细状态
attach 将一个客户会话连接到一个当前运行的data pumpexport作业上
transportable 只为表模式导出而导出元数据
full 在一个full模式下通知data pump导出所有的数据和元数据
schemas 在一个schemas模式导出中命名将导出的模式
tables 列出将用于一个table模式导出而导出的表和分区
tablespaces 列出将导出的表空间
transport_tablespaces
指定一个transportable tablespace模式导出
transport_full_check
是否应该验证正在导出的表空间是一个自包含集
expdp交互模式中的命令列表
参数 说明
add_file 向转储文件集中添加转储文件
exit_client 退出客户机会话并使作业处于运行状态
kill_job 分离和删除作业
paraliel 改变用户data pump export作业的工作进程的数量
start_job 启动、恢复当前作业
status 显示data pump export的作业状态
reuse_dmpfiles 是否覆盖现有的转储文件。设置为y时,现有的转储文件将被覆盖;
当使用默认值n时,如果转储文件已经存在就会产生一个错误。
stop_job 依次关闭执行的作业并退出客户机。stop_job=immediate将立即关闭数据泵作业
【实例】
1,进入目录 D:/>cd D:/oracle/product/10.2.0/db_1/BIN
2,expdp help=y 列出所有参数
3,交互模式下
/BIN> expdp system/system
等待一会,按下ctrl c 进入export模式
Export>stop_job 停止作业
/BIN>
--21.4 实现数据导出
导出模式
模式 参数 说明 操作角色
full full 导出整个数据库 exp_full_database
schema schemas 导出一个或者多个用户模式中的数据和元数据 拥有exp_full_database角色,可以导出任何模式,
否则只能导出自己的模式
table tables 导出一组特定的表 拥有exp_full_database角色,可以导出任何模式的表
tablespace tablespaces 导出一个或者多个表空间的数据 exp_full_database
transportable transport_tablespaces
tablespace 导出表空间中对象的元数据 exp_full_database
【实例】
1,进入bin目录
2,表模式导出
expdp scott/scott_2009 directory=mypump dumpfile=expdptab.dmp tables=dept,emp
(select * from dba_tablespaces; alter tablespace testspace online;)
3,全库模式导出
expdp system/system directory=mypump dumpfile=expdp.dmp full=y
4,schema模式导出
expdp system/system directory=mypump dumpfile=expdp.dmp schemas=scott nologfile=y
5,表空间数据导出
expdp system/system directory=mypump dumpfile=expdpspace.dmp tablespaces=users
6,可移动表空间导出
1 将user表空间设置成只读状态,然后执行可移动表空间元数据导出
sql> alter tablespace users read only;
BIN> expdp system/system directory=mypump dumpfile=exptrans.dmp transport_tablespaces=users;
sql> alter tablespace users online;
--21.5 使用导出参数
1 使用exclude参数
在expdp命令中可以指定参数exclude,用来实现从data pump export中排除对象,如果排除了一个对象,也将排除
所有与它相关的对象。
使用exclude的格式如下:
exclude=object_type[:name_clause][,...]
其中,object_type可以是任何oracle对象类型,包括权限、索引和表等;name_clause用来限制返回的值。
2 使用exclude参数
如果在data pump export中使用include,可以只导出符合要求的对象,其他所有对象均被排除。使用include
参数的格式如下:
include=object_type[:name_clause][,...]
3 使用query参数
对于满足exclude和include标准的对象,将会导出该对象的所有行。这时,可以使用query参数来限制返回的行,
使用query参数格式如下:
query=[schema.][table_name:]query_clause
其中,schema是指定表所属的用户名,或者所属的用户模式名称;
table_name指定表名;query_clause用来指定限制条件。
【实例】
1 exclude参数,注意表名要大写。
expdp system/system directory=mypump dumpfile=expdpexclude.dmp tablespaces=users exclude=table:"in('EMP')" exclude=table:"in('DEPT')"
2 include参数,注意表名要大写。导出users表空间的索引信息
expdp system/system directory=mypump dumpfile=expdpinclude.dmp tablespaces=users include=index
3 query参数
expdp system/system directory=mypump dumpfile=expdpquery.dmp tables=scott.dept query=/"where deptno=10/"
--21.6 数据泵导入选项
关键字 说明 (默认)
------------------------------------------------------------------------------
ATTACH 连接到现有作业, 例如 ATTACH [=作业名]。
CONTENT 指定要加载的数据, 其中有效关键字为:
(ALL), DATA_ONLY 和 METADATA_ONLY。
DIRECTORY 供转储文件, 日志文件和 sql 文件使用的目录对象。
DUMPFILE 要从 (expdat.dmp) 中导入的转储文件的列表,
例如 DUMPFILE=scott1.dmp, scott2.dmp, dmpdir:scott3.dmp。
ENCRYPTION_PASSWORD 用于访问加密列数据的口令关键字。
此参数对网络导入作业无效。
ESTIMATE 计算作业估计值, 其中有效关键字为:
(BLOCKS) 和 STATISTICS。
EXCLUDE 排除特定的对象类型, 例如 EXCLUDE=TABLE:EMP。
FLASHBACK_SCN 用于将会话快照设置回以前状态的 SCN。
FLASHBACK_TIME 用于获取最接近指定时间的 SCN 的时间。
FULL 从源导入全部对象 (Y)。
HELP 显示帮助消息 (N)。
INCLUDE 包括特定的对象类型, 例如 INCLUDE=TABLE_DATA。
JOB_NAME 要创建的导入作业的名称。
LOGFILE 日志文件名 (import.log)。
NETWORK_LINK 链接到源系统的远程数据库的名称。
NOLOGFILE 不写入日志文件。
PARALLEL 更改当前作业的活动 worker 的数目。
PARFILE 指定参数文件。
QUERY 用于导入表的子集的谓词子句。
REMAP_DATAFILE 在所有 DDL 语句中重新定义数据文件引用。
REMAP_SCHEMA 将一个方案中的对象加载到另一个方案。
REMAP_TABLESPACE 将表空间对象重新映射到另一个表空间。
REUSE_DATAFILES 如果表空间已存在, 则将其初始化 (N)。
SCHEMAS 要导入的方案的列表。
SKIP_UNUSABLE_INDEXES 跳过设置为无用索引状态的索引。
SQLFILE 将所有的 SQL DDL 写入指定的文件。
STATUS 在默认值 (0) 将显示可用时的新状态的情况下,
要监视的频率 (以秒计) 作业状态。
STREAMS_CONFIGURATION 启用流元数据的加载
TABLE_EXISTS_ACTION 导入对象已存在时执行的操作。
有效关键字: (SKIP), APPEND, REPLACE 和 TRUNCATE。
TABLES 标识要导入的表的列表。
TABLESPACES 标识要导入的表空间的列表。
TRANSFORM 要应用于适用对象的元数据转换。
有效的转换关键字: SEGMENT_ATTRIBUTES, STORAGE
OID 和 PCTSPACE。
TRANSPORT_DATAFILES 按可传输模式导入的数据文件的列表。
TRANSPORT_FULL_CHECK 验证所有表的存储段 (N)。
TRANSPORT_TABLESPACES 要从中加载元数据的表空间的列表。
仅在 NETWORK_LINK 模式导入操作中有效。
VERSION 要导出的对象的版本, 其中有效关键字为:
(COMPATIBLE), LATEST 或任何有效的数据库版本。
仅对 NETWORK_LINK 和 SQLFILE 有效。
下列命令在交互模式下有效。
注: 允许使用缩写
命令 说明 (默认)
------------------------------------------------------------------------------
CONTINUE_CLIENT 返回到记录模式。如果处于空闲状态, 将重新启动作业。
EXIT_CLIENT 退出客户机会话并使作业处于运行状态。
HELP 总结交互命令。
KILL_JOB 分离和删除作业。
PARALLEL 更改当前作业的活动 worker 的数目。
PARALLEL=<worker 的数目>。
START_JOB 启动/恢复当前作业。
START_JOB=SKIP_CURRENT 在开始作业之前将跳过
作业停止时执行的任意操作。
STATUS 在默认值 (0) 将显示可用时的新状态的情况下,
要监视的频率 (以秒计) 作业状态。
STATUS[=interval]
STOP_JOB 顺序关闭执行的作业并退出客户机。
STOP_JOB=IMMEDIATE 将立即关闭
数据泵作业。
【实例】
查看命令:impdp help=y
1,表模式导入
impdp scott/scott_2009 directory=mypump dumpfile=expdptab.dmp tables=dept,emp table_exists_action=replace
2,全库模式导入
impdp system/system directory=mypump dumpfile=expdp.dmp full=y
3,schema模式导入
impdp system/system directory=mypump dumpfile=expdp.dmp schemas=scott nologfile=y
4,表空间数据导入
impdp system/system directory=mypump dumpfile=expdpspace.dmp tablespaces=users
5,可移动表空间导入
1 将user表空间设置成只读状态,然后执行可移动表空间元数据导出
sql> alter tablespace users read only;
BIN> impdp system/system directory=mypump dumpfile=exptrans.dmp transport_tablespaces=users;
sql> alter tablespace users online;