Oracle SQL Loader数据导入

含序列,不能设direct=true):

1、SQL LOADER是ORACLE的数据加载工具,通常用来将操作系统文件迁移到ORACLE数据库中。SQL*LOADER是大型数据仓库选择使用的加载方法,因为它提供了最快速的途径(DIRECT,PARALLEL)。

它使用的命令为:在NT下,SQL LOADER的命令为SQLLDR,在UNIX下则为sqlldr/sqlload。

2、一般用法

sqlldr scott/tiger control=control_file.ctl log=logFile.log direct=true

其它参数则在输入sqlldr命令时出现:

用法: SQLLDR keyword=value [,keyword=value,...]

有效的关键字:

    userid -- ORACLE username/password
   control -- Control file name
       log -- Log file name
       bad -- Bad file name
      data -- Data file name
      discard -- Discard file name
      discardmax -- Number of discards to allow        (全部默认)
      skip -- Number of logical records to skip (默认0)
      load -- Number of logical records to load (全部默认)
     errors -- Number of errors to allow          (默认50)
      rows -- Number of rows in conventional path bind array or between direct path data saves(默认: 常规路径 64, 所有直接路径)
bindsize -- Size of conventional path bind array in bytes(默认256000)
    silent -- Suppress messages during run (header,feedback,errors,discards,partitions)
    direct -- use direct path                    (默认FALSE)
    parfile -- parameter file: name of file that contains parameter specifications
   parallel -- do parallel load                   (默认FALSE)
      file -- File to allocate extents from
skip_unusable_indexes -- disallow/allow unusable indexes or index partitions(默认FALSE)
   skip_index_maintenance -- do not maintain indexes, mark affected indexes as unusable(默认FALSE)
   readsize -- Size of Read buffer                (默认1048576)
   external_table -- use external table for load; NOT_USED, GENERATE_ONLY, EXECUTE(默认NOT_USED)
   columnarrayrows -- Number of rows for direct path column array(默认5000)
   streamsize -- Size of direct path stream buffer in bytes(默认256000)
   multithreading -- use multithreading in direct path
   resumable -- enable or disable resumable for current session(默认FALSE)
resumable_name -- text string to help identify resumable statement
resumable_timeout -- wait time (in seconds) for RESUMABLE(默认7200)
date_cache -- size (in entries) of date conversion cache(默认1000)

PLEASE NOTE: 命令行参数可以由位置或关键字指定。前者的例子是 'sqlload scott/tiger foo'; 后一种情况的一个示例是 'sqlldr control=foo
userid=scott/tiger'.位置指定参数的时间必须早于但不可迟于由关键字指定的参数。例如,
允许 'sqlldr scott/tiger control=foo logfile=log', 但是
不允许 'sqlldr scott/tiger control=foo log', 即使
参数 'log' 的位置正确。

3、控制文件制定

LOAD DATA
INFILE 'input_File.csv’
INTO TABLE tableName
FIELDS TERMINATED BY ","

(field1,field2,field3,field4)

解释:

infile 指数据源文件 这里我们省略了默认的 discardfile   result.dsc   badfile   result.bad   
into   table   tableName 默认是INSERT,也可以 APPEND into   table   tableName 为追加方式,或REPLACE  

注意:

1、insert,为缺省方式,在数据装载开始时要求表为空     
2、append,在表中追加新记录     
3、replace,删除旧记录,替换成新装载的记录     
4、truncate,同上      

terminated   by   ',' 指用逗号分隔   
terminated   by   whitespace 结尾以空白分隔  

fields   terminated   by   X'09'  字段终止于X'09',是一个制表符(TAB)

tableName:数据表

(field1,field2,field3,field4):数据表导入字段

注意:当infile *时,导入数据就在控制文件中.....

如:

LOAD DATA
INFILE *
APPEND INTO TABLE tableName
FIELDS TERMINATED BY "," Optionally enclosed by '"'
(field1,field2,field3,field4)

BEGINDATA

field1_data,field2_data,field3_data,field4_data

field1_data,field2_data,field3_data,field4_data

field1_data,field2_data,field3_data,field4_data

注:"*" 代表数据文件与此文件同名,即在后面使用BEGINDATA段来标识数据

4、并发操作

sqlldr scott/tiger control=control_file.ctl log=logFile.log direct=true parallel=true

5、导出规则数据

Oracle 没有提供将数据导出到一个文件的工具。但是,我们可以用SQL*Plus的select 及 format 数据来输出到一个文件 set echo off newpage 0 space 0 pagesize 0 feed off head off trimspool on
  spool oradata.txt
  select col1 || ',' || col2 || ',' || col3
  from tab1
  where col2 = 'XYZ';
  spool off

   另外,也可以使用使用 UTL_FILE PL/SQL 包处理:
  rem Remember to update initSID.ora, utl_file_dir='c:\oradata' parameter
  declare
  fp utl_file.file_type;
  begin
  fp := utl_file.fopen('c:\oradata','tab1.txt','w');
  utl_file.putf(fp, '%s, %s\n', 'TextField', 55);
  utl_file.fclose(fp);
  end;

当然你也可以使用第三方工具,如SQLWays ,TOAD for Quest等。
  加载可变长度或指定长度的记录
  如:
  LOAD DATA
  INFILE *
  INTO TABLE load_delimited_data
  FIELDS TERMINATED BY "," OPTIONALLY ENCLOSED BY '"'
  TRAILING NULLCOLS
  ( data1,
  data2
  )
  BEGINDATA
  11111,AAAAAAAAAA
  22222,"A,B,C,D,"
  下面是导入固定位置(固定长度)数据示例:
  LOAD DATA
  INFILE *
  INTO TABLE load_positional_data
  ( data1 POSITION(1:5),
  data2 POSITION(6:15)
  )
  BEGINDATA
  11111AAAAAAAAAA
  22222BBBBBBBBBB
  跳过数据行:
  可以用 "SKIP n" 关键字来指定导入时可以跳过多少行数据。如:
  LOAD DATA
  INFILE *
  INTO TABLE load_positional_data
  SKIP 5
  ( data1 POSITION(1:5),
  data2 POSITION(6:15)
  )
  BEGINDATA
  11111AAAAAAAAAA
  22222BBBBBBBBBB
  导入数据时修改数据:
  在导入数据到数据库时,可以修改数据。注意,这仅适合于常规导入,并不适合 direct导入方式.

SQLLDR直接加载能否分批提交?

测过这样的问题,不过没做细致的分析
oracle也就是一个应用程序,与程序设计有关

sqlldr中的在直接装载时rows所表述的是多少行save 一下data
文档中也说了,这是一个大致的量,实际save多少与buffer所决定的bindsize有关
注意,这里说的是save data

save data只是类似于commit的效果
相同的地方时你在direct load的过程中出现了instance down等类似的状况,save的数据会实际保存到库中
不相同的部分大体有如下几点:
1.直接装载rows参数所表述的save data并没有事务的概念,不经过undo segment,因此无法回滚
2.direct是在hwm上的一个操作,成功了调整hwm,失败则好似未发生过这样的操作
3.direct load在装载时未不维护索引

所以设置了rows参数在load过程表中看不到数据的原因可能如下:
1、如hwm有关,即操作完成及instance recover或pmon清理时才发生调整hwm的操作
2、与direct load是一个无事务的操作有关
3、rows所表述的是save data,即extent操作,与commit所表述的事务操作是不同的

你可能感兴趣的:(Oracle SQL)