j3com

SQL*Loader 用法概述

SQL*Loader

SQL*Loader（SQLLDR）是Oracle的高速批量数据加载工具。这是一个非常有用的工具，可用于多种平面文件格式向Oralce数据库中加载数据。

SQLLDR可以在极短的时间内加载数量庞大的数据。它有两种操作模式：

传统路径：（conventional path）：SQLLDR会利用SQL插入为我们加载数据。
直接路径(direct path)：采用这种模式，SQLLDR不使用SQL；而是直接格式化数据库块。

利用直接路径加载，你能从一个平面文件读数据，并将其直接写至格式化的数据库块，而绕过整个SQL引擎和undo生成，同时还可能避开redo生成。要在一个没有任何数据的数据库中充分加载数据，最快的方法就是采用并行直接路径加载。

命令行参数

userid --       ORACLE username/password
control --       control file name (该参数指定了一个决定Sql*Loader行为的配置文件，它决定了需要从哪个数据文件读取数据，载入到哪张表里，分别有哪些字段等等。)
log --           log file name
bad --           bad file name
data --          data file name (该参数指定了数据来源，也就是从哪个数据文件中读取记录。指定的数据文件每行的数据往往有特定的格式，有特定的分隔符区分每个字段的值。不常用，我们用control file)
discard --      discard file name (该参数指定了一个文件用于记录那些未被正常导入到数据库中的记录。)
discardmax --    number of discards to allow (Default all)
skip --          number of logical records to skip (Default 0)
load --          number of logical records to load (Default all)
errors --        number of errors to allow (Default 50) (允许出错的记录数，一般情况系此参数需要调整)
rows --          number of rows in conventional path bind array or between direct path data saves

(Default: Conventional path 64, Direct path all) (每次Commit的记录数。在Conventional Path模式时，它限定了bind array最大记录数。在Direct Path模式时，它限定了保存之前从数据文件中读取的最大记录数。它的作用和BINDSIZE类似，只是一个限制了记录数，一个限制了记录大小。)

bindsize --      size of conventional path bind array in bytes (Default 256000)
                 (Sql*Loader分批从数据文件中读取记录并提交到数据库中，每批的大小是有限制。该参数决定了Sql*Loader从数据文件读取记录大小的上限，除了每次读取的记录数必须小于ROWS指定的数目外，大小上不得超过BINDSIZE所指定的数值。该参数计量单位是Byte。默认256K)
silent --         suppress messages during run (header,feedback,errors,discards,partitions)
                  (静默方式，不输出信息)

direct -- use direct path (Default FALSE)

(direct=true 使用直通路径方式导入)

parfile -- parameter file: name of file that contains parameter specifications

parallel -- do parallel load (Default FALSE)

(并行导入)

file -- file to allocate extents from

skip_unusable_indexes -- disallow/allow unusable indexes or index partitions (Default FALSE)

skip_index_maintenance -- do not maintain indexes, mark affected indexes as unusable (Default FALSE)

commit_discontinued -- commit loaded rows when load is discontinued (Default FALSE)

readsize -- size of read buffer (Default 1048576)
(读缓存大小。该参数仅针对从数据文件载入数据的方式时有效，默认值为64k，最大值因系统平台各有不同。在Conventional Path模式时，bind array 受限于读缓存，也就是说，在系统内存和bind array足够大的前提下，如果读缓存越大，则可以有更多的记录在commit前被读取，这也就意味着载入性能越好。当READSIZE小于BINDSIZE时，则READSIZE会被自动加大。)

external_table -- use external table for load; NOT_USED, GENERATE_ONLY, EXECUTE (Default NOT_USED)

columnarrayrows -- number of rows for direct path column array (Default 5000)

streamsize -- size of direct path stream buffer in bytes (Default 256000)

multithreading -- use multithreading in direct path

resumable -- enable or disable resumable for current session (Default FALSE)

resumable_name -- text string to help identify resumable statement

resumable_timeout -- wait time (in seconds) for RESUMABLE (Default 7200)

date_cache -- size (in entries) of date conversion cache (Default 1000)

...

以上参数经常用的为，userid,control,errors,rows,bindsize/readsize,direct,parallel。

提醒：如果数据量较大需要显式设定rows（比如：10000），以及bindsize/readsize（比如：5120000），direct=true,parallel=true，以及设置errorx=n(n为允许出错的条数)。

control文件

// 建表

create table dept

(

deptno number(2) constraint dept_pk primary key,

dname varchar2(14),

loc varchar2(13)

);

// control说明

LOAD DATA
INFILE 'data.dat'            // 要导入的文件
// INFILE 'data.date'        // 导入多个文件
// INFILE *                  // 表示要导入的内容就在control文件里,下面的BEGINDATA后面就是导入的内容
BADFILE 'data.bad'           // 可选，指定坏文件地址,缺省在当前目录下生成与原文件名一致的.bad文件

INTO TABLE dept // 指定装入的表

// 以下是4种装入表的方式
APPEND                       // 原先的表有数据就加在后面
// INSERT                    // 装载空表如果原先的表有数据 sqlloader会停止(默认值)
// REPLACE                   // 原先的表有数据原先的数据会全部删除(原表数据量大则较慢，慎重使用)
// TRUNCATE                  // 指定的内容和replace的相同，会用truncate语句删除现存数据(慎重使用)

// 指定分隔符
FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' // 它指定用逗号分隔数据字段，每个字段可以用双引号括起。
// FIELDS TERMINATED BY X’09’   // 使用十六进制格式的制表符（tab符）,采用ASCII时，制表符为9。
// FIELDS TERMINATED BY ' '       // 使用空格
// FIELDS TERMINATED BY WRITESPACE // 以空白分割，查找空白符（制表符、空格和换行符）的第一次出现，
                                   // 然后继续查找，直至找到下一个非空白符。注意和' '的区别

TRAILING NULLCOLS // 表的字段没有对应的值时允许为空

//设置表的字段
(
      DEPTNO,
   DNAME,
   LOC
   //LOC FILLER           // FILLER，表示此列的数值不会被装载，即忽略此列的存在(跳过此列)
)

// BEGINDATA // 对应开始的 INFILE * 要导入的内容就在control文件里
// 0,Sales,Virginia,USA
// 20,Accounting,"Va,USA"
// 30,Consulting,Virginia
// 40,Finance,Virginia

// 加载固定位置格式数据
这种定宽的固定位置数据是最适合SQLLDR加载的数据格式。要加载这种数据，使用SQLLDR是最快的处理方法，因为解析输入数据流相当容易。SQLLDR会在数据记录中存储固定字节的偏移量和长度，因此抽取某个给定字段相当简单。如果要加载大量数据，将其转换为一种固定位置格式通常是最好的办法。当然，定宽文件也有一个缺点，它比简单的定界文件格式可能要大得多。

1、 要加载定宽的固定位置数据，将会在控制文件中使用POSITION关键字，例如：

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE

(
DEPTNO position(1:2),
DNAME position(3:16),
LOC position(17:29),
// ENTIRE_LINE position(1:29) // POSITION子句可以使用重叠的位置，可以在记录中来回反复。
)

BEGINDATA

0,Sales,Virginia,USA

2、 使用POSITION时，可以使用相对偏移量，也可以使用绝对偏移量。

在前面的例子中使用了绝对偏移量，我们明确地指示了字段从哪里开始，到哪里结束。也可以把前面的控制文件写作：

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE

(
DEPTNO position(1:2),
DNAME position(*:16), // DNAME position(3:16),
//DNAME position(*+2:16), // DNAME position(5:16),
LOC position(*:29),
//ENTIRE_LINE position(1:29)
)

BEGINDATA

0,Sales,Virginia,USA

"*"号指示控制文件得出上一个字段在哪里结束。因此，在这种情况下，（*:16）与(3:16)是一样的。注意，控制文件中可以混合使用相对位置和绝对位置。另外。使用*表示法时，可以把它与偏移量相加。例如，如果DNAME从DEPTNO结束之后的2个字节处开始，可以使用(*+2:16)。在这个例子中，其作用就相当于使用(5:16)。

3、POSITION子句中的结束位置必须是数据结束的绝对列位置。

有时，可能指定每个字段的长度更为容易，特别是如果这些字段是连续的（就像前面的例子一样）。采用这种方式，只需告诉SQLLDR：记录从第1个字节开始，然后指定每个字段的长度就行了。这样我们就可以免于计算记录中的开始和结束偏移量，这个计算有时可能很困难。为此，可以不指定结束位置，而是指定定长记录中各个字段的长度，如下：

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE

(
DEPTNO position(1) char(2),
DNAME position(*) char(14),
LOC position(*) char(13),
ENTIRE_LINE position(1) char(29)
)

BEGINDATA

0,Sales,Virginia,USA

在此只需告诉SQLLDR第一个字段从哪里开始及其长度。后面的每个字段都从上一个字段结束处开始，并具有指定的长度。直至最后一个字段才需要再次指定位置，因为这个字段又要从记录起始处开始。

// 加载日期

使用SQLLDR加载日期相当简单，但是看起来这个方面经常导致混淆。你只需在控制文件中使用DATE数据类型，并指定要使用的日期掩码。这个日期掩码与数据库中TO_CHAR和TO_DATE中使用的日期掩码是一样的。SQLLDR会向数据应用这个日期掩码，并为你完成加载。

1、增加字段

alter table dept add last_updated date;

2、配置修改

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','

(
DEPTNO,
DNAME,
LOC,
LAST_UPDATED date 'dd/mm/yyyy'
)
BEGINDATA
10,Sales,Virginia,1/5/2000
20,Accounting,Virginia,21/6/1999

// 使用函数加载数据

1、单字段处理

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','

(
DEPTNO,
DNAME "upper(:dname)", //将字段数据转换为大写
LOC "upper(:loc)",
LAST_UPDATED date 'dd/mm/yyyy'
)
BEGINDATA
10,Sales,Virginia,1/5/2000
20,Accounting,Virginia,21/6/1999

2、多字段处理

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','

TRAILING NULLCOLS   // 如果输入记录中不存在某一列的数据，SQLLDR就会为该列绑定一个NULL值
(
DEPTNO,
DNAME    "upper(:dname)",
LOC     "upper(:loc)",
LAST_UPDATED date 'dd/mm/yyyy',
ENTIRE_LINE ":deptno||:dname||:loc||:last_updated"
)
BEGINDATA
10,Sales,Virginia,1/5/2000
20,Accounting,Virginia,21/6/1999

3、多种日期格式字段

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','

TRAILING NULLCOLS
(
DEPTNO,
DNAME "upper(:dname)",
LOC "upper(:loc)",
LAST_UPDATED
"case               // 进行条件判断
  when length(:last_updated) > 9
   then to_date(:last_updated,'hh24:mi:ss dd/mm/yyyy')
  when instr(:last_updated,':') > 0
   then to_date(:last_updated,'hh24:mi:ss')
  else to_date(:last_updated,'dd/mm/yyyy')
end"
)
BEGINDATA
10,Sales,Virginia,12:03:03 17/10/2005
20,Accounting,Virginia,02:23:54
30,Consulting,Virginia,01:24:00 21/10/2005
40,Finance,Virginia,17/8/2005

// 加载有内嵌换行符的数据
方式如下：

加载数据，其中用非换行符的其他字符来表示换行符（例如，在文本中应该出现换行符的位置上放上串\n），并在加载时使用一个SQL函数用一个CHR(10)替换该文本。

在INFILE指令上使用FIX属性，加载一个定长平面文件。

在INFILE指令上使用VAR属性，加载一个定宽文件，在该文件使用的格式中，每一行的前几个字节指定了这一行的长度（字节数）。

在INFILE指令上使用STR属性，加载一个变宽文件，其中用某个字符序列来表示行结束符，而不是用换行符来表示。

1、使用一个非换行符的字符

如果你能对如何生成输入数据加以控制，这就是一种很容易的方法。如果创建数据文件时能很容易地转换数据，这种方法就能奏效。其思想是，就数据加载到数据库时对数据应用一个SQL函数，用某个字符串来替换换行符。

下面向DEPT表再增加另一个列：
SQL>alter table dept add comments varchar2(4000);

我们将使用这一列来加载文本。下面是一个有内联数据的示例控制文件：

LOAD DATA
INFILE *
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','

TRAILING NULLCOLS
(
DEPTNO,
DNAME "upper(:dname)",
LOC "upper(:loc)",
COMMENTS "replace(:comments,'\\n',chr(10))"

)
BEGINDATA
10,Sales,Virginia,This is the Sales\nOffice in Virginia
20,Accounting,Virginia,This is the Accounting\nOffice in Virginia
30,Consulting,Virginia,This is the Consulting\nOffice in Virginia
40,Finance,Virginia,This is the Finance\nOffice in Virginia

注意，调用中必须使用\\n 来替换换行符，而不只是\n。这是因为\n会被SQLLDR识别为一个换行符，而且SQLLDR会把它转换为一个换行符，而不是一个两字符的串。利用以上控制文件执行SQLLDR时，DEPT表中将加载以下数据：

SQL>select deptno, dname, comments from dept;

DEPTNO       DNAME                     COMMENTS
----------   --------------            -------------------------
       10   SALES                      This is the Sales
                                       Office in Virginia
       20   ACCOUNTING                 This is the Accounting
                                       Office in Virginia
       ... ...

2、使用IFX属性

另一种可用的方法是使用FIX属性。如果使用这种方法，输入数据必须出现在定长记录中。每个记录与输入数据集中所有其他记录的长度都相同，即有相同的字节数。对于固定位置的数据，使用FIX属性就特别适合。这些文件通常是定长输入文件。使用自由格式的定界数据时，则不太可能是一个定长文件，因为这些文件通常是变长的（这正是定界文件的关键：每一行不会不必要地过长）。

使用FIX属性时，必须使用一个INFILE子句，因为FIX属性是INFILE的一个选项。另外，如果使用这个选项，数据必须在外部存储，而并非存储在控制文件本身。因此，假设有定长的输入记录，可以使用如下的一个控制文件：

LOAD DATA
INFILE demo.dat "fix 80"
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','
TRAILING NULLCOLS
(
DEPTNO,
DNAME "upper(:dname)",
LOC "upper(:loc)",
COMMENTS
)

这个文件指定了一个输入数据文件，这个文件中每个记录有80字节，这包括尾部的换行符（每个记录最后可能有换行符，也可能没有）。在这种情况下，输入数据文件中的换行符并不是特殊字符。这只是要加载（或不加载）的另一个字符而已。要知道：记录的最后如果有换行符，它会成为这个记录的一部分。为了充分理解这一点，我们需要一个实用程序将文件的内容转储在屏幕上，以便我们看到文件中到底有什么。使用UNIX（或任何Linux版本），利用od就很容易做到，这个程序可以将文件以八进制（和其他格式）转储到屏幕上。我们将使用下面的demo.dat文件。注意以下输入中的第一列实际上是八进制，所以第2行上的数字0000012是一个八进制数，不是十进制数10.由此我们可以知道所查看的文件中有哪些字节。我对这个输出进行了格式化，使得每行显示10个字符（使用-w10），所以0、12、24和36实际上就是0、10、20和30。

$ od -c -w10 -v demo.dat
0000000           1      0      ,       S      a      l       e      s      ,       V
0000012           i       r       g      i       n      i       a      ,       T      h
0000024           i       s      i       s      t       h      e
0000036           S      a      l       e      s      /n     O     f       f       i
0000050           c      e      i       n      V      i       r       g
0000062           i       n      i       a
0000074
0000106
0000120           2      0      ,       A      c      c      o      u      n      t
0000132           i       n      g      ,       V      i       r       g      i       n
0000144           i       a      ,       T      h      i       s      i       s
0000156           t       h      e      A      c      c      o      u
0000170           n      t       i       n      g      /n     O     f       f       i
0000202           c      e      i       n      V      i       r       g
0000214           i       n      i       a
0000226
0000240           3      0      ,       C     o      n      s      u      l       t
0000252           i       n      g      ,       V      i       r       g      i       n
......

注意，在这个输入文件中，并没有用换行符（\n）来指示SQLLDRE记录在哪里结束；这里的换行符只是要加载的数据而已。SQLLDR使用FIX宽度（80字节）来得出要读取多少数据。实际上，如果查看输入数据，可以看到，输入文件中提供给SQLLDR的记录甚至并非以/n结束。部门20的记录之前的字符是一个空格，而不是换行符。

既然我们知道了每个记录的长度为80字节，现在就可以用前面有FIX80子句的控制文件来加载这些数据了。完成加载后，可以看到以下结果：
SQL> select '"' || comments || '"' comments from dept;

COMMENTS

-------------------------------------------------------------------------------
"This is the Sales
Office in Virginia "
"This is the Accounting
Office in Virginia "
"This is the Consulting
Office in Virginia "
"This is the Finance
Office in Virginia "

你可能需要“截断“这个数据，因为尾部的空白符会保留。可以在控制文件中使用TRIM内置SQL函数来完成截断。
如果你恰好同时在使用Windows和UNIX，能你很“幸运“，在此需要提醒一句：这两个平台上的行结束标记是不同的。在UNIX上，行结束标记就是\n（SQL中的CHR(10)）。在Windows NT上，行结束标记却是\r\n（SQL中的CHR(13)||CHR(10)）。一般来讲，如果使用FIX方法，就要确保是在同构平台上创建和加载文件（UNIX上创建，UNIX上加载；或者Windows上创建，Windows上加载）。

3、使用VAR属性

要加载有内嵌换行符的数据，另一种方法是使用VAR属性。使用这种格式时，每个记录必须以某个固定的字节数开始，这表示这个记录的总长度。通过使用这种格式，可以加载包含内嵌换行符的变长记录，但是每个记录的开始处必须有一个记录长度字段。因此，如果使用如下的一个控制文件：

LOAD DATA
INFILE demo.dat "var 3"
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','
TRAILING NULLCOLS
(
DEPTNO,
DNAME "upper(:dname)",
LOC "upper(:loc)",
COMMENTS
)

VAR 3指出每个输入记录的前3个字节是输入记录的长度。如果取以下数据文件：
$ cat demo.dat
05510,Sales,Virginia,This is the Sales
Office in Virginia
06520,Accounting,Virginia,This is the Accounting
Office in Virginia
06530,Consulting,Virginia,This is the Consulting
Office in Virginia
05940,Finance,Virginia,This is the Finance
Office in Virginia

可以使用该控制文件来加载。在我们的输入数据文件中有4行数据。第一行从055开始，这说明接下来55字节是第一个输入记录。这55字节包括单词Virginia后的结束换行符。下一行从065开始。这一行有65字节的文本，依此类推。使用这种格式数据文件，可以很容易地加载有内嵌换行符的数据。

同样，如果你在使用UNIX和Windows（前面的例子都在UNIX上完成，其中换行符只是一个字符长），就必须调整每个记录的长度字段。在Windows上，前例.dat文件中的长度字段应该是56、66、66和60.

4、使用STR属性

要加载有内嵌换行符的数据，这可能是最灵活的一种方法。通过使用STR属性，可以指定一个新的行结束符（或字符序列）。就能创建一个输入数据文件，其中每一行的最后有某个特殊字符、换行符不再有“特殊“含义。

我更喜欢使用字符序列，通常会使用某个特殊标记，然后再加一个换行符。这样，在一个文本编辑器或某个实用程序中查看输入数据时，就能很容易地看到行结束符，因为每个记录的最后仍然有一个换行符。STR属性以十六进制指定，要得到所需的具体十六进制串，最容易的方法是使用SQL和UTL_RAW来生成十六进制串。例如，假设使用的是UNIX平台，行结束标记是CHR(10)（换行），我们的特殊标记字符是一个管道符号（|），则可以写为：

SQL> select utl_raw.cast_to_raw( '|'||chr(10) ) from dual;

UTL_RAW.CAST_TO_RAW('|'||CHR(10))
-------------------------------------------------------------------------------
7C0A

由此可知，在UNIX上我们需要使用的STR是X’7C0A’。
注意在Windows上，要使用UTL_RAW.CAST_TO_RAW(‘|”||chr(13)||chr(10))。

为了使用这个方法，要有以下控制文件：
LOAD DATA
INFILE demo.dat "str X'7C0A'"
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ','
TRAILING NULLCOLS
(
DEPTNO,
DNAME "upper(:dname)",
LOC "upper(:loc)",
COMMENTS
)

因此，如果输入数据如下：

$ cat demo.dat
10,Sales,Virginia,This is the Sales
Office in Virginia|
20,Accounting,Virginia,This is the Accounting
Office in Virginia|
30,Consulting,Virginia,This is the Consulting
Office in Virginia|
40,Finance,Virginia,This is the Finance
Office in Virginia|

其中，数据文件中的每个记录都以|\n结束，前面的控制文件就会正确地加载这些数据。

5、内嵌换行符小结

关于加载有内嵌换行符的数据，这一节讨论了至少4种方法。在后面的“平面文件卸载“一节中，我们还将看到会使用这里的一种技术，可以在一个通用卸载实用程序使用STR属性来避免与文本中换行符有关的问题。

另外要注意一个问题，我先前已经多次提到，Windows（包括各种版本）上的文本文件可能以\r\n（ASCII 13+ASCII 10，回车/换行）结束。\r是记录的一部分，控制文件必须适应这一点。具体地将，FIX和VAR中的字节数已经STR使用的串必须有所调整。例如，如果取先前的某个.dat文件（目前其中只包含\n），并使用一个ASCII传输工具（默认）将其通过FTP传输到Windows，将各个\n将转换为\r\n。原来UNIX中能工作的控制文件现在却不能加载数据了。这一点你必须当心，建立控制文件时一定要有所考虑。

// 通过SQLLDR加载LOB数据

现在我们来分析如何通过SQLLDR向LOB加载数据。对此方法不止一种，但是我们主要讨论两种最常用的方法：

.数据“内联“在其他数据中。
.数据外联存储（在外部存储），输入数据包含一个文件名，指示该行要加载的数据在哪个文件中。在SQLLDR术语中，这也称为二级数据文件（secondary data file，SDF）。

1、加载内联的LOB数据。
这些LOB通常内嵌有换行符和其他特殊字符。因此，往往会使用“如何加载有内嵌换行符的数据？“一节中详细讨论的4种方法之一来加载这种数据。下面先来修改DEPT表，使COMMENTS列是一个CLOB而不是一个大的VARCHAR2字段：

SQL> truncate table dept;
SQL> alter table dept drop column comments;
SQL> alter table dept add comments clob;

例如，假设有一个数据文件（demo.dat），它有以下内容：

10, Sales,Virginia,This is the Sales
Office in Virginia|
20,Accounting,Virginia,This is the Accounting
Office in Virginia|
30,Consulting,Virginia,This is the Consulting
Office in Virginia|
40,Finance,Virginia,"This is the Finance
Office in Virginia, it has embedded commas and is
much longer than the other comments field. If you
feel the need to add double quoted text in here like
this: ""You will need to double up those quotes!"" to
preserve them in the string. This field keeps going for up to
1000000 bytes (because of the control file definition I used)
or until we hit the magic end of record marker,
the | followed by an end of line - it is right here ->"|

每个记录最后都是一个管道符号（|），后面是行结束标记。部门40的文本比其他部门的文本长得多，有多个换行符、内嵌的引号以及逗号。给定这个数据文件，可以创建一个如下的控制文件：

LOAD DATA
INFILE demo.dat "str X'7C0A'"
INTO TABLE DEPT
REPLACE
FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
TRAILING NULLCOLS
(
DEPTNO,
DNAME "upper(:dname)",
LOC "upper(:loc)",
COMMENTS char(1000000)
)

注意这个例子在UNIX上执行，UNIX平台上行结束标记长度为1字节，因此可以使用以上控制文件中的STR设置。在Windows上，STR设置则必须是’7C0D0A’。

要加载这个数据文件，我们在COMMENTS列上指定了CHAR(1000000)，因为SQLLDR默认所有人们字段都为CHAR(255)。CHAR(1000000)则允许SQLLDR处理多达1,000,000字节的输入文本。可以把这个长度值设置为大于输入文件中任何可能文本块的大小。通过查看所加载的数据，可以看到以下结果：

SQL> select comments from dept;

我们可以观察到：原来重复两次的引号不再重复。SQLLDR去除了在此放置的额外的引号。

2、加载外联的LOB数据
可能要把包含有一些文件名的数据文件加载在LOB中，而不是让LOB数据与结构化数据混在一起，这种情况很常见。这提供了更大程度的灵活性，因为提供给SQLLDR的数据文件不必使用上述的4种方法之一来避开输入数据中的内嵌换行符问题，而这种情况在大量的文本或二进制数据中会频繁出现。SQLLDR称这种额外的数据文件为LOBFILE。

SQLLDR还可以支持加载结构化数据文件（指向另外单独一个数据文件）。我们可能告诉SQLLDR如何从另外这个文件分析LOB数据，这样就可以加载其中的一部分作为结构化数据中的每一行。我认为这种模式的用途很有限（到目前为止，我自己还从来没有见过哪里用到这种方法），在此也不做过多的讨论。SQLLDR把这种外部引用的文件称为复杂二级数据文件（complex secondary data file）。

LOBFILE是一种相对简单的数据文件，旨在简化LOB加载。在LOBFILE中，没有记录的概念，因此换行符不会成为问题，正是这个性质使得LOBFILE与主要数据文件有所区别。在LOBFILE中，数据总是采用以下某种格式：

定长字段（例如，从LOBFILE加载字节100到1,000）
定界字段（以某个字符结束，或者用某个字符括起）
长度/值对，这是一个变长字段

其中最常见的类型是定界字段，实际上就是以一个文件结束符（EOF）结束。一般来讲，可能有这样一个目录，其中包含你想加载到LOB列中的文件，每个文件都要完整地放在一个BLOB中。此时，就可以使用带TERMINATED BY EOF子句的LOBFILE语句。

假设我们有一个目录，其中包含想要加载到数据库中的文件。我们想加载文件的OWNER、文件的TIME_STAMP、文件的NAME以及文件本身。要加载数据的表如下所示：

create table lob_demo
(
owner varchar2(255),
time_stamp date,
filename varchar2(255),
data blob
);

在UNIX上使用一个简单的ls –l来捕获输出（或者在Windows上使用dir \q \n），我们就能生成输入文件，并使用如下的一个控制文件加载（这里使用UNIX平台）：

LOAD DATA
INFILE *
REPLACE
INTO TABLE LOB_DEMO
(
owner         position(17:25),
time_stamp    position(44:55) date "Mon DD HH24:MI",
filename      position(57:100),
data LOBFILE(filename) TERMINATED BY EOF
)

BEGINDATA
-rw-r--r-- 1 tkyte tkyte 1220342 Jun 17 15:26 classes12.zip

现在，运行SQLLDR之后检查LOB_DEMO表的内容，会发现以下结果：

SQL> select owner, time_stamp, filename, dbms_lob.getlength(data) from lob_demo;

OWNER     TIME_STAM   FILENAME          DBMS_LOB.GETLENGTH(DATA)
-------- ---------   --------------    ------------------------
tkyte     17-JUN-05   classes12.zip     1220342

这不光适用于BLOB，也适用于CLOB。以这种方式使用SQLLDR来加载文本文件的目录会很容易。

3、将LOB数据加载到对象列

既然知道了如何将数据加载到我们自己创建的一个简单表中，可能会发现，有时需要将数据加载到一个复杂的表中，其中可能有一个包含LOB的复杂对象类型（列）。使用图像功能时这种情况最为常见。图像功能使用一个复杂的对象类型ORDSYS.ORDIMAGE来实现。我们需要告诉SQLLDR如何向其中加载数据。

要把一个LOB加载到一个ORDIMAGE类型的列中，首先必须对ORDIMAGE类型的结构有所了解。在SQL*Plus中使用要加载的一个目标表以及该表上的DESCRIBE，可以发现表中有一个名为IMAGE的ORDSYS.ORDIMAGE列，最终我们想在这一列中加载IMAGE.SOURCE.LOCALDATA。只有安装并配置好interMedia，项目的例子才能正常工作；否则，数据类型ORDSYS.ORDIMAGE将是一个未知类型：

create table p_w_picpath_load
(
id number,
name varchar2(255),
p_w_picpath ordsys.ordp_w_picpath
);

SQL> desc p_w_picpath_load

Name                                      Null?       Type
---------------------------------------- --------     ----------------------------
ID                                                     NUMBER
NAME                                                   VARCHAR2(255)
IMAGE                                                  ORDSYS.ORDIMAGE

SQL> desc ordsys.ordp_w_picpath

Name                                      Null?       Type
---------------------------------------- --------     ----------------------------
SOURCE                                                ORDSYS.ORDSOURCE
HEIGHT                                                NUMBER(38)
WIDTH                                                 NUMBER(38)
CONTENTLENGTH                                         NUMBER(38)
...

SQL> desc ordsys.ordsource

Name                                      Null?       Type
---------------------------------------- --------     ----------------------------
LOCALDATA                                             BLOB
SRCTYPE                                               VARCHAR2(4000)
SRCLOCATION                                           VARCHAR2(4000)
...

注意: 可以在SQL*Plus中执行SET DESC DEPTH ALL或SET DESC DEPTH 一次显示整个层次结构。

由于ORDSYS.ORDIMAGE的输出可能有几项的篇幅，所以我打算逐部分地介绍。

加载这种数据的控制文件可能如下所示：
LOAD DATA
INFILE *
INTO TABLE p_w_picpath_load
REPLACE
FIELDS TERMINATED BY ','
(
ID,
NAME,
file_name FILLER,
IMAGE      column object
(
SOURCE column object
(
  LOCALDATA LOBFILE (file_name) TERMINATED BY EOF
  NULLIF file_name = 'NONE'
)
)
)
BEGINDATA
1,icons,icons.gif

这里我引入了两个新构造：

.COLUMN OBJECT：这会告诉SQLLDR这不是一个列名；而是列名的一部分。它不会映射到输入文件中的一个字段，只是用来构建正确的对象列引用，从而在加载中使用。在前面的文件中有两个列对象标记，其中一个（SOURCE）嵌入在另一个（SOURCE）嵌入在另一个（IMAGE）中。因此，根据我们的需要，要使用的列名是IMAGE.SOURCE.LOCALDATA。注意，我们没有加载这两个对象类型的任何其他属性（例如，IMAGE.HEIGHT、IMAGE.CONTENTLENGTH和IMAGE.SOURCE.SRCTYPE）。稍后，我们将介绍如何填充这些属性。

.NULL IF FILE_NAME = ‘NONE’：这会告诉SQLLDR，如果字段FILE_NAME包含单词NONE，则向对象列中加载一个NULL。

一旦已经加载了一个interMedia类型，通常需要使用PL/SQL对已经加载的数据进行后处理，以便interMedia能够处理该数据。例如，对于前面的数据，可能想运行以下代码来正确地为图像设置属性：

begin
for c in ( select * from p_w_picpath_load ) loop
c.p_w_picpath.setproperties;
end loop;
end;
/

SETPROPERTIES 是ORDSYS.ORDIMAGE类型提供的对象方法，它处理图像本身，并用适当的值更新对象的其余属性。

SQLLDR 警告

1、TRUNCATE的工作好像不太一样

SQLLDR的TRUNCATE选项看上去好像与SQL*Plus（或其他如何工具）中的TRUNCATE有所不同。SQLLDR有一个假设，认为你会向表中重新加载同样数目的数据，因此会使用一种扩展形式的TRUNCATE。具体地将，它会执行以下命令：
truncate table t reuse storage

REUSE STORAGE选项并不释放已分配的区段，它只是将这些区段标记为“空闲空间”。如果这不是你想要的结果，就应当在执行SQLLDR之前先对表完成截除（truncate）。

2、SQLLDR默认地使用CHAR(255)

默认的输入字段长度为255字符。如果你的字段比这要长，就会将收到一个错误消息：
Record N: Rejected - Error on table T, column C.
Field in data file exceeds maximum length

这并不是说这个数据无法放在数据库列中；而是说，它指示SQLLDR希望有不少或等于255字节的输入数据，不过稍多一些也会接收。对此解决方案很简单，只需在控制文件中使用CHAR(N)，在此N要足够大，能容纳输入文件中最长的字段长度。

3、命令行会覆盖控制文件

SQLLDR的许多选项既可以放在控制文件中，也可以在命令行上使用。例如，可以使用INFILE FILENAME，也可以使用SQLLDR…DATA=FILENAME。命令行会覆盖控制文件中的任何选项。不能指望一定会使用控制文件中的选项，因为执行SQLLDR的人可能会通过命令行覆盖这些选项。

SQLLDR 小结

我们分析了SQLLDR加载数据的许多方面。在此介绍了每天可能遇到的一些典型问题：加载定界文件、加载定长文件、加载包含图像文件的一个目录，以及在输入数据上使用函数来转换输入等。我们没有详细介绍如何使用直接路径加载工具来加载大量数据；而只是简单地提了一下。我们的目标是回答使用SQLLDR时最常出现而且影响面最广的问题。

你可能感兴趣的:(Oracle,工具,数据库,数据库)

谷歌Chrome或微软Edge浏览器修改网页任意内容驯龙高手_追风杂文集 chrome edge 前端
在谷歌或微软浏览器按F12，打开开发者工具，切换到console选项卡：在下面的输入行输入下面的命令回车：document.body.contentEditable="true"效果如下：
Linux系统crontab定时任务用法详解驯龙高手_追风 LINUX Linux主机运维 linux 运维服务器
文章目录1.crontab语法格式示意图2.开机自启命令3.定时执行实例命令4.不生效的可能原因5.执行日志检查方法6.在线配置检验工具参考资料1.crontab语法格式示意图crontab修改方式指令编辑：crontab-e（保存、修改等使用方式同vi命令）列表查看：crontab-l2.开机自启命令开启启动某个命令或脚本@rebootsh/home/start.sh3.定时执行实例命令cron
5分钟看懂数据中台的典型架构 isNotNullX 架构大数据数据管理
数据中台典型架构包括数据采集层、数据存储层、数据处理层、数据服务层和数据应用层。以下是数据中台的分层概述：一、数据采集层数据采集层作为数据中台的基础，主要负责获取各种数据源。这些数据源既可以源自公司内部的业务系统，像ERP、CRM系统等，也可以是外部的数据接口，例如第三方API、社交媒体数据接口，乃至物联网设备的数据。在这一层中，运用高效的数据采集工具和技术是核心要点，常见的工具涵盖ETL（提取、
Python csv库 xiaoming0018 python python 开发语言
CSV文件又称为逗号分隔值文件，是一种通用的、相对简单的文件格式，用以存储表格数据，包括数字或者字符。CSV是电子表格和数据库中最常见的输入、输出文件格式，可参考《CSV介绍》。通过爬虫将数据抓取的下来，然后把数据保存在文件，或者数据库中，这个过程称为数据的持久化存储。本节介绍Python内置模块CSV的读写操作。CSV库Python中集成了专用于处理csv文件的库，名为：csv。csv库中有4个
大模型工程师学习日记（十四）：检索增强生成（RAG） MMMMMMMay Love Code 学习 langchain 深度学习人工智能开发语言
如何递归分割文本递归分割(recursively)，这个文本分割器是用于通用文本的推荐工具。它接受一个字符列表作为参数。它会按顺序尝试在这些字符上进行分割，直到块足够小。默认的字符列表是["\n\n","\n","",""]。这样做的效果是尽可能保持所有段落（然后是句子，再然后是单词）在一起，因为这些通常看起来是语义上相关的文本块。文本如何分割：根据字符列表。块大小如何衡量：根据字符数量。下面我们
leetcode-sql数据库面试题冲刺（高频SQL五十题）我想吃烤肉肉 sql 测试面试数据库 leetcode sql
题目：1633.各赛事的用户注册率用户表：Users±------------±--------+|ColumnName|Type|±------------±--------+|user_id|int||user_name|varchar|±------------±--------+user_id是该表的主键(具有唯一值的列)。该表中的每行包括用户ID和用户名。注册表：Register±---
为什么需要进行软件测试需求分析?专业第三方软件测评中心分享第三方软件测评需求分析
一、什么是软件测试需求分析?软件测试需求就是了解软件测试要测试什么项目，只有明确了测试需求，才能确定如何进行测试工作、测试时间、测试人员、测试环境、测试工具等等，这些都是测试计划设计的基本要素，因此测试需求则是测试计划的基础与重点。测试需求分析是分析软件应满足的用户需求点，总结出一份软件需求规格说明书，测试人员按照需求规格说明书进行测试。二、为什么要进行软件测试需求分析?1、软件测试需求是设计测试
Python 潮流周刊#93：为什么“if not list”比len()快2倍？（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目以下是本期摘要：文章&教程①为什么Python中'ifnotlist'比len()快2倍？②掌握Python单体代码库③Python3.14尾调用解释器的性能④Py
虚幻引擎入门指南-世界构建建议 LiliaY 虚幻引擎入门指南 unreal
1.选择工具快速选择一类快速选择使用某资产的actor统计数据面板也可以选择2.让草沉入地下，与地表垂直，并且向上生长
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
系统架构设计师——架构风格庄隐 #系统架构设计师系统架构架构系统架构设计师
概述软件体系结构风格是指在软件架构设计中，针对特定应用领域所采用的一套惯用模式，这些模式定义了系统的组织方式。以下是对软件体系结构风格的详细解析：1.体系结构风格的概念目的：简化设计过程，提高设计的重用性和可维护性。特点：每种风格都有其特定的适用范围和优势，适用于不同的应用场景和需求。2.词汇表构件：系统中的基本功能单元，如客户端、服务器、数据库等。连接件：用于构件间交互的桥梁，如管道、总线、过滤
无需月费，完全本地运行！开源神器Local Deep Research解锁AI研究新姿势遇见小码 AI棱镜实验室人工智能开源 github
在AI技术日新月异的今天，动辄数百美元的订阅费和高性能硬件需求，让许多开发者和小团队对前沿研究工具望而却步。然而，近期一款名为LocalDeepResearch的开源项目横空出世，凭借完全免费、本地化运行、高度可定制的特性，迅速成为技术社区的热议焦点。它不仅打破了传统AI研究工具的高昂门槛，更让每个人都能轻松拥有堪比专业团队的研究能力！一、LocalDeepResearch是什么？LocalDee
跟着黑马学MySQL基础篇笔记(4)-多表查询小杜不吃糖 mysql 笔记
37.多表查询-多表关系介绍多表关系概述项目开发中，在进行数据库表结构设计时，会根据业务需求及业务模块之间的关系，分析并设计表结构，由于业务之间相互关联，所以各个表结构之间也存在着各种联系，基本上分为三种：一对多（多对一）多对多一对一一对多（多对一）案例：部门与员工的关系关系：一个部门对应多个员工，一个员工对应一个部门实现：在多的一方建立外键，指向一的一方的主键多对多案例：学生与课程的关系一个学生
如何在飞牛云NAS快速使用Docker打造稳定安全的本地网站并对外可见 gkfkfhk docker 安全 eureka
文章目录前言1.Docker下载源设置2.Docker下载WordPress3.Docker部署Mysql数据库4.WordPress参数设置5.飞牛云安装Cpolar工具6.固定Cpolar公网地址7.修改WordPress配置文件8.公网域名访问WordPress前言本文主要介绍如何在飞牛云NAS上利用Docker快速搭建并优化WordPress站点的技巧，并且了解了如何借助cpolar实现内
使用DeepSeek自动生成PPT：高效办公的终极指南点我头像干啥 Ai 人工智能信息可视化深度学习
引言在现代职场中，PPT（PowerPoint演示文稿）已经成为沟通、展示和分享想法的重要工具。然而，制作一份高质量的PPT往往需要耗费大量时间和精力，尤其是在内容整理、排版设计和样式调整方面。幸运的是，随着人工智能技术的发展，像DeepSeek这样的工具可以帮助我们自动化生成PPT，极大地提升工作效率。本文将详细介绍如何使用DeepSeek自动生成PPT，并分享一些实用技巧，帮助你快速上手。一、
探索Pydoll：基于Python的无驱动浏览器自动化新星几道之旅人工智能智能体及数字员工 python 自动化人工智能
在当今Web自动化与数据抓取领域，基于Chromium的工具层出不穷，但大多数方案依赖WebDriver或额外的浏览器插件。Pydoll作为一款新兴的Python库，以无驱动架构和原生异步支持迅速成为开发者关注的焦点。本文将从技术原理、核心功能、应用场景及实战案例多角度解析这一工具。一、Pydoll项目概览Pydoll由开发者thalissonvs等团队维护，旨在通过Python实现对Chromi
Flutter 高级用法完全指南：从状态管理到性能优化，打造高效灵活的跨平台应用 tangweiguo03051987 Flutter flutter
以下是重新整理后的Flutter高级用法完整指南，包含详细讲解和优化后的代码示例，涵盖状态管理、自定义绘制、动画、平台交互、性能优化、插件开发等内容。1.状态管理（StateManagement）状态管理是Flutter开发中的核心问题之一。Flutter提供了多种状态管理方案，适合不同复杂度的应用场景。1.1ProviderProvider是官方推荐的状态管理工具，基于InheritedWidg
lvs、nginx、haproxy区别和使用场景？企鹅侠客 linux 聊聊运维 lvs nginx 运维
0.运维干货分享软考系统架构设计师三科备考经验附学习资料信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版LVS（LinuxVirtualServer）、Nginx和HAProxy都是常见的负载均衡工具，它们在不同的场景中各有优势。以下是它们的区别、特点及
OnionArch：构建高效.NET Core应用的洋葱架构模板樊慈宜Diane
OnionArch：构建高效.NETCore应用的洋葱架构模板项目地址:https://gitcode.com/gh_mirrors/on/OnionArch项目介绍OnionArch是一个基于.NETCore的演示应用程序，采用了经典的洋葱架构（OnionArchitecture）。洋葱架构是一种分层架构模式，通过将核心业务逻辑与外部依赖（如数据库、UI等）分离，使得应用程序更加模块化、可维护和
llm数据存储基础设施 galileo2016 人工智能
链接:https://i68.ltd/notes/posts/20250310-llm-db/infinity专为LLM应用程序构建的AI原生数据库，可提供对密集向量、稀疏向量、张量（多向量）和全文的快速混合搜索项目仓库:https://github.com/infiniflow/infinity关键特性令人难以置信的快在百万级矢量数据集上实现0.1毫秒查询延迟和15K+QPS在33M文档的全文搜
一文讲清楚CUDA与PyTorch、GPU之间的关系平凡而伟大. 编程语言人工智能架构设计 pytorch 人工智能 python
CUDA（ComputeUnifiedDeviceArchitecture）是由NVIDIA开发的一个并行计算平台和编程模型。它允许软件开发人员和研究人员利用NVIDIA的GPU（图形处理单元）进行高性能计算。CUDA提供了一系列API和工具，使得开发者能够编写和优化在GPU上运行的计算密集型任务。CUDA与PyTorch、GPU之间的关系可以这样理解：1.CUDA与GPU：GPU：是一种专门用于
k8s基础架构介绍忍界英雄 docker kubernetes 容器云原生
k8s基础架构介绍k8s是对容器进行编排的一种工具。通过k8s可以实现对容器的编排、部署、更新等学习k8s之前，先了解相关的一些使用和配置k8s的一些工具。k8s的常用工具在kubernetes中，主要有三个日常使用的工具，这些工具使用kube前缀命名，这三个工具如下：kubeadm用来初始化集群的指令，能够创建集群,并且添加新的节点。可用其它部署工具替代。具体功能有:初始化集群：在控制平面节点（
凯立德C-CAR端口修改器：自定义导航系统通信端口朱佳顺
本文还有配套的精品资源，点击获取简介：凯立德C-CAR端口修改器是一款旨在帮助用户自定义和调整凯立德导航软件通信端口设置的工具。它简化了根据不同车辆配置或个人需求调整端口参数的过程，用户只需拖放NaviConfig.dll文件到指定位置即可完成修改。这对于需要在不同车辆间切换导航设备或解决设备不兼容问题的用户特别有用。然而，在使用时需要注意数据备份和确认来源，防止数据丢失或系统损坏。1.凯立德C-
先学node.js还是php,vue和node先学哪个？朱佳顺先学node.js还是php
vue和node应该先学习node，node可以为vue提供包管理工具和模块化管理，可以使vue的开发更加简单快速。所以应该先学习node。vue介绍：Vue.js是web界面的渐进式框架。Vue.js的目标是通过尽可能简单的API实现响应的数据绑定和组合的视图组件。Vue.js自身不是一个全能框架——它只聚焦于视图层。因此它非常容易学习，非常容易与其它库或已有项目整合。另一方面，在与相关工具和支
python hack库_这里有123个黑客必备的Python工具！ weixin_39637571 python hack库
123个Python渗透测试工具，当然不仅于渗透~如果你想参与漏洞研究、逆向工程和渗透，我建议你时候用Python语言。Python已经有很多完善可用的库，我将在这里把他们列出来。这个清单里的工具大部分都是Python写成的，一部分是现有C库的Python绑定，这些库在Python中都可以简单使用。一些强力工具(pentestframeworks、bluetoothsmashers、webappl
Windows下工作组架构和域架构 weixin_33728708 数据库系统架构
工作组架构的网络工作组架构网络也被称为对等网络（peertopeer）域架构网络工作组架构网络域架构网络网络内每台计算机地位平等，资源和管理分散在各个计算机上网络内分为域控制器和成员服务器，如果有多台域控制器，则域控制器之间地位平等每台计算机都有一个本地安全账户管理器（SecurityAccountsManager,SAM）数据库，存储本地账户域内计算机共享一个集中的目录数据库（Directory
QEMU 调试 TF-A开发环境建立(使用 QEMU 调试 TF-A (Trusted Firmware-A) 之二） robin861109 使用QEMU调试TF-A 硬件架构 iot 物联网
文章目录前言1`TF-A(TrustedFirmware-A)`概述2`Cortex-A57`3`ARMFVP`基板4GDB调试环境介绍4.1GDB简介4.2设置GDB调试环境4.3使用GDB5、配置QEMU调试TF-A开发环境5.1安装交叉工具链5.2安装其他必需的依赖项5.3克隆TF-A源代码5.4编译TF-A（TrustedFirmware-A）6、仿真调试过程7、实际调试过程举例前言QEM
红蓝对抗之Windows内网渗透实战 wespten 网络安全AI+渗透测试代码审计等保全栈网络安全开发 windows
无论是渗透测试，还是红蓝对抗，目的都是暴露风险，促进提升安全水平。企业往往在外网布置重兵把守，而内网防护相对来说千疮百孔，所以渗透高手往往通过攻击员工电脑、外网服务、职场WiFi等方式进入内网，然后发起内网渗透。而国内外红蓝对抗服务和开源攻击工具大多数以攻击Windows域为主，主要原因是域控拥有上帝能力，可以控制域内所有员工电脑，进而利用员工的合法权限获取目标权限和数据，达成渗透目的。以蓝军攻击
如何用爬虫根据关键词获取商品列表：一份简单易懂的代码示例 API小爬虫爬虫
在当今数字化时代，网络爬虫已经成为数据收集和分析的强大工具。无论是市场调研、价格监控还是产品分析，爬虫都能帮助我们快速获取大量有价值的信息。今天，我们就来探讨如何通过编写一个简单的爬虫程序，根据关键词获取商品列表。以下是一个基于Python语言的代码示例，适合初学者学习和实践。一、准备工作在开始编写爬虫之前，我们需要准备以下工具和库：Python环境：确保你的电脑上安装了Python。推荐使用Py
Android Jetpack介绍 Gary.Mi Android
1.文档背景本文是Jetpack介绍系列文档的开篇，是对Jetpack整体的介绍，后续会对其中的各个组件分别单独说明。2.官方简介Jetpack是一套库、工具和指南，可帮助开发者更轻松地编写优质应用。使用这些组件，可帮助开发者遵循最佳实践，摆脱编写样板代码的工作并简化复杂任务，使开发者将精力集中放在所需的代码上。Jetpack包含与平台API解除捆绑的androidx.*软件包库。这意味着，它可以
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl