luo_yifan

Oracle 全文索引

前言：

Oracle从7.3开始支持全文检索，即用户可以使用Oracle服务器的上下文（ConText）选项完成基于文本的查询。具体可以采用通配符查找、模糊匹配、相关分类、近似查找、条件加权和词意扩充等方法。在Oracle8.0.x中称为ConText ；在Oracle8i中称为interMedia Text ； Oracle9i中称为Oracle Text。

Oracle Text是9i标准版和企业版的一部分。Oracle9i将全文检索功能做为内置功能提供给用户，使得用户在创建数据库实例时自动安装全文检索。Oracle Text的应用领域有很多：

l 搜索文本：需要快捷有效搜索文本数据的应用程序。

l 管理多种文档：允许搜索各种混和文档格式的应用程序,包括ord,excel,lotus等。

l 从多种数据源中检索文本：不仅来自Oracle数据库中的文本数据,而且可以来自Internet和文件系统的文本数据。

l 搜索XML应用程序。

1、搜索文本

不使用Oracle text功能,也有很多方法可以在Oracle数据库中搜索文本.可以使用标准的INSTR函数和LIKE操作符实现.

SELECT *

FROM mytext

WHERE INSTR (thetext, 'Oracle') > 0;

SELECT *

FROM mytext

WHERE thetext LIKE '%Oracle%';

有很多时候，使用instr和like是很理想的，特别是搜索仅跨越很小的表的时候。然而通过这些文本定位的方法将导致全表扫描,对资源来说消耗比较昂贵，而且实现的搜索功能也非常有限。

利用Oracle Text，你可以回答如“在存在单词’Oracle’的行同时存在单词’Corporation’而且两单词间距不超过10个单词的文本，查询含有单词’Oracle’或者单词’california’的文本，并且将结果按准确度进行排序，含有词根train的文本”，以下的sql代码实现了如上功能，我们且不管这些语法是如何使用的：

DROP　INDEX index mytext_idx; --丢弃索引mytext_idx

CREATE INDEX mytext_idx

ON mytext( thetext )

INDEXTYPE is CTXSYS.CONTEXT; --创建CONTEXT类型索引mytext_idx

SELECT id

FROM mytext

WHERE contains (thetext, 'near((Oracle,Corporation),10)') > 0; --发出contains查询

／

SELECT score (1), id

FROM mytext

WHERE contains (thetext, 'Oracle or california', 1) > 0

ORDER BY score (1) DESC

SELECT id

FROM mytext

WHERE contains (thetext, '$train') > 0;

2、索引介绍

利用Oracle Text对文档集合进行检索的时候，你必须先在你的文本列上建立索引。索引将文本打碎分成很多记号（token），这些记号通常是用空格分开的一个个单词。

Oracle Text应用的实现实际上就是一个数据装载—> 索引数据—>执行检索的一个过程。

建立的Oracle Text索引被称为域索引（domain index），包括4种索引类型：

CONTEXT、CTXCAT、CTXRULE 、CTXXPATH

依据你的应用程序和文本数据类型你可以任意选择一种。可以利用Create Index建立这4种索引。下面说一下这4种索引的使用环境：

l CONTEXT：用于对含有大量连续文本数据进行检索。支持word、html、xml、text等很多数据格式。支持中文字符集，支持分区索引，唯一支持并行创建索引（Parallel indexing）的索引类型。对表进行DML操作后，并不会自动同步索引。需要手工同步索引。查询操作符：CONTAINS。

l CTXCAT：当使用混合查询语句的时候可以带来很好的效率。适合于查询较小的具有一定结构的文本段。具有事务性，当更新主表的时候自动同步索引。The CTXCAT index does not support table and index partitioning, documents services (highlighting, markup, themes, and gists) or query services (explain, query feedback, and browse words.)。查询操作符：CATSEARCH

l CTXRULE：Use to build a document classification application. You create this index on a table of queries, where each query has a classification. Single documents (plain text, HTML, or XML) can be classified by using the MATCHES operator。查询操作符：MATCHES。

l CTXXPATH：Create this index when you need to speed up ExistsNode() queries on an XMLType column。Can only create this index on XMLType column.。查询操作符：无。

在以上4种索引中，最常用的就是CONTEXT索引，使用CONTAINS操作符进行查询。Oracle Text 索引将文本打碎分成很多的记号（token），例如文本‘I Love www.itpub.net’将会被分成：I，LOVE，WWW，ITPUB，NET这样的记号（token）。

Oracle Text CONTEXT 索引是反向索引（inverted index）。每个记号（token）都映射着包含它自己的文本位置。在索引建立过程中，单词Cat会包括如下的条目入口：

Cat row1,row2,row3

表示Cat在行row1、row2、row3都出现过，这样通过查找单词所对应的行的rowid就可以迅速找到文本记录。

在索引建好后，我们可以在该用户下查到Oracle自动产生了以下几个表：（假设索引名为myindex）：DR$myindex$I、DR$myindex$K、DR$myindex$R、DR$myindex$N其中以I表最重要，默认情况下全文索引是不区分大小写。

赋权限：

grant resource,dba,connect,ctxapp to username;

grant execute on ctxsys.ctx_ddl to username;--用于创建同步和优化索引的存储过程。

说明：ctxapp用于用户建立Oracle Text索引。

3、CONTEXT索引

语法：

CREATE INDEX [schema.]index on [schema.]table(column) INDEXTYPE IS ctxsys.context [ONLINE]

LOCAL [(PARTITION [partition] [PARAMETERS('paramstring')]

[, PARTITION [partition] [PARAMETERS('paramstring')]])]

[PARAMETERS(paramstring)] [PARALLEL n] [UNUSABLE];

数据库用创建和插入这些索引的方法叫做索引管道（index Pipeline）。根据不同的参数构建索引，可以应用于很多实际环境。

类别	描述
Datastore	从哪里得到数据？
Filter	将数据转换成文本
Lexer	正在索引什么语言？
Wordlist	应该如何展开茎干和模糊查询
Storage	如何存储索引
Stop List	什么单词或者主题不被索引？
Section Group	允许在区段内查询吗？如何定义文档区段。这把文档转换成普通文本

这些参数在建立CONTEXT索引过程中将按下图顺序对索引进程起作用。在本篇中提供一些简单demo会看到各个参数的作用。

建立索引时，系统默认文档存储在数据库的文本列中。如果不显示的指定索引参数，系统会自动探测文本语言,数据类型和文档格式。

CREATE INDEX myindex ON docs(text) INDEXTYPE IS CTXSYS.CONTEXT;

如上命令在表docs的text列上建立了一个默认参数的CONTEXT类型索引myindex，系统默认：

l 文本存储在数据库中。可以是CLOB, BLOB, BFILE, VARCHAR2, or CHAR类型的文本数据。

l 文本列语言是数据库建立时的默认的字符集。

l 使用数据库默认的终止目录stoplist.stoplist记录存在于文本列中但不对其索引的词。

l 允许模糊查询。

索引参数

Oracle Text 索引文档时所使用的主要参数如下：

1） 数据存储逻辑(DATASTORE) 搜索表的所有行，并读取列中的数据。通常，这只是列数据，但有些数据存储使用列数据作为文档数据的指针。例如，URL_DATASTORE 将列数据作为 URL 使用。

2） 过滤器(FILTER) 提取文档数据并将其转换为文本表示方式。存储二进制文档 (如 Word 或 Acrobat 文件) 时需要这样做。过滤器的输出不必是纯文本格式 -- 它可以是 XML 或 HTML 之类的文本格式。

3） 分段器(SECTIONER) 提取过滤器的输出信息，并将其转换为纯文本。包括 XML 和 HTML 在内的不同文本格式有不同的分段器。转换为纯文本涉及检测重要文档段标记、移去不可见的信息和文本重新格式化。

4） 词法分析器(Lexer) 提取分段器中的纯文本，并将其拆分为不连续的标记。既存在空白字符分隔语言使用的词法分析器，也存在分段复杂的亚洲语言使用的专门词法分析器。

5）    索引引擎(Indexing Engine) 提取词法分析 器中的所有标记、文档段在分段器中的偏移量以及被称为非索引字的低信息含量字列表，并构建反向索引。倒排索引存储标记和含有这些标记的文档。

DataStore：指明你的文本是如何存储的。系统默认文档储存在数据库内的文本列（CHAR, VARCHAR, VARCHAR2, BLOB, CLOB, BFILE, or XMLType）中。DataStore对象在由过滤器处理之前从数据库中的列摘录文本。你要索引的文档可以来自多种数据源。

Datastore Type	Use When
DIRECT_DATASTORE	Data is stored internally in the text column. Each row is indexed as a single document.
MULTI_COLUMN_DATASTORE	Data is stored in a text table in more than one column. Columns are concatenated to create a virtual document, one per row.
DETAIL_DATASTORE	Data is stored internally in the text column. Document consists of one or more rows stored in a text column in a detail table, with header information stored in a master table.
FILE_DATASTORE	Data is stored externally in operating system files. Filenames are stored in the text column, one per row.
NESTED_DATASTORE	Data is stored in a nested table.
URL_DATASTORE	Data is stored externally in files located on an intranet or the Internet. Uniform Resource Locators (URLs) are stored in the text column.
USER_DATASTORE	Documents are synthesized at index time by a user-defined stored procedure.

说明：MULTI_COLUMN_DATASTORE类型的DATASTORE必须在ctxsys用户下建立，在使用时还需要指明来源，如：

SQL>CONNECT CTXSYS/CTXSYS@SDH155

SQL>EXEC CTX_DDL.CREATE_PREFERENCE(‘mymds’,’MULTI_COLUMN_DATASTORE’);

SQL>EXEC ctx_ddl.set_attibute('mymds', 'columns', 'name, address');

SQL>create index doc_idx on docs(doc) indextype is ctxsys.context

parameters(‘DATASTORE ctxsys.mymds’);

Filter 过滤：一旦汇编了文档，它就沿管道传递。接下来这个阶段是过滤（Filter）.如果文档是一种外来格式，就将它转换为可读取的文本，以便进行索引。默认是NULL_FILTER，它简单的直接传递文档，不作任何修改。

通常我们使用NULL_FILTER 过滤普通文本和HTML文档。下面是一个索引HTML文档的例子：

CREATE INDEX myindex

ON docs(htmlfile)

INDEXTYPE IS ctxsys.CONTEXT

PARAMETERS('filter ctxsys.null_filter section group ctxsys.html_section_group');

我们使用null_filter过滤类和ctxsys用户自带的 html_section_group区段组类。我们会在后面马上介绍区段组（Section Groups）的概念。

Section Groups区分组：区分组（Section Groups）是与interMedia一起使用XML的关键。这些组处理XML（或者HTML）文档，输出两个数据流，即区段界限和文本内容。默认是NULL_SECTION_GROUP,它简单的直接传递文本，不执行任何修改和处理。HTML_SECTION_GROUP是专门用来处理HTML文档的。

Storage 类：Storage(存储空间)组的类只含有BASIC_STORAGE.默认情况下，BASIC_STORAGE对象的属性是空的。我们通常需要定制自己的STORAGE类，来控制索引的存储参数以及存储空间。建立全文索引的时候我们通常会考虑表段dr$indexname$I，，dr$indexname$R，索引段dr$indexname$X的空间分配。

类型	描述
BASIC_STORAGE	为CONTEXT索引指定默认的存储参数

BASIC_STORAGE 有如下参数

属性	属性值
i_table_clause	Parameter clause for dr$indexname$I table creation. Specify storage and tablespace clauses to add to the end of the internal CREATE TABLE statement. The I table is the index data table.
k_table_clause	Parameter clause for dr$indexname$K table creation. Specify storage and tablespace clauses to add to the end of the internal CREATE TABLE statement. The K table is the keymap table.
r_table_clause	Parameter clause for dr$indexname$R table creation. Specify storage and tablespace clauses to add to the end of the internal CREATE TABLE statement. The R table is the rowid table. The default clause is: 'LOB(DATA) STORE AS (CACHE)'
n_table_clause	Parameter clause for dr$indexname$N table creation. Specify storage and tablespace clauses to add to the end of the internal CREATE TABLE statement. The N table is the negative list table.
i_index_clause	Parameter clause for dr$indexname$X index creation. Specify storage and tablespace clauses to add to the end of the internal CREATE INDEX statement. The default clause is: 'COMPRESS 2' which instructs Oracle to compress this index table. If you choose to override the default, Oracle recommends including COMPRESS 2 in your parameter clause to compress this table, since such compression saves disk space and helps query performance.
p_table_clause	Parameter clause for the substring index if you have enabled SUBSTRING_INDEX in the BASIC_WORDLIST. Specify storage and tablespace clauses to add to the end of the internal CREATE INDEX statement. The P table is an index-organized table so the storage clause you specify must be appropriate to this type of table.

默认情况下，4个表段和1个索引段将会建立在拥有该表的用户的默认表空间下。如下:

CREATE INDEX iowner.idx ON towner.tab(b) INDEXTYPE IS ctxsys.CONTEXT;

索引将会建立在IOWNER用户的默认表空间下，而不管发出该语句的用户是否是IOWNER

设置词法分析器(lexer) ：Oracle实现全文检索，其机制其实很简单。即通过Oracle专利的词法分析器(lexer),将文章中所有的表意单元（Oracle 称为 term）找出来，记录在一组以dr$开头的表中，同时记下该term出现的位置、次数、hash 值等信息。检索时，Oracle 从这组表中查找相应的term，并计算其出现频率，根据某个算法来计算每个文档的得分（score）,即所谓的‘匹配率’。而lexer则是该机制的核心，它决定了全文检索的效率。Oracle 针对不同的语言提供了不同的 lexer, 而我们通常能用到其中的三个：

l basic_lexer: 针对英语。它能根据空格和标点来将英语单词从句子中分离，还能自动将一些出现频率过高已经失去检索意义的单词作为‘垃圾’处理，如if , is 等，具有较高的处理效率。但该lexer应用于汉语则有很多问题，由于它只认空格和标点，而汉语的一句话中通常不会有空格，因此，它会把整句话作为一个term,事实上失去检索能力。以‘中国人民站起来了’这句话为例，basic_lexer 分析的结果只有一个term ,就是‘中国人民站起来了’。此时若检索‘中国’，将检索不到内容。

l chinese_vgram_lexer: 专门的汉语分析器，支持所有汉字字符集（ZHS16CGB231280 ZHS16GBK ZHT32EUC ZHT16BIG5 ZHT32TRIS ZHT16MSWIN950 ZHT16HKSCS UTF8 ）。该分析器按字为单元来分析汉语句子。‘中国人民站起来了’这句话，会被它分析成如下几个term: ‘中’，‘中国’，‘国人’，‘人民’，‘民站’，‘站起’，起来’，‘来了’，‘了’。可以看出，这种分析方法，实现算法很简单，并且能实现‘一网打尽’，但效率则是差强人意。

l chinese_lexer: 这是一个新的汉语分析器，只支持utf8字符集。上面已经看到，chinese vgram lexer这个分析器由于不认识常用的汉语词汇，因此分析的单元非常机械，像上面的‘民站’，‘站起’在汉语中根本不会单独出现，因此这种term是没有意义的，反而影响效率。chinese_lexer的最大改进就是该分析器能认识大部分常用汉语词汇，因此能更有效率地分析句子，像以上两个愚蠢的单元将不会再出现，极大提高了效率。但是它只支持 utf8, 如果你的数据库是zhs16gbk字符集，则只能使用笨笨的那个Chinese vgram lexer.

如果不做任何设置，Oracle 缺省使用basic_lexer这个分析器。要指定使用哪一个lexer, 可以这样操作:

1）设置词法分析器：

BEGIN

ctx_ddl.create_preference ('my_lexer', 'chinese_vgram_lexer');

END;

2）建立索引时指定词法分析器：

CREATE INDEX myindex ON mytable(mycolumn) indextype is ctxsys.context

parameters('lexer my_lexer');

这样建立的全文检索索引，就会使用chinese_vgram_lexer作为分析器。相应的，索引中文就比索引英文占用的表空间多了许多。Oracle Text为了性能不得不牺牲了空间。如下是我的简单存储空间测试：

文本数据量	索引数据量（4个表段和1个索引段）
6M	80M
80M	900M
230M	2880M
1344M	15232M

STOP Lists类：Stop List只不过是被索引忽略的单词的列表。这些通常是常见的单词，正常情况下不会以任何方式查询它们，因此，索引它们纯粹是表格空间和处理器周期的浪费。在具体的应用中，可能存在这样的单词，它们在特定的文集中出现的频率太大，无法提供有意义的内容，特别是常用的单词。Stop List可以含有最多4095个单词，每个单词最多64个字符，同时为英语和其它语言提供了默认列表。

下图是Chinese Stoplist (Simplified)的默认列表:

可以查看英文的默认列表：

SELECT spw_word FROM DR$STOPWORD;

可以查询ctx_stoplists和ctx_stopwords 视图来观察这些语言。

EXECUTE ctx_ddl.create_stoplist('stoppref');

SELECT *

FROM ctx_stoplists;

EXECUTE ctx_ddl.add_stopword('stoppref','的');

SELECT *

FROM ctx_stoplists;

SELECT spw_word

FROM dr$stopword;

Lists类：要考虑的最后一个类是单一的Word List类，即BASIC_WORDLIST。创建索引时不使用这个类，这个类只在某些高级形式的查询中使用。茎干查询使用从Xerox公司许可的技术，来匹配单词与通用的语言根。

其它选项：MEMORY参数以通常的方式附着到CREATE INDEX中的PARAMETERS上，设置用于构建或更改索引的内存量。这个量不能超过MAX_INDEX_MEMEORY,使用CTX_ADM.SET_PARAMETER 对其进行设置。

查看系统默认参数项：

SELECT par_name, par_value FROM ctx_parameters;

设置系统默认参数：

CTX_ADM.SET_PARAMETER(param_name IN VARCHAR2,

param_value IN VARCHAR2);

Oracle Text使用的索引机制比通常的ORACLE B-TREE索引更复杂，且文档实际是在内存中构建的，而不是一次一行的添加到B-TREE。到达内存参数指定的值时，更新磁盘山的索引，接着，缓冲区由下一组文档重用。任一时刻缓冲区内的文档数会有所不同，并且在索引处理之前不进行任何排序。因此，在少量的内存中索引大量文档会导致出现碎片索引情况。

4、管理DML操作

对于CTXSYS.CONTEXT索引，当应用程序对基表进行DML操作后，对基表的索引维护是必须的。索引维护包括索引同步和索引优化。在索引建好后，我们可以在该用户下查到Oracle自动产生了以下几个表：（假设索引名为myindex）：DR$myindex$I、DR$myindex$K、DR$myindex$R、DR$myindex$N其中以I表最重要，可以查询一下该表，看看有什么内容：

SELECT token_text, token_count FROM dr$i_rsk1$I WHERE ROWNUM <= 20;

这里就不列出查询结果了，可以看到，该表中保存的其实就是Oracle 分析你的文档后，生成的term记录在这里，包括term出现的位置、次数、hash值等。当文档的内容改变后，可以想见这个I表的内容也应该相应改变，才能保证Oracle在做全文检索时正确检索到内容（因为所谓全文检索，其实核心就是查询这个表）。那么如何维护该表的内容呢？总不能每次数据改变都重新建立索引吧！这就用到sync 和 optimize了。

同步（sync）: 将新的term 保存到I表；

优化（optimize）: 清除I表的垃圾，主要是将已经被删除的term从I表删除。

当基表中的被索引文档发生insert、update、delete操作的时候，基表的改变并不能马上影响到索引上直到同步索引。可以查询视图CTX_USER_PENDING查看相应的改动。例如：

SELECT pnd_index_name, pnd_rowid,

TO_CHAR (pnd_timestamp, 'dd-mon-yyyy hh24:mi:ss') timestamp

FROM ctx_user_pending;

该语句的输出类似如下：

PND_INDEX_NAME PND_ROWID TIMESTAMP

------------------------------ ------------------ --------------------

MYINDEX AAADXnAABAAAS3SAAC 06-oct-1999 15:56:50

同步和优化方法: 可以使用Oracle提供的ctx_ddl包同步和优化索引，通过

DESC CTX_DDL

可以查看ctx_ddl包的所有过程。

索引同步

l CTXSRV(同步进程)

Oracle提供一个全文索引同步服务进程负责监视索引表变动并且第一时间同步索引。

只需要在后台运行这个进程，它会监视数据的变化，及时进行同步。但由于存在一些问题在未来的ORACLE版本中将要被取代。启动同步索引服务进程方法：

HOST ctxsrv -user ctxsys/ctxsys>&/tmp/ctx.log&

当你启动了CTXSRV服务进程，在后台的同步请求处理就会像实时一样，在你提交修改1，2秒后新的数据马上就被索引了。与手工同步相比，自动索引同步更容易使索引变的稀疏，需要执行DBMS_JOB定期优化和重建索引rebuild parameters( 'sync' )。默认情况下，如果你不启动CTXSRV进程，索引不会自动更新除非你手工告诉它们去更新自己。你可以使用 alter index <iname> rebuild parameters ('sync') 更新索引。

ALTER INDEX search_idx REBUILD parameters( 'sync' )

Index altered.

9i提供了新的专门用于更新索引的包ctx_ddl.sync_index(…)

l CTX_DDL.SYNC_INDEX（同步索引）

在对基表插入，修改，删除之后同步索引。推荐使用sync同步索引。

语法：

ctx_ddl.sync_index(

idx_name IN VARCHAR2 DEFAULT NULL

memory IN VARCHAR2 DEFAULT NULL,

part_name IN VARCHAR2 DEFAULT NULL

parallel_degree IN NUMBER DEFAULT 1);

idx_name 索引名称

memory 指定同步索引需要的内存。默认是系统参数DEFAULT_INDEX_MEMORY 。指定一个大的内存时候可以加快索引效率和查询速度，且索引有较少的碎片

part_name 同步哪个分区索引。

parallel_degree 并行同步索引。设置并行度。
例如：

使用2M内存同步索引myindex:

BEGIN

ctx_ddl.sync_index ('myindex', '2M');

END;

NOTE：执行者必须是索引所有者或者CTXSYS用户。如果执行者是CTXSYS用户，索引名称可以是空NULL，这样默认优化全部的CONTEXT索引。这样的同步效果就如同ctxsrv. 我们推荐定期执行作业job同步索引。-- 为每一个索引制定单独的作业job, 一个 ctxsys 作业job同步全部索引。这样就减少了使用ctxsrv的机率，也不用在每次数据库启动后都要启动CTXSRV服务进程。由于CTXSRV有一些缺陷，在未来将不再会被ORACLE使用或者被取代。

INSERT INTO mytable

VALUES (2, 'first,second.this is the second rows before indexed');

COMMIT ;

EXEC ctx_ddl.sync_index('mytable_idx');--执行同步

SELECT /*+ FIRST_ROWS() */ ID, SCORE(1), TEXT

FROM MYTABLE

WHERE CONTAINS (TEXT, 'searchterm', 1) > 0

ORDER BY SCORE(1) DESC;

其中score(1)为Oracle为全文查询计算的主题符合程度。

索引优化

经常的索引同步将会导致CONTEXT索引产生碎片，索引碎片严重的影响了查询的反应速度。你可以定期优化索引来减少碎片，减少索引大小，提高查询效率。为了更好的理解索引优化，我们先看看索引的结构以及碎片是如何产生的。

CONTEXT索引是反向索引，每一个索引项目都包括单词和这个单词所出现过的文档地址。例如在一个初始化索引过程中，单词DOG可以包括如下条目

DOG DOC1 DOC3 DOC5

当新的文档被包含到表的时候，索引被同步。如果新行DOC7也包括单词DOG，将会形成如下条目。

DOG DOC1 DOC3 DOC5

DOG DOC7

很多的DML操作以后，单词DOG的条目可能如下情况：

DOG DOC1 DOC3 DOC5

DOG DOC7

DOG DOC9

DOG DOC11

同步新增加的文档产生了索引碎片，单词DOG的文挡列表会越来越长，索引越来越大。

你可以优化索引（CTX_DDL.OPTIMIZE_INDEX），使用FULL或者FAST参数都可以降低索引碎片，提高索引效率。

文档垃圾处理

当文本从表中删除的时候，Oracle Text标记删除的文档，但是并不马上修改索引。因此，就的文档信息占据了不必要的空间，导致了查询额外的开销。你必须以FULL模式优化索引，从索引中删除无效的旧的信息。这个过程叫做垃圾处理。当你经常的对表文本数据进行更新，删除操作的时候，垃圾处理是很必要的。

BEGIN

ctx_ddl.optimize_index ('myidx', 'full');

END;

Single Token Optimization

除了优化整个索引以外，你还可以专门对某个标记（token）进行优化。你可以仅仅优化那些经常查询的标记（token）,而不必花太多时间在很少查询的单词上。例如，你可以专门优化token DOG，它经常被检索或者经常被更新。这样可以提高查询这个token的查询效率。

BEGIN

ctx_ddl.optimize_index ('myidx', 'token', token => 'DOG');

END;

FAST MODE

这种方法仅仅使碎片行紧凑。但是，旧的数据并不从索引中删除。

BEGIN

ctx_ddl.optimize_index ('myidx', 'fast');

END;

使用job定时同步和优化

用以下的两个job来完成(该job要建在和表同一个用户下) :

-- sync:

VARIABLE jobno number;

BEGIN

DBMS_JOB.SUBMIT(:jobno,'ctx_ddl.sync_index(''myindex'');',

SYSDATE, 'SYSDATE + (1/24/4)');

commit;

END;

-- optimizer

VARIABLE jobno number;

BEGIN

DBMS_JOB.SUBMIT(:jobno,'ctx_ddl.optimize_index(''myindex'',''FULL'');',

SYSDATE, 'SYSDATE + 1');

commit;

END;

其中，第一个job的SYSDATE + (1/24/4)是指每隔15分钟同步一次，第二个job的SYSDATE + 1是每隔1天做一次全优化。具体的时间间隔，你可以根据自己的应用的需要而定。至此，你的全文检索功能已设置完成。

6、查询语法

使用contains时，主要查询语法有：

1) Logical Operators：组合搜索条件，通过使用AND，OR等逻辑符号。

a）AND（&），同时含有所有关键词，如：'cats AND dogs' ，'cats & dogs'

b） OR（|），含有所有关键词中的任意一个，如：'cats | dogs' ，'cats OR dogs's

c） NOT（~），不含该关键词，如：'animals ~ dogs'

d） ACCUM（，），与|类似，如：'dogs, cats, puppies'

e）EQUIV（=），如：'German shepherds=alsatians are big dogs'

f） ABOUT等

具体参见：http://download-west.oracle.com/docs/cd/B10501_01/text.920/a96518/cqoper.htm#CCREF03006

操作示例请参见附录

2) Query templates :查询模板

7、示例

a）创建用户：

CREATE USER KNOWLEDGE IDENTIFIED BY KNOWLEDGE

b）授权：

GRANT CONNECT,DBA,RESOURCE,CTXAPP TO KNOWLEDGE;

GRATN EXECUTE ON CTXSYS.CTX_DDL TO KNOWLEDGE;

c）建表：

CREATE TABLE DOCS(ID NUMBER,NAME VARCHAR2(200),ADDRESS VARCHAR2(200));

d）插入数据：

INSERT INTO DOCS VALUES(1, ‘John Smith’,’ 123 Main Street biti’);

e）建立默认参数索引：

CREATE INDEX DOC_IDX ON DOCS(NAME)

INDEXTYPE IS CTXSYS.CONTEXT

注意：在建立索引的时候会自动将表中已有的数据进行同步。

f）查询：

SELECT * FROM DOCS WHERE CONTAINS(NAME,’John’)>0;

g）设置参数：

用ctxsys用户登录，设置多字段数据存储：

EXEC ctx_ddl.create_preference('mymds', 'MULTI_COLUMN_DATASTORE');

EXEC ctx_ddl. set_attribute ('mymds', 'columns', 'name, address');

用KNOWLEDGE登录设置词法分析器：

BEGIN

ctx_ddl.create_preference ('my_lexer', 'chinese_vgram_lexer');

END;

h）重新建立索引：

DROP INDEX DOC_IDX;

CREATE INDEX DOC_IDX ON DOCS(NAME) INDEXTYPE IS CTXSYS.CONTEXT

PARAMETERS(‘DATASTORE CTXSYS.MYMDS LEXER MY_LEXER’);

说明：PARAMETERS中包含有7个首选项参数，没有指定的为默认，上面的参数中指定了“数据存储”为”ctxsys.mymds”，“词法分析器”为”my_lexer”。也可以通过登录oracle控制台，工具——>数据库应用程序——>Text Manager打开全文索引的创建窗口。

i）查询：

SELECT * FROM DOCS WHERE CONTAINS(NAME,’ Main’)>0;

j）创建同步存储过程：

CREATE OR REPLACE PROCEDURE SYNC_Index IS

/******************************************************************************

同步索引

******************************************************************************/

BEGIN

CTXSYS.CTX_DDL.SYNC_INDEX(' DOC_IDX ');

EXCEPTION

WHEN NO_DATA_FOUND THEN

NULL;

WHEN OTHERS THEN

-- Consider logging the error and then re-raise

RAISE;

END SYNC_Index;

k）创建优化存储过程：

CREATE OR REPLACE PROCEDURE OPTIMIZE_Index IS

/******************************************************************************

优化索引

******************************************************************************/

BEGIN

CTXSYS.CTX_DDL.OPTIMIZE_INDEX(' DOC_IDX ','FULL',null ,null ,null);

EXCEPTION

WHEN NO_DATA_FOUND THEN

NULL;

WHEN OTHERS THEN

-- Consider logging the error and then re-raise

RAISE;

END OPTIMIZE_Index;

l）创建job定时执行同步和优化：

SQL>variable job1 number;

SQL>begin

Dbms_job.submit(:job1,’ SYNC_Index;’,sysdate,’sysdate+1/144’);

End;

SQL>variable job1 number;

SQL>begin

Dbms_job.submit(:job1,’ OPTIMIZE_Index;’,sysdate,’sysdate+1/28’);

End;

m）手动执行同步和优化：

执行同步和优化的存储过程：

exec OPTIMIZE_Index;

exec SYNC_Index;

直接执行：

BEGIN

ctx_ddl.sync_index ('myindex', '2M');

ctx_ddl.optimize_index ('myindex', 'full',null,null,null);

END;

执行job：

SQL>begin

dbms_job.run(225);

dbms_job.run(226);

End;

8、CTXCAT索引

CTXCAT索引是CONTEXT索引的简化版，事务型的索引，CTXCAT索引支持的PREFERENCE包括：LEXER、STOPLIST、WORDLIST和STORAGE参数。不支持其他的参数如：DATASTORE、FILTER、SECTION GROUP。虽然支持LEXER但不支持THEME查询，而且不支持FORMAT、CHARSET和LANGUAGE列，另外不支持表和索引分区。

CTXCAT索引仅仅包含了CONTEXT索引的部分内容，但是CTXCAT索引有其自身的优点，其中最突出的优点就是支持DML同步。CONTEXT索引由于结构过于复杂，且索引的数据量一般较大，因此CONTEXT索引并不是自动同步的。而CTXCAT索引是自动同步的，当发生了DML修改时，Oracle会自动同步CTXCAT索引，降低了索引的维护成本。

CTXCAT索引的另外一个优点就是这里要介绍的INDEX SET属性，这也是CTXCAT索引特有的属性。简单的说，CTXCAT可以建立一个索引集。可以把一些经常与CTXCAT查询组合使用的查询列的索引添加到索引集中，比如，如果在查询文章内容的同时，经常需要查询文章的作者、标题或创建时间等信息，则可以将这些信息列的索引添加到索引集中，Oracle可以将这些查询封装到CATSEARCH操作中，从而提高全文索引的效率。

CTXCAT查询语法：

1) Logical Operators：组合搜索条件，通过使用AND，OR等逻辑符号

a） AND（&），如：a b c

b）OR (|) ，如：a|b|c

c） NOT (-)，如：a – b，注意与：a-b不同

d）" " (quoted phrases) ，如：”a b c”

e） *(Wildcarding)，如：a*

f） ()，如：(a&b)|c

2) Query templates :查询模板，通过查询模板，可以使用CONTAINS的查询语法。

查询模板语法格式：

9、附录

参考文档：http://download-west.oracle.com/docs/cd/B10501_01/text.920/a96518/csql.htm

以下是做测试过程的所有代码。

以ctxsys用户创建首选项：

EXEC ctx_ddl.drop_preference('mymds');

EXEC ctx_ddl.create_preference('mymds', 'MULTI_COLUMN_DATASTORE');

EXEC ctx_ddl.set_attribute('mymds', 'columns', 'name, address');

desc ctx_ddl;

以当前用户登录：

--删除表

drop table docs;

--创建表

create table docs(

id number,

name varchar2(200),

address varchar2(2000)

);

--插入数据

insert into docs values(1,'John Smith','Room 403,No.37,ShiFan Residential Quarter,BaoShan District');/

insert into docs values(2,'Noah Abelard','Room 201,No.34,Lane 125,XiKang Road(South),HongKou District');/

insert into docs values(3,'Michael Cole','Room 42， Zhongzhou Road，Nanyang City， Henan Prov. ');/

insert into docs values(4,'Thomas Matthew','Hongyuan Hotel, Jingzhou city, Hubei Prov. ');/

insert into docs values(5,'Joseph','Special Steel Corp，No.272， Bayi　Road，Nanyang City， Henan Prov. ');/

insert into docs values(6,'Lauren','Room 702, 7th Building, Hengda Garden, East District, Zhongshan ');/

insert into docs values(7,'Kevin Victoria','Room 601, No.34 Long Chang Li, Xiamen, Fujian ');/

insert into docs values(8,'Michael','Cheng Nuo Ban, Gong Jiao Zong Gong Si, Xiamen, Fujian ');/

insert into docs values(9,'Timothy Katherine','NO. 204,Entrance A, Building NO. 1, The 2nd Dormitory of the NO. 4 State-owned Textile Factory, 53 Kaiping Road, Qingdao, Shandong');/

insert into docs values(10,'Zhou Wangcai','Room 601, No.34 Long Chang Li,Xiamen, Fujian, China 361012');/

insert into docs values(11,'Sebastian Jared','Cheng Nuo Ban, Gong Jiao Zong Gong SiXiamen, Fujian, China 361004');/

insert into docs values(12,'Jenna','NO. 204, A, Building NO. 1,The 2nd Dormitory of the NO. 4 State-owned Textile Factory,53 Kaiping Road, Qingdao,Shandong, China 266042 ');/

insert into docs values(13,'Catherine','Room403,No.37,SiFanResidentialQuarter,BaoShanDistrict');/

insert into docs values(14,'Sebastian Cole','1 Team CaiQi ChuanXiBei Mining Area JiangYou City SiChuan Province China');/

insert into docs values(15,'Timothy Jared ','Room 201,No.34,Lane 125,XiKang Road(South),HongKou District');/

--建立里索引

drop index doc_idx;

create index doc_idx on docs(name) indextype is ctxsys.context;--默认索引,单字段，name

create index doc_idx on docs(name) indextype is ctxsys.context parameters('DATASTORE ctxsys.mymds');--多字段，name,address

--单字段（name）索引查询

select * from docs where contains(name,'Jared')>0;--id为15

select * from docs where contains(name,'Building')>0;--没有结果

select * from docs where contains(name,'Sebastian & Cole')>0;--注意&之间的空格

select * from docs where contains(name,'Sebastian | Cole')>0;--id分别为3，11，14

select * from docs where contains(name,'Sebastian ~ Cole')>0;--id为11

select * from docs where contains(name,'Sebastian , Cole')>0;--id分别为3，11，14

select * from docs where contains(name,'Michael = Cole')>0;--id分别为3，11，14

select * from docs where contains(name,'about(Cole)')>0;

select * from docs where contains(name,'Michael')>0;

select * from docs where contains(name,'Michael ~ Cole')>0;

select * from docs where contains(name,'Michael , Cole')>0;

select * from docs where contains(name,'Michael | Cole')>0;

select * from docs where contains(name,'Michael = Cole')>0;

select * from docs where contains(name,'Michael - Cole')>0;

select * from docs where contains(name,'near((Michael,Cole),50,true)')>0;

select * from docs where contains(name,'near((Michael,Cole),50,false)')>0;

select * from docs where contains(name,'near((Michael,Cole),6)')>0;

--建立多字段索引（name,address）查询

select * from docs where contains(name,'$build')>0;--Build的所有时态

select * from docs where contains(name,'about(building)')>0;--似乎不区分大小写

select * from docs where contains(name,'near((Michael,Road),50,true)')>0;--取值范围0~100

select * from docs where contains(name,'near((Michael,Road),50,false)')>0;

select * from docs where contains(name,'near((Michael,Road),,false)')>0;

select * from docs where contains(name,'!Michael,Road')>0;

select score(1),id,name,address from docs where contains(name,'road',1) > 0;

select score(1),id,name,address from docs where contains(name,'road',1) = 0;

select score(1),id,name,address from docs where contains(name,'road',1) < 3;

drop index doc_idx_x;

drop index doc_idx_cx;

create index doc_idx_x on docs(name) indextype is ctxsys.context;

create index doc_idx_cx on docs(address) indextype is ctxsys.ctxcat;

select id||'==>'||name from docs where contains(name,'Cole')>0;

select id||'==>'||name from docs where catsearch(name,'Cole','')>0;

select id||'==>'||name from docs where contains(name,

'<query>

</query>')>0;

select * from docs where catsearch(address,'Hongyuan 7th Long',null)>0;--同时包含所有关键字

select * from docs where catsearch(address,'Hongyuan | 7th | Long',null)>0;--包含所有关键字中的任意

select * from docs where catsearch(address,'Hongyuan - 7th',null)>0;--含有前面的关键字，同时不含后面的关键字，注意中间的空格

select * from docs where catsearch(address,'Hongyuan-7th',null)>0;--中间的是一个关键词

select * from docs where catsearch(address,'”Hongyuan 7th“',null)>0;--中间的是一个关键词

select * from docs where catsearch(address,'（Hongyuan 7th）| Long',null)>0;--组合查询

select * from docs where catsearch(address,'Hongy*',null)>0;--关键词为字符串中的一部分

select * from docs where catsearch(address,'Hongy*n',null)>0;--关键词中间含有任意字符

select * from docs where contains(name,'Jiao')>0;--是一个单词，要用单引号括起来

select * from docs where contains(name,'Zong Gong')>0;

select * from docs where contains(name,'"Zong Gong"')>0;--一个词组，在单引号里还要用双引号括起来

select * from docs where contains(name,'"Zong Gong" | China')>0;--可以指定逻辑操作符(包括 AND ，AND NOT，OR )

select * from docs where contains(name,'Zong near China')>0;--A NEAR B，就表示条件： A 靠近 B

select * from docs where contains(name,'Zo*')>0;

select * from docs where contains(name,'ISABOUT (Zong weight (.8), China wright (.4))')>0;

select * from docs where contains(name,'FORMSOF (INFLECTIONAL,street)')>0;

select * from docs where catsearch(address,'Zo*',null)>0;--查询将返回包含 'hubei'，'hunan' 等字样的地址。记住是 *，不是 %

select * from docs where catsearch(address,'ISABOUT (Zong weight (.8), China wright (.4))',null)>0;--ISABOUT 是这种查询的关键字，weight 指定了一个介于 0~1之间的数，类似系数。表示不同条件有不同的侧重。

select * from docs where catsearch(address,'FORMSOF (INFLECTIONAL,street)',null)>0;--查询将返回包含 'street'，'streets'等字样的地址。对于动词将返回它的不同的时态，如：dry，将返回 dry，dried，drying 等等。

select * from docs where contains(name,'$build')>0;

select * from docs where contains(name,'?build')>0;

select * from docs where catsearch(address,'build',null)>0;

select * from docs where catsearch(address,'build*',null)<1;

select * from docs where catsearch(address,

'<query>

building

</textquery>

</query>'

,'')=0;

select sysdate from dual;--查询系统时间格式

desc ctx_ddl;--显示 ctx_ddl结构

create table auction(category_id number primary key,title varchar2(20),bid_close date);

insert into auction values(1,'Sony CD Player',to_date('2008-11-27','yyyy-mm-dd'));

insert into auction values(2,'Sony CD Player',to_date('2008-01-27','yyyy-mm-dd'));

insert into auction values(3,'Pioneer DVD Player',to_date('2008-10-27','yyyy-mm-dd'));

insert into auction values(4,'Sony CD Player',to_date('2008-02-27','yyyy-mm-dd'));

insert into auction values(5,'Bose Speaker',to_date('2008-04-27','yyyy-mm-dd'));

insert into auction values(6,'Tascam CD Bumer',to_date('2008-05-27','yyyy-mm-dd'));

insert into auction values(7,'Nikon digital camera',to_date('2008-06-27','yyyy-mm-dd'));

insert into auction values(8,'Canon digital camera',to_date('2008-07-27','yyyy-mm-dd'));

begin

ctx_ddl.create_index_set('auction_iset');--创建索引集

ctx_ddl.add_index('auction_iset','bid_close');

end;

begin

ctx_ddl.create_stoplist('TAG_STOPLIST','BASIC_STOPLIST');--创建停用词表

ctx_ddl.add_stopword('TAG_STOPLIST','游戏');--添加停用词

ctx_ddl.add_stopword('TAG_STOPLIST','Player');

end;

select * from ctx_stoplists;--查询停词表

select * from ctx_stopwords;--查询停词表中的停用单词

select * from ctx_index_sets;--查看索引集视图

create index auction_titlex on auction(title) indextype is ctxsys.ctxcat parameters('index set auction_iset');--创建ctxcat索引

select * from auction where catsearch(title,'camera',null)>0 order by bid_close desc;--与下一条等价

select * from auction where catsearch(title,'camera','order by bid_close desc')>0;

select * from auction where catsearch(title,'"Sony CD Player"',null)>0 and bid_close=to_date('2008-01-27','yyyy-mm-dd');

select * from auction where catsearch(title,'"Sony CD Player"','bid_close=to_date(''2008-01-27'',''yyyy-mm-dd'')')>0;--注意时间的引号使用

select * from auction where catsearch(title,'CD Player',null)>0;--显示含有‘‘CD Player''的所有记录

select * from auction where catsearch(title,'CD - Player',null)>0;--显示含有CD不含Player的所有记录

select * from auction where catsearch(title,'CD- Player',null)>0;--显示含有CD Player的所有记录

select * from auction where catsearch(title,'CD -Player',null)>0;--显示含有CD不含Player的所有记录

select * from auction where catsearch(title,'CD-Player',null)>0;--显示含有CD Player的所有记录

select * from auction where catsearch(title,'"CD Player"',null)>0;--显示含有CD Player的所有记录,不记中间空格的数目

select * from auction where catsearch(title,'Sony Player',null)>0;--显示含有Sony Player的所有记录

select * from auction where catsearch(title,'"Sony-Player"',null)>0;--没有记录

select * from auction where catsearch(title,'"Sony Player"',null)>0;--没有记录

select * from auction where catsearch(title,'Sony|Player',null)>0;--显示含有Sony或Player的所有记录

select * from auction where catsearch(title,'S*y|P*',null)>0;--显示含有S和y或P的所有记录，不记大小写

select * from auction where catsearch(title,' $Sony ',null)>0;

select * from auction where catsearch(title,'ABOUT(audio equipment)',null)>0;

select * from auction where catsearch(title,'CD',null)>0;

select * from auction where catsearch(title,

'<query>

</query>',null)>0;

SELECT err_index_name, err_timestamp,err_text FROM ctx_user_index_errors;

create table t(id number,docs varchar2(1000));

insert into t values(1,'IT IS A EXAMPLE FOR QUERY TEMPLETE.');

insert into t values(2,'USING THE TEMPLETE CONTAIN OPERATION CAN BE PERFORM ON CTXCAT INDEX.');

insert into t values(3,'AND THE CATSEARCH OPERATION CAN BE PERFORM ON CONTENT INDEX.');

commit;

drop index ind_docs;

create index ind_docs on t(docs) indextype is ctxsys.context;

select id from t where contains(docs,'templete',1)>0;

select id from t where contains(docs,'$USE',1)>0;

select id from t where contains(docs,

'<query>

<textquery>TEMPLETE</textquery>

</query>')>0;

drop index ind_docs;

create index ind_docs on t(docs) indextype is ctxsys.ctxcat;

select id from t where catsearch(docs,'using',null)>0;

select id from t where catsearch(docs,'$USE',null)>0;

select id from t where catsearch(docs,

'<query>

</query>',null)>0;

select * from t;

select * from t where catsearch(docs,'USING',null)>0;

select * from t where contains(docs,'$USE')>0;

select * from t where contains(docs,

'<query>

$USE

</textquery>

</query>')>0;

select * from t where catsearch(docs,

'<query>

|$USE|

</textquery>

</query>',null)>0;

select * from t where catsearch(docs,

'<query>

|$USE|

</textquery>

</query>',null)>0;

/*<TOAD_FILE_CHUNK>*/

select * from v$timer;

desc ctx_query;

--根据进程号获取该进程所在客户端的ip地址

create PROCEDURE dbo.SP_SPIDtoIP @SPID int

-- SPID to MAC

-- lj

DECLARE @MAC as varchar(12)

SELECT @MAC = NET_ADDRESS FROM master..sysprocesses WHERE SPID = @SPID

-- MAC to IP

DECLARE @MACDisplay as varchar(18)

DECLARE @IP as varchar(15)

CREATE TABLE #temp (OUTPUT varchar(255) null)

SET NOCOUNT ON

INSERT INTO #temp EXEC master..xp_cmdshell 'arp -a'

if @@error<>0

begin

RAISERROR ('The level for job_id:%d should be between %d and %d.', 16, 1)

--ROLLBACK TRANSACTION

end

SELECT @MACDisplay = LEFT(@MAC, 2) + '-' + SUBSTRING(@MAC, 3, 2) + '-' + SUBSTRING(@MAC, 5, 2) + '-' + SUBSTRING(@MAC, 7, 2) + '-' + SUBSTRING(@MAC, 9, 2) + '-' + SUBSTRING(@MAC, 11, 2) SELECT @IP = SUBSTRING(output, 3, 15) FROM #temp WHERE output LIKE '%' + @MACDisplay + '%'

-- Resolve the IP

--DECLARE @CMD as varchar(100)

--select @CMD = 'master..xp_cmdshell "ping -a ' + @IP + '"'

--exec (@CMD)

DROP TABLE #temp

SET NOCOUNT OFF

select * from auction where catsearch(title,'<query>

<textquery>CD|DVD|Speaker</textquery>

</query',null)>0;

select * from auction where catsearch(title,'<query>

</query',null)>0;

select * from auction where catsearch(title,'Sony',null)>0;

drop index ind_docs;

create index ind_docs on t(docs) indextype is ctxsys.ctxcat;

create index ind_docs on t(docs) indextype is ctxsys.context;

create or replace procedure T_OPTIMIZE_Index IS

begin

ctxsys.ctx_ddl.OPTIMIZE_INDEX('ind_docs','FULL',null,null,null);

exception

when no_data_found then

null;

when others then

-- Consider logging the error and then re-raise

RAISE;

end T_OPTIMIZE_Index;

CREATE OR REPLACE PROCEDURE T_SYNC_Index IS

BEGIN

ctx_ddl.sync_index('ind_docs');

EXCEPTION

WHEN NO_DATA_FOUND THEN

NULL;

WHEN OTHERS THEN

-- Consider logging the error and then re-raise

RAISE;

END T_SYNC_Index;

你可能感兴趣的:(oracle,null,table,文档,全文检索,Parameters)

UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
2020-8-19晨间日记：看过的电影盐大虾
今天是周三起床：6点半就寝：11点天气：晴心情：正常纪念日：周三任务清单今日完成的任务，最重要的三件事：1.整理写过的文档2.电影《电灯泡》3.这就是街舞第三季第五期改进：早睡早起习惯养成：早睡早起，看书周目标·完成进度两篇文章学习·信息·阅读电影艺术发展史相关教材健康·饮食·锻炼吃了挺多零食，还喝了果粒橙，还是得少吃，多锻炼，不然会慢慢死掉的。人际·家人·朋友淡定交流，不放在心上。工作·思考专心
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
vue3中el-table中点击图片放大时，被表格覆盖叫我小鹏呀 vue.js javascript 前端
问题：vue3中el-table中点击图片放大时，被表格覆盖。解决方法：el-image添加preview-teleported
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
Vue中table合并单元格用法 weixin_30613343 javascript ViewUI
地名结果人名性别{{item.name}}已完成未完成{{item.groups[0].name}}{{item.groups[0].sex}}{{item.groups[son].name}}{{item.groups[son].sex}}exportdefault{data(){return{list:[{name:'地名1',result:'1',groups:[{name:'张三',sex
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
Table列表复现框实现【勾选-搜索-再勾选】～四时春～ java 开发语言 elementui vue
Table列表复现框实现【勾选-搜索-再勾选】概要整体架构流程代码实现技术细节注意参考文献概要最近在开发时遇到一个问题，在进行表单渲染时，正常选中没有问题，单如果需要搜索选中时，一个是已选中的不会回填，二是在搜索的结果中进行选中，没有实现，经过排查，查找资料后实现。例如：整体架构流程具体的实现效果如下：代码实现{{scope.row.userName}}已选区{{userItem.userName
vue+el-table 可输入表格使用上下键进行input框切换以对_ vue学习记录 vue.js javascript 前端
使用上下键进行完工数量这一列的切换-->//键盘触发事件show(ev,index){letnewIndex;letinputAll=document.querySelectorAll('.table_inputinput');//向上=38if(ev.keyCode==38){if(index==0){//如果是第一行,回到最后一个newIndex=inputAll.length-1}elsei
vue + Element UI table动态合并单元格我家媳妇儿萌哒哒 element UI vue.js 前端 javascript
一、功能需求1、根据名称相同的合并工作阶段和主要任务合并这两列，但主要任务内容一样，但要考虑主要任务一样，但工作阶段不一样的情况。（枞向合并）2、落实情况里的定量内容和定性内容值一样则合并。（横向合并）二、功能实现exportdefault{data(){return{tableData:[{name:'a',address:'1',age:'1',six:'2'},{name:'a',addre
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
leetcode-617. 合并二叉树 manba_ leetcode hot100 leetcode 算法
题目描述给你两棵二叉树：root1和root2。想象一下，当你将其中一棵覆盖到另一棵之上时，两棵树上的一些节点将会重叠（而另一些不会）。你需要将这两棵树合并成一棵新二叉树。合并的规则是：如果两个节点重叠，那么将这两个节点的值相加作为合并后节点的新值；否则，不为null的节点将直接作为新二叉树的节点。返回合并后的二叉树。注意:合并过程必须从两个树的根节点开始。示例1：输入：root1=[1,3,2,
【Java】已解决：java.util.concurrent.CompletionException 屿小夏 java 开发语言
文章目录一、分析问题背景出现问题的场景代码片段二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：java.util.concurrent.CompletionException一、分析问题背景在Java并发编程中，java.util.concurrent.CompletionException是一种常见的运行时异常，通常在使用CompletableFuture进行异步计算时出现
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
APQP，ASPICE，敏捷，功能安全，预期安全，这些汽车行业的一堆标准二大宝贝安全架构
前言APQP,ASPICE,敏捷，功能安全，预期安全，PMP，PRICE2汽车行业的有这样一堆标准。我是半路出家来到汽车行业做项目经理的，对几个标准的感觉是，看了文档和各种解析之后还是一头雾水，不知道到底说了个啥，别人问我还是一脸懵逼。APQP（TS16949的最重要工具），ASPICE（软件）这些是质量标准，是优化整个公司体系的，但这套体系对项目管理有要求；敏捷，PMP这些是项目管理的标准；项目
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam