这篇文章继续讨论全文索引的DATASTORE属性,介绍MULTI_COLUMN_DATASTORE。
如果被索引的文章是保存在数据库中,但是内容分布在多个列中,那么可以通过建立一个MULTI_COLUMN_DATASTORE来索引完整的文章:
SQL> CREATE TABLE T (ID NUMBER, DOC1 VARCHAR2(4000), DOC2 VARCHAR2(4000), DOC3 VARCHAR2(4000));
表已创建。
SQL> INSERT INTO T VALUES (1,
2 'The first paragraph of article in doc1.',
3 'The second partments is the doc2.',
4 'The last content is in the doc3.');
已创建 1 行。
SQL> INSERT INTO T VALUES (2,
2 'This example create a multi-column datastore preference',
3 'called test_multicol on three text columns',
4 'to be concatenated and indexed.');
已创建 1 行。
SQL> COMMIT;
提交完成。
下面创建索引,由于需要建立一个多列存储的全文索引,需要将多个列的列名作为参数传给Oracle。这个过程通过建立一个PREFERENCE,并设置属性来完成。
注意,下面的代码需要由CTXSYS用户执行,这点是文档上没有明确说明的。
SQL> CONN CTXSYS/CTXSYS@YANGTK
已连接。
SQL> BEGIN
2 CTX_DDL.CREATE_PREFERENCE('TEST_MULTICOL', 'MULTI_COLUMN_DATASTORE');
3 CTX_DDL.SET_ATTRIBUTE('TEST_MULTICOL', 'COLUMNS', 'DOC1, DOC2, DOC3');
4 END;
5 /
PL/SQL 过程已成功完成。
下面在建立索引的时候指定DATASTORE参数为新建的TEST_MULTICOL参数:
SQL> CONN YANGTK/YANGTK@YANGTK
已连接。
SQL> CREATE INDEX IND_T_DOCS ON T (DOC1) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('DATASTORE CTXSYS.TEST_MULTICOL');
索引已创建。
SQL> SELECT * FROM T WHERE CONTAINS(DOC1, 'CONTENT') > 0;
ID
----------
DOC1
---------------------------------------------------------------------------
DOC2
---------------------------------------------------------------------------
DOC3
---------------------------------------------------------------------------
1
The first paragraph of article in doc1.
The second partments is the doc2.
The last content is in the doc3.
通过查询的结果可以发现,这个多列的全文索引已经生效。
SQL> SELECT * FROM T WHERE CONTAINS(DOC2, 'CONTENT') > 0;
SELECT * FROM T WHERE CONTAINS(DOC2, 'CONTENT') > 0
*
ERROR 位于第 1 行:
ORA-20000: Oracle Text error:
DRG-10599: 列没有编制索引
SQL> CREATE INDEX IND_T_DOCS2 ON T (DOC2) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('DATASTORE CTXSYS.TEST_MULTICOL');
索引已创建。
SQL> SELECT * FROM T WHERE CONTAINS(DOC2, 'CONTENT') > 0;
ID
----------
DOC1
----------------------------------------------------------------------------
DOC2
----------------------------------------------------------------------------
DOC3
----------------------------------------------------------------------------
1
The first paragraph of article in doc1.
The second partments is the doc2.
The last content is in the doc3.
通过上面的例子可以看出,对于多列的全文索引可以建立在多个列的任意一列上,但是,在查询时指定的列必须与索引时指定的列保持一致。
最后注意一点,只有索引指定的列发生修改,Oracle才会认为被索引数据发生了变化,仅仅修改其他列而没有修改索引列,即使同步索引也不会将修改同步到索引中。
SQL> DROP INDEX IND_T_DOCS2;
索引已丢弃。
SQL> SELECT * FROM CTX_USER_PENDING;
未选定行
SQL> UPDATE T SET COL3 = NULL WHERE ID = 1;
UPDATE T SET COL3 = NULL WHERE ID = 1
*
ERROR 位于第 1 行:
ORA-00904: "COL3": 无效的标识符
SQL> UPDATE T SET DOC3 = NULL WHERE ID = 1;
已更新 1 行。
SQL> SELECT * FROM CTX_USER_PENDING;
未选定行
SQL> UPDATE T SET DOC1 = NULL WHERE ID = 1;
已更新 1 行。
SQL> SELECT * FROM CTX_USER_PENDING;
PND_INDEX_NAME PND_PARTITION_NAME PND_ROWID PND_TIMEST
-------------------------- ------------------ ------------------ ----------
IND_T_DOCS AAAJXiAAMAAAAAGAAA 25-7月 -06