详解Oracle数据库中文全文索引

一、历史背景
Oracle数据库的全文检索技术已经非常完美，Oracle Text使Oracle9i具备了强大的文本检索能力和智能化的文本管理能力。Oracle Text是Oracle9i采用的新名称，在Oracle8/8i中它被称作Oracle interMedia Text，在Oracle8以前它的名称是Oracle ConText Cartridge。
二、Oracle Text 索引文档时所使用的主要逻辑步骤如下：
(1) 数据存储逻辑搜索表的所有行，并读取列中的数据。通常，这只是列数据，但有些数据存储使用列数据作为文档数据的指针。
(2) 过滤器提取文档数据并将其转换为文本表示方式。存储二进制文档 (如 Word 或 Acrobat 文件) 时需要这样做。过滤器的输出不必是纯文本格式 -- 它可以是 XML 或 HTML 之类的文本格式。
(3) 分段器提取过滤器的输出信息，并将其转换为纯文本。包括 XML 和 HTML 在内的不同文本格式有不同的分段器。转换为纯文本涉及检测重要文档段标记、移去不可见的信息和文本重新格式化。
(4) 词法分析器提取分段器中的纯文本，并将其拆分为不连续的标记。既存在空白字符分隔语言使用的词法分析器，也存在分段复杂的亚洲语言使用的专门词法分析器。
(5) 索引引擎提取词法分析器中的所有标记、文档段在分段器中的偏移量以及被称为非索引字的低信息含量字列表，并构建反向索引。倒排索引存储标记和含有这些标记的文档。
三、需要的权限
要使用Oracle Text，必须具有CTXAPP角色或者是CTXSYS用户。Oracle Text为系统管理员提供CTXSYS用户，为应用程序开发人员提供CTXAPP角色。具有CTXAPP角色的用户可执行以下任务：创建索引，管理 Oracle Text 数据字典，包括创建和删除首选项，进行Oracle Text 查询，使用 Oracle Text PL/SQL程序包。
如图所示：

四、具体的实现
文本装入文本列后，就可以创建Oracle Text索引。文档以许多不同方案、格式和语言存储。因此，每个 Oracle Text 索引有许多需要设置的选项，以针对特定情况配置索引。创建索引时，Oracle Text可使用若干个默认值，但在大多数情况下要求用户通过指定首选项来配置索引。
每个索引的许多选项组成功能组，称为"类"，每个类集中体现配置的某一方面，可以认为这些类就是与文档数据库有关的一些问题。例如：数据存储、过滤器、词法分析器、相关词表、存储等。
每个类具有许多预定义的行为，称之为对象。每个对象是类问题可能具有的答案，并且大多数对象都包含有属性。通过属性来定制对象，从而使对索引的配置更加多变以适应于不同的应用。
（1）存储（Storage）类
存储类指定构成Oracle Text索引的数据库表和索引的表空间参数和创建参数。它仅有一个基本对象：BASIC_STORAGE，其属性包括：I_Index_Clause、I_Table_Clause、K_Table_Clause、N_Table_Clause、P_Table_Clause、R_Table_Clause。
（2）数据存储（Datastore）类
数据存储：关于列中存储文本的位置和其他信息。默认情况下，文本直接存储到列中，表中的每行都表示一个单独的完整文档。其他数据存储位置包括存储在单独文件中或以其 URL 标识的 Web 页上。七个基本对象包括：Default_Datastore、Detail_Datastore、Direct_Datastore、File_Datastore、Multi_Column_Datastore 、URL_Datastore、User_Datastore。
（3）文档段组（Section Group）类
文档段组是用于指定一组文档段的对象。必须先定义文档段，然后才能使用索引通过 WITHIN 运算符在文档段内进行查询。文档段定义为文档段组的一部分。包含七个基本对象：AUTO_SECTION_GROUP、BASIC_SECTION_GROUP、HTML_SECTION_GROUP、NEWS_SECTION_GROUP、NULL_SECTION_GROUP、XML_SECTION_GROUP、PATH_SECTION_GROUP。
（4）相关词表（Wordlist）类
相关词表标识用于索引的词干和模糊匹配查询选项的语言，只有一个基本对象BASIC_WORDLIST，其属性有：Fuzzy_Match、Fuzzy_Numresults、Fuzzy_Score、Stemmer、Substring_Index、Wildcard_Maxterms、Prefix_Index、Prefix_Max_Length、Prefix_Min_Length。
（5）索引集（Index Set）
索引集是一个或多个Oracle 索引 (不是Oracle Text索引) 的集合，用于创建 CTXCAT类型的Oracle Text索引，只有一个基本对象BASIC_INDEX_SET。
（6）词法分析器（Lexer）类
词法分析器类标识文本使用的语言，还确定在文本中如何标识标记。默认的词法分析器是英语或其他西欧语言，用空格、标准标点和非字母数字字符标识标记，同时禁用大小写。包含8个基本对象：BASIC_LEXER、CHINESE_LEXER、CHINESE_VGRAM_LEXER、JAPANESE_LEXER、JAPANESE_VGRAM_LEXER、KOREAN_LEXER、KOREAN__MORPH_ LEXER、MULTI_LEXER。
（7）过滤器（Filter）类
过滤器确定如何过滤文本以建立索引。可以使用过滤器对文字处理器处理的文档、格式化的文档、纯文本和 HTML 文档建立索引，包括5个基本对象：CHARSET_FILTER、INSO_FILTER INSO、NULL_FILTER、PROCEDURE_FILTER、USER_FILTER。
（8）非索引字表（Stoplist）类
非索引字表类是用以指定一组不编入索引的单词 (称为非索引字)。有两个基本对象：BASIC_STOPLIST (一种语言中的所有非索引字) 、 MULTI_STOPLIST (包含多种语言中的非索引字的多语言非索引字表)。

1、创建词法分析器及相关词表
Begin-- 定义一个词法分析器
ctx_ddl.drop_preference('cnlex');
ctx_ddl.create_preference('cnlex','CHINESE_LEXER'); --针对中文
-- 定义一个相关词表
ctx_ddl.create_preference('mywordlist', 'BASIC_WORDLIST');
ctx_ddl.set_attribute('mywordlist','PREFIX_INDEX','TRUE');
ctx_ddl.set_attribute('mywordlist','PREFIX_MIN_LENGTH',1);
ctx_ddl.set_attribute('mywordlist','PREFIX_MAX_LENGTH', 5);
ctx_ddl.set_attribute('mywordlist','SUBSTRING_INDEX', 'YES');
end;
// 上面的语句中，如果是针对英语语种则可以采用下面的语句来定义词法分析器
ctx_ddl.create_preference('mylex','BASIC_LEXER');
ctx_ddl.set_attribute('mylex','printjoins','_-');

2、在需要创建全文索引的表中创建索引（索引类型必须是 ctxsys.context，即应用上下文索引）
create index idx_person_desc on personinfo(persondesc)
indextype is ctxsys.context
parameters (
'DATASTORE CTXSYS.DIRECT_DATASTORE FILTER
CTXSYS.NULL_FILTER LEXER cnlex WORDLIST mywordlist');
-- 请注意此处采用的是NULL_FILTER过滤器，如果采用INSO_FILTER则不能对中文进行全文索引

3、进行全文索引的同步
exec ctx_ddl.sync_index('idx_user_info', '20M');

具体理解
Oracle实现全文检索，其机制其实很简单。即通过Oracle专利的词法分析器(lexer),将文章中所有的表意单元（Oracle 称为 term，此处我理解为单词或者一些有意义的词语）找出来，记录在一组以 dr$开头的表中，同时记下该term出现的位置、次数、hash 值等信息。检索时，Oracle 从这组表中查找相应的 term，并计算其出现频率，根据某个算法来计算每个文档的得分（score）,即所谓的‘匹配率’。而lexer则是该机制的核心，它决定了全文检索的效率。Oracle 针对不同的语言提供了不同的 lexer, 而我们通常能用到其中的三个：
basic_lexer: 针对英语。它能根据空格和标点来将英语单词从句子中分离，还能自动将一些出现频率过高已经失去检索意义的单词作为‘垃圾’处理，如if , is 等，具有较高的处理效率。但该lexer应用于汉语则有很多问题，由于它只认空格和标点，而汉语的一句话中通常不会有空格，因此，它会把整句话作为一个term,事实上失去检索能力。以‘中国人民站起来了’这句话为例，basic_lexer 分析的结果只有一个term ,就是‘中国人民站起来了’。此时若检索‘中国’，将检索不到内容。
chinese_vgram_lexer: 专门的汉语分析器，支持所有汉字字符集。该分析器按字为单元来分析汉语句子。‘中国人民站起来了’这句话，会被它分析成如下几个term: ‘中’，‘中国’，‘国人’，‘人民’，‘民站’，‘站起’，起来’，‘来了’，‘了’。可以看出，这种分析方法，实现算法很简单，并且能实现‘一网打尽’，但效率则是差强人意。
chinese_lexer: 这是一个新的汉语分析器，只支持utf8字符集。上面已经看到，chinese vgram lexer这个分析器由于不认识常用的汉语词汇，因此分析的单元非常机械，像上面的‘民站’，‘站起’在汉语中根本不会单独出现，因此这种term是没有意义的，反而影响效率。chinese_lexer的最大改进就是该分析器能认识大部分常用汉语词汇，因此能更有效率地分析句子，像以上两个愚蠢的单元将不会再出现，极大提高了效率。但是它只支持 utf8, 如果你的数据库是zhs16gbk字符集，则只能使用笨笨的那个Chinese vgram lexer。
--以上的说法是针对于Oracle8i或者是更低级版本的，在Oracle 9.2中采用 Chinese_lexer 分析器测试是没有这个问题的。
如果不做任何设置，Oracle 缺省使用basic_lexer这个分析器。要指定使用哪一个lexer, 可以这样操作：
第一，在ctxsys用户下建立一个preference:
ctx_ddl.create_preference('cnlex','CHINESE_LEXER');

第二，在建立intermedia索引时，指明所用的lexer:
create index idx_person_desc on personinfo(persondesc)indextype is ctxsys.context
parameters (
'DATASTORE CTXSYS.DIRECT_DATASTORE FILTER
CTXSYS.NULL_FILTER LEXER cnlex WORDLIST mywordlist')

这样建立的全文检索索引，就会使用CHINESE_LEXER作为分析器。
使用job定时同步和优化
在intermedia索引建好后，如果表中的数据发生变化，比如增加或修改了记录，怎么办？由于对表所发生的任何dml语句，都不会自动修改索引，因此，必须定时同步(sync)和优化(optimize)索引，以正确反映数据的变化。
在索引建好后，我们可以在该用户下查到Oracle自动产生了以下几个表：（假设索引名为myindex）：
DR$myindex$I，DR$myindex$K，DR$myindex$R，DR$myindex$N

其中以I表最重要，可以查询一下该表，看看有什么内容：
select token_text, token_count from DR$I_RSK1$I where rownum<=20;

可以看到，该表中保存的其实就是Oracle 分析你的文档后，生成的term记录在这里，包括term出现的位置、次数、hash值等。当文档的内容改变后，可以想见这个I表的内容也应该相应改变，才能保证Oracle在做全文检索时正确检索到内容（因为所谓全文检索，其实核心就是查询这个表）。那么如何维护该表的内容呢？总不能每次数据改变都重新建立索引吧！这就用到sync 和 optimize了。
同步（sync）:将新的term 保存到I表。
优化（optimize）:清除I表的垃圾，主要是将已经被删除的term从I表删除。
检查全文索引是否创建成功
1、检查DR$myindex$I是否存在，其中的 myindex 代表建立的索引名称；
2、检查全文索引是否创建成功，最好采用 Contains来检查，具体的语法为
Contains(ColumnName,SearcherKey) > 0// ColumnName为所需要检查的列名，也即创建了全文索引的列名
// SearcherKey 为你需要查找的内容，为字符型

列如，按上面创建的全文索引，可以使用如下的语句：
Select * From PERSONINFO Where Containts(PERSONDESC, 'abcd',1) > 0
Select * From PERSONINFO Where Containts(PERSONDESC, 'abcd',1) > 0

如果你创建的全文索引不成功，则返回失败，其内容为：
ORA-20000: Oracle Text error: DRG-10599: 列没有编制索引
当然，如果你创建成功，则会正确返回数据。还有一个检查全文索引是否创建成功的方法是感觉创建全文索引后的查询速度。

测试数据
下面是对一个表进行操作时，在同一台机器中获得的测试数据。
PersonInfo表中共有 182263 条记录，其中persondesc不为null的记录数为180187 条记录，
其中，persondesc 包括 “大学”两个汉字的记录数为 21579 条记录
persondesc 包括 “1999”两个汉字的记录数为 10889条记录
测试一、直接用like 来查询中文“大学”
SQL: Select count(*) From personinfo Where persondesc like '%大学%'

时间开销：耗时 40秒 688 毫秒
测试二、直接用like 来查询英文“1999”
SQL: Select count(*) From personinfo Where persondesc like '%1999%'

时间开销：耗时 47秒 218毫秒
测试三、未创建全文索引时，直接用dbms_lob.instr 来查询中文“大学”
SQL: Select count(*) From personinfo Where dbms_lob.instr(persondesc,'大学',1,1)>0

时间开销：耗时 47秒 031毫秒
测试四、未创建全文索引时，直接用dbms_lob.instr 来查询英文“1999”
SQL: Select count(*) From personinfo Where dbms_lob.instr(persondesc,'1999',1,1)>0

时间开销：耗时 44秒 360毫秒
测试五、未创建全文索引时，直接用Contains 来查询中文“大学”
SQL: Select count(*) From personinfo Where Contains(persondesc,'大学',1)>0";

执行失败： ORA-20000: Oracle Text error: DRG-10599: 列没有编制索引
测试六、未创建全文索引时，直接用Contains 来查询英文“1999”
SQL: Select count(*) From personinfo Where Contains(persondesc,'1999',1)>0";

执行失败： ORA-20000: Oracle Text error: DRG-10599: 列没有编制索引
测试七、采用CHINESE_LEXER词法分析器创建全文索引后，直接用Contains 来查询英文“1999”
SQL: Select count(*) From personinfo Where Contains(persondesc,'1999',1)>0";

时间开销：第一次查询耗时 469毫秒，后面的多次查询耗时 210毫秒左右
***查询出来的记录数比在未建立索引时用like、dbms_lob.instr方式查询出来的记录数要少一些
测试八、采用CHINESE_LEXER词法分析器创建全文索引后，直接用Contains 来查询中文“大学”
SQL: Select count(*) From personinfo Where Contains(persondesc,'大学',1)>0";

时间开销：第一次查询耗时 9秒359毫秒，后面的多次查询耗时 210毫秒左右
***查询出来的记录数比在未建立索引时用like、dbms_lob.instr方式查询出来的记录数要少一些
测试九、采用CHINESE_LEXER词法分析器创建全文索引后，用dbms_lob.instr 来查询中文“大学”
SQL: Select count(*) From personinfo Where dbms_lob.instr(persondesc,'大学',1,1)>0

时间开销：耗时 54秒 953毫秒
测试十、采用CHINESE_LEXER词法分析器创建全文索引后，直接用dbms_lob.instr 来查询英文“1999”
SQL: Select count(*) From personinfo Where dbms_lob.instr(persondesc,'1999',1,1)>0

时间开销：耗时 52秒 652毫秒
总体感觉Oracle的中文全文索引不是很好。后续版本或许会有所改进吧。

从需求分析到数据库实现：MySQL完整课程设计实例范范0825 数据库需求分析 mysql
从需求分析到数据库实现：MySQL完整课程设计实例引言在现代软件开发中，数据库设计和实现是项目成功的关键因素之一。特别是在使用MySQL数据库管理系统（DBMS）时，从需求分析到数据库实现的每一步都需要细致的规划和执行。本课程旨在为学习者提供一个从需求分析到数据库实现的完整设计实例，包括需求收集、概念设计、逻辑设计、物理设计以及数据库实施和优化的全过程。一、需求分析1.需求收集需求分析的第一步是收
MySQL数据库设计基础：从零开始构建你的第一个数据库范范0825 数据库 mysql
MySQL数据库设计基础：从零开始构建你的第一个数据库数据库设计是软件开发的重要组成部分。良好的数据库设计可以显著提高应用程序的性能、维护性和可扩展性。在实际项目中，MySQL是最常用的关系型数据库之一，本教程将帮助你从零开始学习MySQL数据库设计，逐步构建你的第一个数据库。目录数据库设计基础什么是数据库？关系型数据库与MySQL简介数据库设计的重要性MySQL环境准备安装与配置MySQL选择数
MySQL学习（入门） shmilychan 数据库 mysql 数据库
一、数据库概述数据库（DataBase，DB）：指长期保存在计算机的存储设备上，按照一定规则组织起来，可以被各种用户或应用共享的数据集合。(文件系统)数据库管理系统（DataBaseManagementSystem，DBMS）：指一种操作和管理数据库的大型软件，用于建立、使用和维护数据库，对数据库进行统一管理和控制，以保证数据库的安全性和完整性。用户通过数据库管理系统访问数据库中的数据。数据库软件
MySQL高级课程：索引设计与性能优化的最佳实践勤劳兔码农 mysql 性能优化数据库
MySQL高级课程：索引设计与性能优化的最佳实践MySQL作为一种流行的关系型数据库管理系统，在企业级应用中被广泛使用。随着数据量的增加和业务复杂度的提升，数据库的性能成为关键问题。为了保证MySQL数据库在高并发、大数据量场景下的高效运行，索引设计与性能优化成为数据库管理的重要一环。本课程将深入探讨MySQL索引设计和性能优化的最佳实践，帮助你掌握从理论到实战的优化技巧。一、索引的基础知识1.1
驾驭SQL的多表连接：解锁复杂查询的高级技巧 2401_85761762 sql 数据库
驾驭SQL的多表连接：解锁复杂查询的高级技巧在数据库管理中，多表连接是处理关系型数据库中数据关联的一种强大工具。通过使用SQL的多表连接，可以合并来自多个表的数据，以提供更丰富的信息和深入的分析。本文将详细介绍如何使用SQL进行复杂的多表连接，并提供实际的代码示例，帮助你掌握这一关键技能。多表连接的基本概念多表连接是SQL中的一种操作，它允许你将两个或多个表中的行组合起来，基于它们之间的共同字段。
衣服让我烦恼至极！若山若水
“一场秋雨一场寒”，最近，绵绵秋雨连续下了几天，气温骤降，衣柜里的雪纺裙和真丝短袖衫已经难抵飒飒西风，只好翻开橱子寻找秋装。五个衣柜门打开，发现除了一个柜子的一角放着老公少得可怜的一摞衣服，其他都是我的。一件一件翻看，有姐姐给的她买小了穿不上的格子衬衫；有买时觉得还不错，结果买回家再试穿，左照右照却怎么也穿不出门的粉红色休闲装；有每年都要收拾出来，特别喜欢却因为生孩子体重骤增，怎么也穿不进的长袖连
sql之ddl语句，语法与思路并不是全黑 sql 数据库 mysql
首先MySQL是管理数据库软件，通过SQL语言操控数据管理软件来创建（增删改查）数据库。SQL语言命令分类1,ddl数据库定义语言，一般来定义表的结构（表头）2,dml数据库操作语言，一般来对表内数据增删改查3,dql数据库查询语言，一般来查询表内数据，记录4,dcl数据库控制语言，一般来创建用户，给权限这些都是我自学时手打到文本文档，在复制粘贴到博客的，有一些命令格式不对，但全部百分百原创，如果
幸福养猪场元宝50元能提现吗？最中肯的答案来了赏帮赚帮人忙
幸福养猪场元宝50元能提现吗？答：不能的，从表面上看，这是一个养猪赚钱的游戏，但实际上，它还是靠看广告赚钱。看广告的收入取决于你每天看多少广告。如果你多花点时间，一天可以赚两三块钱。而其他奖励只是一块馅饼，以防人们认为他们赚得太少。我觉得这种游戏赚的太少了，如果你真想利用休闲时间赚点零花钱，还不如用赏帮赚APP做任务挣钱，一天随便也能赚个几十块。你可以>>点此注册下载赏帮赚app如点击打不开请浏览
SQL之存储过程学习十一* mysql sql 学习数据库
文章目录前言一、存储过程的定义1、系统存储过程2、本地存储过程3、临时存储过程4、远程存储过程5、扩展存储过程二、创建存储过程语法1.简单示例三、调用存储过程四、删除存储过程四、存储过程的优缺点优点缺点总结前言上一篇学习了SQL的DDL（数据定义语言）和DML（数据操作语言），接着我们来学习SQL的存储过程一、存储过程的定义存储过程(StoredProcedure)是在大型数据库系统中，一组为了完
【MYSQL】在MySQL中设置 max_allowed_packet、wait_timeout 和 interactive_timeout 丶2136 web 数据库 mysql 数据库后端
目录重要配置参数临时设置参数1.使用SQL语句设置1.检查当前设置持久化设置修改配置文件在Linux上重启MySQL服务：在Windows上重启MySQL服务：注意事项示例：使用BLOB存储大数据总结解决连接断开问题的总结在处理大于1MB的数据时，MySQL数据库可能会遇到连接断开的问题。此类问题通常与几个重要的配置参数有关，包括max_allowed_packet、wait_timeout和in
Redis基础知识学习笔记（一）晚睡早起₍˄·͈༝·͈˄*₎◞ ̑̑ redis redis 学习笔记
文章目录Redis简介Redis简介REmoteDIctionaryServer(Redis)是一个由SalvatoreSanfilippo写的key-value存储系统，是跨平台的非关系型数据库,其是一个开源的使用ANSIC语言编写、遵守BSD协议、支持网络、可基于内存、分布式、可选持久性的键值对(Key-Value)存储数据库，并提供多种语言的API。Redis通常被称为数据结构服务器，因为值
《内在自信》讲书稿 MiMi蜜桃
你是否常常怀疑自己不够优秀？不敢去挑战、觉得不配享受更好的生活和工作呢？我经常这样，就比如这次进入八强，面对同时准备讲两本书的压力我就问自己，悠闲看书不香吗？为什么要这样逼自己？放弃算了！因为我真的太害怕了，太紧张了。好在有本书救了我，才让大家在决赛中看到了我。这本书就是《内在自信》，2020年职场热销书，作者是经验丰富的商业教练曼迪霍尔盖特。书提到，自信不是追求外在认可，而是追求内在自我，自信是
数据库实验1 我是一只大狸子数据库原理与技术数据库 sql database 数据库系统
数据库实验1第1关：创建数据库实验要求创建名为TESTDB的数据库。代码----------BEGIN----------createdatabaseTESTDB;----------END----------第2关：创建简单的数据表实验要求在TESTDB数据库中创建教师表（teacher），表结构如下：字段名数据类型（长度）备注tnoCHAR(4)工号tnameVARCHAR(12)姓名sexC
【flask框架搭建服务器demo】Python 使用轻量级 Flask 框架搭建 Web 服务器可视化数据库数据demo 嘻嘻仙人 web开发 python flask 后端 sqlite 数据库可视化
本文适合刚入门flask框架用来熟悉项目的开发人员，关于flask框架的组成概念一些用法请参考下面的文章https://blog.csdn.net/qq_47452807/article/details/122289200本文主要给出一个可视化sqlite数据库数据的demo，先展示一下效果：主要的代码如下（1）app.py文件fromflaskimportFlask,jsonify,render
我的生命该如何度过？禅与计算机程序设计艺术
我的生命该如何度过？很多人整天坐在办公桌前想我到底在这里做什么？但是大部分时候想归想，最后还是原地踏步。是因为他们不知道自己的生命应该如何度过，不知道自己还能干些其他什么事情，他们只知道自己不想在干当前这份工作了。你需要极大的勇气，疯狂的激情和超出理性范畴的决心。在你的想法成为现实的过程中，你要忍受反复出现的近乎死亡的体验，这种体验肯定会出现。要想在职场上取得成功，必须投入更多的精力去实现良好的结
《C++与新兴数据库技术的完美交互：开启高效数据处理新时代》程序猿阿伟 c++数据库开发语言
在当今快速发展的科技领域，数据库技术不断推陈出新，为数据的存储、管理和检索带来了更高效、更灵活的解决方案。而C++作为一种强大的编程语言，如何更好地与新兴的数据库技术进行交互，成为了众多开发者关注的热点问题。一、新兴数据库技术的崛起随着大数据、云计算和人工智能等技术的飞速发展，传统的关系型数据库在某些场景下已经难以满足日益增长的需求。新兴的数据库技术，如NoSQL数据库、NewSQL数据库、分布式
【Linux】Linux系统性能调优技巧大雨淅淅 linux linux
目录一、Linux系统性能指标二、Linux系统性能调优技巧2.1保持系统更新2.2磁盘I/O性能优化2.3内存管理调整2.4关闭不必要的服务2.5进程资源限制2.6网络性能调整2.7监控和分析工具2.8编译器优化2.9预读取和写入缓存2.10内核参数调整2.11性能分析工具2.12NUMA优化2.13数据库性能调优2.14使用交换空间2.15更新和维护2.16负载均衡和分布式计算2.17使用固态
Redis 系列（二）Redis 安装后端小哥 Redis 系列 redis
Redis全称：RemoteDictionaryServer(远程字典服务器)，是完全开源免费的，用C语言编写的，遵守BSD协议，是一个高性能的(key/value)分布式内存数据库，基于内存运行并支持持久化的NoSQL数据库，是当前最热门的NoSql数据库之一，也被人们称为数据结构服务器。1.Redis介绍官方网站https://redis.iohttp://www.redis.cnRedis与
macos 使用port安装mariadb/mysql数据库服务器 tekin macos 数据库 macos mariadb port install
在mac下安装mariadb/mysql数据库服务器的方式有多种,可以直接下载官方安装包安装,或者使用port,brew这类macos下的专业包管理工具安装,推荐使用port包管理工具来安装mysql数据库服务器.使用方法如下:先使用portsearchxxx查找要安装的软件都有哪些安装包命令:portsearchmariadb可见这里找到了50个相关的软件包,这个port还是很强大的哦!>por
在 CentOS Stream 9 中安装 MySQL 8 LuckyTHP centos mysql linux
MySQL是一种广泛使用的开源关系型数据库管理系统，它可以存储和管理各种类型的数据，如文本，数字，日期，图像等。MySQL8是MySQL的最新版本，它提供了许多新的特性和改进，如窗口函数，通用表表达式，角色，JSON支持等。本文将介绍如何在CentOSStream9系统中安装MySQL8，并进行基本的配置和测试。前提条件在开始安装MySQL8之前，您需要准备以下内容：一台运行CentOSStrea
提交保存，要做重复请求拦截，避免出现重复保存的问题 niceLiuSir 幂等性
**问题：**前端ajax提交数据的时候，当频繁点击的时候，或者两个账号以相同数据创建的时候，会出现问题。**处理办法：**前端拦截，防止重复提交数据，在上一次请求返回结果之后才允许提交第二次；后端和数据库也同意做拦截判断。**1.前端拦截：**结合layer.confirm可以屏蔽掉重复点击确认按钮产生重复请求的情况。//创建征地补差价协议functioncreateDisparityContr
k8s-pod 实战七（PreStop 和 PostStart 详细分析）清风 001 K8S-Pod实战 rpc 网络协议网络 k8s kubernetes 容器云原生
PreStop和PostStart详细分析PreStopHookPreStopHook是在容器终止之前执行的操作。它通常用于执行一些清理任务或完成某些操作，以确保容器能够平稳关闭。例如，在数据库应用中，你可能希望在容器终止之前完成所有正在进行的事务。PostStartHookPostStartHook是在容器启动之后立即执行的操作。它通常用于在容器启动后执行一些初始化任务。例如，你可能希望在容器启
我与2019有个告白：你好，再见，未来已来孙学镂
你好，我是喵喵说职场。今天是2019年12月31日，想给这一年做一个总结，关于职场，关于生活。停下来整理自己的身体、行囊，为了更好地前行。2018年12月31日：罗胖的跨年演讲每年到这个时候，都会关注罗胖的跨年演讲，脑子里总是会冒出一句话：岁月不饶人，苍天饶过谁。我们也确实没有饶过岁月，整场演讲，给我最大的感受就是压抑，可能是跟我工作有关，身处互联网行业人力资源体系中，能够最直观感受企业生存压力，
【选型】数据库 Mysql MariaDB 存储引擎选择我是Superman丶数据库架构心得数据库 mysql mariadb
【选型】数据库MysqlMariaDB存储引擎选择MariaDB新增十多个存储引擎，比较有特色的有：（1）Aria：适用于快速读取快速写入场景，替代为人诟病的MyISAM，支持事务，支持崩溃恢复；（2）TokuDB：适用于大数据量写入场景，支持事务，支持高压缩比，减少存储空间；（3）Spider：适用于水平分片场景，支持数据分片，将数据分布在多个服务器上；（5）DynamicComumns：支持动
窥一斑而知全豹薛晓刚数据库
说几个DTCC大会的插曲由于经济形势的不好，我看参展商少了一点。可能不少都是为了生计而挣扎。2023年1月明叔主持的栏目有一期特别节目《数据库诸神之战》，请来了OB、TiDB、TDSQL和TDEngine的掌门人来讨论数据库的未来，那时候结论是3年后国内健康运营的数据库公司不超过30家。目前已经快过去2年了。现在日子的确越来越难过了。现实可能和预测差不多。从出版社少到图书劵少每次大会都有各家出版社
Redis缓存穿透/雪崩/击穿凌晨去看海缓存 redis java
目录一缓存穿透1.什么是缓存穿透2.解决方法①在请求api接口时对数据进行非法校验②在redis中对没有的数据作个标记③布隆过滤器二缓存雪崩1.什么是缓存雪崩2.解决方法三缓存击穿1.什么是缓存击穿2.解决方法一缓存穿透1.什么是缓存穿透我们使用redis请求数据的时候，正常流程是先去redis缓存中查找，如果查到了数据，那么就直接返回，不需要再去查数据库，如果没有查到，就需要去查询数据库。所以缓
【Redis】什么是Redis缓存雪崩、穿透、击穿？（一篇文章就够了） Mxin5 Redis 缓存 redis 数据库
目录什么是Redis?Redis的正常存储流程？什么是Redis缓存雪崩？缓存雪崩缓存预热缓存失效时间的随机性什么是Redis缓存穿透？缓存穿透缓存空对象BloomFilter（布隆过滤器）什么是Redis缓存击穿？缓存击穿互斥锁逻辑过期时间什么是Redis?Redis：是一种高性能开源的基于内存的，采用键值对存储的非关系型数据库，不保证数据的ACID特性【事务一旦提交，都不会进行回滚】采用键值对
【ERPNext】Frappe、Bench、Bench CLI、 ERPNext、Desk 烟话6 python
文章目录Frappe：Bench：BenchCLI：ERPNext：Desk:Frappe：提示：就是一个开源的Web应用程序框架Frappe是一个开源的Web应用程序框架，用于构建数据驱动的应用。它的核心特点包括：MVC架构：Frappe基于模型-视图-控制器（MVC）架构，使代码结构清晰，便于维护和扩展。集成数据库：Frappe使用MariaDB/MySQL作为后端数据库，并提供ORM（对象关
公众号小说如何赚钱？揭秘其背后的盈利之道氧惠帮朋友一起省
在移动互联网时代，公众号已经成为许多人获取信息、娱乐消遣的重要平台。其中，公众号小说以其独特的魅力吸引了大量读者。那么，公众号小说究竟是如何赚钱的呢？本文将为您深入剖析公众号小说的盈利之道。公众号流量主就找善士导师（shanshi2024）公众号：「善士笔记」主理人，《我的亲身经历，四个月公众号流量主从0到日入过万！》公司旗下管理800+公众号矩阵账号。代表案例如：爸妈领域、职场道道、国学中庸、本
职场十大法则！一个内心独白
十大职场生存法则之一：男女搭档干活不累。在办公室里找到个合拍的搭档这很重要，即便是再能干的人，也不可能独自在办公室里游刃有余。还是别把自己总当成是“水”，运用智慧做一条处处都是碧波海洋的快乐之“鱼”，有时候会比“水”拥有着更广阔的生存空间。之二：同事之间莫谈友情。你当然要和自己的同事友好相处，又默契配合，但这仅限于工作之中，除此之外你要有不同的生活圈子。和同事是没办法成为朋友的，因为你们之间存在利
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

详解Oracle数据库中文全文索引

你可能感兴趣的:(oracle,数据库,职场,休闲)