达龙猫

Solr搜索引擎第九篇-DataImportHadler导入MySQL数据超详细

文章目录

了解Index Handler
通过DIH导入Mysql数据

步骤一：准备mysql数据库和表数据
步骤二：拷贝mysql的驱动jar
步骤三：在solrconfig.xml配置DIH
步骤四：集成中文分词器IKAnalyzer
步骤五：配置Solr存储字段的格式
步骤六：编写dih-data-config.xml文件

配置数据源
配置document对应的实体

单表全量
多表全量
单表增量
多表增量

动态入参
API接口

全量导入
增量导入
查看导入状态
重新加载dih配置文件
终止当前操作

总结

了解Index Handler

Index handler 索引处理器，是一种Request handler 请求处理器。
Solr对外提供http服务，每类服务在solr中都有对应的request handler来接收处理，Solr中提供了默认的处理器实现，如有需要我们也可提供我们的扩展实现，并在conf/solrconfig.xml中进行配置。在 conf/solrconfig.xml中，requestHandler的配置就像我们在web.xml中配置servlet-mapping（或spring mvc 中配置controller 的requestMap）一样：配置该集合/内核下某个请求地址的处理类。

Solrconfig中通过updateHandler元素配置了一个统一的更新请求处理器支持XML、CSV、JSON更新请求（映射地址为/update），它根据请求提交内容流的内容类型Content-Type将其委托给适当的ContentStreamLoader来解析内容，再进行索引更新。
我们可以打开内核主目录下的/conf/solrconfig.xml配置文件，查看默认配置了的update的处理器内容：


<updateHandler class="solr.DirectUpdateHandler2">

除此之外，我们还可以自定义handler（一般使用默认的就可以了）：

<requestHandler name="/update" class="solr.UpdateRequestHandler"/>

通过DIH导入Mysql数据

前提：

启动一个Solr服务实例
创建一个名称为mycore内核

步骤一：准备mysql数据库和表数据

新建一个mysql数据库：dih_test
创建并导入如下表和数据：

create table t_product(
	prod_id	varchar(64) PRIMARY key,
	name 	varchar(200)	not null,
	simple_intro LONGTEXT,
	price bigint,
	uptime datetime,
	brand_id varchar(64),
	last_modify_time datetime,
	isDelete char(1)
) comment '产品表';

create table t_brand(
	id varchar(64) PRIMARY key,
	name varchar(200) not null,
	last_modify_time datetime
) comment '产品对应的品牌表';

create table t_cat(
	id varchar(64) PRIMARY key,
	name varchar(200) not null,
	last_modify_time datetime
) comment '产品的分类表';

create table t_prod_cat(
	prod_id varchar(64),
	cat_id	varchar(64) ,
	last_modify_time datetime
) comment '产品-分类关系表';

INSERT INTO t_brand VALUES ('b01', '华为', '2018-5-17 00:00:00');
INSERT INTO t_brand VALUES ('b02', '戴尔', '2018-5-18 00:00:00');

INSERT INTO t_cat VALUES ('c01', '台式机', '2018-5-17 00:00:00');
INSERT INTO t_cat VALUES ('c02', '服务器', '2018-5-17 00:00:00');

INSERT INTO t_product VALUES ('tp001', '华为（HUAWEI）RH2288HV3服务器', '12盘(2*E5-2630V4 ,4*16GB ,SR430 1G，8*2TSATA,4*GE,2*460W电源,滑轨) ', 4699900, '2018-5-8 00:00:00', 'b01', '2018-5-8 00:00:00', '0');
INSERT INTO t_product VALUES ('tp002', '戴尔 DELL R730 2U机架式服务器', '戴尔 DELL R730 2U机架式服务器（E5-2620V4*2/16G*2/2T SAS*2热/H730-1G缓存/DVDRW/750W双电/导轨）三年', 2439900, '2018-5-18 15:32:13', 'b02', '2018-5-18 17:32:23', '0');

INSERT INTO t_prod_cat VALUES ('tp001', 'c01', '2018-5-8 14:48:56');
INSERT INTO t_prod_cat VALUES ('tp001', 'c02', '2018-5-8 14:49:15');
INSERT INTO t_prod_cat VALUES ('tp002', 'c01', '2018-5-18 15:32:48');
INSERT INTO t_prod_cat VALUES ('tp002', 'c02', '2018-5-18 18:29:23');

表结构说明：

t_product：商品表，主表

t_brand：品牌表，子表，商品表和品牌表是一对一关系

t_cat：商品分类表，子表，商品表和商品分类表是一对多关系，一个商品有多个分类，通过t_prod_cat表进行关联

步骤二：拷贝mysql的驱动jar

因为Solr底层会通过mysql的驱动jar去连接数据库，获取数据后导入到引擎中，因此这里需要将mysql的驱动jar拷贝到D:\Program Files\solr-7.5.0\server\solr-webapp\webapp\WEB-INF\lib
我这里拷贝的是：mysql-connector-java-6.0.6.jar

步骤三：在solrconfig.xml配置DIH

在创建的内核mycore主目录的/conf/solrconfig.xml文件中添加一个requestHandler，名称为dataimport，具体内容如下：

<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-dataimporthandler-.*\.jar" />

<requestHandler name="/dataimport" class="solr.DataImportHandler">
  <lst name="defaults">
	<str name="config">dih-data-config.xmlstr>
  lst>
requestHandler>

lib说明：

DIH的jar包默认是没有引入的，需要引入

DIH的jar包是存放在D:\Program Files\solr-7.5.0\dist中的

requestHandler 说明：

name必须为/dataimport

dih-data-config.xml文件是必须要配置的，该文件可以使绝对路径或相对集合主目录conf/的相对路径，这里直接配置在conf/目录下。该文件是最核心的部分，在后面会讲述到。

步骤四：集成中文分词器IKAnalyzer

因为有些字段需要进行分词，比如name、simple_intro，且这些字段又是中文的，因此solr中要集成中文分词器IKAnalyzer，具体如何集成请看我的另一篇文章，有非常详细的说明：Solr搜索引擎第六篇-Solr集成中文分词器IKAnalyzer
集成完毕后，确认在mycore内核主目录下的/conf/managed-schema.xml文件中有添加中文分词的FieldType：

<fieldType name="zh_CN_text" class="solr.TextField">
	<analyzer>
		<tokenizer class="com.dalomao.framework.lucene.analizer.ik.IKTokenizer4Lucene7Factory" useSmart="true" /> 
	analyzer>
fieldType>

步骤五：配置Solr存储字段的格式

将上述的产品表对应的字段数据导入到solr中，需要定义映射到solr中的哪些字段，这些前提工作需要先做好。
这部分需要根据自己的实际情况去定义（是否需要分词、索引、存储、多值等情况），这里我列出映射关系（其中brand_name和cat_name两个字段是需要关联出来的，isDelete只是逻辑删除标志这里不会用到）：

数据库字段	solr字段	solr字段格式
prod_id	solr_prod_id	商品ID，唯一键，字符串，不分词，索引，存储
name	solr_name	商品名称，字符串，中文分词，索引，存储
simple_intro	solr_simple_intro	商品简介，字符串，中文分词，索引，不存储
price	solr_price	价格，整数（单位元），不分词，索引，存储
uptime	solr_uptime	上架时间，时间类型，不分词，索引、存储，docValues支持排序
brand_id	solr_brand_id	品牌ID，字符串，不分词，不索引，存储
brand_name	solr_brand_name	品牌名称，字符串，不分词，索引，存储，docValues支持分页查询
cat_name	solr_cat_name	分类名称，多值，不分词，索引，存储，docValues支持分页查询
last_modify_time	solr_last_modify_time	最后更新时间，时间类型，不分词，索引，存储，docValues支持排序

根据上述表格中solr字段格式定义，修改mycore主目录下的/conf/managed-schema.xml文件，添加如下内容：

<field name="solr_prod_id" type="string" indexed="true" stored="true" required="true" />
<field name="solr_name" type="zh_CN_text" indexed="true" stored="true" required="true" />
<field name="solr_simple_intro" type="zh_CN_text" indexed="true" stored="false" />
<field name="solr_price" type="pint" indexed="true" stored="true" />
<field name="solr_uptime" type="pdate" indexed="true" stored="true" docValues="true" />
<field name="solr_brand_id" type="string" indexed="false" stored="true" />
<field name="solr_brand_name" type="string" indexed="true" stored="true" docValues="true" />
<field name="solr_cat_name" type="strings" indexed="true" stored="true" />
<field name="solr_last_modify_time" type="pdate" indexed="true" stored="true" docValues="true" />

这里我不使用solr自带的唯一键id，而重新设置唯一键为solr_prod_id，需要改两个地方：


<field name="id" type="string" indexed="true" stored="true" 
required="false" multiValued="false" />


<uniqueKey>solr_prod_iduniqueKey>

步骤六：编写dih-data-config.xml文件

在mycore主目录的/conf/目录下创建dih-data-config.xml文件

配置数据源

<dataSource driver="com.mysql.jdbc.Driver" 
		url="jdbc:mysql://127.0.0.1:3306/dih_test?useUnicode=true&characterEncoding=utf-8&serverTimezone=GMT" 
		user="root" password="123456" />

serverTimezone=GMT是为解决引入最新版mysql驱动jar报时区错误而加入的连接请求参数
上面配置的是单数据源，如果想配置多数据源的话，则需要多加一个属性name，如下：

<dataSource type="JdbcDataSource" name="ds-1" driver="com.mysql.jdbc.Driver" 
		url="jdbc:mysql://db1-host/dbname" user="db_username" password="db_password"/>
<dataSource type="JdbcDataSource" name="ds-2" driver="com.mysql.jdbc.Driver" 
		url="jdbc:mysql://db2-host/dbname" user="db_username" password="db_password"/>

说明：

name、type是通用属性，type默认是JdbcDataSource

其他属性是非固定的，支持多种数据库

配置document对应的实体

这一部分是最核心的配置部分，我们分为如下情况进行说明：

单表全量：单张表的全量数据导入的情形

多表全量：多张关联表（存在父子表）的全量数据导入的情形

单表增量：单张表的增量数据导入的情形

多表增量：多张关联表（存在父子表）的增量数据导入的情形

单表全量

dih-data-config.xml文件加入字段映射关系：

<document>
  <entity name="product" query="SELECT * FROM t_product">
     <field column="prod_id" name="solr_prod_id"/>
     <field column="name" name="solr_name"/>
     <field column="simple_intro" name="solr_simple_intro"/>
     <field column="price" name="solr_price"/>
     <field column="uptime" name="solr_uptime"/>
     <field column="brand_id" name="solr_brand_id"/>
     <field column="last_modify_time" name="solr_last_modify_time"/>
  entity>
document>

注意：document下可包含一个或多个entity数据实体
entity标签独有的属性有如下：

name：必须，表示实体的唯一名称

dataSource：当配置多个数据源时，指定使用的数据源的名字

processor：当数据源是非RDBMS时，必须指定处理器。默认是SqlEntityProcessor

transformer：应用在该实体上的转换器

rootEntity：默认document元素的子entity是rootEntity，如果把rootEntity属性设为false，则它的子类会被作为rootEntity（以此类推），rootEntity返回的每一行会创建一个document

pk：仅用于增量导入，实体的主键列名，表示的是数据库表中的主键，和模式中的唯一键是两个不同的东西。

onError：当处理entity的行为document的过程中发生异常该如何处理：默认是 abort，放弃导入。skip：跳过这个文档，continue：继续索引该文档

preImportDeleteQuery：在全量导入前，如果需要进行索引清理cleanup，可以通过此属性指定一个清理的索引删除查询，否则默认是删除所有。只有document的直接子entity设置此属性有效

postImportDeleteQuery：指定全量导入后需要进行索引清理的delete查询。只有document的直接子entity设置此属性有效

entity中没有配置processor处理器，则默认使用的是SqlEntityProcessor。该处理器也有一些默认的属性，这些属性主要是用于全量或增量导入的时候指定sql语句查询数据库，属性说明如下：

query：必须，从数据库中加载实体数据用的SQL语句。

deltaQuery：仅用于增量导入，指定增量数据pk的查询SQL。

parentDeltaQuery：指定增量关联父实体的pk的查询SQL。

deletedPkQuery：仅用于增量导入，被删除实体的pk查询SQL。

deltaImportQuery：仅用于增量导入，指定增量导入实体数据的查询SQL。如果没有指定该查询语句，solr将使用query属性指定的语句，经修改后来查询加载增量数据（这很容易出错），因此一般有增量查询的时候往往需要定义该属性的增量查询语句。在该语句中往往需要引用deltaQuery查询结果的列值，通过 $ {dih.delta.< column-name >} 来引用，如：select * from tbl where id=${dih.delta.id}

单表全量情形下的dih-data-config.xml文件最终内容如下：


<dataConfig>
	<dataSource driver="com.mysql.jdbc.Driver" 
		url="jdbc:mysql://127.0.0.1:3306/dih_test?useUnicode=true&characterEncoding=utf-8&serverTimezone=GMT" 
		user="root" password="123456" />

	<document>
	  <entity name="product" query="SELECT * FROM t_product">
		 <field column="prod_id" name="solr_prod_id"/>
		 <field column="name" name="solr_name"/>
		 <field column="simple_intro" name="solr_simple_intro"/>
		 <field column="price" name="solr_price"/>
		 <field column="uptime" name="solr_uptime"/>
		 <field column="brand_id" name="solr_brand_id"/>
		 <field column="last_modify_time" name="solr_last_modify_time"/>
	  entity>
	document>
dataConfig>

有两种方式触发全量导入，一种是登陆web控制台操作，一种是访问url发送post请求，这里只说明用web控制台操作的方式，http api放在最后统一说明。

然后去查询界面，确实已经导入了：

注意：在全量数据导入成功之后，solr会自动在内核主目录/conf/下生成dataimport.properties文件，记录上次导入的时间，主要用于下次增量导入的起始时间。

多表全量

此时我们需要额外导入两个字段solr_brand_name、solr_cat_name，而这两个字段是在子表中，需要关联出来的。solr提供了嵌套entity的写法，可以获取子表中的数据，如下：

<document>
  <entity name="product" query="SELECT * FROM t_product">
	 <field column="prod_id" name="solr_prod_id"/>
	 <field column="name" name="solr_name"/>
	 <field column="simple_intro" name="solr_simple_intro"/>
	 <field column="price" name="solr_price"/>
	 <field column="uptime" name="solr_uptime"/>
	 <field column="brand_id" name="solr_brand_id"/>
	 <field column="last_modify_time" name="solr_last_modify_time"/>
		
	 <entity name="brand" query="SELECT name FROM t_brand WHERE id='${product.brand_id}'">
		
		<field column="name" name="solr_brand_name"/>
	 entity>
	 
	 <entity name="product_cat" query="SELECT cat_id FROM t_prod_cat WHERE prod_id='${product.prod_id}'">
		<entity name="cat" query="SELECT name FROM t_cat WHERE id='${product_cat.cat_id}'">
			
			<field column="name" name="solr_cat_name"/>
		entity>
	 entity>
  entity>
document>

上述写法，应该很简单明了，基本都看得懂，就是主表和子表的LEFT JOIN关系给他拆分成多个嵌套的entity，几个点说明一下：

第一层的entity为rootEntity，嵌套的entity都是子entity，你可以理解为主表和子表的关系

${product.brand_id}这种写法很容易理解，product就是上层entity的名称，关联的使用会用到

若主表和子表的关系嵌套很深，则多些几个嵌套entity即可

${xxx}这种写法一定要带上单引号，否则会报错！

登陆控制台查询，导入正确：

单表增量

单表增量导入，首先这张表必须有两个字段：更新时间、逻辑删除标志，缺一不可！因为增量导入会分为更新、删除两种情况，所以在一开始设计表结构的时候就要注意！就当前这个例子的话，就是指last_modify_time、isDelete两个字段.
单表增量只需要添加entity的几个属性即可，如下：

<document>
  <entity 
		name="product" 
		query="SELECT * FROM t_product"
		deltaQuery="SELECT prod_id FROM t_product WHERE last_modify_time  > '${dataimporter.last_index_time}'"
		deltaImportQuery="SELECT * FROM t_product WHERE prod_id='${dih.delta.prod_id}'"
		deletedPkQuery="SELECT prod_id FROM t_product WHERE isDelete='1'">
	 <field column="prod_id" name="solr_prod_id"/>
	 <field column="name" name="solr_name"/>
	 <field column="simple_intro" name="solr_simple_intro"/>
	 <field column="price" name="solr_price"/>
	 <field column="uptime" name="solr_uptime"/>
	 <field column="brand_id" name="solr_brand_id"/>
	 <field column="last_modify_time" name="solr_last_modify_time"/>
  entity>
document>

说明：

query：用于全量导入的语句，前面已经介绍过了，这里不用改动它

deltaQuery：用来同步更新的数据，根据dataimporter.properties每次刷新的last_index_time获取变更后的数据，这里只能返回主键prod_id

deltaImportQuery：用来同步更新的数据，solr首先会从deltaQuery语句查询修改的主键，然后使用deltaImportQuery语句并传入deltaQuery查出来的主键去查询出最终更新后的数据

deletedPkQuery：用来同步删除的数据，当然在mysql层面是逻辑删除，而在solr这里是直接删除该文档

${dataimporter.last_index_time}是默认的固定写法，表示上次同步的时间，前面也有介绍，每次全量更新或增量更新后，solr内部会维护这么一个变量（保存在mycore主目录/conf/dataimport.properties文件中）

${dih.delta.prod_id}：deltaImportQuery语句中会引用deltaQuery语句中的字段，引用于法dih.delta是固定写法，后面跟上deltaQuery查询出来的字段名

具体如何测试，这里不详细描述。无非就是改下mysql中的last_modify_time和isDelete，然后看下solr中是否会同步更新及删除document数据，但是在操作solr更新的时候要选择同步更新delta-import，这个要注意下：

多表增量

父子关联表，当父表或任何一张子表发生变更了，则都是需要同步更新到solr，因此子表也必须有更新时间这个字段，这里只演示更新时间，至于子表的逻辑删除同父表的处理逻辑一致，修改后的dih-data-config.xml文件如下：

<document>
  <entity 
		name="product" 
		query="SELECT * FROM t_product"
		deltaQuery="SELECT prod_id FROM t_product WHERE last_modify_time  > '${dataimporter.last_index_time}'"
		deltaImportQuery="SELECT * FROM t_product WHERE prod_id='${dih.delta.prod_id}'"
		deletedPkQuery="SELECT prod_id FROM t_product WHERE isDelete='1'"
		pk="prod_id">
	 <field column="prod_id" name="solr_prod_id"/>
	 <field column="name" name="solr_name"/>
	 <field column="simple_intro" name="solr_simple_intro"/>
	 <field column="price" name="solr_price"/>
	 <field column="uptime" name="solr_uptime"/>
	 <field column="brand_id" name="solr_brand_id"/>
	 <field column="last_modify_time" name="solr_last_modify_time"/>
	 
	 <entity 
			name="brand" 
			query="SELECT name FROM t_brand WHERE id='${product.brand_id}'"
			deltaQuery="SELECT id FROM t_brand WHERE last_modify_time  > '${dataimporter.last_index_time}'"
			deltaImportQuery="SELECT name FROM t_brand WHERE id='${dih.delta.id}'"
			parentDeltaQuery="SELECT prod_id FROM t_product WHERE brand_id='${brand.id}'"
			pk="id">
		
		<field column="name" name="solr_brand_name"/>
	 entity>
	 
	 <entity 
			name="product_cat" 
			query="SELECT cat_id FROM t_prod_cat WHERE prod_id='${product.prod_id}'"
			deltaQuery="SELECT prod_id,cat_id FROM t_prod_cat WHERE last_modify_time  > '${dataimporter.last_index_time}'"
			parentDeltaQuery="SELECT prod_id FROM t_product WHERE prod_id='${product_cat.prod_id}'"
			pk="prod_id">
		<entity 
			name="cat" 
			query="SELECT name FROM t_cat WHERE id='${product_cat.cat_id}'"
			deltaQuery="SELECT id FROM t_cat WHERE last_modify_time  > '${dataimporter.last_index_time}'"
			deltaImportQuery="SELECT name FROM t_cat WHERE id='${dih.delta.id}'"
			parentDeltaQuery="SELECT prod_id,cat_id FROM t_prod_cat WHERE cat_id='${cat.id}'"
			pk="id">
			
			<field column="name" name="solr_cat_name"/>
		entity>
	 entity>
  entity>
document>

看起来有点复杂~~

首先，每张表都可能更新，因此都需要写deltaQuery和deltaImportQuery语句。其实也可以不写deltaImportQuery语句，如果不写的话，那么query就会被拿来用，查询出最终的实体数据。但这样容易出错，所以建议分开。

query语句是全量更新的，这里我们不改，保留之前的即可。

pk：查询增量的时候，每一个entity都要指定一个pk值，对应的是数据库中的主键

parentDeltaQuery：子表有更新，必须向上关联出父表的id，然后将更新信息一直向上传递，parentDeltaQuery就是这个作用，主要用来通过子表查询出父表的主键

product_cat这个entity是中间表，会有两个主键，这里pk随便指定一个即可

查询流程是这样的：主表或子表通过deltaQuery语句查询出本身更新后的主键，若本身是主表，则直接使用deltaImportQuery语句查询出更新的数据；若本身是子表，则通过parentDeltaQuery语句查询出更新后的父表的主键，并向上传递通知父表（直到传递到rootEntity），然后所有的父表和本身通过deltaImportQuery语句查出更新的数据。

这种情况在子表很多的情况下就显得比较复杂，因此还有一种写法，将父表和所有子表的更新统一写到父表的deltaQuery语句，如下：

<document>
  <entity 
		name="product" 
		query="SELECT * FROM t_product"
		deltaQuery="
			SELECT prod_id FROM t_product 
			WHERE last_modify_time  > '${dataimporter.last_index_time}'
			OR brand_id IN (SELECT id FROM t_brand WHERE last_modify_time  > '${dataimporter.last_index_time}')
			OR prod_id IN 
			(
				SELECT prod_id FROM t_prod_cat 
				WHERE last_modify_time  > '${dataimporter.last_index_time}'
				OR cat_id IN (SELECT id FROM t_cat WHERE last_modify_time  > '${dataimporter.last_index_time}')
			)"
		deltaImportQuery="SELECT * FROM t_product WHERE prod_id='${dih.delta.prod_id}'"
		deletedPkQuery="SELECT prod_id FROM t_product WHERE isDelete='1'"
		pk="prod_id">
	 <field column="prod_id" name="solr_prod_id"/>
	 <field column="name" name="solr_name"/>
	 <field column="simple_intro" name="solr_simple_intro"/>
	 <field column="price" name="solr_price"/>
	 <field column="uptime" name="solr_uptime"/>
	 <field column="brand_id" name="solr_brand_id"/>
	 <field column="last_modify_time" name="solr_last_modify_time"/>
	 
	 <entity 
		name="brand" 
		query="SELECT name FROM t_brand WHERE id='${product.brand_id}'">
		
		<field column="name" name="solr_brand_name"/>
	 entity>
	 
	 <entity 
		name="product_cat" 
		query="SELECT cat_id FROM t_prod_cat WHERE prod_id='${product.prod_id}'">
		<entity 
			name="cat" 
			query="SELECT name FROM t_cat WHERE id='${product_cat.cat_id}'">
			
			<field column="name" name="solr_cat_name"/>
		entity>
	 entity>
  entity>
document>

动态入参

如果DIH配置文件中需要使用请求时传入的参数，可以用${dataimporter.request.paramname}表示引用请求参数。
配置实例：

<dataSource 
	driver="org.hsqldb.jdbcDriver" 
	url="${dataimporter.request.jdbcurl}" 
	user="${dataimporter.request.jdbcuser}" 
	password="${dataimporter.request.jdbcpassword}" />

请求传参实例：
http://localhost:8983/solr/mycore/dataimport?command=full-import&jdbcurl=jdbc:hsqldb:./example-DIH/hsqldb/ex&jdbcuser=sa&jdbcpassword=secret

API接口

除了使用web控制台进行全量和增量的导入，还可以使用post工具。

全量导入

API接口：http://127.0.0.1:8983/solr/mycore/dataimport?command=full-import

会返回导入正在进行中的状态信息，导入会在一个新线程中开启（可能需要一定时间完成导入）。导入完成后，导入的开始时间将存入到conf/dataimport.properties文件中，用于后面的增量导入。增量导入完成后也会存入增量开始的时间到这个文件，用于下一次增量导入。全量导入期间并不会阻塞solr查询。
可以附加的参数如下：

entity：指定导入下的哪些实体（必须是直接子entity），如果没有给定该参数，则是其下所有子entity

clean：指定是否在导入前清理索引，默认true

commit：指定导入后是否提交，默认true

optimize：是否进行优化，默认false

debug：是否以调试模式运行，开发下使用，默认false。调试模式下不会提交，除非明确指定commit=true.

增量导入

API接口：http://127.0.0.1:8983/solr/mycore/dataimport?command=delta-import
支持的附加参数同全量导入

查看导入状态

API接口：http://127.0.0.1:8983/solr/mycore/dataimport?command=dataimport
导入是异步进行的，该命令可以查看导入的进度、状态信息

重新加载dih配置文件

API接口：http://127.0.0.1:8983/solr/mycore/dataimport?command=reload-config

终止当前操作

API接口：http://127.0.0.1:8983/solr/mycore/dataimport?command=abort

总结

Solr支持从很多数据源导入数据

Solr内部实现了很多处理器和转换器，在导入过程中，最重要的是编写dih-data-config.xml文件

参考地址：
http://lucene.apache.org/solr/guide/7_5/uploading-structured-data-store-data-with-the-data-import-handler.html
https://wiki.apache.org/solr/DataImportHandle

你可能感兴趣的:(搜索引擎)

文本纠错（Text Correction） dundunmm 人工智能数据挖掘文本纠错人工智能数据挖掘文本纠错深度学习
文本纠错（TextCorrection）是自然语言处理（NLP）中的一个重要任务，旨在自动检测并修正文本中的错误，包括拼写、语法、语义等层面的错误。其核心目标是通过算法模型将错误文本转换为符合语言规范的表达。该任务在自动写作辅助、搜索引擎优化、智能客服、教育等多个领域具有广泛应用。输入：包含错误的原始文本（如“我明天要去北京，希望天汽好。”）输出：修正后的规范文本（如“我明天要去北京，希望天气好。
从关键词到权重：TF-IDF算法解析多巴胺与内啡肽. 机器学习 tf-idf 算法机器学习
文章目录前言一、TF-IDF：关键词的“价值”评估师二、TF-IDF的计算：拆解关键词的“价值”三、TF-IDF的应用：从搜索引擎到文本挖掘四、代码实现：从《红楼梦》中提取核心关键词1、分卷处理1.1代码功能1.2代码实现1.2.1、读取文件1.2.2逐行处理1.2.3.关闭文件2、分词与停用词过滤2.1代码功能2.2代码实现2.2.1读取分卷内容构建DataFrame：2.2.2分词与停用词过滤
Spring Boot 整合 Elasticsearch 实践：从入门到上手遇见伯灵说 mysql Spring elasticsearch jenkins springboot
引言Elasticsearch是一个开源的分布式搜索引擎，广泛用于日志分析、搜索引擎、数据分析等场景。本文将带你通过一步步的教程，在SpringBoot项目中整合Elasticsearch，轻松实现数据存储与查询。1.创建SpringBoot项目首先，你需要创建一个SpringBoot项目。如果你还没有创建，可以使用SpringInitializr快速生成一个项目。在生成项目时，确保选择了以下依赖
autosar功能安全文档解析 dont__cry 安全
该文档是AUTOSAR汽车搜索引擎发布的关于AUTOSAR经典平台功能安全措施的概述，涵盖功能安全机制、措施、硬件诊断等内容，为汽车安全相关系统开发提供指导。1.**引言**-**范围**：涵盖功能安全机制、措施及硬件诊断等多方面内容，帮助理解AUTOSAR在功能安全方面的作用。-**目的**：总结AUTOSAR功能安全要点，指导相关系统开发人员利用其机制和措施，取代旧文档。-**目标受众**：主
第七章Solr：企业级搜索应用 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
第七章Solr：企业级搜索应用1.背景介绍1.1搜索引擎的重要性在当今信息时代,数据量呈指数级增长,海量数据中蕴含着极其宝贵的信息和知识。然而,如何快速、准确地从大数据中检索出所需的信息,一直是企业和组织面临的巨大挑战。传统的数据库查询方式已经无法满足现代搜索需求,因此高效的搜索引擎应运而生。1.2什么是SolrApacheSolr是一个高性能、可扩展、云就绪的企业级搜索平台,由Apache软件基
MySQL 与 Elasticsearch 联合查询墨瑾轩一起学学数据库【一】mysql elasticsearch adb
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，小伙伴们！今天我们要来聊聊MySQL与Elasticsearch如何携手合作，共同完成高效的联合查询和数据检索任务。MySQL是一款非常流行的数据库管理系统，而Elasticsearch则是一款基于Lucene的搜索引擎，擅长全文搜索和实时数据分析。两者结
大模型联网搜索组件 SearXNG 部署和使用「已注销」
SearXNG是一个免费的互联网元搜索引擎，它整合了来自超过70个搜索服务的结果。用户不会被跟踪或进行特征分析，很好地保护了用户隐私。2022年11月OpenAI发布ChatGPT后，大模型和知识库开始火爆，联网搜索成为弥补大模型知识陈旧的重要工具。提供元搜索功能的SearXNG开始被很多大模型应用比如ChatNio[1]采用，在大模型时代发挥了巨大作用。本文将介绍如何基于docker部署私人的S
信息收集之子域名收集，子域名爆破_dnsdumpster 2401_89829398 网络
「作者主页」：士别三日wyx「作者简介」：CSDNtop100、阿里云博客专家、华为云享专家、网络安全领域优质创作者「专栏简介」：此文章已录入专栏《网络安全快速入门》子域名收集一、域名爆破原理二、搜索引擎收集子域名三、第三方网站收集子域名1.VirusTotal2.DNSdumpster四、工具收集子域名子域名就是下一级域名的意思，比如map.baidu.com和image.baidu.com就是
添加 ChatGPT/Grok/Gemini 到浏览器搜索引擎 YiYueHuan 搜索引擎 Grok ChatGPT
添加ChatGPT/Grok/Gemini到浏览器搜索引擎添加ChatGPT/Grok/Gemini到浏览器搜索引擎如何添加步骤1:打开浏览器设置步骤2:添加新搜索引擎步骤3:保存设置注意事项添加ChatGPT/Grok/Gemini到浏览器搜索引擎在使用ChatGPT/Grok/Gemini进行对话时，每次都需要先打开对应的网页，然后再进行对话，非常繁琐。因此，我们可以将这些工具添加到浏览器的搜
国内外AI搜索产品盘点 Suee2020 人工智能
序号AISearch产品名简介网站开发者1Perplexity强大的对话式AI搜索引擎https://www.perplexity.aiPerplexity2GensparkAIAgent搜索引擎https://www.genspark.aiMainFunc（景鲲、朱凯华）3Kimi.ai智能助手https://kimi.moonshot.cn/月之暗面（杨植麟）4秘塔AI搜索AI搜索引擎http
Elasticsearch大文件检索性能提升20倍实践（干货）_elasticsearch 查询优化 2401_84247505 2024年程序员学习 elasticsearch jenkins 大数据
3、问题排查与定位步骤1：限定返回记录条数。不提供直接访问末页的入口。baidu，360，搜狗等搜索引擎都不提供访问末页的请求方式。都是基于如下的请求方式：通过点击上一下、下一页逐页访问。这个从用户的角度也很好理解，搜索引擎返回的前面都是相关度最高的，也是用户最关心的信息。Elasticsearch的默认支持的数据条数是10000条，可以通过post请求修改。最终，本步骤将支持ES最大返回值100
百度蜘蛛池是什么 asdjka2wfd 百度百度小程序百度云算法
百度蜘蛛池是一种SEO策略或程序，旨在吸引百度搜索引擎的爬虫（百度蜘蛛）更频繁地访问和收录网站内容5。以下是关于它的详细介绍：构成要素：通常包括大量的域名资源、强大的服务器支持以及复杂的链接结构。大量的域名数量众多，来源多样；强大的服务器是为了承载众多域名的运行和大量的访问请求，确保稳定和高效的服务；而复杂的链接结构则将各个域名和页面相互连接，形成一个有机的整体，引导蜘蛛在其中爬行。www.sgs
算法在各领域的广泛应用：100 个实例全解析软件职业规划 AI&模型算法
一、互联网与信息技术领域搜索引擎算法：如谷歌的PageRank算法，用于根据网页的重要性和相关性对搜索结果进行排序，帮助用户快速找到所需信息。推荐系统算法：例如亚马逊和Netflix使用的协同过滤算法。根据用户的历史行为（购买、观看记录等）和其他相似用户的偏好，为用户推荐可能感兴趣的产品或内容。社交网络分析算法：用于分析社交网络中的用户关系，如Facebook通过算法发现用户的好友推荐、社区划分等
springboot 整合 elk （Elasticsearch+Logstash+Kibana）高大王竟然被注册 spring 运维
Elasticsearch是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。Logstash是一个完全开源的工具，他可以对你的日志进行收集、过滤，并将其存储供以后使用（如，搜索）。Kibana也是一个开源和免费的工具，它Kibana可以为Logstash和ElasticSearch提供的日志分析友好的Web界
信息检索系统评估指标的层级分析：从单点精确度到整体性能度量人工智能深度学习llm检索系统
在构建搜索引擎系统时，有效的评估机制是保证系统质量的关键环节。当用户输入查询词如"machinelearningtutorialspython"，系统返回结果列表后，如何客观评估这些结果的相关性和有效性？这正是信息检索评估指标的核心价值所在。分析用户与搜索引擎的交互模式，我们可以观察到以下行为特征：用户主要关注结果列表的前几项对顶部结果的关注度显著高于底部结果用户基于多次搜索体验形成对搜索系统整体
泛目录程序：站群策略在SEO优化中的优势与应用奥顺互联_老张站群 php 数据库缓存搜索引擎
泛目录程序案例：站群策略在SEO优化中的优势与应用引言在当今竞争激烈的互联网环境中，搜索引擎优化（SEO）已成为企业提升在线可见性和流量的关键策略。泛目录和站群作为SEO优化中的两种重要策略，近年来备受关注。本文将通过具体案例，深入探讨这两种策略在SEO优化中的优势与应用。一、泛目录的定义与优势1.1泛目录的定义泛目录是指通过创建大量内容相关、结构相似的目录页面，覆盖广泛的搜索关键词，从而提升网站
SEO 优化前端岳大宝前端核心知识总结前端 html
以下是SEO（搜索引擎优化）的基础知识点梳理，从前端技术、内容策略到搜索引擎原理，覆盖核心优化方向：一、SEO基础概念定义与目标SEO是通过优化网站结构、内容和技术，提升网站在搜索引擎自然搜索结果中的排名，吸引更多免费流量。核心目标：满足用户搜索意图，同时符合搜索引擎爬虫的抓取规则。搜索引擎工作原理爬取（Crawling）：搜索引擎蜘蛛（如Googlebot）抓取网页内容。索引（Indexing）
HTML标记语言＜head＞中的几个元素 2301_79698214 html 前端
在HTML文档中，部分包含了文档的元数据（metadata），这对于网页的正确显示和搜索引擎优化（SEO）非常重要。部分通常包含以下几个重要的元素：：定义了网页的标题，这个标题会显示在浏览器的标题栏或页面的标签上。例如：我的网页：用于定义网页的元数据，如字符集、页面描述、关键词、作者、视口设置等。例如：：用于链接外部资源，如CSS文件、图标（favicon）等。例如：：用于直接在文档中嵌入CSS样
文件关键字搜索技术要点与实战体制教科书
本文还有配套的精品资源，点击获取简介：在IT行业中，能够通过输入关键字高效定位和管理大量文档是一项重要的技能。此功能通常集成于文件管理软件、搜索引擎或脚本程序中。技术实现包括文件系统API、文本搜索算法和文件过滤规则。本文将详细介绍这些技术要点，例如使用文件系统API遍历文件、采用高效文本搜索算法（如Boyer-Moore）以及应用文件过滤规则（包括类型筛选和正则表达式匹配）。特殊文件格式如Out
Python 爬虫基础教程盛子涵666 python 爬虫开发语言
爬虫的背景与应用诞生爬虫（WebCrawling）是自动化程序，用于从互联网上获取信息。爬虫的基本任务是自动访问网站，通过抓取网页内容并提取有用数据来构建数据库、索引或者进行进一步的数据分析。爬虫通常会模拟浏览器的行为，以避免被服务器识别为机器人，并且能够在大规模范围内高效地抓取信息。爬虫技术最早由搜索引擎开发者提出，目的是自动收集网页信息并将其索引，便于用户搜索时快速检索相关内容。随着互联网的快
爬虫的精准识别：基于 User-Agent 的正则实现 Small踢倒coffee_氕氘氚经验分享笔记
##摘要随着互联网技术的飞速发展，网络爬虫在数据采集、搜索引擎优化等领域的应用日益广泛。然而，恶意爬虫的存在也给网站安全和数据隐私带来了严重威胁。因此，精准识别爬虫行为成为网络安全领域的重要课题。本文提出了一种基于User-Agent正则表达式的爬虫识别方法，通过分析User-Agent字符串的特征，构建正则表达式规则，实现对爬虫的精准识别。实验结果表明，该方法具有较高的识别准确率和较低的误报率，
Java线程协作式中断机制超人汪小建(seaboat) 线程协作式中断机制 jvm
跟着作者的65节课彻底搞懂Java并发原理专栏，一步步彻底搞懂Java并发原理。作者简介：笔名seaboat，擅长工程算法、人工智能算法、自然语言处理、计算机视觉、架构、分布式、高并发、大数据和搜索引擎等方面的技术，大多数编程语言都会使用，但更擅长Java、Python和C++。平时喜欢看书写作、运动、画画。崇尚技术自由，崇尚思想自由。出版书籍：《Tomcat内核设计剖析》、《图解数据结构与算法》
美司法部考虑分拆谷歌：美国司法部在谷歌垄断在线搜索市场后，正在考虑的惩罚谷歌选择中，包括将谷歌分拆这种罕见的举措。百态老人笔记
1.案件背景与起因1.1美国司法部对谷歌提起诉讼美国司法部对谷歌提起诉讼的背景是该公司在在线搜索市场的主导地位引起了反垄断的担忧。司法部认为谷歌通过排他性协议和财务激励手段，限制了其他搜索引擎的发展空间，从而损害了市场竞争。诉讼时间：诉讼始于2020年，由美国司法部联合52个州及司法辖区的检察长共同发起。诉讼焦点：主要聚焦于谷歌与设备制造商、无线服务商等签订的独家协议，这些协议使谷歌搜索成为默认选
AI编程方法第二弹：边提问边调整 leeshuqing AI编程 AI编程
AI编程的提问词非常类似于传统搜索引擎中的检索词，虽然采取了自然语言表示，但是在获取结果的策略上却很一致。因为用户在一开始可能并不非常清楚AI编程工具如何理解用户的提问，因此输出结果可能并不能完全满足用户要求，此时用户可以不断的根据生成结果，动态的灵活的调整提问，使之不断趋近于自己满意的结果。比如，对于“Python”等任意英文单词，允许用户指定总宽度后，通过自动填充空格，使之总宽度尽可能等于该宽
网站外链影响网站排名吗为什么霏霏看世界搜索引擎百度百度小程序百度云算法
权重传递：搜索引擎认为，如果一个网站被其他高质量、权威的网站所链接，就像是获得了这些网站的“信任投票”。高质量的外链能够将一部分权重传递给目标网站，提升其在搜索引擎眼中的重要性和可信度，从而有助于提高排名。例如，在学术领域，一篇论文被众多知名学术期刊引用，那么这篇论文的学术价值和影响力就会被认可，类似地，网站获得权威网站的外链，也会被搜索引擎认为更有价值。www.czyhjy.cn增加爬行入口：搜
【爬虫实战】python入门爬取猫眼电影排行进击的C语言爬虫自动化网络
爬虫爬虫概述应用场景：1、抓取特定网站或应用的内容，提取出有价值的信息。2、模拟用户在浏览器或应用中的操作，实现自动化流程。爬虫是什么专业术语：网络爬虫（又称网页蜘蛛、网络机器人）网络爬虫是一种自动按照特定规则抓取网页信息的程序或脚本。爬虫起源随着网络的迅猛发展，万维网成为海量信息的载体，如何有效地提取和利用这些信息成为一项巨大挑战。搜索引擎如Yahoo、Google、百度等，作为帮助人们检索信息
分布式系统架构设计原理与实战：理解并使用分布式搜索引擎 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍在当代互联网时代，随着互联网的迅速发展、信息量的爆炸性增长，人们对获取新信息的渠道越来越多，需要快速而准确地检索信息。基于这一需求，许多网站都提供搜索功能。目前，搜索引擎服务主要由传统的基于数据库检索技术向云端托管的检索服务器和搜索引擎框架组成。由于传统的基于数据库检索方式具有很高的查询效率，因此可以满足一般用户的搜索需求；但是，对于一些高级的功能要求或是特
MindSearch: 革新人工智能搜索引擎的未来 2401_87189860 人工智能搜索引擎
MindSearch:革新人工智能搜索引擎的未来在人工智能和大语言模型快速发展的今天,搜索引擎领域正迎来新的变革。由上海人工智能实验室开发的MindSearch项目,正是这场变革中的佼佼者。MindSearch是一个开源的AI搜索引擎框架,它通过模仿人类思维过程,为用户提供深度的AI搜索能力。本文将深入探讨MindSearch的特点、工作原理以及它对未来搜索技术的影响。MindSearch的核心特
Scira：极简AI驱动搜索引擎开源项目精选人工智能
Scira（原名MiniPerplx）是一款极简的AI驱动搜索引擎，可帮助您在互联网上查找信息。它由VercelAISDK提供支持，并可使用Grok2.0等模型进行搜索。Stars数7,186Forks数845主要特点AI驱动的智能搜索：借助Anthropic的模型，快速获取问题的答案，让搜索变得更加智能化。网页搜索：使用Tavily的API来进行高效的网页搜索，无需额外的插件即可快速得到网页内容
9.3 智谱AI大模型生态爆发！中文准确率89.2%+代码生成67.3%，全面碾压GPT-4！少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力人工智能语言模型 gpt
智谱AI大模型生态爆发！中文准确率89.2%+代码生成67.3%，全面碾压GPT-4！1.WebGLM：联网检索增强大模型智谱AI于2022年推出的WebGLM是基于GLM-10B打造的检索增强生成（RAG）模型，其创新性地将大语言模型与搜索引擎深度整合，构建了独特的四阶段处理架构：
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D