sosoft_dzz

基于 Hibernate搜索的数据库全文检索系

1
概述数据库与全文检索系统的部署不同步，或是由于某些原因造

Internet中 80%的数据是属于网络隐藏的，虽然网络隐藏成索引库文件丢失时，手动模式可以依据数据库中数据恢复
的数据可以被访问，但却难以被搜索引擎检索，这些网络隐Lucene索引库。
藏的数据大多被存储在关系数据库中 [1]。而关系数据库本身(2)数据处理模块：它与索引更新模块有着紧密的联系，

提供的检索服务还有很多不足，例如：受分词技术的制约，主要负责对 Lucene不能直接处理的数据进行预处理工作，以

其全文检索服务不能很好地支持中文。对于存储在数据中的及提取数据中与数据处理相关联的信息。数据处理模块主要
非结构化数据，如采用二进制格式存储的文本文件，可能是由处理桥 (HandlerBridge)构成，数据通过这些处理桥的处理
PPT, PDF或 Excel等多种类型，这些文件中的有用文本信息便能交予 Lucene建立索引了。
难以直接获取，数据库针对其内容提供的检索服务十分有限(3)查询模块：主要负责提供查询服务。查询模块依据外

且不易扩展。
部提供的查询参数，调用如日期、域内容、二次查询等相应

Hibernate搜索(Hibernate Search)是 Hibernate提供的一种的过滤器得到正确的查询结果。
开源的数据库检索工具。 Hibernate Search通过简单的设置和数据库全文检索系统的总体架构如图 1所示。
通用的 API，为数据持久域模型以及相应的 Hibernate框架[2]
提供全文检索支持。其内部调用 Apache Lucene[3]，提供了对
传统 Lucene API的支持，并且弥补了 Lucene在为复杂的对
象域模型建立索引时，难以应对诸如建立时间索引、处理索
引结构与对象域模型不匹配、查询不匹配等缺陷[4]。

本文针对现有数据库全文检索服务的不足，通过采用
Hibernate Search等技术设计了一个能较好支持中文的、易于
扩展的数据库全文检索系统。

2
系统总体架构
数据库全文检索系统主要包括以下 3个模块：

数据库
Lucene
索引库
DocumentDocumentDocument Search
索引更新查询
Time
Index
查询过滤器 HandlerBridge
Word PPTPDF
Hibernate
+
Hibernate Search
(1)索引更新模块：主要有自动和手动 2种工作模式。在
自动模式下，索引更新模块主要负责监听外部通过 Hibernate
对数据库的访问。当数据库中的数据发生更改时，索引更新
模块通过调用相应的事件处理器对 Lucene的索引库进行同
步更新。手动模式是对自动模式在特殊情况下的补充。手动
模式与自动模式的最大区别在于，在手动模式下建立索引无
需通过 Hibernate的事件监听器，而直接由用户进行操作。当
图 1 数据库全文检索系统的总体架构

3 相关技术细节

3.1 映射关系的建立
要实现通过
Lucene API对数据库的全文检索，就必须为
Lucene索引库中
Document与
Hibernate框架中的
POJO(Plain
Old Java Object)类建立映射关系。
Hibernate ORM与
Lucene
全文索引库之间的区别与联系如下：

(1)业务所要使用到的基础数据单元：1)Hibernate ORM：
对象持久化得到的
POJO(对应关系数据库中的记录)；
2)Lucene索引：
Document逻辑文件对象
(对应实际的物理
文件)。
(2)基础数据单元的组成结构：
1)Hibernate ORM：每个
POJO中包含有许多属性(对应关系数据库中单个记录的许多
字段)；2)Lucene索引：每个
Document包含很多
Field(这些
域对应物理文件的文件名、文件内容、创立时间等信息
)。
(3)针对数据单元提供的
CRUD操作：1)Hibernate ORM：
为持久化的
POJO提供了
update(), insert(), delete()等操作；
2)Lucene索引：提供了
addDocument(), delete()等增减
Document逻辑文件的操作。
(4)查询得到的结果集：1)Hibernate ORM：List容器存放
包含所要查询关键字的
POJO集；2)Lucene索引：Hits保存
有按由关键字相似度排序的
Document对象集。
由此可知，如果将
Hibernate关系映射框架中的
POJO与
Lucene索引库中的
Document对象建立映射关系，便可以实
现对数据库的全文检索。

以
POJO持久类
File为例，为其建立映射的代码如下：
@Entity
@Indexed
public class File {
@Id
@DocumentId
private Integer id;
@Field(index=Index.TOKENIZED, store=Store.YES)
@FieldBridge(impl=org.yankee.demo.bridge.NameBridge.class)
private String name;
@Field(index=Index.TOKENIZED, store=Store.NO)
@FieldBridge(impl=org.yankee.demo.bridge.HandlerBridge.class)

private byte[] content;
.}
如果去掉代码中“
@”定义的标签，则上述代码只是一

个普通的
POJO类。加上这些标签以后，
POJO对象本身及其
所包含的属性都与
Lucene中
Document对象及其所包含的
Field建立了一一对应的映射关系。其中主要标签的意义为：
@Indexed声明当前
POJO对象要被检索；@Id声明了当前
POJO对象的主键与
Document中的
DocumentId的匹配，通
过这种匹配，系统就可以查找到
Lucene索引库中
Document
对象所对应的
POJO；@Field声明了当前属性与
Document
中
Field的对应关系。通过上述设置，将数据库表中的记录与
Lucene索引库中的
Document建立关联，如图
2所示。

数据库中的
File表
Id( PM ) |name| content
.

Hibernate POJO File
Class File {
int id;
String name;
byte [ ] content
…}
Lucene Document
Field:DocumentID
图
2 关系数据库与
Lucene索引库的映射关系

3.2 大字段检索
数据库本身难以提供对非结构化数据的检索服务，这些
非结构化数据大多按二进制大字段格式存储，按其性质主要
分为
2类：(1)不可检索的文件，如视频、音频、图片等；

(2)可检索而数据库难以提供检索服务的文件，如
PPT, PDF,
Excel等文本文件，这一类数据是数据库全文检索的重点。
前文定义了
File的
Hibernate POJO类，Hibernate框架中
的
File类对应着数据库中的文件表。当要对数据库中存储的
文件建立索引时，系统先通过
Hibernate获取到文件所对应的
POJO对象，再依据
File类中定义的标签对对象中的不同属
性采取相应的处理方式。由于数据库中存储的文件格式多种
多样，因此系统先要判断出当前文件的所属类型。文件数据
处理过程如图
3所示。

Hibernate POJO File
Class File {
int id;
String name;
byte [ ] content;
.}
NamBridge
HandlerBridge
WordHandlerBridge
ExcelHandlerBridge
PDFHandlerBridge Type
Type？
Lucene
Document
图
3 文件数据处理过程

根据在
File类中@FieldBridge的设置，系统通过
Name
Bridge对象获取到所要检索文件的文件名并提取文件的类型
参数(filetype)，由于
HandlerBridge继承自
Namebridge，因此
HandlerBridge对象可以得到当前文件类型。如果文件是不可
检索的类型，则返回一个空串；否则根据文件的具体类型，
如
PDF, Excel等调用相应的
PDFHandlerBridge, ExcelHandler
Bridge等处理桥进行处理。

例如，当
ExcelHandlerBridge接收到传输给它的二进制
信息时，转换桥会先将这些二进制信息转换为字符串数据。
根据
Excel文件的结构，转换桥会逐个提取其中的
Sheet，对
于文件中的每一个
Sheet，按行和列的顺序读取其中非空
Cell
小方格中的文本数据。通过这样的处理，系统便得到了以二
进制格式存储的
Excel文件中的文本信息，并将文本信息交
予
Lucene建立索引。
Lucene索引建立之后，系统便能通过
查找索引实现全文检索。

为了能提供对多种格式文本文件的全文检索需要，在
Apache以及其他开源组织提供的
API基础上，笔者为系统开
发了支持
PDF, Excel, PPT等格式的处理桥。根据实际需要，
通过扩展桥的种类，系统也可以提供对其他类型文件的支持。

3.3 中文分词
为了让全文检索工具能够较好地支持中文，采用成熟的
中文分词器是必不可少的。在建立索引的过程中，为了能满
足中英文混合查询的需要，系统采用了中科院的
JE-Analysis
分词器作为
Lucene API建立索引时的默认分析器。这种分词
器采用正向最大匹配算法进行中文分词。机械匹配式的切分
词方法已经相当成熟了，其中最大匹配算法是机械匹配式切
分词方法的代表算法，该算法已被国内很多研究机构采用
[5]。
通过采用成熟的中文分词工具，全文检索系统便可以较好地
支持中文。在实际使用中根据应用需要，通过修改配置文件
系统也能够采用其他更适合的分词工具。

3.4 倒排索引的建立与更新
数据库全文检索的对象是数据库中的数据。数据库作为
信息存储的核心，其存储的数据更新频繁，因此，要实现对

—75—

数据库的全文检索就要保持索引库与数据库间的同步更新。

在
Hibernate上配置事件监听器可以有效捕捉数据库的
更新。通过在
hibernate.cfg.xml配置文件上配置
update, insert,
delete 3类事件的监听器及其事件处理对象，便能在数据库中
的数据改变时对
Lucene索引库进行同步更新。索引库的更新
操作主要包括以下
2个方面：

(1)建立
Lucene索引：当数据库中有新的数据被插入时，
设置在
Hibernate中的事件监听器便可以捕捉到这一事件，通
过事件处理对象调用
Lucene API，建立对应的
Document对
象并存储在索引库中。
(2)删除
Lucene索引：利用
Hibernate Search技术所建立
的映射关系，通过事件监听器，当数据库中的文件表项被删
除时，系统便会同步删除索引库中对应主键的
Document。
3.5
数据查询
系统最初的查询对象是
Lucene索引，当用户输入关键字
并选择了相应的查询条件后，系统根据对应的查询条件调用
过滤器处理并返回正确结果。要对某个
POJO类使用过滤器，
需要在该
POJO类中写入标签，指明该类将会用到的过滤器，
代码如下：

@FullTextFilterDefs ({

@FullTextFilterDef(name = "keywordFilter",

impl = KeywordFilterFactory.class),

@FullTextFilterDef(name = "dateFilter",

impl = DateFilterFactory.class),

.})

过滤器可以对查询的结果进行限制，如对文件上传日期
的过滤，对某个域的内容进行过滤等。常用的过滤器有日期
过滤器、域内容过滤器以及二次查询过滤器。

(1)日期过滤器：系统实现的日期过滤器继承自
Lucene
的
RangeFilter，通过设置天数来限制查询结果。当用户想查
找最近一个月内的文件，只需设置过滤条件为
30天，也可以
通过输入起始时间和终止时间来限制得到某段时间内相应的
结果。
(2)域内容过滤器：通过输入域名称和过滤关键字来进行
过滤。当用户希望搜索结果的文件名中带有“
book”这个单
词，则设置域过滤器域名称为“filename”，域关键字为“book”。
通过域内容过滤器也可以实现结果保密性的过滤，只需在对
应的
POJO类中增加一个保密性的域，并指定保密程度。搜
索时根据不同用户的权限来过滤可搜索的范围。
(3)二次查询过滤器：如果用户希望在某次搜索的结果中
进行再搜索，则需要二次查询过滤器。通过将上一次搜索的
关键字和条件作为过滤器的条件进行设置，则第
2次查询的
范围会被限制在第
1次查询的结果之内。另外也可以对一个
查询同时使用多个过滤器。在实际过程中，还可以根据需要
开发更多的过滤器。
过滤器在实际查询中的调用顺序由于采用的是交集，因
此，对查询结果没有影响，但对查询的效率会有一定影响。
查询时应该根据查询条件，尽量先采用能够一次性过滤最多
数据项的过滤器，其次采用能过滤次多数据项的过滤器，以
此类推。系统通过过滤器获得需要的查询结果后，再根据结
果集中的
Documented获取对应的
Hibernate POJO集。

4
实验分析
在数据库全文检索系统的基础上，使用实现的系统和直
接采用
Lucene API这
2种方式，分别对存储在数据库和存放

在硬盘目录上不同大小的纯文本
Word文档建立索引并进行
对比。实验的硬件设备为：
CPU AMD 3800+双核，主频
2.0 GHz，内存
DDR2667, 1 GB，硬盘
7 200转。实验采用
MySQL5.0数据库以及相同的分词器。实验结果数据见表
1。
表
1 文件建立索引的实验对比结果

建立索引的时间
/ms

Word文档大小
/KB
Disk Database

28 1 140 1 453
68 1 235 1 438
161 1 266 1 875
265 1 422 1 735
445 1 313 1 672
861 1 359 1 907
1 511 1 453 1 953
3 631 2 031 3 047
5 887 1 734 3 718
8 838 2 297 4 500

表
1中的
Disk行表示直接采用
Lucene API对存储在硬
盘文件目录不同大小
Word文档建立索引的时间；
Database
行表示采用所实现的数据库全文检索模块对存储在数据库中
相对应
Word文档建立索引的时间。对比实验中的数据源都
是相同的
Word文档集，只是文档的存储方式不同。

实验表明，同样采用
Lucene API作为检索引擎的核心，
数据源为
Word文档时，对硬盘文件目录建立索引的效率要
比系统对数据库建立索引的效率高，并且随着数据源增大对
数据库文件建立索引的时间消耗增长更明显。

对数据库建立索引时效率较低，主要是由数据库的存取
方式决定的，但是这种效率上的差距并不影响对关系数据库
建立索引的意义。因为对数据库建立索引并实现对数据库全
文检索是对数据库存储优势的进一步补充，且文献
[6]实验证
明，通过对数据库建立
Lucene索引能有效提高数据挖掘的
效率。

5
结束语

本文结合
Hibernate Search技术及
Lucene等开源工具，
实现了一个能对关系数据库中的数据进行全文检索的原型。
该原型能满足对数据库中的结构化数据以及多种文本类型的
非结构化数据的检索需要，在权限允许的条件下可以提供安
全高效的站内数据库检索服务。
Hibernate与
Lucene相结合，
可以充分发挥两者的优势，确保了检索的高效性，实现了索
引库与数据库的同步。

参考文献

[1] Bohlen M, Bukauskas L, Dyreson C. The Jungle Database Search
Engine[C]//Proc. of the ACM SIGMOD International Conf. on
Management of Data. San Diego, California, USA: [s. n.], 1999.
[2] Bauer C, King G. Hibernate in Action[M]. Greenwich, CT, USA:
Manning Publications Co., 2005.
[3] Hatcher E, Gospodnetic O. Lucene in Action[M]. Greenwich, CT,
USA: Manning Publications Co., 2005.
[4] Hibernate. Hibernate Search[Z]. (2008-01-01). http://www. hibernate.
org/410.html.
[5]
张滨, 李文翔, 夏德麟
, 等. 基于汉语句模的中文分词算法
[J].
计算机工程
, 2004, 30(1): 1-3.
[6]
Zhou Ning, Wu Jiaxin, Zhang Shaolong. Mining Weighted
Association Rules with Lucene Index[C]//Proc. of WiCom’07.
Shanghai, China: [s. n.], 2007.

【部署k8s集群时，彻底删除calico、flannel网络插件】 Yang三少喜欢撸铁 Docker技术实战应用 kubernetes 网络容器
文章目录前言一、直接执行以下命令删除网络插件1.执行下面命令，网络插件名称对应自己部署的前言提示：在部署k8s分别是集群的时候，遇到网络插件执行后不可用，一直导致pod状态无法显示完成，只能彻底删除网络插件，再重新安装其他网络插件。一、直接执行以下命令删除网络插件1.执行下面命令，网络插件名称对应自己部署的代码如下（示例）：kubectldelete-f网络插件名称.yamlmodprobe-ri
Git cherry-pick 详解 ChampionDragon Git git cherry-pick
gitcherry-pick:单独合并一个提交gitcherry-pick-x：同上，不同点：保留原提交者信息。gitcherry-pick..gitcherry-pick^..前者表示把到之间(左开右闭，不包含start-commit-id)的提交cherry-pick到当前分支；后者有”^”标志的表示把到之间(闭区间，包含start-commit-id)的提交cherry-pick到当前分支。
蓝桥杯单片机刷题——串口控制指示灯与数码管显示 lzb759 一个月备赛蓝桥杯单片机蓝桥杯单片机
设计要求通过串口发送字符控制数码管的显示，串口接收字符’A’，数码管显示’A’，且LED1指示灯亮；串口接收字符’S’，数码管显示’S’，且LED3指示灯亮；接收其它非法字符时，数码管显示’E’。数码管显示格式如下：备注单片机IRC振荡器频率设置为12MHz。串口通信波特率：9600bps。按键模式：BTN；扩展方式：IO模式。上电时数码管处于熄灭状态。除字符’A’和’S’外，其它字符均为非法字符
Flowable/Activiti系列之五：流程引擎远程调用时透传任意复杂的业务对象无级程序员 flowable activiti 流程引擎微服务
系列文章：Flowable(Activiti)系列之一：中会签（多实例）使用方法以及ExecutionListener和TaskListener的区别Flowable(Activiti)系列之二：不用自己写代码，使用Flowable-ui的Rest接口Flowable(Activiti)系列之三：docker运行flowable-ui，存储到mysql/postgres数据库，支持arm64架构F
Python小练习系列 Vol.10：埃氏筛法（高效素数筛选）滴答滴答滴嗒滴 Python 小练习 python 算法开发语言
Python小练习系列Vol.10：埃氏筛法（高效素数筛选）✨本期带你掌握一个古老但高效的算法——埃拉托色尼筛法（SieveofEratosthenes）。埃拉托斯特尼筛法，简称埃氏筛或爱氏筛，是一种由希腊数学家埃拉托斯特尼所提出的一种简单检定素数的算法。要得到自然数n以内的全部素数，必须把不大于根号n的所有素数的倍数剔除，剩下的就是素数。一、题目描述给定一个正整数n，请找出所有小于等于n的素数（
Python小练习系列 Vol.4：迷宫寻路（回溯 + DFS）滴答滴答滴嗒滴 Python 小练习深度优先 python 算法
Python小练习系列Vol.4：迷宫寻路（回溯+DFS）本期我们将探索一个二维世界，借助回溯算法帮助角色走出迷宫！这是学习路径搜索类题目的经典案例。一、题目描述给定一个二维迷宫地图（由0和1组成），其中0表示可以通行，1表示障碍。请找出从起点(0,0)到终点(n-1,m-1)的一条可行路径（若存在），并打印路径坐标。示例输入：maze=[[0,1,0,0],[0,0,0,1],[1,1,0,1]
Docker学习--容器生命周期管理相关命令--run命令 geek_super docker 学习容器
run命令的作用：创建并启动一个新的容器。语法：dockerrun[参数选项]IMAGE（要运行的容器镜像）[COMMAND]（在容器内部执行的命令）[ARG…]（传递给command的参数）参数解释：-d:后台运行容器并返回容器ID。-it:交互式运行容器，分配一个伪终端。–name:给容器指定一个名称。-p:端口映射，格式为host_port:container_port。-v:挂载卷，格式为
Linux 指令篇：du 命令详解 Stay Passion Linux linux 运维
前言du（diskusage）命令用于统计目录和文件的磁盘使用情况，适用于分析磁盘空间占用。1.du命令的基本用法常用参数-h：以人类可读格式（KB/MB/GB）显示大小。-s：仅显示目录的总大小，不显示子目录大小。-c：输出总计（total）。-a：列出所有文件和目录的大小。-b：以字节为单位显示大小。-m：以MB为单位显示大小。-k：以KB为单位显示大小（默认单位）。--exclude="*.
MinIO 入门指南：快速搭建自己的对象存储服务滴答滴答滴嗒滴入门指南服务器 ubuntu linux
随着数据规模的不断增长，存储和管理数据变得越来越重要。而MinIO是一个优秀的对象存储解决方案，它是一个高性能、轻量级的对象存储服务器，兼容AmazonS3API，本文将带你了解MinIO的基本概念、安装方法以及如何使用它搭建自己的对象存储服务。1.什么是MinIO？MinIO是一个高性能、轻量级的对象存储服务器，专为大规模数据存储和分析而设计。它兼容AmazonS3API，可以无缝替代Amazo
intel c++ compiler的优化选项有哪些，数值计算程序中哪些选项比较重要东北豆子哥 C++c++
IntelC++编译器（ICC/ICX）提供了丰富的优化选项，特别针对数值计算程序（如科学计算、HPC、金融建模等）进行了大量优化。以下是关键优化选项的总结及数值计算中的重点推荐：一、通用优化选项优化级别：-O1：基本优化，保证编译速度。-O2：默认级别，平衡代码大小与性能。-O3：激进优化（可能增加代码大小），数值计算推荐。-Ofast：启用-O3+非严格标准合规的优化（如快速数学），适合对精度
Api架构设计--- HTTP + RESTful 马达加斯加D #系统设计/设计模式 http restful pandas
Api架构设计---HTTP+RESTful什么是RESTfulRESTful设计原则RESTful接口类型RESTful状态码RESTfulUri设计原则Api传参：QueryString和UriPathRESTful和HTTP的区别注意事项什么是RESTfulRESTful（RepresentationalStateTransfer）是一种基于HTTP协议设计网络应用程序接口（API）的架构风
C# --- LINQ 马达加斯加D #C#---语法糖 c#linq 开发语言
C#---LINQ什么是LINQFluentSyntax和SQL-LikeQueryLINQOperations什么是LINQLINQ的全称为LanguageIntegratedQuery,为各种查询(包括对象查询，数据库查询，XML查询)提供了统一模型.LINQ源于SQL，但比SQL更加强大，更加灵活.LINQ可以用类似于SQL的形式对C#Collection中的对象进行查询LINQ可以在代码中
蓝桥杯单片机竞赛——串口通信程序设计微康测控蓝桥杯单片机嵌入式硬件
目录一、竞赛板串口通信相关资料解析2、单片机串口接收数据解析3、返回指令格式二、程序设计1、串口1初始化程序2、串口1中断服务函数设计3、接收信息分析处理函数（1）分析指令函数结构（2）查询数据指令程序（3）查询参数指令程序（4）查询参数指令程序程序包链接一、竞赛板串口通信相关资料解析串口通信在蓝桥杯单片机竞赛中出现的次数不多，串口通信对竞赛学生来说也相对难一些，好在竞赛中考点不是很多，由于竞赛板
智能优化算法应用：基于JAYA算法与双伽马校正的图像自适应增强算法智能算法研学社（Jack旭）智能优化算法应用图像增强算法计算机视觉人工智能
智能优化算法应用：基于JAYA算法与双伽马校正的图像自适应增强算法-附代码文章目录智能优化算法应用：基于JAYA算法与双伽马校正的图像自适应增强算法-附代码1.全局双伽马校正2.JAYA算法3.适应度函数设计4.实验与算法结果5.参考文献6.Matlab代码摘要：本文主要介绍基于JAYA算法与双伽马校正的图像自适应增强算法。1.全局双伽马校正设图像的灰度值范围被归一化到[0,1]范围之内，基于全局
远程温度控制系统设计与实现（含有源码）妄北y xcode macos ide 单片机嵌入式硬件
1.引言在现代工业及家庭生活中，温度控制技术扮演着关键角色。随着人们对生活质量的不断追求，温度控制系统的需求日益增加。本项目旨在设计一个基于微控制器的远程温度控制系统，主要功能包括温度监测、温度设定及无线通信。2.系统设计概述2.1设计任务本项目的设计任务包括：设计远程温度控制系统，电烤箱温度可由人工设定，控制范围室温至125℃。采用PID控制算法实现温度实时控制，并能显示实际温度值。实现无线发送
面经分享，中科创达（安卓开发，二面挂）慕容魏 java 开发语言
首先是评价，公司属于是新成立的外资合资企业，主要是对德和对日。然后一面线上面试很简单，二面线下技术主管和HR一起面试，强度较大比较细腻，但是面试官很温和很耐心。一面（因为是安卓开发，不对口，就只问了Java）1.Java高并发多线程理解，线程池参数2.Java集合3.list具体，以及和map区别4.hashmap的底层原理5.数据结构，集合队列和树6.项目里面的和安卓开发有关吗，讲解一下7.排序
C++代码随想录刷题知识分享-----长度最小的子数组 HR Zhou C++代码随想录刷题知识分享 c++算法 leetcode 数据结构
给定一个含有n个正整数的数组和一个正整数s，找出该数组中满足其和≥s的长度最小的连续子数组，并返回其长度。如果不存在符合条件的子数组，返回0。示例：输入：s=7,nums=[2,3,1,2,4,3]输出：2解释：子数组[4,3]是该条件下的长度最小的子数组。提示：1&nums){intn=nums.size();intleft=0;intsum=0;intminLen=INT_MAX;for(in
centos 配置 rabbitmq环境(zookeeper单机环境配置) hongdu_dudua1 java java zookeeper rabbitmq erlang centos
在安装环境之前，相信已经了解了为什么要使用中间件？以及使用中间件的好处？主要优势：1：系统解耦2：异步调用3：容纳流量中间件的主要用来：存储消息和转发消息的，这个消息可以定义为通信载体--》通信载体可以定义为任何的请求报文和响应报文。rabbitmq使用erlang语言开发，所以无论在哪个系统上面，想要使用rabbitmq中间件，必须先安装依赖erlang。安装过很多次erlang和mq，但是最后
基于Web技术的体育赛事咨询平台设计与实现(源码+定制+开发）体育赛事信息查询平台的开发、在线体育赛事咨询与数据服务系统开发、基于Web技术的多功能体育赛事信息平台程序员阿龙 SpringBoot实战项目 JAVA精选毕设 Web技术体育赛事平台毕业设计体育赛事信息查询系统体育赛事咨询与互动平台在线体育赛事数据分析赛事结果查询与资讯平台体育新闻与赛事分析系统
博主介绍：✌我是阿龙，一名专注于Java技术领域的程序员，全网拥有10W+粉丝。作为CSDN特邀作者、博客专家、新星计划导师，我在计算机毕业设计开发方面积累了丰富的经验。同时，我也是掘金、华为云、阿里云、InfoQ等平台的优质作者。通过长期分享和实战指导，我致力于帮助更多学生完成毕业项目和技术提升。技术范围：我熟悉的技术领域涵盖SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nod
2025年渗透测试面试题总结-某长亭-安全开发工程师（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全红蓝攻防 web安全 python java
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录长亭-安全开发工程师一、Nmap扫描方式与TCP握手阶段对应关系1.1基础扫描类型与原理1.2高级扫描技术扩展1.3云环境与IPv6扩展二、进程/线程/协程应用场景2.1核心概念与资源模型2.2现代架构演进2.3安全与调试考量三、浏览器多窗口/标签进程模型3.1架构设
推荐算法分析乘秋川毕设推荐算法
一、性能分析指标1.准确性指标（AccuracyMetrics）衡量推荐系统预测评分的准确性，包括：✅RMSE（均方根误差,RootMeanSquaredError）解释：衡量预测评分(\hat{r}_i)和真实评分(r_i)之间的偏差，数值越低表示误差越小。适用场景：适用于评分预测任务，比如电影评分推荐（1~5星）。缺点：对大误差更敏感，如果有极端值（outliers），RMSE可能会偏大。✅M
蓝桥杯嵌入式第十届省赛解析花落已飘蓝桥杯嵌入式蓝桥杯 c++职场和发展
文章目录前言一、题目解析二、LCD高亮显示三、E2PROM如何存储小数部分四、参数合理性判断五、完整代码总结前言本篇文章将为大家讲解第十届省赛题目，总的来说题目的难点就是EEPROM的数据存储，因为这里涉及到了小数的部分，其他的其实都是不难的。一、题目解析本届题目主要考察了LCD显示，LED控制，模拟电压输入，按键输入E2PROM数据存储，这些都是非常常规的操作起来并不难，值得一讲的就是数据存储和
什么是AI大模型?常见的AI大模型有哪些? AI产品经理人工智能机器学习深度学习自然语言处理 gpt
什么是AI大模型？在人工智能领域，"AI大模型"的官方概念通常指的是具有大量参数的机器学习模型，这些模型能够捕捉和学习数据中的复杂模式。参数是模型中的变量，它们在训练过程中不断调整，以便模型能够更准确地进行预测或分类任务。AI大模型通常具有以下特点：高参数量：AI大模型含有数百万甚至数十亿的参数，这使得它们能够学习和记忆大量信息。深度学习架构：它们通常基于深度学习架构，如卷积神经网络（CNNs）用
Flutter完整开发实战详解(三、打包与填坑篇) 色的归属感 http udp https websocket 网络安全网络协议 tcp/ip
Flutter开发实战：打包流程、APP包对比与细节处理作为Flutter开发系列文章的第三篇，继前两篇基础篇和实战篇之后，本篇将为你着重展示Flutter开发过程中的打包流程、APP包对比、细节技巧与问题处理。一、打包流程1、Android打包在Android的打包上，Flutter提供了简洁的打包流程。在android/app/build.grade文件下，配置applicationId、ve
利用选择性振动激发实现单分子解离反应的动力学研究获进展 hdpai2018 科研资讯
如何选择性地控制分子的解离反应即化学键断裂是从化学反应到分子器件等诸多领域的核心问题。表面单个分子化学反应包括分子在表面的运动、化学键断裂等，都与分子的不同激发态直接相关。扫描隧道显微镜技术可以直接将非弹性隧穿电子注入到表面单个分子的电子激发态和振动激发态，并通过控制非弹性隧穿电子的能量和注入位置，实现单分子在表面的选择性激发，同时具有原子级的空间分辨率和高能量分辨率，是研究表面单分子解离反应的理
操作系統恐龍書第十版課後答案 ch12 單細胞生物系统架构
12.1Statethreeadvantagesofplacingfunctionalityinadevicecontroller,ratherthaninthekernel.Statethreedisadvantages.優點：bug不太可能導致系統崩潰；通過使用專用硬體和硬編碼演算法可以提高性能；通過將算法移出核心可以簡化缺點：bug更難修復改進演算法也需要硬體更新嵌入式演算法可能與應用程序對
在比分网中添加即时通讯功能（IM）的好处 Tina0898 比分网 IM功能体育直播站
作者：东奔西走的小喇叭链接：https://zhuanlan.zhihu.com/p/704060396来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。随着移动互联网的普及和智能手机的普遍应用，人们获取信息的方式发生了根本性的变化。在体育赛事领域，比分网因其及时、准确、全面的比分数据，成为了广大体育爱好者的必备工具。然而，随着用户需求的不断提升，单纯的比分服务已经无法
深入理解 C 语言头文件：从基础到高级应用烂蜻蜓 c语言算法开发语言
引言在C语言的编程世界里，头文件扮演着不可或缺的角色。无论是进行简单的程序开发，还是构建复杂的软件系统，头文件都能帮助我们组织代码，实现代码的模块化与复用。本文将深入探讨C语言头文件的各个方面，从其基础概念到高级应用，助您全面掌握头文件的使用技巧。一、头文件是什么头文件是扩展名为.h的文件，它包含了C函数声明、宏定义等内容，这些内容可被多个源文件引用共享。头文件主要分为两类：程序员编写的自定义头文
一个华科大差生的12年程序员工作总结 _findyi 互联网程序员职场认知程序人生
是的，这个差生说的就是洋哥本洋，高考结束以后，随着毕业季的到来，也来了很多大学生和刚工作没多久的读者。很多新读者问洋哥，让我指导下程序员的职场怎么发展、如何把工作做得更好，回答的多了，想着还不如写一篇自己整个职场的成长经历，或许对大家有一些价值。全文较长，大约4000字，需要一点点耐心去阅读：1.毕业的选择大学时期我是个彻头彻尾的学渣，大一大二都沉迷于游戏中，曾经住网吧17天，挂科无数，我也写了篇
蓝桥杯嵌入式题目 - 主观题精简知识点 PynRlang 蓝桥杯职场和发展嵌入式
嵌入式系统是一种专门设计用于特定应用领域的计算机系统，通常被用于控制、监测、测量和通信等任务。在蓝桥杯嵌入式比赛中，经常涉及到各种主观题，要求参赛者熟悉嵌入式系统的相关知识并能够灵活应用。本文将介绍一些常见的主观题知识点，并提供相应的源代码示例。嵌入式系统的基本概念嵌入式系统是一种特定功能的计算机系统，通常由处理器、存储器、输入/输出接口和操作系统组成。它们被设计用于嵌入到其他设备中，以执行特定的
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

基于 Hibernate搜索的数据库全文检索系

你可能感兴趣的:(基于 Hibernate搜索的数据库全文检索系)