E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
lucene2.4
初识elasticsearch
文章目录一、前言二、了解ES2.1elasticsearch的作用2.2ELK技术栈2.3elasticsearch和
lucene2.4
为什么不是其他搜索技术2.5总结三、倒排索引3.1正向索引3.2倒排索引
生生不息~
·
2023-11-30 16:58
微服务
elasticsearch
大数据
搜索引擎
SolrLucene优劣势分析详解
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch、solr的出现,lucene变得更加热。
HelloMy_World
·
2018-09-06 14:31
Solr\Lucene优劣势分析
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch 、solr的出现,lucene变得更加热。
weitao1026
·
2015-07-27 01:00
Lucene 源代码剖析-5 索引文件结构(4)
种文件:1.文档索引或.tvx文件:对每个文档来说,它把偏移(offset)存储进文档数据(.tvd)文件和域field数据(.tvf)文件版本包含的项数目类型描述全部版本TVXVersion1Int在
Lucene2.4
wbj0110
·
2014-08-08 11:00
Lucene
lucene3.0_IndexSearcher的基础使用及注意事项
lucene3.0_IndexSearcher的基础使用及注意事项较之
lucene2.4
版本,lucene3.0在indexSearcher这块变动比较大,从api可以直观的了解到。
hai0378
·
2013-08-06 15:00
IndexSearcher
lucene2.4
源码学习11 查询 tf
在termscore中计算得分的时候,用到tf的。tf就是这个term在这个文档出现的次数。怎么用到的呢:publicfloatscore(){ intf=freqs[pointer]; floatraw=//computetf(f)*weight f>>1;//shiftofflowbit if((docCode&1)!=0)//iflowbitisset freq=1;//freqi
huangyunbin
·
2013-05-13 09:00
Lucene
lucene2.4
源码学习10 查询 coord
lucene计算得分的时候要*coord,那这个coord是什么意思呢。就是这个document满足了多少个查询条件。如:Documentdoc=newDocument(); doc.add(newField("title","searchengine",Field.Store.YES,Field.Index.ANALYZED)); doc.add(newField("content","go
huangyunbin
·
2013-05-12 20:00
Lucene
lucene2.4
源码学习9 搜索 norm
public float score() { int f = freqs[pointer]; float raw = // compute tf(f)*weight f < SCORE_CACHE_SIZE // check cache
huangyunbin
·
2013-05-12 12:00
Lucene
lucene2.4
源码学习8 得分计算方法 Weight的变量部分
publicinterfaceWeightextendsjava.io.Serializable{ /**Thequerythatthisconcerns.*/ QuerygetQuery(); /**Theweightforthisquery.*/ floatgetValue(); /**Thesumofsquaredweightsofcontainedqueryclauses
huangyunbin
·
2013-05-12 11:00
Lucene
lucene2.4
源码学习7 构建查询树 rewrite
搜索结果的排序需要搜索得分的计算,计算得分与查询条件有关。所以第一步就是构建查询条件。 源码中的Weight 就是计算得分的方法,这个是依赖查询条件的构建的。 public Weight weight(Searcher searcher) throws IOException { Query query = searcher.rewrite(this);
huangyunbin
·
2013-05-12 10:00
rewrite
lucene2.4
源码学习6 搜索 TooManyClauses
在lucene的搜索中不少情况会报TooManyClauses的错,这个是因为查询条件太多了。报错的具体原因我们来分析下。在BooleanQuery:publicvoidadd(BooleanClauseclause){ if(clauses.size()>=maxClauseCount) thrownewTooManyClauses(); clauses.add(clause); }
huangyunbin
·
2013-05-12 10:00
Lucene
TooManyClauses
一、
lucene2.4
的创建和查询及其分词显示
1、工程目录2、lucene的创建搜索过程3、建立索引的示意图4、硬盘和内存中创建索引示意图5、lucene的创建及其搜索的代码packagecn.hj.lucene.helloworld; importjeasy.analysis.MMAnalyzer; importorg.apache.lucene.analysis.Analyzer; importorg.apache.lucene.docu
wxwzy738
·
2013-04-12 11:00
二、
lucene2.4
的增删改查及其查询语法
1、工程结构图2、排序的几种方式03、增删改查索引packagecn.hj.lucene.dao; importjava.io.IOException; importjava.util.ArrayList; importjava.util.HashMap; importjava.util.List; importjava.util.Map; importjeasy.analysis.MMAnaly
wxwzy738
·
2013-04-12 11:00
Solr\Lucene优劣势分析
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch 、solr的出现,lucene变得更加热。
lyacct
·
2013-04-09 11:00
Solr
Lucene
lucene2.9的改进
Lucene会在FieldCache中缓存字段信息,不过在
Lucene2.4
以及之前的版本中,加载字段缓存的开销相对较高,尤其在2.4版本中还会不断重新加
caihongshijie6
·
2013-04-05 16:00
Lucene
改进
2.4
2.9
lucene2.4
源码学习5 写文件之WaitQueue
lucene是多线程写文件的,但是也要写出来的文件号是从小到大的。也就是最后写的时候还需要一个同步的过程。 当文档号低的还没有生成完,但是另外一个线程的已经生成好一个文档号高的文档了,这个时候怎么办,这个时候文档号高的是不能写的,要等到文档号低的写完再写。 lucene的做法是把这些高的文档加入到一个队列,即WaitQueue。 这样当低文档写完的时候,还会去写准备好的高的文档。
huangyunbin
·
2013-03-17 10:00
多线程
Lucene
lucene2.4
源码学习4 写文件的脉络
lucene_写文件脉络lucene_写frq文件lucene_写tii和tis文件lucene_写fat_fdx文件.pnglucene_fnm的起点lucene_fnm信息添加lucene_写fnm文件
huangyunbin
·
2013-03-17 00:00
Lucene
lucene2.4
源码学习3 写文件的装饰者 + 责任链 模式
lucene写文件的装饰者+责任链模式,当时看的我是一头雾水。其实本来是很简单的,写的文件无非就是字段信息和term信息,但是lucene要保证多线程,所以很多方法后面有个PerThread。为了保证功能的单一和可扩展性,用了很多的Consumer,而这些Consumer的源头是Processor。最后问了实现filed的重用,有很多的类是以PerField结尾的。链同基本索引链有相似的树形结构,
huangyunbin
·
2013-03-16 15:00
Lucene
lucene2.4
源码学习2 lucene的基本文件学习
看看lucene各个文件和作用:fnm文件图fdtfsv文件图tvxtvdtvf文件图注意:.tvx,.tvd,.tvf这三个文件不是必须的,当新建立的文档有Field.TermVector.WITH_POSITIONS_OFFSETS这个的时候才会创建。.tvx,.tvd,.tvf这些文件提供的是term在filed中的位置和频率信息。这个是正向的,就是知道一个文档包含哪些哪些term,以及这些
huangyunbin
·
2013-03-16 11:00
Lucene
lucene2.4
源码学习1
先来看看lucene的总体情况可以看到lucene代码代码行数是36099行,一共344个类。当然注释也有18302行。是代码行数的一半,这个其实是很好的,但是对于英文不好的我表示比较蛋疼。而且indexwrite有2000多行代码,有点多,还好这样的类比较少,绝大多数都是200行以下。这点也是给了不少信息啊。看看lucene的包依赖情况 1.CC-ConcreteClassCount 2.A
huangyunbin
·
2013-03-16 10:00
Lucene
Solr\Lucene优劣势分析
zhuan:http://rdc.taobao.com/team/jm/archives/1999 最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch
sina_jerry_chen
·
2013-03-06 10:00
Lucene
Solr\Lucene优劣势分析
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch、solr的出现,lucene变得更加热。
flychen
·
2012-09-21 10:00
Uncategorized
lucene+compass
环境
lucene2.4
+ compass2.2 1. xml 配置 a. compass.cfg.xml <?
john.zhang
·
2012-07-31 16:00
compass
Solr\Lucene优劣势分析
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch 、solr的出现,lucene变得更加热。
san_yun
·
2012-07-11 11:00
Lucene
SolrLucene优劣势分析
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch、solr的出现,lucene变得更加热。
阿里中间件
·
2012-06-26 15:00
分析
SolrLucene
优劣势
SolrLucene优劣势分析
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch、solr的出现,lucene变得更加热。
阿里中间件
·
2012-06-26 15:00
分析
优劣势
SolrLucene
Solr\Lucene优劣势分析
最早
lucene2.4
以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch、solr的出现,lucene变得更加热。
yingyuan
·
2012-06-26 07:00
未分类
solr排序OOM解决方法
使用排序时会将被排序字段全部加入内存再进行排序,当多次使用不同字段进行排序时会造成OOM问题 解决方案 修改lucene源码在每次查询完成后将排序所使用的FieldCache里的缓存清空 分别需要修改两个工程
lucene2.4
topcat
·
2011-12-06 13:00
oom
Solr
solr排序OOM解决方法
使用排序时会将被排序字段全部加入内存再进行排序,当多次使用不同字段进行排序时会造成OOM问题 解决方案 修改lucene源码在每次查询完成后将排序所使用的FieldCache里的缓存清空 分别需要修改两个工程
lucene2.4
topcat
·
2011-12-06 13:00
oom
Solr
IkAnalyzer3.1.6 分词 (兼容
lucene2.4
和2.9)
package com.ourdms.util; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis
wmj2003
·
2011-11-01 15:00
IKAnalyzer
IkAnalyzer3.1.6 分词 (兼容
lucene2.4
和2.9)
package com.ourdms.util; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis
wmj2003
·
2011-11-01 15:00
IKAnalyzer
Lucene2.4
索引库位置介绍
在Lucene第一个简单实例中,我们是直接把文件位置indexPah作为索引库位置:IndexWriterindexWriter=newIndexWriter(indexPath,analyzer,true,MaxFieldLength.LIMITED); 今天我们将介绍Lucene提供的一个索引库位置的类DirectoryStringfilePath="G:\\work5\\luceneDemo
longzhun
·
2011-08-07 17:00
Lucene
Lucene2.4
第一个简单实例
首先来认识下全文检索的工作流程: java Project目录结构如图: packagecom.lebuqi.lucene; importjava.io.IOException; importorg.apache.lucene.analysis.Analyzer; importorg.apache.lucene.analysis.standard.StandardAnaly
longzhun
·
2011-08-07 16:00
Lucene
FSDirectory NIOFSDirectory 性能对比
lucene/solrFSDirectoryNIOFSDirectory性能测试对比与Http11NioProtocol文章分类:互联网
lucene2.4
开始有一个NIOFSDirectory实现,使用
wf1982
·
2011-04-01 16:00
lucene2.4
测试_updateDocument替换文档,更新索引
package lucene.test.index; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lu
tanbin5321120
·
2011-03-09 09:00
apache
单元测试
Lucene
lucene/solr FSDirectory NIOFSDirectory 性能测试对比与Http11NioProtocol
lucene2.4
开始有一个NIOFSDirectory实现,使用java.nio'sFileChannel读取文件。
异步获取爱
·
2011-02-21 13:00
java
tomcat
windows
Solr
Lucene
lucene影响索引速度的因素-MergeFactor, MaxMergeDocs, RAMBufferSizeMB
版本:Java
lucene2.4
在索引算法确定的情况下,最为影响Lucene索引速度有三个参数--IndexWriter中的 MergeFactor, MaxMergeDocs, RAMBufferSizeMB
zhaolei415
·
2011-01-14 10:00
算法
虚拟机
Lucene
lucene2.4
学习笔记1
网站要用搜索功能,本来想用SQL语句来实现,后来感觉没什么意思,并开始考虑用LUCENE,去官网下载了2.9的版本,发现新东西比较多,于时下载了 2.4版本.相比以前的版本有些变化。首先建立Index:类文件如下:import jeasy.analysis.MMAnalyzer;import org.apache.lucene.analysis.Analyzer;import org.apache
asdtiang
·
2010-02-22 18:00
Lucene2.4
多条件过滤
Lucene2.4
多条件过滤 最近在开发站内搜索,以开源的lucene作為基础框架。Lucene可以实现自定义过滤器Filter接口,也可以直接调用lucene已經提供的类。
有时,退一步,能一口气进几步,只是这先退一步需要勇气和自信。
·
2009-10-13 17:00
Apache Lucene 2.9的改进
Lucene会在FieldCache中缓存字段信息,不过在
Lucene2.4
以及之前的版本中,加载字段缓存的开销相对较高,尤其在2.4版本中还会不断重新加
Charles Humble
·
2009-10-08 00:00
lucene2.4
学习笔记1-(初学Lucene,简单例子)
说明一下,这一篇文章的用到的lucene,是用2.4版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别 下面是一个简单的例子 1.第一步建立索引 public class IndexDatebase { public static void main(String[] args) throws IOException { //创建保存索引的目录
langhua9527
·
2009-06-25 23:00
apache
C++
c
dos
Lucene
lucene2.4
学习笔记1-(初学Lucene,简单例子)
说明一下,这一篇文章的用到的lucene,是用2.4版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别 下面是一个简单的例子 1.第一步建立索引 public class IndexDatebase { public static void main(String[] args) throws IOException { //创建保存索引的目录
langhua9527
·
2009-06-25 23:00
apache
C++
c
dos
Lucene
lucene2.4
学习笔记1-(初学Lucene,简单例子)
说明一下,这一篇文章的用到的lucene,是用2.4版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别 下面是一个简单的例子 1.第一步建立索引 public class IndexDatebase { public static void main(String[] args) throws IOException { //创建保存索引的目录
langhua9527
·
2009-06-25 23:00
apache
C++
c
dos
Lucene
庖丁解牛的
Lucene2.4
全文搜索代码
package org.heming.sucene.test; import java.io.IOException; import java.sql.Connection; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; import java.util.Arr
WIN
·
2009-04-24 12:00
apache
sql
F#
Lucene
Lucene2.4
入门总结
1、利用Lucene构建搜索引擎的一般过程: 各类文档的字符化——>对字符数据进行分词——>建立索引——>搜索(选择搜索字段、搜索方式,执行搜索)。 2、Lucene文件系统说明: %LUCENE_HOME%\contrib\:Lucene扩展包,包括针对多种语言的分词工具、亮亮显示、Ant、xml文件解析等。其他目录
idealab
·
2009-04-12 10:00
apache
数据结构
搜索引擎
Excel
Lucene
Lucene2.4
入门总结
1、利用Lucene构建搜索引擎的一般过程: 各类文档的字符化——>对字符数据进行分词——>建立索引——>搜索(选择搜索字段、搜索方式,执行搜索)。 2、Lucene文件系统说明: %LUCENE_HOME%\contrib\:Lucene扩展包,包括针对多种语言的分词工具、亮亮显示、Ant、xml文件解析等。其他目录
idealab
·
2009-04-12 10:00
apache
数据结构
搜索引擎
Excel
Lucene
Lucene2.4
入门总结
1、利用Lucene构建搜索引擎的一般过程: 各类文档的字符化——>对字符数据进行分词——>建立索引——>搜索(选择搜索字段、搜索方式,执行搜索)。 2、Lucene文件系统说明: %LUCENE_HOME%\contrib\:Lucene扩展包,包括针对多种语言的分词工具、亮亮显示、Ant、xml文件解析等。其他目录
idealab
·
2009-04-12 10:00
apache
数据结构
搜索引擎
Excel
Lucene
lucene2.4
的查询方法
1.不带排序的方法 TopDocCollector collector = new TopDocCollector(100); chinaMSearcher.search(query1,null,collector); ScoreDoc[] cHits = collector.topDocs().scoreDocs; Hits cHits
gcgmh
·
2009-04-11 13:00
java
Lucene2.4
全文搜索代码
Lucene2.4
全文搜索代码packagecom.laozizhu.article.util;importjava.io.IOException;importjava.sql.Connection;importjava.sql.ResultSet
蓝山
·
2009-03-09 17:00
lucene2.4
gong on
我把
lucene2.4
发行包的一个例子改的更简单些,仅供参考,其中在eclipse中运行遇到中文乱码问题,这些在代码中会有体现。
zhyt710
·
2009-01-20 02:00
apache
eclipse
Excel
Lucene
上一页
1
2
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他