E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Lucene.Net
盘古分词 - 多元分词
盘古分词 - 多元分词 作者:eaglet 盘古分词开发了多元分词算法,其与
lucene.net
配合构建全文搜索,经测试准确度接近
·
2015-10-30 12:04
分词
修改 highlighter.net-1.4.0 一处Bug
最近在做 KTDictSeg 的 1.3 版本,在这个版本中做了一个用
Lucene.net
搜索新闻的例子,其中生成关键词摘要用了 highlighter.net-1.4.0版本,发现中文关键词摘要生成结果总是不对
·
2015-10-30 12:03
highlighter
Lucene.Net
实现GroupBy的效果(2.3.1版)
本文简单介绍
Lucene.Net
实现GroupBy效果的方法,与《
Lucene.Net
按类别统计搜索结果数 》一文类似。注意,这种使用方法很影响效率,特别是命中结果多的情况下。
·
2015-10-30 11:10
Lucene
Lucene.Net
2.3.1开发介绍 —— 四、搜索(二)
4.3 表达式用户搜索,只会输入一个或几个词,也可能是一句话。输入的语句是如何变成搜索条件的上一篇已经略有提及。 4.3.1 观察表达式在研究表达式之前,一定要知道,任何一个Query都会对于一个表达式。不光可以通过Query构造表达式,还可以通过拼接字符串构造。这里说的观察表达式是指,用Query完成查询语句后,用ToString()方法输出Query的表达式。很简单是吧,呵呵。 4.3.2
·
2015-10-30 11:09
Lucene
Lucene.Net
2.3.1开发介绍 —— 四、搜索(三)
Lucene有表达式就有运算符,而运算符使用起来确实很方便,但另外一个问题来了。 代码 4.3.4.1 Analyzer analyzer = new StandardAnalyzer(); QueryParser parser = new QueryParser("title",&nb
·
2015-10-30 11:09
Lucene
Lucene.Net
2.3.1开发介绍 —— 三、索引(五)
话接上篇,继续来说权重对排序的影响。从上面的4个测试,只能说是有个直观的理解了。“哦,是!调整权重是能影响排序了,但是好像没办法来分析到底怎么调啊!”。似乎是这样,现在需要把问题放大,加大索引的内容。到博客园新闻区,用zzk找了4篇内容包含“测试”的文章。代码变成 2.1.5 代码2.1.5 1using System; 2us
·
2015-10-30 11:08
Lucene
Lucene.Net
2.3.1开发介绍 —— 三、索引(六)
2.2 Field的Boost 如果说Document的Boost是一条线,那么Field的Boost则是一个点。怎么理解这个点呢?设置Document的Boost会影响所有字段。在搜索的过程中,一般至少会搜索两个Field,比如同时搜索标题和内容。而Document的Boost将同时影响标题和内容的搜索得分,但是设置Field的Boost则不会有那么大的影响,Field的Boost只会影响一个
·
2015-10-30 11:08
Lucene
Lucene.Net
2.3.1开发介绍 —— 四、搜索(一)
既然是内容筛选,或者说是搜索引擎,有索引,必然要有搜索。搜索虽然与索引有关,那也只是与索引后的文件有关,和索引的程序是无关的,因此,搜索和索引一般是分开部署。简单地说,就是一个应用程序(桌面程序)来索引,一个WEB程序来实现搜索。当然,为了测试的时候简单,这里还是使用NUnit的方式运行。搜索讲完后,将会简单介绍单机搜索引擎如何部署。 4.1 搜索与什么有关 搜索与什么有关呢?即使没有看过前面
·
2015-10-30 11:08
Lucene
Lucene.Net
2.3.1开发介绍 —— 三、索引(四)
在不使用字段排序的情况下,
Lucene.Net
默认是按文档的得分来排序的,这个公式看着很复杂,感觉像是大学时高数书上
·
2015-10-30 11:07
Lucene
Lucene.Net
2.3.1开发介绍 —— 三、索引(三)
3、Field配置所产生的效果 索引数据,简单的代码,只要两个方法就搞定了,而在索引过程中用到的一些类里最简单,作用也不小的就是Field,接下来看看Field的各项设置都会有什么样的效果。 代码 3.1 Code 1/**//// <summary> 2/// 索引数据 3/// <
·
2015-10-30 11:07
Lucene
Lucene.Net
2.3.1开发介绍 —— 三、索引(二)
2、索引中用到的核心类 在
Lucene.Net
索引开发中,用到的类不多,这些类是索引过程的核心类。
·
2015-10-30 11:07
Lucene
Lucene.Net
2.3.1开发介绍 —— 二、分词(四)
前文说过
Lucene.Net
内置分词中StandardAnalyzer分词还算比较实用(见1.1.2小节)。StandardAnalyzer为什么能满足我们的部分需求,而它又有哪些不足呢?
·
2015-10-30 11:06
Lucene
Lucene.Net
2.3.1开发介绍 —— 二、分词(六)
Lucene.Net
的上一个版本是2.1,而在2.3.1版本中才引入了Next(Token)方法重载,而ReusableStringReader类也是在新版本中引入的。
·
2015-10-30 11:06
Lucene
Lucene.Net
2.3.1开发介绍 —— 二、分词(五)
2.1.3 二元分词 上一节通过变换查询表达式满足了需求,但是在实际应用中,如果那样查询,会出现另外一个问题,因为,那样搜索,是只要出现这个字,不管它出现在什么位置。这就产生了上一小节开头讲的,对准确性产生了极大干扰。比如,如果有一段这样的话:“这是一个英雄!他有无法用词汇形容的孤单,但是他并没有用言语来表达。”这句话包含了“英 语 单 词”这四个字,但是却和“英语单词
·
2015-10-30 11:06
Lucene
Lucene.Net
2.3.1开发介绍 —— 二、分词(二)
1.2、分词的过程 1.2.1、分词器工作的过程 内置的分词器效果都不好,那怎么办?只能自己写了!在写之前当然是要先看看内置的分词器是怎么实现的了。从1.1分析分词效果,可以看出KeywordAnalyzer这个分词器最懒惰,基本什么事情也没做。并不是它不会做,而是我们没找到使用它的方法,就像手上拿着个盒子,不知道里面是什么,就不知道这个是干嘛的,有什么用。打开盒子,那就是要查
·
2015-10-30 11:05
Lucene
Lucene.Net
2.3.1开发介绍 —— 二、分词(三)
1.3 分词器结构 1.3.1 分词器整体结构 从1.2节的分析,终于做到了管中窥豹,现在在
Lucene.Net
项目中添加一个类关系图,把TokenStream和他的儿孙们统统拉上去
·
2015-10-30 11:05
Lucene
Lucene.Net
2.3.1开发介绍——附录一、如何下载
Lucene.Net
的各种版本
然后在d盘下建立一个空文件夹,命名为
Lucene.Net
。打开文件夹,右键,则出现菜单。如图"附录一 1"。
·
2015-10-30 11:04
Lucene
[
Lucene.Net
] 基本用法
以下例子采用
Lucene.NET
1.9 版本,可取去
Lucene.Net
下载。 1.
·
2015-10-30 11:42
Lucene
Lucene.NET
使用
以下例子采用
Lucene.NET
1.9 版本,可取去
Lucene.Net
下载。1.
·
2015-10-30 10:33
Lucene
lucene.net
应用资料
本文将围绕该个实例介绍了
lucene.net
的索引的建立以及如何针对索引进行搜索.最后还将给出源代码供大家学习. 源代码下载 What
·
2015-10-30 10:33
Lucene
用
Lucene.net
对数据库建立索引及搜索<转>
用
Lucene.net
对数据库建立索引及搜索 最近我一直在研究
Lucene.net
,发现
Lucene.net
对数据库方面建索引的文章在网上很少见
·
2015-10-30 10:06
Lucene
[
Lucene.Net
] 基本用法
id=313 [
Lucene.Net
] 基本用法 本文仅记录一些简单的使用方法,供初学者参考。
·
2015-10-30 10:48
Lucene
C#中文分词算法:ChineseAnalyzer
Lucene.Net.dll + Lucene.China.dll ,会打包在本文结束处,使用VS2008调试通过: using
Lucene.Net
·
2015-10-30 10:36
chinese
Lucene.NET
给索引库添加文档时 String.Intern 方法 详解(来自MSND)
调试
lucene.NET
时候遇到的,希望对大家有用。 ------------- 更新: 2008 年 7 月 检索系统对指定 String 的引用。
·
2015-10-29 08:41
Lucene
lucene、
lucene.NET
详细使用与优化详解
代码 1 lucene简介 1.1 什么是lucenepowered by 25175 .net Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回
·
2015-10-28 09:02
Lucene
在
Lucene.net
实现自定义排序
在
Lucene.net
实现自定义排序,需要实现两个Lucene.Net.Search的两个接口: public interface SortComparatorSource
·
2015-10-28 09:01
Lucene
Lucene.NET
使用
Code 本文仅记录一些简单的使用方法,供初学者参考。 以下例子采用 Lucene.NET 1.9 版本,可取去 Lucene.Net 下载。 1. 基本应用 using System; using System.Collections.Generic; using System.Tex
·
2015-10-28 09:17
Lucene
关于C#在
lucene.net
下的中文切词
关于C#在
lucene.net
下的中文切词 2007-09-27 10:50 作者: 佚名 出处: 论坛整理 责任编辑:>幽灵 以下是引用片段: using
·
2015-10-28 09:17
Lucene
初试
Lucene.net
搜索及高亮分页
using System; using System.Data; using System.IO; using System.Text.RegularExpressions; using Lucene.Net.Analysis.Standard; using Lucene.Net.Do
·
2015-10-28 09:17
Lucene
Lucene.net
系列六 -- search 下
本文主要结合测试案例介绍了Lucene下的各种查询语句以及它们的简化方法. 通过本文你将了解Lucene的基本查询语句,并通过学习相关的测试代码以加强了解. 源代码下载 具体的查询语句 在了解了SQL后, 你是否想了解一下查询语法树 ? 在这里简要介绍一些能被Lucene直接使用的查询语句. 1 . &n
·
2015-10-28 09:31
Lucene
Lucene.net
系列四 --- index 下
本文将介绍有关索引并发控制的问题,以结束对
Lucene.net
建立索引问题的讨论. 1 . 允许任意多的读操作并发.即可以有任意多的用户在同一时间对同一份索引做查询工作. 2 .
·
2015-10-28 09:31
Lucene
Lucene.net
系列五 --- search 上
在前面的系列我们一直在介绍有关索引建立的问题,现在是该利用这些索引来进行搜索的时候了,Lucene良好的架构使得我们只需要很少的几行代码就可以为我们的应用加上搜索的功能,首先让我们来认识一下搜索时最常用的几个类. 查询特定的某个概念 当我们搜索完成的时候会返回一个按Sorce排序的结果集Hits. 这里的Score就是接近度的意思,象Google那样每个页面都会有一个分值,搜索结果按
·
2015-10-28 09:31
Lucene
Lucene.net
系列三 --- index 中
本文将进一步讨论有关
Lucene.net
建立索引的问题: 主要包含以下主题: 1 .索引的权重 2 .利用IndexWriter 属性对建立索引进行高级管理 3 .利用RAMDirectory
·
2015-10-28 09:30
Lucene
Lucene.net
系列二 --- index (上)
Lucene建立Index的过程: 1. 抽取文本. 比如将PDF以及Word中的内容以纯文本的形式提取出来.Lucene所支持的类型主要为String,为了方便同时也支持Date 以及Reader.其实如果使用这两个类型lucene会自动进行类型转换. 2. &
·
2015-10-28 09:30
Lucene
Lucene.net
站内搜索—6、站内搜索第二版
目录
Lucene.net
站内搜索—1、SEO优化
Lucene.net
站内搜索—2、
Lucene.Net
简介和分词
Lucene.net
站内搜索—3、最简单搜索引擎代码
Lucene.net
站内搜索—
·
2015-10-28 09:01
Lucene
Lucene.net
站内搜索—4、搜索引擎第一版技术储备(简单介绍Log4Net、生产者消费者模式)
目录
Lucene.net
站内搜索—1、SEO优化
Lucene.net
站内搜索—2、
Lucene.Net
简介和分词
Lucene.net
站内搜索—3、最简单搜索引擎代码
Lucene.net
站内搜索—
·
2015-10-28 09:00
Lucene
Lucene.net
站内搜索—3、最简单搜索引擎代码
目录
Lucene.net
站内搜索—1、SEO优化
Lucene.net
站内搜索—2、
Lucene.Net
简介和分词
Lucene.net
站内搜索—3、最简单搜索引擎代码
Lucene.net
站内搜索—
·
2015-10-28 09:59
Lucene
写一点应用关于
Lucene.Net
,snowball的重新组装(一)在
Lucene.Net
中加入词性标注与词根还原功能
作者:finallyliuyu (资料使用,博文引用请您表面出处) 本专题是有关借助于
Lucene.Net
工具如何对英文文章进行分词,词性标注,词根还原的。
·
2015-10-28 08:44
Lucene
博客园和百度空间,我的两个家
智慧掩盖真相的
Lucene.net
系列,让我
·
2015-10-28 08:43
百度
【分享】
Lucene.Net
的中文分词组件AdvancedChineseAnalyzer
运行环境:Microsoft .Net Framework 2.0 依存软件:
Lucene.Net
作者:Kelvin ZHANG (kelvin.cn{@t}56.com) 授权:Free for
·
2015-10-28 08:39
Advanced
Lucene.Net
无障碍学习和使用:搜索篇
在上一篇中,我们初步理解了索引的增删改查基本操作。本文着重介绍一下常用的搜索,以及搜索结果的排序和分页。本文的搜索主要是基于前一篇介绍的文本文件的索引,建议下载最后改进的demo对照着看阅读本文,同时大家可以自己动手创建一些测试文本,然后建立索引并搜索试试看。 一、初步认识搜索 先从上一篇示例代码中我们摘录一段代码看看搜索的简单实现: 1 2 3 4 5
·
2015-10-28 08:36
Lucene
Lucene.Net
学习
学习夕阳轨迹的
Lucene.Net
开发介绍,做个测试 Code using System; using System.Collections.Generic
·
2015-10-28 08:37
Lucene
Spring.net整合
Lucene.net
实现全文检索(附例程)
什么是
Lucene.net
? 引用wikipedia上的介绍:“Lucene是一套用于全文检索和搜尋的開放源碼程式庫,由Apache软件基金会支持和提供。
·
2015-10-28 08:45
spring
基于
Lucene.NET
的文件搜索工具
本文要介绍的是利用
Lucene.NET
写的一个简单的文档搜索器。实现最基本的索引和搜索功能。
·
2015-10-28 08:17
Lucene
Lucene.net
实现近实时搜索(NRT)和增量索引
Lucene做站内搜索的时候经常会遇到实时搜索的应用场景,比如用户搜索的功能。实现实时搜索,最普通的做法是,添加新的document之后,调用 IndexWriter 的 Commit 方法把内存中的索引提交到硬盘;然后重新打开IndexReader,进行搜索。但是索引一般存储在硬盘上,而且当索引文件比较大的时候,Commit操作和重新打开IndexReader效率比较低。 于是就想,可否一份索
·
2015-10-28 08:02
Lucene
Lucene.Net
2.3.1开发介绍 —— 三、索引(七)
原文:
Lucene.Net
2.3.1开发介绍 —— 三、索引(七) 5、IndexWriter 索引这部分最后讲的是IndexWriter。
·
2015-10-27 16:58
Lucene
Lucene.Net
2.3.1开发介绍 —— 三、索引(一)
原文:
Lucene.Net
2.3.1开发介绍 —— 三、索引(一) 在说索引之前,先说说索引是什么?为什么要索引?怎么索引?
·
2015-10-27 16:57
Lucene
Lucene.Net
1、
Lucene.Net
是什么?
·
2015-10-27 16:20
Lucene
Lucene.net
实现全文搜索
忙了几天终于实现一个简单的全文搜索在此回顾总结一下 本文介绍一下
Lucene.Net
是什么?
Lucene.Net
能作什么?以及怎么做的问题?
·
2015-10-27 16:22
Lucene
Cheatsheet: 2010 09.16 ~ 09.30
.NET Visual Studio 2008 Load Test Gotchas Getting started with
Lucene.NET
Writing a Semi-Local
·
2015-10-27 15:20
sh
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他