E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
基于词典
分词小议
具我所知,已有某某paper“研究指出”采用二元切分的方式构建索引是“最好的”;也看到过园子里的一位兄弟认为单字切分最准确(sorry,忘记具体出处);当然,将某个
基于词典
或者共现频率的中文分词组件包装一下加入自己的项目中也是非常流行的做法
chl033
·
2009-11-01 21:00
Web
搜索引擎
Google
Lucene
文档
磁盘
构建
基于词典
的Lucene分析器
这篇文章中给出了一个
基于词典
的简单的实现。实现这个中文分析器的过程就像
FutureInHands
·
2008-07-10 19:00
C++
c
算法
C#
Lucene
构建
基于词典
的Lucene分析器
这篇文章中给出了一个
基于词典
的简单的实现。实现这个中文分析器的过程就像
FutureInHands
·
2008-07-10 19:00
C++
c
算法
C#
Lucene
构建
基于词典
的Lucene分析器
这篇文章中给出了一个
基于词典
的简单的实现。实现这个中文分析器的过程就像
FutureInHands
·
2008-07-10 19:00
C++
c
算法
C#
Lucene
rmmseg-cpp - 简洁高效的ruby中文分词程序
rmmseg是浙江大学的学生pluskid开发的纯ruby版本的中文分词程序,采用的也是“
基于词典
的最大匹配算法”,rmmseg的相关介绍请看:http://www.iteye.com/news/1380
robbin
·
2008-05-27 00:00
rmmseg
Ruby
算法
全文检索
Windows
rmmseg-cpp - 简洁高效的ruby中文分词程序
rmmseg是浙江大学的学生pluskid开发的纯ruby版本的中文分词程序,采用的也是“
基于词典
的最大匹配算法”,rmmseg的相关介绍请看: http://www.iteye.com/news/1380
robbin
·
2008-05-27 00:00
windows
算法
Ruby
全文检索
rmmseg
rmmseg-cpp - 简洁高效的ruby中文分词程序
rmmseg是浙江大学的学生pluskid开发的纯ruby版本的中文分词程序,采用的也是“
基于词典
的最大匹配算法”,rmmseg的相关介绍请看:http://www.iteye.com/news/1380
robbin
·
2008-05-27 00:00
rmmseg
Ruby
算法
全文检索
Windows
构建
基于词典
的Lucene分析器
构建
基于词典
的Lucene分析器 solo L 发布日期:2006年09月03日,更新日期:2006年10月03日 Lucene是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包
zhangljerry
·
2007-08-13 17:00
apache
eclipse
算法
软件测试
Lucene
构建
基于词典
的Lucene分析器
阅读更多构建
基于词典
的Lucene分析器soloL发布日期:2006年09月03日,更新日期:2006年10月03日Lucene是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包
zhangljerry
·
2007-08-13 17:00
lucene
算法
软件测试
Apache
Eclipse
构建
基于词典
的Lucene分析器
这篇文章中给出了一个
基于词典
的简单的实现。实现这个中文分析器的过程就像是一场精彩的赛事。好了,让我们马上开始。冗长的代码常常是复杂性的标
DL88250
·
2007-07-31 04:00
算法
String
null
Lucene
import
Dictionary
构建
基于词典
的Lucene分析器
构建
基于词典
的Lucene分析器soloL发布日期:2006年09月03日,更新日期:2006年10月03日Lucene是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包
javafan_303
·
2007-07-02 07:00
C++
c
算法
C#
Lucene
构建
基于词典
的Lucene分析器
构建
基于词典
的Lucene分析器soloL发布日期:2006年09月03日,更新日期:2006年10月03日Lucene是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包
javafan_303
·
2007-07-02 07:00
C++
c
算法
C#
Lucene
ICTCLAS分词系统研究(七)--未登陆词识别
我们冷静想一想,前面初分的结果主要都是
基于词典
库的词条得到的,象人名、地名之类的未登录词(即指该词条不在词典库中)该如何识别呢?
sinboy
·
2007-06-04 13:00
c
算法
360
引入局部统计识别高频词汇的Lucene中文分词程序
在
基于词典
的最大匹配的Lucene中文分词程序基础上引入了局部统计识别新词的功能,目前实现的方法有两种: 1、基于后缀数组的局部统计识别高频词汇 &
billgmh
·
2007-04-02 18:00
算法
Lucene
领域模型
idea
基于词典
的最大匹配的Lucene中文分词程序
把自己之前完成的
基于词典
的最大匹配的中文分词程序修改成基于Lucene。
billgmh
·
2007-03-11 17:00
spring
算法
.net
Google
Lucene
原创中文分词代码分享(2.2)——
基于词典
的分词接口
接着是正向最大匹配的实现类MaxMatchSegmentProcessor: java 代码 /* * @作者:Hades , 创建日期:2006-11-17 * * 汕头大学03计算机本科 * &nb
billgmh
·
2006-12-28 08:00
中文分词
原创中文分词代码分享(2.1)——
基于词典
的分词接口
现在来看一下
基于词典
的分词接口(最大匹配法)。
billgmh
·
2006-12-28 08:00
java
C++
c
C#
上一页
1
2
3
4
5
6
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他