E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分词算法
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切
分词算法
的比较具体的安装和使用简介:系统结构介绍和演示
milife2012
·
2012-03-26 13:00
java
数据库
String
Lucene
全文检索
语言
Python实现mmseg
分词算法
和吐嘈
搜索引擎嘛,我想要写出来必须要懂五个部分:1、基础的多线程爬虫2、
分词算法
,对用户输入的查找文本进行切割3、MapReduce,用来统计词语出现的次数,这个直接关系到URL在队列中的等级4、PageRank
Acceptedxukai
·
2012-03-24 16:00
算法
python
Microsoft
token
import
float
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切
分词算法
的比较具体的安装和使用简介:系统结构介绍和演示
Mirage520
·
2012-03-13 21:00
java
数据库
String
Lucene
全文检索
语言
深入搜索引擎--查询(Query)
分词算法
从最简单的最大正向、最大反向
分词算法
,到复杂的
poson
·
2012-03-13 08:00
算法
搜索引擎
百度
电子商务
query
产品
深入搜索引擎--查询(Query)
分词算法
从最简单的最大正向、最大反向
分词算法
,到复杂的隐马
poson
·
2012-03-12 22:00
搜索引擎
query
分词
搜索引擎设计实用教程(3)-以百度为例 之三:对百度
分词算法
的进一步分析
中科院软件所 2005年11月 上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度
分词算法
步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误
wxfstwxf
·
2012-03-07 09:00
算法
百度
mmseg
分词算法
MMSEG是中文分词中一个常见的、基于词典的
分词算法
(作者主页:http://chtsai.org/index_tw.html),简单、效果相对较好。
zimohuakai
·
2012-03-04 14:00
Algorithm
算法
生活
Google
tree
Random
分词算法
介绍
===============================================================================如有需要可以转载,但转载请注明出处,并保留这一块信息,谢谢合作!部分内容参考互联网,如有异议,请跟我联系!作者:刀剑笑(Blog:http://blog.csdn.net/jyz3051)Email:jyz3051atyahoodotcom
bertzhang
·
2012-03-02 14:00
算法
互联网
Yahoo
文档
语言
email
中文分词原理
主要的方法有三种:基于词典匹配的分词方法,基于语义理解的分词,基于词频统计的分词. 1.基于词典分配的
分词算法
基于字典匹配的
分词算法
按一定的匹配策略将输入的字符串与机器字典词条进行匹配
fjg0427
·
2012-02-28 14:00
中文分词
PHP中文
分词算法
及代码实现
简单的中文
分词算法
,二元分词的PHP代码:$str='苏杭,人间的天堂paradise!'
luochuan
·
2012-02-27 23:00
算法
PHP
null
search
存储
merge
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切
分词算法
的比较 具体的安装和使用简介
sdustyongz
·
2012-02-11 21:00
Lucene
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切
分词算法
的比较具体的安装和使用简介:系统结构介绍和演示
edisonkun
·
2012-02-06 17:00
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切
分词算法
的比较具体的安装和使用简介:系统结构介绍和演示
yaraja
·
2012-02-02 10:00
Lucene
使用Perl读取Excel文件
1.任务 为了实现一些机械
分词算法
,准备使用“国家语委语料库”的分词词表,在线下载到得词表文件是一个Excel文件。本文的任务就是使用Perl从该Execl文件中提取所有的词语。
xiaodongrush
·
2012-01-30 16:00
在Hadoop上运行基于RMM中文
分词算法
的MapReduce程序
其实不然,只是一份普通的实验报告,同时本文也不对RMM中文
分词算法
进行研究。这个实验报告是我做高性能计算课程的实验里提交的。
solu
·
2012-01-29 23:00
hadoop
python
高亮显示与拼音汉字互转及文本相似度匹配
中文分词 这个
分词算法
是基于网上一个叫IK
分词算法
(这里并没有使用我的那个敏感词过滤算法)!我只是将它的词表进行了优化和补充。
hellohank
·
2012-01-10 16:00
文本相似度
漫话中文自动分词和语义识别(下):句法结构和语义结构
这篇文章是漫话中文
分词算法
的续篇。在这里,我们将紧接着上一篇文章的内容继续探讨下去:如果计算机可以对一句话进行自动分词,它还能进一步整理句子的结构,甚至理解句子的意思吗?
Matrix67 tossking
·
2012-01-05 16:00
算法
Brain
Storm
语言学
文字游戏
漫话中文自动分词和语义识别(下):句法结构和语义结构
这篇文章是漫话中文
分词算法
的续篇。在这里,我们将紧接着上一篇文章的内容继续探讨下去:如果计算机可以对一句话进行自动分词,它还能进一步整理句子的结构,甚至理解句子的意思吗?
Matrix67 tossking
·
2012-01-05 08:00
算法
storm
Brain
文字游戏
语言学
MMSEG 中文
分词算法
MMSEG中文
分词算法
November1st,2009leeingLeaveacommentGotocomments由于学习需要,我尝试翻译MMSEG算法,目前处于初稿状态,很许多地方的翻译仍不尽准确,
endual
·
2012-01-04 22:00
中文分词
MMSEG 中文
分词算法
MMSEG中文
分词算法
November1st,2009leeingLeaveacommentGotocomments由于学习需要,我尝试翻译MMSEG算法,目前处于初稿状态,很许多地方的翻译仍不尽准确,
endual
·
2012-01-04 22:00
中文分词
在Hadoop上运行基于RMM中文
分词算法
的MapReduce程序
其实不然,只是一份普通的实验报告,同时本文也不对RMM中文
分词算法
进行研究。这个实验报告是我做高性能计算课程的实验里提交的。
Xiaoxia
·
2011-12-18 11:00
Algorithm
hadoop
map
reduce
parallel
我的分享
做了一个脚本,方便大家用sunpot做中文全文索引
,在ruby做全文索引属于首选方案,但是原始配置不支持中文分词,我做了一个脚本,可以很方便build一个带mmseg4j ( http://code.google.com/p/mmseg4j/ )
分词算法
的
QuakeWang
·
2011-12-02 12:00
Solr
sunspot
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切
分词算法
的比较具体的安装和使用简介:系统结构介绍和演示
fenglibing
·
2011-11-15 14:00
java
数据库
String
Lucene
全文检索
语言
【转】三种中文
分词算法
优劣比较
转 中文分词 http://blog.csdn.net/jyz3051/article/details/3202431 ============================================================================== 如有需要可以转载,但转载请注明出处,并保留这一块信息,谢谢合作! 部分内容参考互
nhy520
·
2011-11-07 17:00
中文分词
漫话中文
分词算法
(转)
记得第一次了解中文
分词算法
是在 Google黑板报 上看到的,当初看到那个算法时我彻底被震撼住了,想不到一个看似不可能完成的任务竟然有如此神奇巧妙的算法。
TheAlgorithmArt
·
2011-10-15 12:00
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切
分词算法
的比较具体的安装和使用简介:系统结构介绍和演示
cfeibiao
·
2011-10-03 21:00
中文
分词算法
中文
分词算法
(mini版)http://www.cnblogs.com/overred/archive/2010/04/17/Segmentword.htmlhttp://blog.minidx.com
·
2011-10-02 23:00
中文分词
中文
分词算法
中文
分词算法
(mini版)http://www.cnblogs.com/overred/archive/2010/04/17/Segmentword.htmlhttp://blog.minidx.com
·
2011-10-02 23:00
中文分词
中文
分词算法
中文
分词算法
(mini版)http://www.cnblogs.com/overred/archive/2010/04/17/Segmentword.htmlhttp://blog.minidx.com
·
2011-10-02 23:00
中文分词
java trie实现
http://www.riaos.com/ria/5814javatrie最大正向匹配中文
分词算法
http://hxraid.iteye.com/blog/667134goodarticle!!
·
2011-10-02 01:00
java
改写lucene的Analyzer,添加自己的中文分词系统的方法
*/ 这几天完成了我的中文
分词算法
,就着手把它加入到lucene中去,goo
·
2011-09-30 20:00
Lucene
关于MMSEG
分词算法
http://hi.baidu.com/catro/blog/item/e9b8ceea24754ec0d539c9b8.html关于MMSEG
分词算法
2011-02-0213:54MMSEG是中文分词中一个常见的
·
2011-09-29 19:00
MMS
常用
分词算法
的比较与设想
http://www.cnblogs.com/alic/archive/2008/06/06/1215001.html常用
分词算法
的比较与设想 与基于理解的
分词算法
和基于统计的
分词算法
相比,
·
2011-09-29 19:00
算法
Double-Array详解
Trie结构是模式匹配中经常用到的经典结构,在字符串处理中发挥着重要的作用,比如
分词算法
,就会利用Trie结构将分句的已知词条先识别出来,然后再判断剩下的未识别部分是否是新的未知词。
joylnwang
·
2011-09-28 15:00
数据结构
c
算法
存储
工具
badge
基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切
分词算法
的比较具体的安装和使用简介:系统结构介绍和演示
East271536394
·
2011-09-15 10:57
全文检索
java
lucene
数据库
语言
string
基于词典的逆向最大匹配中文
分词算法
,逆向分词比正向分词效果好
基于词典的逆向最大匹配中文
分词算法
,逆向分词比正向分词效果好基于词典的逆向最大匹配中文
分词算法
,能实现中英文数字混合分词。比如能分出这样的词:bb霜、3室、乐phone、touch4、mp3、T恤。
lucene + hadoop 分布式并行计算搜索框架
·
2011-08-19 13:00
ruby分词
用纯ruby编写的rmmseg分词的速度非常慢,而且内存消耗非常惊人,当使用复杂
分词算法
的时候,内存呈线性上升的现象。
·
2011-08-17 21:00
Ruby
lucense全文检索
关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切
分词算法
的比较
小学毕业
·
2011-08-15 13:00
全文检索
Lucene是一个基于Java的全文索引工具包
关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切
分词算法
的比较
563525042
·
2011-08-11 11:00
Lucene
全文检索
基于词典的正向最大匹配中文
分词算法
,能实现中英文数字混合分词
基于词典的正向最大匹配中文
分词算法
,能实现中英文数字混合分词基于词典的正向最大匹配中文
分词算法
,能实现中英文数字混合分词。
lucene + hadoop 分布式并行计算搜索框架
·
2011-08-04 15:00
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切
分词算法
的比较 具体的安装和使用简介
dcbjavaeye
·
2011-06-30 04:00
Lucene
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切
分词算法
的比较 具体的安装和使用简介
欣水寓言
·
2011-06-24 17:00
java
数据结构
搜索引擎
Lucene
全文检索
中文分词简介
现有的
分词算法
可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
success041000
·
2011-05-31 13:00
算法
搜索引擎
IBM
自然语言处理
语言
产品
Lucene简介及如何使用?
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切
分词算法
的比较 具体的安装和使用简介
306963591
·
2011-05-23 17:00
数据结构
应用服务器
搜索引擎
Lucene
全文检索
Lucene中文分词组件 JE-Analysis 1.5.1
//采用正向最大匹配的中文
分词算法
,相当于分词粒度等于0MMAnalyzeranalyzer=newMMAnalyzer();//参数为分词粒度:当字数等于或超过该参数,且能成词,该词就被切分出来MMAnalyzeranalyzer
kongjing0815
·
2011-05-20 10:00
三种中文
分词算法
优劣比较
http://blog.csdn.net/liuzongshun/archive/2009/05/27/4216403.aspx
慎道
·
2011-05-18 20:00
正向最大匹配中文
分词算法
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。 在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法 (MaximumMatching,以下简称MM算法) 。MM算法有两种:一种正向最大匹配,一种逆向
yangyan19870319
·
2011-05-06 14:00
算法
HashMap
tree
Lucene
存储
自然语言处理
MySQL 中文全文搜索
对于CJK的文字没有MYSQL没有
分词算法
,那么只能自己分词了,以空格隔开。mysql规定大于 ft_min_word_len长度的文字才进行索引,这个可以在my.ini里设置。
lijiecong
·
2011-04-20 21:00
mysql
算法
Lucene:基于Java的全文检索引擎简介
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切
分词算法
的比较 具体的安装和使用简介:
zhaohaolin
·
2011-04-11 21:00
java
数据结构
搜索引擎
Lucene
全文检索
站内优化相关性如何计算?
一、什么是相关性百度和谷歌等为了给用户提供高质量的信息,从中过滤掉匹配度不高或黑猫垃圾信息搜索引擎如何计算什么叫百度
分词算法
搜索引擎对关键词进行规划,就是把原先的这种不公平性去掉。
zywrou
·
2011-04-07 21:56
生活
seo
休闲
站内优化
百度分词
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他