E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
向量空间模型
Rocchio算法
Rocchio算法是相关反馈实现中的一个经典算法,它提供了一种将相关反馈信息融到
向量空间模型
的方法。
sulliy
·
2011-08-08 23:00
算法
优化
文档
ide
扩展
改进KNN算法描述及实现
KNN算法是VSM(
向量空间模型
)下最好的分类算法之一。1.何为KNN? 以下是引用wiki的一个定义
csdn_zuoqiang
·
2011-07-20 23:00
算法
基于
向量空间模型
的文本聚类算法
阅读更多转自:http://edu.codepub.com/2009/0910/15270.php1文本聚类研究现状Internet已经发展为当今世界上最大的信息库和全球范围内传播信息最主要的渠道。随着Internet的大规模普及和企业信息化程度的提高,各种资源呈爆炸式增长。在中国互联网络信息中心(CNNIC)2007年1月最新公布的中国互联网络发展状况统计报告中显示,70.2%的网络信息均以文本
lkf0217
·
2011-06-11 13:00
算法
领域模型
互联网
网络应用
搜索引擎
基于
向量空间模型
的文本聚类算法
转自:http://edu.codepub.com/2009/0910/15270.php 1文本聚类研究现状 Internet已经发展为当今世界上最大的信息库和全球范围内传播信息最主要的渠道。随着Internet的大规模普及和企业信息化程度的提高,各种资源呈爆炸式增长。在中国互联网络信息中心(CNNIC)2007年1月最新公布的中国互联网络发展状况统计报告中显示,70.2%的网络信息均以文本形式
lkf0217
·
2011-06-11 13:00
算法
搜索引擎
互联网
网络应用
领域模型
打分公式
文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索
向量空间模型
中的向量夹角的接近度。一个文档越与查询词相关,得分越高。
mxdxm
·
2011-05-21 16:00
apache
F#
Blog
Lucene
Lucene Similarity (Lucene 文档评分score机制详解)
查看文章 翻译:LuceneSimilarity(Lucene文档评分score机制详解)2008-11-2819:09文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索
向量空间模型
中的向量夹角的接近度
duck_genuine
·
2011-05-04 17:00
apache
Lucene
query
文档
float
byte
句子相似度计算
如何计算句子的语义相似度,很容易想到的是
向量空间模型
(VSM)和编辑距离的方法,比如A:“我爸是李刚”,B:“我儿子是李刚”,利用VSM方法A(我,爸,是,李刚)B(我,儿子,是,李刚),计算两个向量的夹角余弦值
amblue
·
2011-04-25 16:00
数据挖掘概念与技术_文本挖掘
1、文本检索的基本度量—— 准确率和召回率 http://fuhao-987.iteye.com/blog/930140 2、文本检索方法——
向量空间模型
http://fuhao-987.iteye.com
fuhao_987
·
2011-04-05 16:00
数据结构
算法
数据挖掘
Blog
ITeye
有关Lucene的问题(收藏)推荐
有关Lucene的问题(2):stemming和lemmatization 有关Lucene的问题(3):
向量空间模型
与Lucene的打分机制 有关Lucene的问题(4):影响Lucene
liuxinglanyue
·
2010-12-30 21:00
Lucene
Lucene Scoring 评分机制
Lucenescoring组合使用了信息检索的
向量空间模型
和布尔模型。首先来看下lucene的评分公式(在Similarity类里的说明)sco
duck_genuine
·
2010-12-30 11:00
Lucene
query
文档
token
float
byte
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
【文本分类】文本表示 --- VSM
目前文本表示通常采用
向量空间模型
(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。
Heart.X.Raid
·
2010-09-17 14:00
算法
领域模型
D语言
翻译:Lucene Similarity (Lucene 文档评分score机制详解)[转]
2008-11-28 19:09 文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索
向量空间模型
中的向量夹角的接近度。一个文档越与查询词相关,得分越高。
javaso
·
2010-07-22 00:00
apache
F#
Blog
Lucene
有关Lucene的问题(3):
向量空间模型
与Lucene的打分机制
在索引阶段设置DocumentBoost和FieldBoost,存储在(.nrm)文件中。如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。如果不进行设定,则DocumentBoost和Fie
pangliyewanmei
·
2010-07-15 09:00
exception
File
Lucene
query
文档
float
lucene 标准化因子 norm
相关性打分(score)使用
向量空间模型
(VectorSpaceModel),在计算相关性之前,要计算TermWeight,也即某Term相对于某Document的重要性
wwty
·
2010-06-27 11:00
Lucene
lucene 标准化因子 norm
相关性打分(score)使用
向量空间模型
(VectorSpaceModel),在计算相关性之前,要计算TermWeight,也即某Term相对于某Document的重要性
wwty
·
2010-06-27 11:00
Lucene
余弦相似度
余弦相似度原文地址:http://hi.baidu.com/zzpppork/blog/item/c1c79cfadbfe0a6e034f5683.html在
向量空间模型
中,文本泛指各种机器可读的记录。
编程自动化
·
2010-06-07 13:00
lucene学习
相关性打分(score)使用
向量空间模型
(Vector Space Model),在计算相关性之前,要计算Term Weight,也即某Term相对于某Document的重要性。
interlxs
·
2010-05-25 22:00
qq
Lucene
信息检索
信息检索(Informationretrieval)基本原理:提问标识(检索式)与文献标识的对比.2.信息检索常用方法:(一)布尔逻辑:逻辑或(+,OR):逻辑与(*,AND):逻辑非(-,NOT):(二)
向量空间模型
pqcc
·
2010-05-08 16:00
信息检索
信息检索常用方法: (一)布尔逻辑: 逻辑或(+,OR): 逻辑与(*,AND): 逻辑非(-,NOT): (二)
向量空间模型
pqcc
·
2010-05-08 16:00
Lucene 的 Scoring 评分机制
Lucenescoring组合使用了 信息检索的
向量空间模型
和 布尔模型 。首先来看下lucene的评分公式(在Similarity类里的说明
Java2King
·
2010-03-28 22:00
Lucene
search
query
文档
float
UML
vsm
向量空间模型
将文档映射为一个特征向量V(d)=(t1,ω1(d);…;tn,ωn(d)),其中ti(i=1,2,…,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值,一般被定义为ti在d中出现频率
mxsfengg
·
2010-03-08 12:00
算法
J#
vsm
向量空间模型
将文档映射为一个特征向量V(d)=(t1,ω1(d);…;tn,ωn(d)),其中ti(i=1,2,…,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值,一般被定义为ti在d中出现频率
mxsfengg
·
2010-03-08 12:00
算法
J#
有关Lucene的问题(3):
向量空间模型
与Lucene的打分机制
问题: 在你的文章中提到了: 于是我们把所有此文档中词(term)的权重(term weight) 看作一个向量。 Document = {term1, term2, …… ,term N} Document Vector = {weight1, weight2, …… ,weight N}
forfuture1978
·
2010-02-06 12:00
F#
Lucene
J#
有关Lucene的问题(3):
向量空间模型
与Lucene的打分机制
问题: 在你的文章中提到了: 于是我们把所有此文档中词(term)的权重(term weight) 看作一个向量。 Document = {term1, term2, …… ,term N} Document Vector = {weight1, weight2, …… ,weight N}
forfuture1978
·
2010-02-06 12:00
F#
Lucene
J#
有关Lucene的问题(3):
向量空间模型
与Lucene的打分机制
问题:在你的文章中提到了:于是我们把所有此文档中词(term)的权重(termweight)看作一个向量。 Document={term1,term2,……,termN} DocumentVector={weight1,weight2,……,weightN} 同样我们把查询语句看作一个简单的文档,也用向量来表示。 Query={term1,term2,……,termN} Que
forfuture1978
·
2010-02-06 12:00
vector
String
Lucene
query
文档
float
余弦相似度
在
向量空间模型
中,文本泛指各种机器可读的记录。
zhouqiang128
·
2009-12-16 09:00
C++
c
C#
D语言
向量空间模型
(VSM)在文档相似度计算上的简单介绍
向量空间模型
(VSM:Vectorspacemodel)是最常用的相似度计算模型,在自然语言处理中有着广泛的应用,这里简单介绍一下其在进行文档间相似度计算时的原理。
chl033
·
2009-10-27 22:00
vector
BI
文档
自然语言处理
VSM -
向量空间模型
向量空间模型
(Vector Space Model)是一种自然语言处理中常用的模
provista
·
2009-10-26 18:00
D语言
与tf*idf权重的关系
3.3.4与tf*idf权重的关系tf*idf权重计算策略在传统的检索模型如
向量空间模型
和概率检索模型中都起着十分关键的作用。
summerbell
·
2009-10-19 20:00
C++
c
C#
D语言
【转贴】基于
向量空间模型
的文本聚类算法
基于
向量空间模型
的文本聚类算法[日期:2009-07-27]来源: 作者:[字体:大中小]姚清耘,刘功申,李翔(上海交通大学信息安全工程学院,上海200240) 摘要:文本聚类是聚类的一个重要研究分支,
zfrong
·
2009-09-10 14:00
Algorithm
算法
vector
文档
自然语言处理
classification
webhtml网页自动分类(carrot2初步研究)
香港回来后(3月9~3月16),开始了这个课题的研究,这个过程中碰到种种困难.比如vsm(
向量空间模型
),STC(后缀树表示法)等等要涉及一些矩阵分解(对web网页表示的降维),基向量,特
zfrong
·
2009-09-10 11:00
框架
算法
Web
matlab
文档
Path
向量空间模型
一:不同区域的权重计算1. 对出现在文档的不通区域的term赋予不同的权值,例如title,author,body等,这样需要在倒排表中记录term每一次出现的位置2.对不同的区域赋予不通的权值,Gi,使得Sum(Gi)=13.对于这个Gi的值,可以通过机器学习的方法来确定:给定一个文档集合和query,以及query与文档之间的相似性,然后假定一个表达式,采用这个样本来计算各种系数 二:出现频率
tianqio
·
2009-05-24 15:00
query
文档
改进
向量空间模型
声明:只是对
向量空间模型
的介绍(或者叫推广),并没有理论创新工作。
felomeng
·
2009-04-09 12:00
优化
工作
C#
文档
改进
向量空间模型
声明:只是对
向量空间模型
的介绍(或者叫推广),并没有理论创新工作。
felomeng
·
2009-04-09 12:00
优化
工作
C#
文档
改进
向量空间模型
21.2pt;"><span style=""><span style="font-size: small;">声明:只是对
向量空间模型
的介绍
insertyou
·
2009-04-09 12:00
模型
向量空间模型
(VSM)在文档相似度计算上的简单介绍
<p>C#实现在:</p> <p><a href="http://blog.csdn.net/Felomeng/archive/2009/03/25/4023990.aspx">http://blog.csdn.net/Felomeng/archive/2009/03/25/4023990.aspx</a></
insertyou
·
2009-03-25 16:00
相似度计算
向量空间模型
(VSM)在文档相似度计算上的简单介绍
C#实现在:http://blog.csdn.net/Felomeng/archive/2009/03/25/4023990.aspx
向量空间模型
(VSM:Vectorspacemodel)是最常用的相似度计算模型
felomeng
·
2009-03-25 16:00
vector
C#
BI
文档
自然语言处理
向量空间模型
文档相似度计算实现(C#)
读者可以根据自己的需要进行加壳或改写,本文权当抛砖引玉。笔者加的壳在:http://download.csdn.net/source/1143450 VSM模型介绍:http://blog.csdn.net/Felomeng/archive/2009/03/25/4024078.aspx usingSystem;usingSystem.Collections.Generic;usingSystem
felomeng
·
2009-03-25 16:00
优化
String
C#
文档
regex
Dictionary
向量空间模型
文档相似度计算实现(C#)
<p class="MsoNormal" style="margin: 0cm 0cm 0pt; line-height: normal;"><span style=""><span style="color: #000000;"><span style="font-
insertyou
·
2009-03-25 16:00
相似度计算
北大ppt 文本挖掘技术系列之三---TextMining03-检索part2
北大ppt文本挖掘技术系列之三---TextMining03-检索part2 各种检索系统介绍Smart免费,开源(基于
向量空间模型
的文本信息检索系统,文档支持不佳,500m以下) Okapi系统不免费
专注创造价值
·
2008-06-16 23:00
搜索引擎词汇
half-lifeMD5签名算法Bitmap数据结构网页重要度量泊松分布多爬虫多调度员网页库投票方法I-Match Shingle中文分词统计学PageRank全文检索游程编码变长编码倒排索引齐普夫法则拉链法
向量空间模型
lastsweetop
·
2008-06-13 10:00
数据结构
算法
搜索引擎
全文检索
北大ppt 文本挖掘技术系列之一---TextMining02-特征提取---(附:海明距离)
海明距离)TextMining02-特征提取.pdf分词最大匹配法..分词歧义和各种数字,日期,姓名识别最大概率法最短路径法词性标注基于规则的词性标注 基于统计的词性标注(及缺陷) 文档模型布尔模型
向量空间模型
专注创造价值
·
2008-06-09 20:00
基于
向量空间模型
的文本自动分类系统的研究与实现
基于
向量空间模型
的文本自动分类系统的研究与实现ResearchandImplementationofTextCategorizationSystemBasedonVSM(Pangjianfeng)(Budongbo
starxu85
·
2008-05-31 09:00
算法
工作
vector
测试
processing
methods
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他