E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Similarity
数据挖掘笔记(3)——聚类、离群点分析
聚类基本概念聚类: 将对象分成相似的类,聚类中一个样本可属于多个类别特征: 不考虑数据的类标号,而是通过聚类产生新类标号评价: 最大化类内相似性(
similarity
),最小化类间相似性
dananhai381
·
2013-08-26 18:00
Lucene Scoring 评分机制
首先来看下lucene的评分公式(在
Similarity
类里的说明)sco
san_yun
·
2013-08-21 20:00
Lucene
hdu 3718
Similarity
(二分图KM算法)
解题思路:二分图。建图:将学生的答案所映射的正确答案作为二分图的边,边权值为1,有两条就为2,依此类推。然后用KM算法求出最佳匹配。除以n就是要求的答案了。#include #include #include usingnamespacestd; #defineN101 #defineMIN-0xfffffff #defineMAX0xfffffff #definemax(a,b)((a)>(b)
ljd4305
·
2013-08-15 15:00
有趣的分形图形-递归和数学方法解决-POJ 2083
DescriptionAfractalisanobjectorquantitythatdisplaysself-
similarity
,inasomewhattechnicalsense,onallscales.Theobjectneednotexhibitexactlythesamestructureatallscales
gaotong2055
·
2013-08-13 14:00
使用余弦相似性原理计算文本的相似度
原理参考: http://www.ruanyifeng.com/blog/2013/03/cosine_
similarity
.html /** * */ package com.text
riching
·
2013-08-10 19:00
相似度
Mahout之(三)相似性度量
基于皮尔森相关性的相似度 —— Pearson correlation-based
similarity
皮尔森相关系数反应了两个变量之间的线性相关程度,它的取值在
·
2013-07-24 14:00
Mahout
WordNet词网研究——JWS(Java Wordnet
Similarity
)语义相似度计算
JWS是WordNet::
Similarity
(一个Perl版的WordNet相似度比较包)的Java实现版本,想用Java实现用WordNet比较
skiffloveblue
·
2013-07-17 19:00
估算不同样本之间的相似性度量(
Similarity
Measurement)
本文的目的就是对常用的相似性度量作一个总结。本文目录:1.欧氏距离2.曼哈顿距离3.切比雪夫距离4.闵可夫斯基距离5.标准化欧氏距离6.马氏距离7.夹角余弦8.汉明距离9.杰卡德距离&杰卡德相似系数10.相关系数&相关距离11.信息熵1.欧氏距离(EuclideanDistance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。(1)二维平面上两点a(x1,y
keith0812
·
2013-07-16 00:00
TF-IDF与余弦相似性的应用(二):找出相似文章
原文:http://www.ruanyifeng.com/blog/2013/03/cosine_
similarity
.html 上一次,我用TF-IDF算法自动提取关键词。
llystar
·
2013-07-10 14:00
id
利用LUCENE求相似文档
. */ package
Similarity
; import ja
strayly
·
2013-06-06 16:00
Lucene
ERROR common.AbstractJob: Unexpected
SIMILARITY
_EUCLIDEAN_DISTANCE while processing Job-Specific Opt
在使用mahout的RecommenderJob时遇到上面的问题,调用的命令如下:bin/hadoopjarlib/mahout-core-0.5.jarorg.apache.mahout.cf.taste.hadoop.item.RecommenderJob-iinput/recommenderjob.txt-oout/recommenderjob--similarityClassnameSIM
fansy1990
·
2013-04-09 16:00
Mahout
距离设置异常
ERROR common.AbstractJob: Unexpected
SIMILARITY
_EUCLIDEAN_DISTANCE while processing Job-Specific Opt
在使用mahout的RecommenderJob时遇到上面的问题,调用的命令如下: bin/hadoop jar lib/mahout-core-0.5.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -i input/recommenderjob.txt -o out/recommenderjob --similarityCl
thecloud
·
2013-04-09 16:00
abstract
ERROR common.AbstractJob: Unexpected
SIMILARITY
_EUCLIDEAN_DISTANCE while processing Job-Specific Opt
在使用mahout的RecommenderJob时遇到上面的问题,调用的命令如下: bin/hadoop jar lib/mahout-core-0.5.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -i input/recommenderjob.txt -o out/recommenderjob --similarityCl
thecloud
·
2013-04-09 16:00
abstract
ERROR common.AbstractJob: Unexpected
SIMILARITY
_EUCLIDEAN_DISTANCE while processing Job-Specific Opt
在使用mahout的RecommenderJob时遇到上面的问题,调用的命令如下: bin/hadoop jar lib/mahout-core-0.5.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -i input/recommenderjob.txt -o out/recommenderjob --similarityCl
thecloud
·
2013-04-09 08:00
abstract
距离和相似度度量
原文地址:http://webdataanalysis.net/reference-and-source/distance-and-
similarity
/在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小
Json_Nie
·
2013-02-18 21:22
咨询
Lucene打分规则与
Similarity
模块详解
搜索排序结果的控制 Lucnen作为搜索引擎中,应用最为广泛和成功的开源框架,它对搜索结果的排序,有一套十分完整的机制来控制;但我们控制搜索结果排序的目的永远只有一个,那就是信息过滤,让用户快速,准确的找到其想要的结果,丰富用户体验。 以前看过一个牛人的博客,总结了4个地方,可对Lucene检索结果的排序进行控制,现在已经记不住。我自己简单整理了下面几个,若有疏漏,欢迎补充: 1
itfafa
·
2013-02-06 14:00
搜索引擎
Lucene
mahout的推荐引擎Taste的学习笔记(二)
(一)基于 Mahout 实现 User CF 1、相似度的计算
Similarity
是计算两个用户或者两个物品之间的相似度的,归结到数学上就是计算向量的距离
eric_gcm
·
2013-01-30 14:00
Mahout
Java WordNet
Similarity
JWS是WordNet::
Similarity
(一
·
2013-01-24 10:00
WordNet
WordNet词网研究7——之JWS(Java Wordnet
Similarity
)语义相似度计算
JWS是WordNet::
Similarity
(一个Perl版的WordNet相似度比较包)的Java实现版本,想用Java实现用WordNet比较
·
2013-01-23 23:00
相似度计算
OpenCV_模板匹配(Template Matching)
其原理很简单,就是通过一些相似度准则来衡量两个图像块之间的相似度
Similarity
(S,T)。2.用途模板匹配方法常用于一些平面图像处理中,例如印刷中的数字、工业零器件等小尺寸目标图像识别分类。
icvpr
·
2013-01-22 21:00
template
opencv
matching
模板匹配
数据挖掘导论学习笔记(2)----- 数据(3)
相似性和相异性的度量 相似度:两个对象之间的相似度(
similarity
)的非正式定义是这两个对象相似程度的数值度量。因而,两个对象越相似,它们的相似度越高。
defungo
·
2013-01-14 08:00
数据挖掘
论文读书笔记-Using neural network to combine measures of word semantic
similarity
for image annotation
标题:Usingneuralnetworktocombinemeasuresofwordsemanticsimilarityforimageannotation.这篇论文是人工智能老师刘峡壁学生作品,正好和上课讲的内容相关,其中用到了神经网络,体现出了神经网络在解决问题时的优越性。下面是摘抄的一些要点:1、refineimageannotationmethod这里提到了对图像注释的改进,图像注
jj12345jj198999
·
2012-12-27 22:00
【
Similarity
calculation】 Levenshtein Distance
Levenshtein Distance 概念: 首先由俄国科学家Levenshtein提出的,又叫Levenshtein Distance。 是一种字符串之间相似度计算的方法。给定两个字符串S、T,将S转换成T所需要的删除,插入,替换操作的数量就叫做S到T的编辑路径。而最短的编辑路径就叫做字符串S和T的编辑距离。 分析: 例子:S=“eeba”
cooliufang
·
2012-11-27 21:00
java
【
Similarity
calculation】Jaro Winkler distance
based on http://en.wikipedia.org/wiki/Jaro%E2%80%93Winkler_distance import java.util.Arrays; public class JaroDistance { public static double jaroDistance(String source, String target
cooliufang
·
2012-11-27 21:00
java
【
Similarity
calculation】Jaccard Distance
JaccardtokendistanceIt issimplygivenbythenumberofcommontokensintwonamesandthecountoftotalnumberoftokensinthosenames.Jaccarddistance(simplify)Toreducethecomputationalcomplexity Jaccarddistance(weighted
cooliufang
·
2012-11-27 16:00
java
distance
Jaccard
senseidb中对zoie的整合
com.senseidb.conf.SenseiServerBuilder.buildCore()方法中开始对zoie进行实例化: 1 构建ZoieConfig实例: ZoieConfig会设置Analyzer,
Similarity
shixin42
·
2012-10-11 21:00
IE
hdu 3718
Similarity
(费用流应用)
SimilarityTimeLimit:4000/2000MS(Java/Others) MemoryLimit:65536/65536K(Java/Others)TotalSubmission(s):855 AcceptedSubmission(s):319ProblemDescriptionWhenwewerechildren,wewerealwaysaskedtodothecla
fp_hzq
·
2012-10-04 13:00
apple
homework
each
output
classification
Numbers
interviewstreet-string
similarity
- 类别-string process
题目来源:https://www.interviewstreet.com/challenges/dashboard/#problem/4edb8abd7cacd解题报告:简单的字符串处理,对S的每个后缀,计算它与S的相似度,相似度计算是用递归做的。#include#includeusingnamespacestd;intgetSim(char*str1,char*str2){if(*str1=='
kindlucy
·
2012-09-18 22:50
interviewstreet-string
similarity
- 类别-string process
题目来源:https://www.interviewstreet.com/challenges/dashboard/#problem/4edb8abd7cacd解题报告:简单的字符串处理,对S的每个后缀,计算它与S的相似度,相似度计算是用递归做的。#include #include usingnamespacestd; intgetSim(char*str1,char*str2) { if(*s
kindlucy
·
2012-09-18 22:00
String
input
each
output
lucene.search.
Similarity
SimilaritydefinesthecomponentsofLucenescoring.OverridingcomputationofthesecomponentsisaconvenientwaytoalterLucenescoring.Suggestedreading:IntroductionToInformationRetrieval,Chapter6.Thefollowingdescri
Tonyguxu
·
2012-04-20 10:00
Lucene
java比较字符串的匹配度
引用:http://www.jiaojingkuan.com/archives/689 package com.sky.file; public class
Similarity
god_sky
·
2012-04-19 14:00
java
java比较字符串的匹配度
引用:http://www.jiaojingkuan.com/archives/689 package com.sky.file; public class
Similarity
god_sky
·
2012-04-19 14:00
java
Lucene
Similarity
(Lucene 文档评分score机制详解)
个人博客:http://demi-panda.com 文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索向量空间模型中的向量夹角的接近度。一个文档越与查询词相关,得分越高。分值计算公式如下: score(q,d) = coord(q,d) · queryNorm(q) &midd
a280606790
·
2012-04-06 16:00
Lucene
Learning dense Models of Query
Similarity
from User Click Logs
背景:有大量的论文研究如何计算Query直接的相关性,而这篇论文是2010年的一篇。3名作者是GoogleResearch的成员。第一作者是Fabiodebona貌似是一个德国人。他还介绍了一种并行的SVMs训练方法。GPDTisaC++softwaredesignedtotrainlarge-scaleSupportVectorMachines(SVMs) 介绍:这里训练样本很多,达到10亿Pa
poson
·
2012-04-04 13:00
Lucene打分规则与
Similarity
模块详解
搜索排序结果的控制 Lucnen作为搜索引擎中,应用最为广泛和成功的开源框架,它对搜索结果的排序,有一套十分完整的机制来控制;但我们控制搜索结果排序的目的永远只有一个,那就是信息过滤,让用户快速,准确的找到其想要的结果,丰富用户体验。以前看过一个牛人的博客,总结了4个地方,可对Lucene检索结果的排序进行控制,现在已经记不住。我自己简单整理了下面几个,若有疏漏,欢迎补充:1. 通过
Breath_L
·
2012-03-27 19:00
java
排序
Lucene
打分
Similarity
图像运算(三)——乘法(Multiplication)
Code:
Similarity
,showinga
Marphy11
·
2012-02-24 16:58
Image
Processing-Base
图像运算(三)——乘法(Multiplication)
Code:
Similarity
,showinga
lj695242104
·
2012-02-24 16:00
function
image
Arrays
input
float
output
[KM算法]hdoj 3718:
Similarity
大致题意: 给你两个长度相同的字符串,问这两个串中的字母怎么样匹配才能使得总的复合度最大。 大致思路: 按照字母间的对应关系建二分图,求出最大全匹配后除以总长度。 #include<cstdio> #include<iostream> #include<cstri
暴风雪
·
2012-02-08 23:00
数据结构
ACM
hdoj 3718
Similarity
KM算法
搜索博客
http://flychen.com/article/calculated-based-on-the-
similarity
-of-the-main-features-of-spatial-segmentation-algorithm-and-segmentation-framework.html
·
2011-12-10 11:00
博客
字符串Jaccard
Similarity
分析与源代码
Jaccard
Similarity
定义 定义: Jaccard
Similarity
是针对2个集合而言的,对于集合S和 T,Jaccard
similarity
: Jaccard(S,T) =
xitong
·
2011-12-02 05:00
字符串
一篇关于相似性解释的文章,写得非常的仔细
http://www.miislita.com/information-retrieval-tutorial/cosine-
similarity
-tutorial.htmlMiIslitaTutorialsonSVD
·
2011-12-01 16:00
文章
一篇关于相似性解释的文章,写得非常的仔细
http://www.miislita.com/information-retrieval-tutorial/cosine-
similarity
-tutorial.htmlMiIslitaTutorialsonSVD
·
2011-12-01 16:00
文章
自定义评分器
Similarity
提高搜索体验
http://www.gbsou.com/2011/11/01/8048.htmlscore(q,d)=coord(q,d)·queryNorm(q)·∑(tf(tind)·idf(t)2·t.getBoost()·norm(t,d))具体可以查看相关文章:http://blog.chenlb.com/2009/08/lucene-scoring-architecture.html这里先考虑三个因
johnny_hg
·
2011-11-04 20:44
搜索引擎及相关
Java
自定义评分器
Similarity
提高搜索体验
http://www.gbsou.com/2011/11/01/8048.html score(q,d) = coord(q,d)· queryNorm(q)·∑( tf(tind)· idf(t)2 · t.getBoost()· norm(t,d) ) 具体可以查看相关文章:http://blog.chenlb.com/2009/08/lucene-scoring-architec
johnnyhg
·
2011-11-04 20:00
自定义
WordNet-based semantic
similarity
measurement
WordNet-basedsemanticsimilaritymeasurement(http://www.cppblog.com/baby-fly/archive/2010/03/19/110111.html)DownloadsourcefromGoogleCoderepository(Seethearticleonhowtogeta workingcopyoftherepository.)I
wuwuwuwuwuwuwuwu
·
2011-10-30 17:00
Algorithm
each
library
Dictionary
distance
Semantic
自定义评分器
Similarity
,提高搜索体验
首先说一下lucene对文档的评分规则: score(q,d) = coord(q,d)· queryNorm(q)·∑(tf(tind)· idf(t)2· t.getBoost()· norm(t,d))具体可以查看相关文章:http://blog.chenlb.com/2009/08/lucene-scoring-architecture.html 这里先考虑三个因素coord(
xzknet
·
2011-10-10 15:00
hdu 3718
Similarity
二分图最大权匹配
/* 二分图最大权匹配问题,题目给定条件可以看出是完备匹配; 利用最小费用最大流解决 X集合连源点,边权为1,花费0 Y集合连汇点,边权为1,花费0 X连Y中任意元素,边权为1,花费为权值的相反数 最后得到的最小费用就是最大权匹配 */ #include #include #include #include #include usingnamespacestd; constintM=20010,M
wsniyufang
·
2011-09-08 12:00
Class
ini
相似度 (
Similarity
Score) 的计算
相似度(SimilarityScore)是经常用在信息检索中.相似度在信息检索中的作用是对文档中的字和词有的共性大小在匹配时来定义相似度T为被识字符块与标准字模板某类点的共有数分别占两图块该类点总数的比率,其取值范围为0~1.以上我用JAVA代码介绍了TF-IDF的计算.这里我将会用余玄相似度公式来介绍在信息检索中如何计算文档中的词与查询相似度.公式:在计算信息检索的相似度中,这里需要先计算文档中
天空上尉
·
2011-09-02 00:30
java比较两个字符串的相似度
java.text.NumberFormat; import java.util.Locale; /** * 比较两个字符串的相似度 */ public class
Similarity
w123456h19
·
2011-08-16 13:00
相似度
lucene 学习
Lucene的
similarity
模块主要负责对相关性打分的实现。
epgcnydy
·
2011-07-29 15:00
Lucene
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他