Similarity 第13页

数据挖掘笔记（3）——聚类、离群点分析

聚类基本概念聚类：将对象分成相似的类，聚类中一个样本可属于多个类别特征：不考虑数据的类标号，而是通过聚类产生新类标号评价：最大化类内相似性（similarity），最小化类间相似性

dananhai381·2013-08-26 18:00

Lucene Scoring 评分机制

san_yun·2013-08-21 20:00

hdu 3718 Similarity (二分图KM算法)

解题思路：二分图。建图：将学生的答案所映射的正确答案作为二分图的边，边权值为1，有两条就为2，依此类推。然后用KM算法求出最佳匹配。除以n就是要求的答案了。#include #include #include usingnamespacestd; #defineN101 #defineMIN-0xfffffff #defineMAX0xfffffff #definemax(a,b)((a)>(b)

ljd4305·2013-08-15 15:00

有趣的分形图形-递归和数学方法解决-POJ 2083

DescriptionAfractalisanobjectorquantitythatdisplaysself-similarity,inasomewhattechnicalsense,onallscales.Theobjectneednotexhibitexactlythesamestructureatallscales

gaotong2055·2013-08-13 14:00

使用余弦相似性原理计算文本的相似度

原理参考： http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html /** * */ package com.text

riching·2013-08-10 19:00

Mahout之（三）相似性度量

·2013-07-24 14:00

WordNet词网研究——JWS（Java Wordnet Similarity）语义相似度计算

JWS是WordNet::Similarity（一个Perl版的WordNet相似度比较包）的Java实现版本，想用Java实现用WordNet比较

skiffloveblue·2013-07-17 19:00

估算不同样本之间的相似性度量(Similarity Measurement)

本文的目的就是对常用的相似性度量作一个总结。本文目录：1.欧氏距离2.曼哈顿距离3.切比雪夫距离4.闵可夫斯基距离5.标准化欧氏距离6.马氏距离7.夹角余弦8.汉明距离9.杰卡德距离&杰卡德相似系数10.相关系数&相关距离11.信息熵1.欧氏距离(EuclideanDistance) 欧氏距离是最易于理解的一种距离计算方法，源自欧氏空间中两点间的距离公式。(1)二维平面上两点a(x1,y

keith0812·2013-07-16 00:00

TF-IDF与余弦相似性的应用（二）：找出相似文章

原文：http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 上一次，我用TF-IDF算法自动提取关键词。

llystar·2013-07-10 14:00

利用LUCENE求相似文档

. */ package Similarity; import ja

strayly·2013-06-06 16:00

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

在使用mahout的RecommenderJob时遇到上面的问题，调用的命令如下：bin/hadoopjarlib/mahout-core-0.5.jarorg.apache.mahout.cf.taste.hadoop.item.RecommenderJob-iinput/recommenderjob.txt-oout/recommenderjob--similarityClassnameSIM

fansy1990·2013-04-09 16:00

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

在使用mahout的RecommenderJob时遇到上面的问题，调用的命令如下： bin/hadoop jar lib/mahout-core-0.5.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -i input/recommenderjob.txt -o out/recommenderjob --similarityCl

thecloud·2013-04-09 16:00

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

在使用mahout的RecommenderJob时遇到上面的问题，调用的命令如下： bin/hadoop jar lib/mahout-core-0.5.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -i input/recommenderjob.txt -o out/recommenderjob --similarityCl

thecloud·2013-04-09 16:00

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

在使用mahout的RecommenderJob时遇到上面的问题，调用的命令如下： bin/hadoop jar lib/mahout-core-0.5.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -i input/recommenderjob.txt -o out/recommenderjob --similarityCl

thecloud·2013-04-09 08:00

距离和相似度度量

原文地址：http://webdataanalysis.net/reference-and-source/distance-and-similarity/在数据分析和数据挖掘的过程中，我们经常需要知道个体间差异的大小

Json_Nie·2013-02-18 21:22

Lucene打分规则与Similarity模块详解

搜索排序结果的控制 Lucnen作为搜索引擎中，应用最为广泛和成功的开源框架，它对搜索结果的排序，有一套十分完整的机制来控制；但我们控制搜索结果排序的目的永远只有一个，那就是信息过滤，让用户快速，准确的找到其想要的结果，丰富用户体验。以前看过一个牛人的博客，总结了4个地方，可对Lucene检索结果的排序进行控制，现在已经记不住。我自己简单整理了下面几个，若有疏漏，欢迎补充： 1

itfafa·2013-02-06 14:00

mahout的推荐引擎Taste的学习笔记（二）

（一）基于 Mahout 实现 User CF 1、相似度的计算 Similarity是计算两个用户或者两个物品之间的相似度的，归结到数学上就是计算向量的距离

eric_gcm·2013-01-30 14:00

Java WordNet Similarity

JWS是WordNet::Similarity（一

·2013-01-24 10:00

WordNet词网研究7——之JWS（Java Wordnet Similarity）语义相似度计算

JWS是WordNet::Similarity（一个Perl版的WordNet相似度比较包）的Java实现版本，想用Java实现用WordNet比较

·2013-01-23 23:00

OpenCV_模板匹配（Template Matching）

其原理很简单，就是通过一些相似度准则来衡量两个图像块之间的相似度Similarity(S,T)。2.用途模板匹配方法常用于一些平面图像处理中，例如印刷中的数字、工业零器件等小尺寸目标图像识别分类。

icvpr·2013-01-22 21:00

数据挖掘导论学习笔记（2）----- 数据（3）

相似性和相异性的度量相似度：两个对象之间的相似度（similarity）的非正式定义是这两个对象相似程度的数值度量。因而，两个对象越相似，它们的相似度越高。

defungo·2013-01-14 08:00

论文读书笔记-Using neural network to combine measures of word semantic similarity for image annotation

标题：Usingneuralnetworktocombinemeasuresofwordsemanticsimilarityforimageannotation.这篇论文是人工智能老师刘峡壁学生作品，正好和上课讲的内容相关，其中用到了神经网络，体现出了神经网络在解决问题时的优越性。下面是摘抄的一些要点：1、refineimageannotationmethod这里提到了对图像注释的改进，图像注

jj12345jj198999·2012-12-27 22:00

【Similarity calculation】 Levenshtein Distance

Levenshtein Distance 概念：首先由俄国科学家Levenshtein提出的，又叫Levenshtein Distance。是一种字符串之间相似度计算的方法。给定两个字符串S、T，将S转换成T所需要的删除，插入，替换操作的数量就叫做S到T的编辑路径。而最短的编辑路径就叫做字符串S和T的编辑距离。分析：例子：S=“eeba”

cooliufang·2012-11-27 21:00

【Similarity calculation】Jaro Winkler distance

based on http://en.wikipedia.org/wiki/Jaro%E2%80%93Winkler_distance import java.util.Arrays; public class JaroDistance { public static double jaroDistance(String source, String target

cooliufang·2012-11-27 21:00

【Similarity calculation】Jaccard Distance

JaccardtokendistanceIt issimplygivenbythenumberofcommontokensintwonamesandthecountoftotalnumberoftokensinthosenames.Jaccarddistance(simplify)Toreducethecomputationalcomplexity Jaccarddistance(weighted

cooliufang·2012-11-27 16:00

senseidb中对zoie的整合

com.senseidb.conf.SenseiServerBuilder.buildCore()方法中开始对zoie进行实例化： 1 构建ZoieConfig实例： ZoieConfig会设置Analyzer, Similarity

shixin42·2012-10-11 21:00

hdu 3718 Similarity（费用流应用）

fp_hzq·2012-10-04 13:00

interviewstreet-string similarity - 类别-string process

题目来源：https://www.interviewstreet.com/challenges/dashboard/#problem/4edb8abd7cacd解题报告：简单的字符串处理，对S的每个后缀，计算它与S的相似度，相似度计算是用递归做的。#include#includeusingnamespacestd;intgetSim(char*str1,char*str2){if(*str1=='

kindlucy·2012-09-18 22:50

interviewstreet-string similarity - 类别-string process

题目来源：https://www.interviewstreet.com/challenges/dashboard/#problem/4edb8abd7cacd解题报告：简单的字符串处理，对S的每个后缀，计算它与S的相似度，相似度计算是用递归做的。#include #include usingnamespacestd; intgetSim(char*str1,char*str2) { if(*s

kindlucy·2012-09-18 22:00

lucene.search.Similarity

Tonyguxu·2012-04-20 10:00

java比较字符串的匹配度

引用：http://www.jiaojingkuan.com/archives/689 package com.sky.file; public class Similarity

god_sky·2012-04-19 14:00

java比较字符串的匹配度

引用：http://www.jiaojingkuan.com/archives/689 package com.sky.file; public class Similarity

god_sky·2012-04-19 14:00

Lucene Similarity (Lucene 文档评分score机制详解)

个人博客：http://demi-panda.com 文档的分值代表了该文档在特定查询词下对应的相关性高低，他关联着信息检索向量空间模型中的向量夹角的接近度。一个文档越与查询词相关，得分越高。分值计算公式如下： score(q,d) = coord(q,d) · queryNorm(q) &midd

a280606790·2012-04-06 16:00

Learning dense Models of Query Similarity from User Click Logs

背景：有大量的论文研究如何计算Query直接的相关性，而这篇论文是2010年的一篇。3名作者是GoogleResearch的成员。第一作者是Fabiodebona貌似是一个德国人。他还介绍了一种并行的SVMs训练方法。GPDTisaC++softwaredesignedtotrainlarge-scaleSupportVectorMachines(SVMs) 介绍：这里训练样本很多，达到10亿Pa

poson·2012-04-04 13:00

Lucene打分规则与Similarity模块详解

搜索排序结果的控制 Lucnen作为搜索引擎中，应用最为广泛和成功的开源框架，它对搜索结果的排序，有一套十分完整的机制来控制；但我们控制搜索结果排序的目的永远只有一个，那就是信息过滤，让用户快速，准确的找到其想要的结果，丰富用户体验。以前看过一个牛人的博客，总结了4个地方，可对Lucene检索结果的排序进行控制，现在已经记不住。我自己简单整理了下面几个，若有疏漏，欢迎补充：1. 通过

Breath_L·2012-03-27 19:00

图像运算(三)——乘法(Multiplication)

Code:Similarity,showinga

Marphy11·2012-02-24 16:58

图像运算(三)——乘法(Multiplication)

Code:Similarity,showinga

lj695242104·2012-02-24 16:00

[KM算法]hdoj 3718：Similarity

大致题意：给你两个长度相同的字符串，问这两个串中的字母怎么样匹配才能使得总的复合度最大。大致思路：按照字母间的对应关系建二分图，求出最大全匹配后除以总长度。 #include<cstdio> #include<iostream> #include<cstri

暴风雪·2012-02-08 23:00

搜索博客

http://flychen.com/article/calculated-based-on-the-similarity-of-the-main-features-of-spatial-segmentation-algorithm-and-segmentation-framework.html

·2011-12-10 11:00

字符串Jaccard Similarity分析与源代码

xitong·2011-12-02 05:00

一篇关于相似性解释的文章，写得非常的仔细

http://www.miislita.com/information-retrieval-tutorial/cosine-similarity-tutorial.htmlMiIslitaTutorialsonSVD

·2011-12-01 16:00

一篇关于相似性解释的文章，写得非常的仔细

http://www.miislita.com/information-retrieval-tutorial/cosine-similarity-tutorial.htmlMiIslitaTutorialsonSVD

·2011-12-01 16:00

自定义评分器Similarity提高搜索体验

http://www.gbsou.com/2011/11/01/8048.htmlscore(q,d)=coord(q,d)·queryNorm(q)·∑(tf(tind)·idf(t)2·t.getBoost()·norm(t,d))具体可以查看相关文章：http://blog.chenlb.com/2009/08/lucene-scoring-architecture.html这里先考虑三个因

johnny_hg·2011-11-04 20:44

自定义评分器Similarity提高搜索体验

http://www.gbsou.com/2011/11/01/8048.html score(q,d) = coord(q,d)· queryNorm(q)·∑( tf(tind)· idf(t)2 · t.getBoost()· norm(t,d) ) 具体可以查看相关文章：http://blog.chenlb.com/2009/08/lucene-scoring-architec

johnnyhg·2011-11-04 20:00

WordNet-based semantic similarity measurement

WordNet-basedsemanticsimilaritymeasurement(http://www.cppblog.com/baby-fly/archive/2010/03/19/110111.html)DownloadsourcefromGoogleCoderepository(Seethearticleonhowtogeta workingcopyoftherepository.)I

wuwuwuwuwuwuwuwu·2011-10-30 17:00

自定义评分器Similarity,提高搜索体验

首先说一下lucene对文档的评分规则： score(q,d) = coord(q,d)· queryNorm(q)·∑(tf(tind)· idf(t)2· t.getBoost()· norm(t,d))具体可以查看相关文章：http://blog.chenlb.com/2009/08/lucene-scoring-architecture.html 这里先考虑三个因素coord(

xzknet·2011-10-10 15:00

hdu 3718 Similarity 二分图最大权匹配

/* 二分图最大权匹配问题，题目给定条件可以看出是完备匹配；利用最小费用最大流解决 X集合连源点，边权为1，花费0 Y集合连汇点，边权为1，花费0 X连Y中任意元素，边权为1，花费为权值的相反数最后得到的最小费用就是最大权匹配 */ #include #include #include #include #include usingnamespacestd; constintM=20010,M

wsniyufang·2011-09-08 12:00

相似度 (Similarity Score) 的计算

天空上尉·2011-09-02 00:30

java比较两个字符串的相似度

java.text.NumberFormat; import java.util.Locale; /** * 比较两个字符串的相似度 */ public class Similarity

w123456h19·2011-08-16 13:00

lucene 学习

Lucene的similarity模块主要负责对相关性打分的实现。

epgcnydy·2011-07-29 15:00

推荐频道

Similarity

数据挖掘笔记（3）——聚类、离群点分析

Lucene Scoring 评分机制

hdu 3718 Similarity (二分图KM算法)

有趣的分形图形-递归和数学方法解决-POJ 2083

使用余弦相似性原理计算文本的相似度

Mahout之（三）相似性度量

WordNet词网研究——JWS（Java Wordnet Similarity）语义相似度计算

估算不同样本之间的相似性度量(Similarity Measurement)

TF-IDF与余弦相似性的应用（二）：找出相似文章

利用LUCENE求相似文档

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

ERROR common.AbstractJob: Unexpected SIMILARITY_EUCLIDEAN_DISTANCE while processing Job-Specific Opt

距离和相似度度量

Lucene打分规则与Similarity模块详解

mahout的推荐引擎Taste的学习笔记（二）

Java WordNet Similarity

WordNet词网研究7——之JWS（Java Wordnet Similarity）语义相似度计算

OpenCV_模板匹配（Template Matching）

数据挖掘导论学习笔记（2）----- 数据（3）

论文读书笔记-Using neural network to combine measures of word semantic similarity for image annotation

【Similarity calculation】 Levenshtein Distance

【Similarity calculation】Jaro Winkler distance

【Similarity calculation】Jaccard Distance

senseidb中对zoie的整合

hdu 3718 Similarity（费用流应用）

interviewstreet-string similarity - 类别-string process

interviewstreet-string similarity - 类别-string process

lucene.search.Similarity

java比较字符串的匹配度

java比较字符串的匹配度

Lucene Similarity (Lucene 文档评分score机制详解)

Learning dense Models of Query Similarity from User Click Logs

Lucene打分规则与Similarity模块详解

图像运算(三)——乘法(Multiplication)

图像运算(三)——乘法(Multiplication)

[KM算法]hdoj 3718：Similarity

搜索博客

字符串Jaccard Similarity分析与源代码

一篇关于相似性解释的文章，写得非常的仔细

一篇关于相似性解释的文章，写得非常的仔细

自定义评分器Similarity提高搜索体验

自定义评分器Similarity提高搜索体验

WordNet-based semantic similarity measurement

自定义评分器Similarity,提高搜索体验

hdu 3718 Similarity 二分图最大权匹配

相似度 (Similarity Score) 的计算

java比较两个字符串的相似度

lucene 学习