E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
jaccard相似度
[论文笔记]Sentence-BERT[v2]
BERT系列模型基于交互式计算输入两个句子之间的
相似度
是非常低效的(但效果是很好的)。
愤怒的可乐
·
2023-10-20 13:30
论文翻译/笔记
#
文本匹配[论文]
论文阅读
bert
人工智能
SentenceBERT
Milvus 介绍
关键概念非结构化数据嵌入向量向量
相似度
搜索为什么是Milvus?支持哪些索引和指标?索引类型
相似度
指标(Similaritymetrics)应用示例Milvus是如何设计的?
engchina
·
2023-10-20 13:48
LINUX
milvus
SnowNLP使用自定义语料进行模型训练
SnowNLP是一个功能强大的中文文本处理库,它囊括了中文分词、词性标注、情感分析、文本分类、关键字/摘要提取、TF/IDF、文本
相似度
等诸多功能,像隐马尔科夫模型、朴素贝叶斯、TextRank等算法均在这个库中有对应的应用
qq_30895747
·
2023-10-20 12:12
python智能算法
python
snowNLP
情感分析
变位词算法
题目描述大致如下:1.给出一个两个字符串互为变位词的
相似度
算法。当他们为变位词的时候输出1.0;当他们长度不同且没有相同字母时输出0;其他情况给出一个规则输出一个0到1之间的浮点数。2.有一个文件其
zhuyufufu
·
2023-10-20 10:30
编程相关
Java相关
数据结构算法
性能优化
算法
面试
变位词
数据结构
容器集合
10.19课后作业
一、视频分镜:基于均值哈希;基于直方图
相似度
首先导入需要的包以及视频所在位置importcv2importnumpyasnpimportmatplotlib.pyplotaspltimportosos.chdir
zhimahua121000
·
2023-10-20 04:08
python
深度分析短视频搬运视频消重九种方法各平台轻松过原创
所以比较两个视频的
相似度
其实就是图片的对比。平台会把视频的片头几秒抽出几帧,然
大飞哥软件自习室
·
2023-10-20 00:34
短视频消重
音视频
不再关心世界的看法-取关/掉粉/阅读量下降
也在今天下午,遇到了一位老乡,她和我的
相似度
高达百分之九十。这是我今天最大的收获吧,收获了友谊。忽然想到昨天,那些取关的好友。突然想想,在一个人疯狂进化与迭代的路上,有人弃你实在是一件太过正常
释心_98a3
·
2023-10-19 22:51
数据挖掘(6)聚类分析
挖掘有价值的客户:找到客户的黄金客户ATM的安装位置1.2区别·二、距离和相似系数2.1概述原则:组内数据有较高
相似度
、不同组数据不相似相似性的度量(统计学角度):Q型聚类:对样本聚类(行聚类)R型聚类
烟雨平生9527
·
2023-10-19 01:20
数据挖掘
人工智能
协同过滤之基于用户-物品矩阵推荐系统(待续)
先说基于物品的协同过滤,原理就是上面这张图,下面说步骤一、基于物品的协同过滤步骤:1、根据用户对物品的评分构建用户-物品矩阵2、创建一个nn的物品
相似度
矩阵在产品-产品协同过滤中的产品之间的相似性值是通过观察所有对两个产品之间的打分的用户来度量的通过计算每一个
平原2018
·
2023-10-19 00:34
算法
推荐算法
协同过滤
词向量源码解析:(4.6)hyperwords源码解析之evaluation
simialrity衡量词向量性质的过程是:数据集包括了大量的单词对(wordpair)以及人对于这个两个单词
相似度
的打分。我们得到的词向量同样也能对这个单词对的
相似度
进行打分。我们希
Sailing_ZhaoZhe
·
2023-10-18 10:38
词向量
Programming Collective Intelligence 读书笔记之 Data clustering
在数据量巨大的应用中,通过相关方法找到
相似度
很高的群组,并针对其进行下一步操作,例如市场营销,推荐策略等是数据聚类相关的应用价值SupervisedLearning,监督学习,这是一类利用已有的样本的输入输出来预判接下来的输入相对应的输出的学习方法
Sophia大黄
·
2023-10-18 09:46
Wor2vec application for Recommenders and Advertising
通过平均用户所有喜欢歌单中的歌曲嵌入生成用户的"MusicTaste"Vector,该向量可以用于
相似度
查询找到其他"MusicTaste"Ve
BoringFantasy
·
2023-10-18 08:23
DIN模型和SIM模型原理与实践
文章目录1.DIN模型原理缺点2.SIM模型原理算法步骤1.查找2.注意力机制参考文献1.DIN模型原理计算用户LastN向量的加权平均权重是候选物品与LastN物品的
相似度
缺点注意力层的计算量正比于n
HelloNettt
·
2023-10-17 20:31
深度学习
心法利器[13] | 任务方案思考:句子
相似度
和匹配
【前沿重器】全新栏目,本栏目主要和大家一起讨论近期自己学习的心得和体会,与大家一起成长。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。往期回顾心法利器[8]|模型热更新小记心法利器[9]|算法项目从0到1孵化过程心法利器[10]|算法项目从1到N的进化心法利器[11]|任务方案思考:文本分类篇心法利器[12]|任务方案思考:序列标注(NER)篇0小系列初衷自己接触的项目大都是初创,没开始多久
机智的叉烧
·
2023-10-17 11:29
人工智能
深度学习
机器学习
大数据
java
【Interview】想法合集
i2i算法概述-皓轩的文章-知乎i2i相比u2i的优点;统计召回与向量召回的区别:i2i算法的目的是计算两个item之间的
相似度
。主要有两大类型,分别是基于统计的算法、基于embedding的算法。
sdbhewfoqi
·
2023-10-17 03:30
Interview
深度学习
基于物品的协同过滤算法的Python实现
作者:冯向博微信:supermvn介绍:推荐系统学习整理目录一.基于物品的协同过滤二.物品
相似度
计算与实现三.ICF的推荐实现四.总结一下五.练习一.基于物品的协同过滤基于物品的协同过滤,是将用户A的item
MiAlexFeng
·
2023-10-17 00:45
算法学习-回溯问题与剪枝
字母大小写全排列棋盘问题二叉树问题257.二叉树的所有路径129.求根节点到叶节点数字之和988.从叶结点开始的最小字符串112.路径总和113.路径总和2437.路径总和3集合划分问题698.划分为k个相等的子集其他问题854.
相似度
为
蒋大钊!
·
2023-10-16 18:30
算法人生
算法
学习
剪枝
聚类算法
我们手里没有标签聚类:相似的东西分到一组难点:如何评估,如何调参算法概述一、k-means算法基本概念:1.要得到簇的个数,需要指定k值2.质心:均值,即向量各纬取平均即可3.距离的度量:常用欧几里得距离和余弦
相似度
鬼马星mc
·
2023-10-16 11:24
tBERT-BERT融合主题模型
今天分享一个论文ACL2020-tBERT,论文主要融合主题模型和BERT去做语义
相似度
判定,在特定领域使用这个模型,效果更明显。
biuHeartBurn
·
2023-10-16 11:53
NLP学习笔记
深度学习
人工智能
bert
人工智能
深度学习
机器学习-无监督学习之聚类
计算样本点到各均值向量的距离,距离哪个最近就属于哪个簇Step3:重新计算中心点作为均值向量,重复第二步直到收敛常见距离曼哈顿距离(街区距离)欧氏距离切比雪夫距离(棋盘距离)闵氏距离(结合前三种)余弦
相似度
适用场景
小蒋的技术栈记录
·
2023-10-16 10:45
深度学习
机器学习
学习
聚类
云原生向量数据库Milvus知识大全,看完这篇就够了[基本概念、系统架构、主要组件、应用场景]
Milvus基于FAISS、Annoy、HNSW等向量搜索库构建,核心是解决稠密向量
相似度
检索的问题。
汀、人工智能
·
2023-10-15 20:15
Milvus
云原生
数据库
milvus
向量数据库
搜索引擎
Annoy vs Milvus:哪个向量数据库更适合您的AI应用?知其然知其所以然
1.AnnoyvsMilvus简介Annoy和Milvus都是用于向量索引和
相似度
搜索的开源库,它们可以高效地处理大规模的向量数据。
汀、人工智能
·
2023-10-15 20:41
Milvus
milvus
数据库
人工智能
annoy
向量搜索
搜索系统
语义搜索
基于OpenCV的灰度图的图片
相似度
计算
fromskimage.metricsimportstructural_similarityasssimimportmatplotlib.pyplotaspltimportcv2defpicture_recognization(imagname):#读取两张图片image1=cv2.imread('D:/AutoTest/PythonProject/standard_img/'+imagname)
巅峰程序
·
2023-10-15 16:09
UI自动化测试
opencv
python
人工智能
【Pytorch】深度学习之损失函数
损失函数平滑L1(SmoothL1)损失函数目标泊松分布的负对数似然损失KL散度MarginRankingLoss多标签边界损失函数二分类损失函数多分类的折页损失三元组损失HingEmbeddingLoss余弦
相似度
自律版光追
·
2023-10-15 14:55
#
Pytorch教程
深度学习
pytorch
人工智能
学习
笔记
孤立核函数( Isolation Kernel)的前世今生
图1:水果酸甜度分布
相似度
计算是很多数据挖掘和机器学习算法中不可或缺的一部分,而核函数(kernelfunction)的最终目的也是计算任意两个数据点的
相似度
。
YeZhu
·
2023-10-15 07:06
ConSERT和SimCSE方法对比
问答系统的搭建过程一般需要多个模块联合工作才能实现整个系统的功能,但通过实践发现,每个模块归根到底都是在计算
相似度
,而使用范围广、有效性强的一种任务就是计算句子对的相似性,或者称为SemanticTextualSimilarity
zzfive
·
2023-10-15 06:55
论文阅读
NLP对比学习
深度学习
人工智能
机器学习
文本匹配SimCSE模型代码详解以及训练自己的中文数据集
前言在上一篇博客文本匹配中的示例代码中使用到了一个SimCSE模型,用来提取短文本的特征,然后计算特征
相似度
,最终达到文本匹配的目的。
肥宅程序员aka不会游泳的鱼
·
2023-10-15 06:23
人工智能
深度学习
loss函数之CosineEmbeddingLoss,HingeEmbeddingLoss
CosineEmbeddingLoss余弦
相似度
损失函数,用于判断输入的两个向量是否相似。常用于非线性词向量学习以及半监督学习。
旺旺棒棒冰
·
2023-10-14 15:05
深度学习理论
loss
余弦loss
余弦损失函数
学习笔记(attention-transformer)
词向量学习文本的表示方式主要分为:one-hot表达方式与分布式表达方式one-hot表达方式存在两个明显的缺陷:无法表示语义的
相似度
sparsity(形成的矩阵非常稀疏)100维的one-hot最后可以表示
小孙同学1997
·
2023-10-13 21:39
Java计算余弦值的方法_Java基于余弦方法实现的计算
相似度
算法示例
本文实例讲述了Java基于余弦方法实现的计算
相似度
算法。分享给大家供大家参考,具体如下:(1)余弦相似性通过测量两个向量之间的角的余弦值来度量它们之间的相似性。
weixin_39633954
·
2023-10-13 19:39
Java计算余弦值的方法
向量的夹角余弦公式_文本
相似度
之余弦夹角 度量算法
相似度
度量(Similarity),即计算个体间的相似程度,
相似度
度量的值越小,说明个体间
相似度
越小,
相似度
的值越大说明个体差异越大。
愙賗
·
2023-10-13 19:09
向量的夹角余弦公式
搜索高维向量余弦
相似度
的优化原理+算法实现
目录1、定义2、优化思路2.1、传统方法2.2、优化方法3、数学原理4、实验程序(Java)1、定义余弦
相似度
用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。
黎明鱼儿
·
2023-10-13 19:38
算法
线性代数
算法
矩阵
自然语言处理(二):余弦算法计算词汇
相似度
预备知识:欧式距离与余弦
相似度
计算方法1、欧式距离随机取出两个词向量A和B,A的词向量表示为[A1,A2,A3…An],B的词向量表示为[B1,B2,B3…Bn]。
悠哉的咸鱼
·
2023-10-13 19:34
自然语言处理
python
深度学习
机器学习
自然语言处理
milvus和
相似度
检索
流程milvus的使用流程是创建collection->创建partition->创建索引(如果需要检索)->插入数据->检索这里以Python为例,使用的milvus版本为2.3.x首先按照库,python3-mpipinstallpymilvusConnectfrompymilvusimportconnectionsconnections.connect(alias="default",use
梦实现了吗
·
2023-10-13 19:33
vector-database
milvus
数据库
java算法(1)——余弦
相似度
计算字符串相似率
余弦
相似度
计算字符串相似率功能需求:最近在做通过爬虫技术去爬取各大相关网站的新闻,储存到公司数据中。
阿舒带你学编程
·
2023-10-13 19:31
java
java
算法
python
jvm
intellij-idea
使用余弦
相似度
算法计算文本
相似度
-数学
20211201也就是效果皮尔逊>余弦>欧式余弦
相似度
的局限皮尔逊的优势,相当于是改进版余弦
相似度
欧式与余弦欧式侧重于直线距离归一化之后的欧式和余弦的效果也不同比如0,1和1,0tfidf用余弦
相似度
就足够
weixin_ry5219775
·
2023-10-13 19:00
数据仓库
sql
python
cos
相似度
算法 余弦距离计算
定义余弦距离,也称余弦
相似度
,是用向量空间中两个向量夹角的余弦值作为衡量两个个体之间差异大小的度量。
工程师小哥
·
2023-10-13 19:28
算法
java
大数据
文本向量化方法比较:tf-idf、doc2bow、doc2vec、lsi、lda
用余弦距离计算
相似度
以判断向量化效果tf-idf、doc2bow稀疏,适合短文本doc2vec效果时好时坏,偶然性大,不稳lsi、lda效果好且较稳,但lda计算量偏大fromgensim.modelsimportdoc2vecfromgensimimportcorpora
帅气的学术狗
·
2023-10-13 14:48
Java 计算两个字符串的
相似度
CosineSimilarity实现
沉淀下来,雕琢技术~最近遇到需要校验字符串的
相似度
的需求,遂经常调研查询资料发现,apache提供的commons-text依赖有个CosineSimilarity类提供可以匹配两个字符串的
相似度
。
爱打斯诺克的码农飞
·
2023-10-13 12:09
java
开发语言
TP-LINK校招系统测试岗面经汇总
思路:由于这个网站的滑动验证码没有原图,于是使用了cv2这个库的一些方法进行滑块和缺口位置的匹配,找到最相似的坐标然后进行移动,因为有些滑块图和验证码图片
相似度
较高,所以可能会出现失败的情况(事实
消极掰
·
2023-10-13 03:47
面试
python 公司名称
相似度
分析_使用Python完成公司名称和地址的模糊匹配
正如题目中说的一样,这个程序的目的是实现公司名及公司地址的模糊匹配,也可以迁移到房产信息、电话号码之类的字段上。本来的应用场景是反团伙欺诈以及失联客户的修复,大概的意思就是说多个相同公司的同事都在我公司借贷的欺诈可能性要高于其他客户,以及造假的房产信息和电话号码可能不完全相同,但有一定的相似性,我们需要把这些客户找出来,但是又不能用精确匹配。因为存在问题的房产信息和电话可能只是相似,而不是完全相同
weixin_39532421
·
2023-10-13 02:32
python
公司名称
相似度分析
集合
相似度
#include#include#include#includeusingnamespacestd;//3//39987101//487101587//7991011851351899//2//12//13intmain(){intN,M;cin>>N;sets[50];for(inti=0;i>a;s[i].insert(a);}}intk;scanf("%d",&k);for(inti=0,a
云儿乱飘
·
2023-10-12 20:58
算法题
算法
c++
数据结构
玩好五个微信运营方法,创造上百万的收益
然而,做了一段时间后效果却不理想,不同微信号之间的
相似度
太高了,也没有自己的特点,自然做不大、做不强,今天,微信群小编就为大家揭秘那些微信大咖们是如何做好微信运营的。
琴狂剑也妄
·
2023-10-12 19:09
自定义git命令
扩展git功能的一种方式有时需要根据自己的工作场合去扩展git命令,比如推送到仓库后自动打开浏览器跳转到发起合并求页面分支命名比较长其
相似度
比较大时,自动补全不那么有效率,给每个分支编号,输入指定编号即可切换对应的分支我最推荐的一种方式是利用
浮生琐忆
·
2023-10-12 16:51
OpenCV4(C++)——模板匹配
matchTemplate模板匹配和卷积运算大致相同,模板图类似于卷积核,从原图的左上角开始进行滑动窗口的操作,最后得到一个特征图,这个特征图里的数值就是每次计算得到的
相似度
,通用匹配方式,相似值是(0
想要躺平的一枚
·
2023-10-12 16:22
opencv
c++
opencv
简单方便,西葫芦鸡蛋饼,少油少盐,美味可口
也许一个家族的人总会在某一点上有着惊人的
相似度
,给人似曾相似的感觉。首先把西葫芦叫小南瓜的人,未必学过植物学,很可能完全无从知晓两者之间的关系,但是,
灶里烟火
·
2023-10-12 12:08
【科学文献计量】利用pybibx分析Scopus文献数据集(EDA,N-Grams,Cluster,Network analysis,NLP)
4.4文献聚类4.5主题词演化4.6桑基图可视化4.7树图可视化4.8作者生产力可视化5网络可视化5.1文献引用与被引用可视化5.2文献引用与被引用历年直方图5.3邻接网络5.4指定节点网络5.5文献
相似度
网络
lys_828
·
2023-10-12 08:37
python科学计量数据可视化
N-Grams
主题模型
摘要提取
知识图谱
文献聚类
汉明距离之算法和实现总结
用来表示两个向量之间的
相似度
。汉明距离计算的步骤,即对两个向量首先进行异或操作,然后对异或的结果的每一位bit进行统计,最后合计出有多少bit的值为1。
Zuocheng_Liu
·
2023-10-11 20:29
Algorithm
算法
c++
开发语言
基于ChatGPT+词向量/词嵌入实现相似商品推荐系统
,给一个商品描述(比如'WIENERA/B7IN5/LBFZN'),系统给出商品库中最相似的TOP5种商品,这种单纯的推荐系统用词向量就可以实现,不过,这个项目特点是商品库巨大,有19万余商品,且商品
相似度
高
合众国的原野
·
2023-10-11 18:53
项目笔记
人工智能
推荐算法
chatgpt
embedding
学会突破
今天突然发现,自己写的文章感觉
相似度
挺高的。虽然完稿的速度变快了,可是重复性特别高,也代表没有进步,一直在做重复的工作,特别浪费时间。
Mongchichi
·
2023-10-11 15:25
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他