E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
K均值文本聚类
python中文
文本聚类
可视化_Python、R对小说进行文本挖掘和层次聚类可视化分析案例...
原文链接:http://tecdat.cn/?p=5673《第二十二条军规》是美国作家约瑟夫·海勒创作的长篇小说,该小说以第二次世界大战为背景,通过对驻扎在地中海一个名叫皮亚诺扎岛(此岛为作者所虚构)上的美国空军飞行大队所发生的一系列事件的描写,揭示了一个非理性的、无秩序的、梦魇似的荒诞世界。我喜欢整本书中语言的创造性使用和荒谬人物的互动。本文对该小说进行文本挖掘和可视化。数据集该文有大约175
河岸的翁
·
2023-04-07 22:36
python中文文本聚类可视化
机器学习 - 聚类
K均值
聚类 KMeans Analysis(学习笔记)
基于划分的KMeans算法原理(Partition-basedmethods)目标:类内的点足够近,类间的点足够远算法流程:1.选择聚类的个数K2.随机选定聚类中心3.根据点到聚类中心距离(欧式距离)确定各个点所属类别4.根据各个类别的数据更新聚类中心5.重复以上步骤直到收敛(中心点不再变化)优点:1.算法快速、简单2.对大数据集有较高的效率并且是可伸缩性的3.时间复杂度近于线性,而且适合挖掘大规
corina_qin
·
2023-04-07 00:27
机器学习
学习笔记
机器学习
聚类
数学建模—聚类(matlab、spss)
K均值
Q型聚类 R型聚类
文章目录一、
K均值
二、Q型聚类三、R型聚类聚类三种方法:【说明】1、三种方式输入矩阵行为个案,列为变量量纲不同需要预处理,一般使用zscore()zscore()标准化为对每一列操作减去均值除以标准差2
斌狗
·
2023-04-06 03:23
数学建模
聚类
机器学习
python
5-Spark高级数据分析-第五章 基于
K均值
聚类的网络流量异常检测
据我们所知,有‘已知的已知’,有些事,我们知道我们知道;我们也知道,有‘已知的未知’,也就是说,有些事,我们现在知道我们不知道。但是,同样存在‘不知的不知’——有些事,我们不知道我们不知道。上一章中分类和回归都属于监督学习。当目标值是未知时,需要使用非监督学习,非监督学习不会学习如何预测目标值。但是,它可以学习数据的结构并找出相似输入的群组,或者学习哪些输入类型可能出现,哪些类型不可能出现。5.1
weixin_30553065
·
2023-04-05 13:26
scala
大数据
java
Spark数据挖掘-基于 K 均值聚类的网络流量异常检测(1): 数据探索、模型初探
Spark数据挖掘-基于
K均值
聚类的网络流量异常检测(1):数据探索、模型初探1前言分类和回归是强大易学的机器学习技术。
chengtuo5899
·
2023-04-05 12:23
大数据
数据结构与算法
人工智能
自学机器学习笔记(二十一)
表示相应的Xi所属类别,我们要将同一类别的点的欧氏距离比较近,因此我们设置每一个类别的中心为C1,C2……CK
K均值
聚类的优化目标最小化:要合理选取每个点的类别和类别的中心,这是一个非连续的优化问题,我们把这类优化问题叫整数规划
梦忆师
·
2023-04-02 21:10
机器学习
聚类
人工智能
计算机基础练习总结
K均值
聚类的核心目标是将给定的数据集划分为K个簇,并给出每个数据对应的簇中心点。
静默安然
·
2023-04-01 02:33
招聘
机器学习
基于k-means和tfidf的
文本聚类
代码简单实现
俗话说“外行看热闹,内行看门道“,作为一个机器学习的门外汉,刚研究python机器学习scikit-learn两周时间,虽然下面这段程序可能对于那些专研算法或机器学习的人来说非常简单,但对于一些入门的同学和我自己还是非常有帮助的。如果文章中有错误或不足之处,还请你微微一笑,原谅之;当然也非常欢迎你提出建议或指正~基本步骤包括:1.使用python+selenium分析dom结构爬取百度|互动百科文
叶过无痕
·
2023-04-01 00:13
python
word2vec
基于TF-IDF与k-means的情感聚类
目前很多情感聚类都是细分到逐词分析,而对于逐句的情感分析可以通过将文本转化为数字矩阵从而采用传统的聚类方法来实现,这里以
K均值
为例进行演示:importpandasaspdimportcodecsimportmatplotlib.pyplotaspltfromsklearn.feature_extraction.textimportTfidfTransformerfromsklearn.featu
#温室里的土豆
·
2023-03-31 23:33
NLP
聚类
kmeans
python
数据挖掘
机器学习实践(十七)—sklearn之无监督学习-K-means算法
无监督学习包含算法聚类K-means(
K均值
聚类)降维PCA二、K-means原理K-means聚类步骤随机设置K个特征空间内的点作为初始的聚类中心对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别接着对着标记的聚类中心之后
泡泡码客
·
2023-03-31 17:20
机器学习
机器学习实践
机器学习
机器学习实践
sklearn
k-means
轮廓系数
一文读懂聚类算法原理
常用算法:①划分方法:K-Means(
K均值
)、K-Medoids(K中心);②层次方法:凝聚
PM见闻
·
2023-03-30 20:24
K-means聚类及距离度量方法小结
kmeans算法又名
k均值
算法,K-means算法中的k表示的是聚类为k个簇,means代表取每一个聚类中数据值的均值作为该簇的中心,或者称为质心,即用每一个的类的质心对该簇进行描述。
ASS-ASH
·
2023-03-29 09:46
无监督学习
1024程序员节
聚类
kmeans
算法
数据挖掘
无监督学习
K均值
算法的优缺点是什么?如何对其进行调优?
slyxk
·
2023-03-28 03:41
K 均值算法-如何让数据自动分组
而本篇文章要介绍的
K均值
算法是一种无监督学习。与分类算法相比,无监督学习算法又叫聚类算法,就是只有特征数据,没有目标数据,让算法自动从数据中“学习知识”,将不同类别的数据聚集到相应的类别中。
码农充电站pro
·
2023-03-25 23:36
NLP系列学习:
文本聚类
最近一段时间在
文本聚类
的工作,一路也遇到了不少坑,自己也写一篇文章记录了一下自己的过程.1:什么是
文本聚类
先说说聚类的概念,聚类又称群分析,是数据挖掘的一种重要的思想,聚类(Cluster)分析是由若干模式
云时之间
·
2023-03-25 20:06
python中文
文本聚类
_python进行中文
文本聚类
实例(TFIDF计算、词袋构建)
花了好几天时间学习了
文本聚类
,以下记录一下这次的学习,也整理了一些这方面的资料,和大家分享一下,一起交流学习,进步在于不断总结和分享以及相互交流。
weixin_39629352
·
2023-03-24 11:23
python中文文本聚类
图像分割|机器学习|模式识别(2019-04-23~04-28)
做了一个总结
K均值
和KNN算法(学习笔记)4.25学校机器学习课的作业真的难成shi。不像国外作业,很多代码都写好
Rlinzz
·
2023-03-21 21:45
高斯混合模型(Gaussian mixture model)
简单介绍算法大鉴赏:高斯混合模型(Gaussianmixturemodel)-知乎(zhihu.com)与
k均值
区别最佳聚类实践:高斯混合模型(GMM)-知乎(zhihu.com)GMM不需要对数据做标准化处理
遥远的清平湾
·
2023-03-17 18:39
使用
K均值
聚类算法进行产品划分
下面将通过一个案例展示
K均值
聚类建模的流程和思路。*本文通过可视化工具建模,这种方法优点是适合没有代码基础的人操作,缺点是不够灵活,工具仅提供了部分解决方案。
PM见闻
·
2023-03-16 01:52
K均值
算法介绍
K均值
(K-means)算法是最常用的一种聚类算法。K-means算法假设有如上的数据集,可以看到只有输入,没有输出。
爱吃鱼的夏侯莲子
·
2023-03-10 15:55
【Python代码】K-means聚类模型
一、简介
K均值
聚类算法是先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。
王八变成汤
·
2023-02-24 07:52
聚类
python
kmeans
机器学习-kmeans(实现步骤、sklearn实现、python自实现、优缺点)
机器学习-kmeansKMeans(
K均值
)是典型的基于距离的排他划分方法:给定一个n个对象的数据集,它可以构建数据的k个划分,每个划分就是一个聚类,并且k<=n,同时还满足两个要求:1.每个组至少包含一个对象
嘣嘣嚓
·
2023-02-24 07:50
python
机器学习
sklearn
kmeans
聚类
Clustering Analysis -- 聚类分析
夹角余弦3.相关系数4.最大最小法5.算数平均最小法6.几何平均最小法7.绝对值指数法8.指数相似系数法9.绝对值倒数法10.绝对值减数法11.非参数法12.贴近度法13.专家打分法划分聚类方法(PAM)
K均值
聚类分析层次聚类方法最小距离法
萌新待开发
·
2023-02-22 13:52
ᕦ
机器学习
ᕤ
聚类
算法
神经网络
机器学习
机器学习笔记六:K-Means聚类,层次聚类,谱聚类
一.一般问题聚类分析的目标是,创建满足于同一组内的对象相似,不同组的对象相异的对象分组.它作为一种无监督学习,将相似对象归到同一个簇中去.因此,聚类有时候被称为无监督分类.二.
K均值
聚类(K-means
喜欢打酱油的老鸟
·
2023-02-22 07:51
人工智能
K-Means聚类
层次聚类
Open3D 点云
K均值
聚类(KMeans,Python版本)
文章目录一、简介二、算法步骤三、代码实现四、实现效果参考资料一、简介在诸多的聚类方法中,K-Means聚类方法是属于“基于原型的聚类”(也称为原型聚类)的方法,此类方法均是假设聚类结构能通过一组原型刻画,在现实聚类中极为常用。通常情况下,该类算法会先对原型进行初始化,然后再对原型进行迭代更新求解。采用不同的原型表示、不同的求解方式,也将会产生不同的算法。K-Means算法作为一种经典的“原型聚类”
大鱼BIGFISH
·
2023-02-16 20:55
python
open3d
kmeans
聚类
k均值
电子科技大学本科机器学习期末考试指南
○
K均值
聚类算法○
K均值
聚类基于EM实
敲代码的小提琴手
·
2023-02-07 07:19
机器学习
人工智能
文本聚类
都被刷爆了…
今天给大家介绍的正是一篇将对比学习应用到
文本聚类
上的工作,NAACL21新鲜出炉的paper——《SupportingClusteringwithContrastiveLearning》。
夕小瑶
·
2023-02-06 19:30
机器学习
人工智能
计算机视觉
深度学习
编程语言
(十一) 异常检测分析
常用的异常检测方法分为基于统计的异常检测方法(如基于泊松分布、正态分布等分布规律找到异常分支点)、基于距离的异常检测方法(如基于
K均值
找到离所有分类最远的点)、基于密度的离群检
晓迦
·
2023-02-06 16:44
K均值
聚类及代码实现
KMeans聚类在聚类算法中,最出名的应该就是
k均值
聚类(KMeans)了,几乎所有的数据挖掘/机器学习书籍都会介绍它,有些初学者还会将其与KNN等混淆。
Leo蓝色
·
2023-02-05 12:46
用python设计一个系统_使用python实现一个小型的文本分类系统
目前文本挖掘主要有7个主要领域:·搜索和信息检索IR·
文本聚类
:使用聚类方法对词汇、片段、段落或文件进行分组和归类·文本分类:对片段、段落或文件进行分组和归类,在使用数据挖掘分类方法的基础上,经过训练地标记实例模型
weixin_39795845
·
2023-02-05 08:46
用python设计一个系统
python生成停词表_一个小型的文本分类系统-python(文末附语料,停用词文本文档,工程全部代码)...
目前文本挖掘主要有7个主要领域:·搜索和信息检索IR·
文本聚类
:使用聚类方法对词汇、片段、段落或文件进行分组和归类·文本分类:对片段、段落或文件进行分组和归类,在使用数据挖掘分类方法的基础上,经过训练地标记实例模型
weixin_39552037
·
2023-02-05 08:15
python生成停词表
R语言文本挖掘相关包介绍
文本挖掘被描述为“自动化或半自动化处理文本的过程”,中文分词的结果就可以直接用来建立文本对象,最常用的结构就是词条与文档的关系矩阵,利用这个矩阵可以使用很多文本挖掘的算法来得到不同的结果,包括相似度计算、
文本聚类
jiabiao1602
·
2023-02-04 07:44
深度学习
R语言
深度学习
基于text2vec进行文本向量化、聚类
text2vec进行文本向量化、聚类基于text2vec进行文本向量化、聚类介绍安装安装text2vec库安装transformers库模型下载文本向量化使用text2vec使用transformers
文本聚类
训练流程
楚楚小甜心
·
2023-02-03 12:57
聚类
bert
text2vec
文本向量化
计算智能——K-means聚类算法学习
计算智能——K-means聚类算法学习定义
k均值
聚类算法(k-meansclusteringalgorithm)是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离
buaixvexi
·
2023-02-03 09:42
聚类算法比较:K-means 和高斯混合模型
算法原理K-means,
K均值
聚类算法假设每个cluster存在一个中心点,该cluster内的所有数据项到这个中心点的欧式距离(勾股定理的扩展:各维度差的平方求和再开方)都小于到其他cluster中心点的距离
weixin_34411563
·
2023-02-01 18:52
人工智能
数据结构与算法
matlab
基于
K均值
(KMeans)与EM法估计高斯混合模型(GMM)参数的图像分割matlab程序
前些天已经写过KMeans图像分割和高斯混合模型EM法图像分割的文章,今天写一写KMeans与EM法估计高斯混合模型参数相结合的文章。具体操作流程见下图所示(摘自Szeliski的《计算机视觉——算法与应用》中文版p223)(图片上传后旋转了,大概CSDN默认图像宽度不小于高度吧,大家可自行下载观看,有知道解决办法的小伙伴可以在评论区分享一下经验):下面给出本人实现的matlab程序:functi
光电学子
·
2023-02-01 18:21
信号与图像处理
K-means算法和高斯混合模型的异同
写这篇文章的缘由是因为早上的机器学习讨论班大家对于一句话:用于向量化的
k均值
是高斯混合模型的一个硬版本(出处:机器学习导论,隐马尔科夫模型,p247,(15-36))产生了深刻的思考然后不理解,在结合老师的讲解以及搜索资料后
会飞的小罐子
·
2023-02-01 18:50
机器学习竞赛及相关
GMM
K-means
【文献学习1】PSO-KMC:基于粒子群的
K均值
聚类算法
目录一、文献框架二、简介和创新点三、理论综述1.PSO算法2.PSO-KMC算法3.算法流程四、实验分析五、疑问和思考六、相关文献一、文献框架二、简介和创新点针对
K均值
聚类算法的缺陷,结合粒子群提出一种新的
qq_44122600
·
2023-01-31 13:34
Literature
reading
粒子群算法
聚类算法
人工智能
NLP之
文本聚类
算法综述
NLP之
文本聚类
算法综述
文本聚类
算法综述常见算法通用场景评估指标实现流程代码实现
文本聚类
算法综述常见算法常见的
文本聚类
算法有以下几种:K-Means:是最常见的聚类算法,通过迭代不断更新聚类中心来实现
文本聚类
楚楚小甜心
·
2023-01-31 09:42
聚类
算法
自然语言处理
文本聚类
轮廓系数
数学建模学习笔记(14)聚类模型
聚类模型
K均值
聚类算法和
K均值
++聚类算法系统聚类算法(层次聚类)DBSCAN聚类算法聚类问题概述:把样本划分为由相似的对象组成的多个类的过程。
北岛寒沫
·
2023-01-30 12:13
数学建模
聚类
学习
古老的spc也可以用机器学习(一)-
k均值
算法
大家都很清楚SPC的中文叫统计过程控制,它的作用是发现过程数据中的异常行为,SPC有8种以上的判异规则,每一中判异规则对应可能的异常原因,非常实用。现在大数据、机器学习应用越来越广泛,而机器学习算法的一个常见应用就算异常检测,接下来的一系列内容的更新都会分别介绍不同的机器学习算法来进行异常检测,包括算法基本原理、系统实现和应用。注意:SPC是异常判定的一种方法,其他机器学习同样可以做异常判定,不要
statr
·
2023-01-29 00:21
文本挖掘之
文本聚类
(DBSCAN)
刘勇Email:
[email protected]
简介鉴于基于划分的
文本聚类
方法只能识别球形的聚类,因此本文对基于密度的
文本聚类
算法展开研究。
weixin_33897722
·
2023-01-28 14:34
人工智能
python
java
文本聚类
算法 python_
文本聚类
算法之K-means算法的python实现
一、算法简介算法接受参数k,然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得的一个“中心对象”来进行计算的。基本思想:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。算法描述:(1)适当选择c个类的初始中心(2)
weixin_39755952
·
2023-01-28 14:04
文本聚类算法
python
python
文本聚类
可视化_Python 文本相似度和聚类
Python文本相似度和聚类文本数据是非结构化的和高噪声的。在执行文本分类时,拥有标记合理的训练数据和有监督学习大有裨益。但是,文档聚类是一个无监督的学习过程,将尝试通过让机器学习各种各样的文本文档及其特征、相似度以及它们之间的差异,来讲文本文档分割和分类为单独的类别。这使得文档聚类更具挑战性,也更有意思。考虑一个设计各种不同的概念和想法的文档语料库。人类以这样的方式将它们联系在一起,即使用过去学
weixin_39645249
·
2023-01-28 14:03
python
文本聚类可视化
相似
文本聚类
聚类方法原型聚类原型是指样本空间中具有代表性的点。此类算法假设聚类结构能通过一组原型刻画,在现实聚类中极为常用。如:k-means、高斯混合聚类高斯混合聚类::层次聚类层次聚类根据划分策略包括聚合层次聚类和拆分层次聚类,由于前者较后者有更广泛的应用且算法思想一致,因此本节重点介绍聚合层次聚类算法。聚合层次聚类的基本思想:1)计算数据集的相似矩阵;2)假设每个样本点为一个簇类;3)循环:合并相似度最
真炎破天
·
2023-01-28 14:03
nlp
深度学习
python
聚类
人工智能
机器学习
文本相似度、文本匹配、
文本聚类
11在Keras的Embedding层中使用预训练的word2vec词向量:https://blog.csdn.net/u012052268/article/details/90238282importnumpyasnpimportpandasaspd#1准备工作#graphLR#文本-->分词#分词-->训练词向量#训练词向量-->保存词向量importgensim#训练自己的词向量,并保存de
stay_foolish12
·
2023-01-28 14:33
自然语言处理
深度学习
python
python
机器学习
深度学习
文本相似度
文本匹配
NLP学习(十五)-NLP实战之基于K-Means
文本聚类
-Python3
何为聚类简单理解,如果一个数据集合包含N个实例,根据某种准则可以将这N个实例划分为m个类别,每个类别中的实例都是相关的,而不同类别之间是区别的也就是不相关的,这个过程就叫聚类了。聚类过程1)特征选择(featureselection):就像其他分类任务一样,特征往往是一切活动的基础,如何选取特征来尽可能的表达需要分类的信息是一个重要问题。表达性强的特征将很影响聚类效果。这点在以后的实验中我会展示。
安然烟火
·
2023-01-28 14:02
NLP
机器学习
python
kmeans算法
相似
文本聚类
与调参
去年我有使用sklearn做过
文本聚类
,今天我就给大家演示一下如何在一大堆文本中自动寻找出相似的文本进行聚类
小小明-代码实体
·
2023-01-28 14:29
python
聚类
机器学习
sklearn
10.聚类模型--相比分类模型事先不知道类别
聚类模型1.K-means聚类算法基本流程更好的求解K的聚类中心的方法spss求解
k均值
聚类3.层次聚类基本流程距离的介绍spss实现层次聚类确定k值确定方法--用图形估计聚类的数量3.DBSCAN算法
好好记密码
·
2023-01-28 11:20
数学建模学习
数学建模
K近邻聚类算法
K近邻聚类算法
k均值
(k-means)是聚类算法中最为简单、高效的,属于无监督学习算法核心思想:由用户指定k个初始质心(initialcentroids),以作为聚类的类别(cluster),重复迭代直至算法收敛基本算法流程
大数据面壁者
·
2023-01-28 07:15
机器学习与算法
算法
聚类
机器学习
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他