E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据挖掘十大算法
超详细EM算法举例及推导
最好先学习一下极大似然EM(Expectation-Maximum)算法也称期望最大化算法,曾入选“
数据挖掘十大算法
”中,可见EM算法在机器学习、数据挖掘中的影响力。
老实人小李
·
2024-01-04 21:33
聚类算法
聚类
分类算法-----决策树(包括ID3,C4.5)
经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全不代表你将来的面试中会遇到此类问题,只是因为我的简历上写了句:熟悉常见的聚类&分类算法而已),而我向来恨对一个东西只知其皮毛而不得深入,故写一个有关
数据挖掘十大算法
的系列文章以作为自己备试之用
Yt_Sports
·
2023-11-30 20:56
机器学习算法
机器学习算法
决策树
数据挖掘十大算法
--K-均值聚类算法
一、相异度计算在正式讨论聚类前,我们要先弄清楚一个问题:如何定量计算两个可比较元素间的相异度。用通俗的话说,相异度就是两个东西差别有多大,例如人类与章鱼的相异度明显大于人类与黑猩猩的相异度,这是能我们直观感受到的。但是,计算机没有这种直观感受能力,我们必须对相异度在数学上进行定量定义。设,其中X,Y是两个元素项,各自具有n个可度量特征属性,那么X和Y的相异度定义为:,其中R为实数域。也就是说相异度
peterchan88
·
2023-11-03 21:12
机器学习
数据挖掘
数据挖掘
kmeans
关联规则挖掘理论和算法(
数据挖掘十大算法
---Apriori算法)
一、(Apriori)发现频繁项目集通过用户给定的最小支持度,寻找所有频繁项目集(满足Support不小于Minsupport的所有项目子集)逐层发现算法,按照项集的长度由下到大逐级进行,并最后发现频繁几项集项(Item)购物篮(Transcation):交易项集(Itemset):所有项的集合K项集:在集合中包含K个项的项集支持度:support(x)=count(x)/|D|*100%——x出
Gyanga
·
2023-10-17 20:48
算法
数据挖掘
python
数据挖掘十大算法
--Apriori算法
一、Apriori算法概述Apriori算法是一种用于关联规则挖掘的经典算法。它用于在大规模数据集中发现频繁项集,进而生成关联规则。关联规则揭示了数据集中项之间的关联关系,常被用于市场篮分析、推荐系统等应用。以下是Apriori算法的基本概述:频繁项集:项集(Itemset):项集是数据集中的一个或多个项(item)的集合。项可以是任何可以在数据集中唯一标识的元素,例如购物篮中的商品。支持度(Su
Wzideng
·
2023-10-17 20:17
各种计算机相关小知识
大数据学习
python学习
算法
数据挖掘
人工智能
python
大数据
排序算法
【1】机器学习实战peter Harrington——学习笔记
机器学习实战peterHarrington——学习笔记综述
数据挖掘十大算法
本书结构一、机器学习基础1.1机器学习1.2关键术语1.3机器学习主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤综述机器学习算法在包含信息检索和数据挖掘在内的多个领域都有着十分广泛的应用
手可摘辰
·
2023-10-16 11:03
机器学习
机器学习
深度学习
python
SVM(上):如何用一根棍子将蓝红两色球分开?
欢迎小伙伴们点赞、收藏⭐️、留言、关注,关注必回关上一篇文章已经跟大家介绍过《朴素贝叶斯分类(下):
数据挖掘十大算法
之一》,相信大家对朴素贝叶斯分类(下)都有一个基本的认识。下面我讲一
秋无之地
·
2023-09-29 06:43
数据分析
支持向量机
算法
机器学习
朴素贝叶斯分类(上):
数据挖掘十大算法
之一
⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️作者:秋无之地简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据开发、数据分析等。欢迎小伙伴们点赞、收藏⭐️、留言、关注,关注必回关上一篇文章已经跟大家介绍过《决策树(下):泰坦尼克号乘客的生存预测》,相信大家对决策树(下)都有一个基本的认识。下面我讲一下:朴素贝叶
秋无之地
·
2023-09-28 02:09
数据分析
数据挖掘
算法
分类
朴素贝叶斯分类(下):
数据挖掘十大算法
之一
欢迎小伙伴们点赞、收藏⭐️、留言、关注,关注必回关上一篇文章已经跟大家介绍过《朴素贝叶斯分类(上):
数据挖掘十大算法
之一》,相信大家对朴素贝叶斯分类(上)都有一个基本的认识。下面我讲一
秋无之地
·
2023-09-28 02:35
数据分析
数据挖掘
算法
分类
决策树(下):泰坦尼克号乘客的生存预测(完整代码)
欢迎小伙伴们点赞、收藏⭐️、留言、关注,关注必回关上一篇文章已经跟大家介绍过《决策树(中):
数据挖掘十大算法
之一》,相信大家对决策树(中)都有一个基本的认识。下面我讲一下:决策树(下)
秋无之地
·
2023-09-21 05:46
数据分析
数据挖掘
算法
决策树
决策树(上):
数据挖掘十大算法
之一
⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️作者:秋无之地简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据开发、数据分析等。欢迎小伙伴们点赞、收藏⭐️、留言、关注,关注必回关上一篇文章已经跟大家介绍过《超详细!一次学会Python数据可视化的10种技能》,相信大家对Python数据可视化都有一个基本的认识。
秋无之地
·
2023-09-21 05:45
数据分析
python
数据分析
算法
决策树(中):
数据挖掘十大算法
之一
欢迎小伙伴们点赞、收藏⭐️、留言、关注,关注必回关上一篇文章已经跟大家介绍过《决策树(上):
数据挖掘十大算法
之一》,相信大家对决策树(上)都有一个基本的认识。下面我讲一下:决策树(中)
秋无之地
·
2023-09-21 05:09
数据分析
数据挖掘
算法
决策树
决策树——基础知识
根据信息相似原则将样本划分为若干个类分类:根据决策属性给样本区分归类训练集:一部分类别已知的样本数据(局部代替整体)用于建立预测模型,挖掘数据规律测试集:另一部分类别已知的样本数据用于评估模型预测能力,从而确定规律是否正确
数据挖掘十大算法
mxylulu
·
2023-07-28 16:50
SVM在二维平面的理解
SVM是
数据挖掘十大算法
之一,其原理不是很好理解,学习了一些资料之后做一个浅显的笔记,欢迎有机器学习爱好的同仁来交流,和批评指正。
安心远
·
2023-04-21 10:54
EM算法(1)
摘自https://zhuanlan.zhihu.com/p/409917841.摘要EM(Expectation-Maximum)算法也称期望最大化算法,曾入选“
数据挖掘十大算法
”。
蔷北
·
2023-03-13 23:27
数据挖掘十大算法
之分类算法(决策树模型)
文章目录1.决策树的概念2.构建决策树3.决策树中的信息论原理3.1信息量3.2熵3.3分类集合信息量3.4信息增益接上篇文章分类介绍及评价指标我们讨论了分类算法中,分类模型的选择是非常关键的一步,接下来我们分析常用的分类模型——决策树模型在本文中没有举例,全部为概念,所有举例都在ID3算法的学习中1.决策树的概念决策树是一种树形结构,决策树包含一系列规则,一般我们使用决策树将大型记录集分割为小记
每天都要加油呀!
·
2023-01-20 21:36
#
数据仓库与数据挖掘
数据挖掘
决策树模型
数据挖掘十大算法
:PageRank算法原理及实现
一、PageRank的概念PageRank,网页排名,是一种由根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,它由LarryPage和SergeyBrin在20世纪90年代后期发明,并以拉里·佩吉(LarryPage)之姓来命名。PageRank是Google专有的算法,用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度。PageRank算法计算每一个网页的PageRank
也曾被风温柔以待
·
2023-01-16 15:21
算法
大数据
数据挖掘十大算法
之Apriori算法
文章目录1.“啤酒与尿布”的案例2.Aprior算法核心术语事物集记录(事务)项目(项)项目集(项集)K项集支持度(Support)置信度(Confidence)最小支持度(min_support)最小置信度(min_confidence)提升度频繁K项(目)集候选K项(目)集3.Aprior算法的三大性质(关联规则的三大性质)4.Aprior算法实现过程5.数据挖掘5.1寻找关联属性5.2生成关
每天都要加油呀!
·
2022-12-21 18:27
#
数据仓库与数据挖掘
数据挖掘
大数据
(有监督)Python实现KNN算法(学习笔记)
一、前言
数据挖掘十大算法
–KNN算法。K-NN是一种基于实例的学习,或者是局部近似和将所有计算推迟到分类之后的惰性学习。k-近邻算法是所有的机器学习算法中最简单的之一。
maligebilaowang
·
2022-12-17 12:27
机器学习算法
KNN
有监督
机器学习
基于EM算法的参数辨识和分类识别算法matlab仿真
目录1.算法描述2.仿真效果预览3.MATLAB核心程序4.完整MATLAB1.算法描述EM(Expectation-Maximum)算法也称期望最大化算法,曾入选“
数据挖掘十大算法
”中,可见EM算法在机器学习
我爱C编程
·
2022-12-15 08:29
Matlab深度学习
matlab
EM算法
参数辨识
分类识别
从决策树学习谈到贝叶斯分类算法、EM、HMM
经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全不代表你将来的面试中会遇到此类问题,只是因为我的简历上写了句:熟悉常见的聚类&分类算法而已),而我向来恨对一个东西只知其皮毛而不得深入,故写一个有关
数据挖掘十大算法
的系列文章以作为自己备试之用
v_JULY_v
·
2022-12-10 15:04
机器学习十大算法系列
算法
vector
自然语言处理
string
数据挖掘
从决策树学习谈到贝叶斯分类算法、EM、HMM --别人的,拷来看看
经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全不代表你将来的面试中会遇到此类问题,只是因为我的简历上写了句:熟悉常见的聚类&分类算法而已),而我向来恨对一个东西只知其皮毛而不得深入,故写一个有关
数据挖掘十大算法
的系列文章以作为自己备试之用
dngirz6194
·
2022-12-10 15:31
人工智能
面试
java
数据挖掘十大算法
之分类算法(分类介绍及评价指标)
文章目录1.分类相关知识1.1分类的概念1.2分类的流程1.3分类模型评价标准2.二分类分类案例参考文章:接上篇文章,接下来学习挖掘算法中的分类算法:首先我们应该知道
数据挖掘十大算法
中可以简单的进行分类
每天都要加油呀!
·
2022-11-27 19:44
#
数据仓库与数据挖掘
数据挖掘
数据科学学习笔记8 --- 分类(有监督的学习)
数据挖掘十大算法
中的C4.5和CART(分类和回归树)算法都是决策树算法。其他常用的决策树算法有C5.0、FuzzyC4.5、SLIQ(Mehta1996)、SPRINT(Shafer1996)等。
Y_Cxhiao
·
2022-11-22 20:58
数据科学
课程笔记
数据科学
数据挖掘十大算法
---朴素贝叶斯
一、介绍朴素贝叶斯:基于贝叶斯定理与特征条件独立假设的分类方法优点:原理和实现都比较简单;对小规模的数据表现很好,能处理多分类任务;对缺失数据不太敏感,常用与文本分类。缺点:假设属性之间相互独立,这个假设在实际应用中往往是不成立的;在属性个数比较多或者属性之间相关性较大时,分类效果不好。二、概念解释先验概率:根据以往经验和分析得到的概率。记为:P(Y=Ci),i=1,2,3,….K联合概率:指在多
睡醒了叭
·
2022-11-22 14:08
数据挖掘
算法
python
习题:PageRank算法原理——Python实现(Google矩阵)
参考
数据挖掘十大算法
(六):PageRank算法原理与Python实现_梦想总是要不可及,是不是应该放弃的博客-CSDN博客PageRand算法:历史上,PageRank算法作为计算互联网网页重要度的算法被提出
spiritqi
·
2022-11-21 10:57
数据挖掘
人工智能
machine learning KNN
本博客是机器学习实战的读书笔记......
数据挖掘十大算法
:C4.5决策树k-means支持向量机SVMApriori最大期望法EMPageRank算法AdaBoot算法K-邻近算法(KNN)朴素贝叶斯算法
AdaLeery
·
2022-11-11 18:20
机器学习
从决策树学习谈到贝叶斯分类算法、EM、HMM
经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全不代表你将来的面试中会遇到此类问题,只是因为我的简历上写了句:熟悉常见的聚类&分类算法而已),而我向来恨对一个东西只知其皮毛而不得深入,故写一个有关
数据挖掘十大算法
的系列文章以作为自己备试之用
weixin_34402090
·
2022-10-13 14:52
人工智能
面试
java
Expectation Maximization Algorithm
EM(Expectation-Maximum)算法也称期望最大化算法,曾入选“
数据挖掘十大算法
”中,可见EM算法在机器学习、数据挖掘中的影响力。
1zeryu
·
2022-05-10 21:00
数据挖掘十大算法
数据挖掘十大算法
一、C4.5算法二、K-Means算法三、朴素贝叶斯算法四、K最近邻分类算法(KNN)五、EM最大期望算法六、PageRank算法七、AdaBoost八、Apriori算法九、SVM支持向量机十
小鬼_0101
·
2022-04-27 07:33
机器学习
机器学习
算法
数据挖掘
数据挖掘十大算法
——Naive Bayes
简介Naive和BayesNaive:假定向量中的所有特征是相互独立的Bayes:面向的问题NB主要用于解决有监督分类问题。相比于其他模型,其具备简单(不需要复杂的迭代式参数估计,由此方便处理大数据)、可解释性强(生成模型)、效果佳的特点。目标针对二分类问题,利用训练集数据学习一个判断阈值α,对于新来的数据做判定,大于α的数据属于正类,小于α的数据属于负类。有监督分类中存在两大流派diagnost
景语
·
2020-09-15 10:11
数据结构与算法
数据挖掘
算法
数据挖掘十大算法
——SVM
SVM两大分支SupportVectorClassifier(SVC)与SupportVectorRegressor(SVR)SVC函数间隔:minγ=wx+b,此时如果我们倍增w,b可以无限扩大函数间隔,因此,它并不能作为标准几何间隔,是归一化的函数间隔:minγ=wx+b||w||为了方便讨论,令几何间隔等于1,有wxi+b≥1foryi=+1wxi+b≤−1foryi=−1线性可分支持向量机
景语
·
2020-09-15 10:39
数据挖掘
算法
svm
数据挖掘十大算法
---EM 期望最大算法
EM(Expectatioin-Maximalization)算法即期望最大算法,被誉为是数据挖掘的十大算法之一。它是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测到的隐变量。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),也就是将隐藏变量象能够观测到的一样包含在内,从而计算最大似然的期望值;另外一步是最大化(M),也就是最大化在E步上找到的最大似然的期望值从而计
zefi279175732
·
2020-09-15 09:38
大数据
数据挖掘EM算法R
EM算法及例题详解
一、简介EM(Expectation-Maximum)算法也称期望最大化算法,曾入选“
数据挖掘十大算法
”中,可见EM算法在机器学习、数据挖掘中的影响力。
watermelon12138
·
2020-09-12 07:15
机器学习
大数据书目及公众号
SPSS统计分析基础教程》--SPSS软件基础《数据挖掘:R语言实战》--R语言基础《编程小白的第1本Python入门书》--了解Python《Python编程从入门到实践》--Python编程基础《
数据挖掘十大算法
Zatanna之
·
2020-08-24 17:00
机器学习之决策树算法
前言:决策树模型是一类算法的集合,在
数据挖掘十大算法
中,具体的决策树算法占有两席位置,即C4.5和CART算法下表为是否适合打垒球的决策表,预测E={天气=晴,温度=适中,湿度=正常,风速=弱}的场合,
刘敬
·
2020-08-24 07:48
数据挖掘十大算法
算法分类连接分析:PageRank关联分析:Apriori分类算法:C4.5,朴素贝叶斯,SVM,KNN,Adaboost,CART聚类算法:K-Means,EM一、PageRank当一篇论文被引用的次数越多,证明这篇论文的影响力越大。一个网页的入链越多,入链越优质,网页的质量越高原理网页影响力=阻尼影响力+所有入链集合页面的加权影响力之和一个网页的影响力:所有入链的页面的加权影响力之和一个网页对
Jmayday
·
2020-08-19 16:46
数据挖掘
数据挖掘十大算法
(十):CART(分类回归树)
本文记录一下关于CART的相关知识其中包括(回归树、树的后剪枝、模型树、树回归模型的预测(树回归模型的评估))。在之前学习完ID3算法有记录一篇相关的学习笔记,所以后面学习CART算法能有一个比较和熟悉的理解。贪心算法的决策树,构建算法是ID3,即通过香农熵计算数据的混乱程度,然后求出信息增益,每次选择最大信息增益的划分方式,作为当前的划分方式,直到数据集完成划分,被划分过的特征在之后不会再有任何
不论如何未来很美好
·
2020-08-03 03:05
机器学习实战
数据挖掘算法
数据挖掘十大算法
-
整理里一晚上的数据挖掘算法,其中主要引自wiki和一些论坛。发布到上作为知识共享,但是发现Latex的公式转码到网页的时候出现了丢失,暂时没找到解决方法,有空再回来填坑了。——编者按一、C4.5C4.5算法是由RossQuinlan开发的用于产生决策树的算法[1],该算法是对RossQuinlan之前开发的ID3算法的一个扩展。C4.5算法主要应用于统计分类中,主要是通过分析数据的信息熵建立和修剪
NO_OcaNE
·
2020-07-31 09:15
教科书式爬虫:由浅入深爬取丁香园
过程很复杂,很辛酸),明天或后天给大家分享数学建模掉头发的故事,马上上课,天天几乎满课,时间真的滴滴答答的在走,恐慌和抱怨是没什么用了,X先生后面会更加努力,写出更多好的原创,清华大学出版社小姐姐送的
数据挖掘十大算法
可能是后面学习的重点
简说Python
·
2020-07-28 08:59
数据挖掘十大算法
之一C4.5(详细版终结版)
欢迎关注微信公众号“智能算法”,带您体验不一样的人生!1.C4.5算法简介C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。C4.5由J.RossQuinlan在ID3
左右Shawn
·
2020-07-15 10:38
数据挖掘算法
KNN分类和回归学习--sklearn
参考文章:《Python大战机器学习》(不好,就是官方文档的中文版再加上几个简单的例子)
数据挖掘十大算法
–K近邻算法机器学习笔记—KNN算法常用样本相似性和距离度量方法KNN(K近邻法)输入为实例的特征向量
weixin_30485799
·
2020-07-15 03:58
数据挖掘十大算法
(六)------SVM算法
SVM算法(supportvectormachines,支持向量机)(一)、算法核心思想SVM算法最初是为二值分类问题涉及的,是一个二分类的分类模型(分类器),当处理多分类问题时,需要我们构造合适的多类分类器。这里以最简单的二分类问题来记录。给定一个包含正例、反例的样本集合,SVM的目的是寻找一个超平面分割线(在二维中实质就是一条线,三维中就是一个平面)来对样本进行分割。例如上图,我们有三条直线可
ws_Ando
·
2020-07-09 00:27
算法分析
数据挖掘十大算法
(二)------决策树算法
一、决策树模型算法决策树模型算法是一类算法,不单单指的一个算法,最基本也是最主要的是Hunt算法、ID3算法、C4.5算法和CART算法。决策树算法本质上还是解决分类问题。分类问题总述:给定一个数据集,我们需要训练出(或建立出)一个模型f。当出现一组新的特征向量时,预测(或判断)拥有这样一组新特征向量的对象是属于哪个类别。决策树分类:对实例进行分类的树形结构。决策树包含节点(node)和有向边组成
ws_Ando
·
2020-07-09 00:27
算法分析
数据挖掘十大算法
总结--核心思想,算法优缺点,应用领域
------------------------------------------------------------------------------------欢迎转载,请附上链接http://blog.csdn.net/iemyxie/article/details/40736773-----------------------------------------------------
Bonnie_Xie
·
2020-07-06 09:00
Data
Mining
数据挖掘十大算法
(一)------朴素贝叶斯算法
一、朴素贝叶斯二、决策树三、逻辑(Logistic)回归四、线性回归五、KNN算法(最邻近算法)六、SVM七:聚类算法八:Apriori算法(频繁项挖掘算法)九:EM(最大期望算法)十:分类回归算法朴素贝叶斯算法一、贝叶斯算法归属于分类算法贝叶斯分类是一类算法的总称,这类算法均已贝叶斯定理为基础。故统称为贝叶斯分类。朴素贝叶斯分类是贝叶斯分类中最简单、最常见的一种分类方法。分类的定义:已知集合和,
ws_Ando
·
2020-07-06 07:57
算法分析
数据挖掘十大算法
(九):朴素贝叶斯原理、实例与Python实现
一、条件概率的定义与贝叶斯公式二、朴素贝叶斯分类算法朴素贝叶斯是一种有监督的分类算法,可以进行二分类,或者多分类。一个数据集实例如下图所示:现在有一个新的样本,X=(年龄:0,31~40-->1,>40-->2#收入,'低'-->0,'中'-->1,'高'-->2#是否学生,'是'-->0,'否'-->1#信誉:'中'-->0,'优'-->1#类别属性用数字替换#购买电脑是-->0,不购买电脑否-
tensory.online
·
2020-07-05 14:47
KDD
and
ML
【机器学习算法笔记系列】决策树(Decision Tree)算法详解和实战
决策树模型是一类算法的集合,在
数据挖掘十大算法
中,具体的决策树算法占有两席位置,即C4.5和CART算法。决策树是通过一系列规则对数据进行分类的过程。
fpzRobert
·
2020-07-04 07:20
机器学习
数据挖掘
数据挖掘案例分析(1)-Apriori算法
学习资料来源,《
数据挖掘十大算法
》-清华大学和《数据挖掘实用案例分析》-机械工业出版社。案例:商业零售业中的购物篮分析一、挖掘目标的提出零售商的问题:销售什么样子的
一直飞不快的鸟
·
2020-07-02 01:03
kmeans聚类算法及matlab实现
一、kmeans聚类算法介绍:kmeans算法是一种经典的无监督机器学习算法,名列
数据挖掘十大算法
之一。作为一个非常好用的聚类算法,kmeans的思想和实现都比较简单。
AlexInML
·
2020-06-27 13:22
机器学习基础
上一页
1
2
3
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他