E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
《统计学习方法
《
统计学习方法
》第十四章聚类算法
一、写在前面本文是《
统计学习方法
》第十四章聚类方法读书笔记。
骑猪流浪江湖
·
2022-11-28 10:43
《统计学习方法》读书笔记
算法
机器学习
聚类
统计学习方法
学习笔记:第十四章:聚类方法
第十四章:聚类方法基本概念聚类是根据样本之间的相似度或距离来将样本进行归类,不同的距离度量方式会影响最终的聚类效果,常用的距离或相似度有下列:闵可夫斯基距离:欧式、曼哈顿距离、切比雪夫距离等马哈拉诺比斯距离:dij=[(xi−xj)TS−1(xi−xj)]12,d_{ij}=[(x_i-x_j)^TS^{-1}(x_i-x_j)]^{\frac{1}{2}},dij=[(xi−xj)TS−1(xi
小滔滔ahh
·
2022-11-28 10:12
统计学习
统计学习方法
学习笔记:第十六章.主成分分析
第十六章:主成分分析(PCA:principalcomponentanalysis)利用正交变换\color{red}{正交变换}正交变换把由线性相关变量表示的观测数据转换为少数几个由线性无关变量表示\color{red}{由线性无关变量表示}由线性无关变量表示的数据,同时尽可能的保留较多的原始数据信息,线性无关的变量称为主成分,\color{red}{线性无关的变量称为主成分},线性无关的变量称
小滔滔ahh
·
2022-11-28 10:12
统计学习
《
统计学习方法
》第 14 章 聚类方法 KMeans
k-均值聚类n个样本分到k个不同的类或簇,每个样本到其所属类的中心的距离最小。每个样本只能属于一个类,所有k-均值聚类是硬聚类。模型k
weixin_34406061
·
2022-11-28 10:11
数据结构与算法
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第14章 聚类方法
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第14章聚类方法介绍聚类的基本概念样本的相似度或距离闵可夫斯基距离马哈拉诺比斯距离相关系数夹角余弦类或簇定义特征距离聚类算法层次聚类聚合聚类步骤例子k
电信保温杯
·
2022-11-28 10:40
机器学习
聚类
学习
机器学习
李航老师《
统计学习方法
》第十六章主成分分析课后题答案
其他章节答案请参考我的汇总
统计学习方法
答案汇总,都是自己写的。
六七~
·
2022-11-28 10:39
统计学习方法第二版
数据分析
协方差
算法
数据挖掘
李航老师《
统计学习方法
》第十四章聚类方法课后题答案
其他章节答案请参考我的汇总
统计学习方法
答案汇总,都是自己写的。1、试写出分裂聚类算法,自上而下地对数据进行聚类,并给出其算法复杂度。
六七~
·
2022-11-28 10:38
统计学习方法第二版
聚类
算法
数据挖掘
《
统计学习方法
(第2版)》李航 第16章 主成分分析 PCA 思维导图笔记 及 课后习题答案(步骤详细)PCA 矩阵奇异值 第十六章
16.1对以下样本数据进行主成分分析:X=[233457245568]X=\left[\begin{array}{llllll}2&3&3&4&5&7\\2&4&5&5&6&8\end{array}\right]X=[223435455678]由于手解数据不是那么“友好”所以直接用代码求解:importnumpyasnpX=np.array([[2,3,3,4,5,7],[2,4,5,5,6,8]
ML--小小白
·
2022-11-28 10:08
统计学习方法笔记
矩阵
机器学习
人工智能
深度学习
大数据
《
统计学习方法
(第2版)》李航 第14章 聚类方法 思维导图笔记 及 课后习题答案(步骤详细) k-均值 层次聚类 第十四章
思维导图:14.1试写出分裂聚类算法,自上而下地对数据进行聚类,并给出其算法复杂度。i.计算n个样本两两之间的距离,并将所有样本看作一个类,将样本间最大距离作为类直径;ii.对于类直径最大的类,将其中相距最远,也就是距离为类直径的两个样本分成两个新类,该类其他样本就近(相对于那两个选中的样本)归于两个类之一;iii.如果类别个数达到停止条件(预设的分类书)则停止,否则回到ii.步骤。模型复杂度O(
ML--小小白
·
2022-11-28 10:38
统计学习方法笔记
聚类
均值算法
人工智能
机器学习
算法
第十四章聚类方法.14.3K均值聚类
文章目录主要内容k均值聚类的定义样本空间划分k均值聚类策略算法步骤例题k均值聚类算法特性收敛性初始类的选择类别数k的选择k均值聚类缺点改进本课程来自深度之眼,部分截图来自课程视频以及李航老师的《
统计学习方法
oldmao_2000
·
2022-11-28 10:37
统计学习方法
第十四章聚类方法.14.2.5有序样本分类法
文章目录主要内容算法功能与数据类型有序聚类步骤定义类的直径定义分类的损失函数最优解的求法例子:本课程来自深度之眼,部分截图来自课程视频以及李航老师的《
统计学习方法
》第二版。
oldmao_2000
·
2022-11-28 10:07
统计学习方法
机器学习
深度学习
概率论
《
统计学习方法
》(第十四章)——聚类方法
聚类基本概念相似度或距离相似度或距离: 聚类的核心是相似度或距离的定义,它将直接影响到聚类的结果闵可夫斯基距离dij=(∑k=1m∣xki−xkj∣)1pd_{ij}=(\sum\limits_{k=1}^m|x_{ki}-x_{kj}|)^{\frac{1}{p}}dij=(k=1∑m∣xki−xkj∣)p1p=2时偶啦距离p=2时偶啦距离p=2时偶啦距离p=1时曼哈顿距离p=1时曼哈顿距离p
mkopvec
·
2022-11-28 10:06
机器学习
第十四章聚类方法.14.2.4确定最佳聚类数
1、给定阈值2、数据点散布图3、根据统计量分析聚类数量预备知识R2R^2R2统计量半偏R2R^2R2统计量伪F统计量伪t2t^2t2统计量谱系图本课程来自深度之眼,部分截图来自课程视频以及李航老师的《
统计学习方法
oldmao_2000
·
2022-11-28 10:06
统计学习方法
《
统计学习方法
》学习笔记 第十四章 聚类方法
目录1聚类的基本概念1.1相似度或距离1.2类(class)或簇(cluster)1.2.1类或簇的定义1.2.2类的特征1.3类与类之间的距离(linkage)2Hierarchicalclustering3k-meansclustering3.1模型3.2策略3.3算法3.4算法特性总结前情提要:见第十三章无监督学习概论1聚类的基本概念1.1相似度或距离假设有n个样本,每个样本由m个属性的特征
LittleFish0820
·
2022-11-28 10:05
统计学习方法
聚类算法
《
统计学习方法
》学习笔记 第十六章 PCA(principal component analysis)
目录1总体主成分分析1.1基本想法1.2定义和导出1.3主要性质1.4主成分的个数1.5规范化变量的总体主成分2样本主成分分析2.1样本主成分2.2相关矩阵的特征值分解方法2.3数据矩阵的奇异值分解算法总结1总体主成分分析1.1基本想法(以前学过,很好理解,不放了)1.2定义和导出x=(x1,x2,⋯ ,xm)T\bm{x}=(x_1,x_2,\cdots,x_m)^Tx=(x1,x2,⋯,xm)
LittleFish0820
·
2022-11-28 10:05
统计学习方法
pca降维
复现经典:《
统计学习方法
》第16章 主成分分析
第16章主成分分析本文是李航老师的《
统计学习方法
》一书的代码复现。作者:黄海广备注:代码都可以在github中下载。我将陆续将代码发布在公众号“机器学习初学者”,可以在这个专辑在线阅读。
风度78
·
2022-11-28 10:03
从奇异值分解SVD到主成分分析PCA
SVD)简介1.1矩阵A(A∈Rm×nA\inR^{m\timesn}A∈Rm×n)的奇异值分解1.2SVD的紧凑形式1.3SVD的截断形式2.奇异值分解的求解过程3.主成分分析(PCA)实现3.1《
统计学习方法
L1_Zhang
·
2022-11-28 10:02
机器学习
机器学习
pca降维
主成分分析
复现经典:《
统计学习方法
》第14章 聚类方法
第14章聚类方法本文是李航老师的《
统计学习方法
》一书的代码复现。作者:黄海广备注:代码都可以在github中下载。我将陆续将代码发布在公众号“机器学习初学者”,可以在这个专辑在线阅读。
湾区人工智能
·
2022-11-28 10:00
聚类
算法
python
聚类算法
gwt
《
统计学习方法
》 第十六章 主成分分析PCA
主成分分析(PCA)假设xxx为mmm维随机变量,其均值为μ\muμ,协方差矩阵为Σ\SigmaΣ考虑由mmm维随机变量xxx到mmm维随机变量yyy的线性变换yi=αiTx=∑k=1mαkixk,i=1,2,⋯ ,my_{i}=\alpha_{i}^{T}x=\sum_{k=1}^{m}\alpha_{ki}x_{k},\quadi=1,2,\cdots,myi=αiTx=k=1∑mαkixk,
小鹏AI
·
2022-11-28 10:30
统计学习方法
学习方法
概率论
《
统计学习方法
》 第十四章 聚类方法
聚类方法1.聚类是针对给定的样本,依据它们属性的相似度或距离,将其归并到若干个“类”或“簇”的数据分析问题。一个类是样本的一个子集。直观上,相似的样本聚集在同类,不相似的样本分散在不同类。2.距离或相似度度量在聚类中起着重要作用。常用的距离度量有闵可夫斯基距离,包括欧氏距离曼哈顿距离、切比雪夫距离、、以及马哈拉诺比斯距离。常用的相似度度量有相关系数、夹角余弦。用距离度量相似度时,距离越小表示样本越
小鹏AI
·
2022-11-28 10:29
统计学习方法
聚类
学习方法
《
统计学习方法
》 第三章 K近邻法(原理+代码)
KKK近邻法kkk近邻法是基本且简单的分类与回归方法kkk近邻法的基本做法是:对给定的训练实例点和输入实例点,首先确定输入实例点的kkk个最近邻训练实例点利用这kkk个训练实例点的类的多数来预测输入实例点的类kkk近邻模型是对应于基于训练数据集对特征空间的一个划分kkk近邻法中,当训练集、距离度量、kkk值及分类决策规则确定后,其结果唯一确定kkk近邻法三要素:距离度量、kkk值的选择和分类决策规
小鹏AI
·
2022-11-28 04:39
统计学习方法
学习方法
python
NNDL 实验五 前馈神经网络(3)鸢尾花分类
深入研究鸢尾花数据集画出数据集中150个数据的前两个特征的散点分布图:【
统计学习方法
】感知机对鸢尾花(iris)数据集进行二分类4.5实践:基于前馈神经网络完成鸢尾花分类继续使用第三章中的鸢尾花分类任务
Guo_weiqi
·
2022-11-27 09:37
深度学习
机器学习
人工智能
机器学习笔记(十一)-聚类(Clustering)
本次学习笔记主要记录学习机器学习时的各种记录,包括吴恩达老师视频学习、李宏毅老师视频学习、周志华老师的《机器学习》(西瓜书)以及李航老师的《
统计学习方法
》。
997and
·
2022-11-27 08:03
机器学习
聚类
机器学习
算法
深度学习/机器学习资料汇总
MachineLearningDeepLearningSeq2SeqLSTMAttentionSelf-AttentionTransfomerBert(这周目标)读研期间收集的学习资料汇总(持续更新中)MachineLearning西瓜书以及
统计学习方法
笔记
金州啦啦啦啦文
·
2022-11-27 07:50
深度学习
深度学习
人工智能
统计学习方法
——(第七章)支持向量机详解与推导
一、知识梳理二、支持向量机1、原理SVM作为传统机器学习的一个非常重要的分类算法,它是一种通用的前馈网络类型,最早是由VladimirN.Vapnik和Alexey在1963年提出,目前的版本是CorinnaCortes和Vapnik在1993年提出,1995年发表。深度学习(2012)出现之前,SVM被认为是机器学习中近十几年最成功表现最好的算法。支持向量机(supportvectormachi
我学数学我骄傲
·
2022-11-26 14:50
算法笔记(蓝皮书
西瓜书
花书
CV)
机器学习
算法
人工智能
深度学习
统计学习方法
读书笔记15-逻辑斯蒂回归习题
文章目录1.课后习题2.视频课后习题1.课后习题importnumpyasnpimporttimeimportmatplotlib.pyplotaspltfrommpl_toolkits.mplot3dimportAxes3Dfrompylabimportmpl#图像显示中文mpl.rcParams['font.sans-serif']=['MicrosoftYaHei']classLogisti
哎呦-_-不错
·
2022-11-26 02:56
#
机器学习《统计学习方法》
python
机器学习
逻辑斯蒂回归
用python写梯度下降算法实现逻辑斯蒂回归
1.logistic的理论基础可参考网上一位大佬写的李航的《
统计学习方法
》笔记pdf笔记文档链接:链接:https://pan.baidu.com/s/1Gee9aOdNvemy5K6co1daZg提取码
melicent114
·
2022-11-26 02:52
python
逻辑斯蒂回归模型——逻辑斯蒂分布、二项逻辑斯蒂回归模型、参数估计与多项逻辑斯蒂回归
本笔记整理自李航老师《
统计学习方法
》第二版第六章逻辑斯蒂回归是统计学习中经典的分类方法。
如化雨
·
2022-11-26 02:44
机器学习
机器学习
python
逻辑回归
算法
数据分析
机器学习之树形算法(一):决策树
目录一、决策树介绍二、决策树特征选择三、决策树的生成四、决策树的剪枝五、CART算法总结参考资料:《
统计学习方法
》李航一、决策树介绍目前最流行的一类机器学习算法是树形算法(决策树、随机森林、GBDT、XGBoost
大哇唧
·
2022-11-25 21:08
机器学习
决策树
机器学习
算法
(四)决策树与python代码实现ID3算法
李航老师《
统计学习方法
》第二版学习笔记知识点:决策树是一种基本的分类与回归方法,是基于树结构来进行决策的根据损失函数最小化的原则建立决策树模型决策树内部节点表示一个特征或属性,叶节点表示一个类决策树可以看成
十二十二呀
·
2022-11-25 17:41
数据挖掘学习笔记
机器学习
数据挖掘
python
算法
我们追求的泛化,竟是一条死路?
文|鹰钩鼻涕虫从我们刚刚接触
统计学习方法
开始,想必就一直在接受一个思想:相比符号算法,统计模型最重要的能力之一,即是它的泛化能力。
夕小瑶
·
2022-11-25 15:20
统计学习方法
(李航) 支持向量机 附python及sklearn实现
支持向量机有监督学习分类问题VapnikVapnikVapnik线性可分支持向量机/线性支持向量机/非线性支持向量机什么是支持向量机呢?SupportVectorMachineSupport\spaceVector\spaceMachineSupportVectorMachine:支持向量机先抛出难懂的定义~可以先跳过,最后再来回顾定义:支持向量机的基本模型是定义在特征空间上的间隔最大的线性分类器
tsuiraku
·
2022-11-25 07:09
机器学习
支持向量机
svm
李航
统计学习方法
sklearn
支持向量机SVM(包括线性核、多项式核、高斯核)python手写实现+代码框架说明
支持向量机SVM(包括线性核、多项式核、高斯核)python手写实现理论理论参考《
统计学习方法
》Chapter.7支持向量机(SVM)完整代码见github仓库:https://github.com/wjtgoo
taotaoiit
·
2022-11-25 07:36
统计学习方法笔记
python
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第19章 马尔可夫链蒙特卡罗法
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第19章马尔可夫链蒙特卡罗法论文介绍逆变换采样蒙特卡罗法随机抽样接受拒绝采样法步骤特点求解某种随机分布的特征数数学期望估计积分计算例题1例题2马尔可夫链定义离散状态马尔可夫链转移概率矩阵和状态分布例题平稳分布例题
电信保温杯
·
2022-11-25 02:09
机器学习
学习
python
算法
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第17章 潜在语义分析
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第17章潜在语义分析论文介绍单词向量空间话题向量空间话题向量空间文本在话题向量空间的表示从单词向量空间到话题向量空间的线性变换潜在语义分析算法矩阵奇异值分解算法步骤
电信保温杯
·
2022-11-25 02:38
机器学习
学习
算法
python
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第18章 概率潜在语义分析
电信保温杯笔记——《
统计学习方法
(第二版)——李航》第18章概率潜在语义分析论文介绍基本想法模型生成式模型共现模型文本、话题、单词之间的关系几何解释与潜在语义分析的关系算法步骤本章概要相关视频相关的笔记相关代码论文介绍电信保温杯笔记
电信保温杯
·
2022-11-25 02:38
机器学习
当我们谈数据分析时,到底在谈什么?
——《
统计学习方法
》1个标准流程业务理解确定数据挖掘目标、制定项目计划。数据理解收集原始数据、描述数据、探索数据、检验数据质量
媚婉兰君
·
2022-11-25 00:04
名词
大数据
KNN算法python实现
内容参考了某_
统计学习方法
_。KNN算法的主要实现步骤:计算测试数据与各训练数据之间的距离。按照距离的大小进行排序。选择其中距离最小的k个样本点。确定K个样本点所在类别的出现频率。
ZZZZ_ccc
·
2022-11-24 13:21
python
算法
机器学习
机器学习基础——损失函数与风险函数
参考自李航《
统计学习方法
》。损失函数损失函数(lossfunction)用来预测模型单次预测的好坏,即模型的预测值f(X)和真实值Y之间的差别,记作L(Y,f(x))。
本初-ben
·
2022-11-24 07:15
机器学习
机器学习
人工智能
机器学习系列(4):决策树
本文结合李航博士的《
统计学习方法
》与周志华老师的《机器学习》决策树部分,《
统计学习方法
》重理论的证明推导,《机器学习》注重讲解算法的特点与扩展。
Wwwwhy_
·
2022-11-24 01:58
机器学习算法系列(
正在更新
)
机器学习
算法
NLP小白自学日记——《
统计学习方法
》(持续更新)
阅读目录监督学习第1章统计学习及监督学习概论1.2统计学习的分类1.3
统计学习方法
三要素1.4模型评估与模型选择1.5正则化和交叉验证1.6泛化能力1.7生成模型与判别模型1.8监督学习应用个人总结第2
小小小书柜
·
2022-11-23 16:28
深度学习
自然语言处理
机器学习
数据挖掘-朴素贝叶斯算法的R实现
基础知识来自教材:李航的《
统计学习方法
》本人小白,仍在不断学习中,有错误的地方恳请大佬指出,谢谢!
Rr-7
·
2022-11-23 15:43
数据挖掘
数据挖掘
算法
r语言
近邻算法
机器学习
统计学习方法
5 - 决策树
决策树:判别模型问题描述:假设要对一批样本分K类。其中这些样本又有A个特征。如何生成一个树形结构,按照特征一层一层往下分。决策树生成思路:有A个特征可供分类,但是先选哪个特征作为分类标准呢?决策树为了解决这个问题,首先会判断该特征的对样本的区分能力,比如在男宿舍这样一个条件下判断谁有ipad,如果用性别作为一个特征来判断分类,收益很小;如果我们用生活费多少来判断,那么对这个分类就有很大的帮助。决策
周某1111
·
2022-11-23 13:10
自学
算法
李航博士《
统计学习方法
》第一章课后习题参考答案
1.1说明伯努利模型的极大似然估计以及贝叶斯估计中的
统计学习方法
三要素。伯努利模型是定义在取值为0与1的随机变量上的概率分布。
Siyu_Zhu
·
2022-11-23 00:33
统计学习方法
机器学习
概率论
李航
统计学习方法
第二版 课后习题答案
第一章第二章1第二章2第三章第四章1第四章2第五章1第五章2第六章第七章1第七章2
Fancy Wang
·
2022-11-23 00:00
机器学习
李航
统计学习方法
课后习题答案 第二版 机器学习
李航《
统计学习方法
》课后习题答案(第2版)【李航课后习题解答+书中疑点推导+算法代码实现+可私聊耐心解答(48小时内回复),包会!!】
#苦行僧
·
2022-11-23 00:49
学习方法
人工智能
统计学
线性代数
一文读懂决策树剪枝
本文主要依据周志华的《机器学习》和李航的《
统计学习方法
》。
xisi克利夫
·
2022-11-22 22:33
机器学习
机器学习
【白话机器学习】算法理论+实战之PCA降维
常见的机器学习算法:监督学习算法:逻辑回归,线性回归,决策树,朴素贝叶斯,K近邻,支持向量机,集成算法Adaboost等无监督算法:聚类,降维,关联规则,PageRank等为了详细的理解这些原理,曾经看过西瓜书,
统计学习方法
文文学霸
·
2022-11-22 21:56
《
统计学习方法
》极简笔记P4:朴素贝叶斯公式推导
《
统计学习方法
》极简笔记P4:朴素贝叶斯公式推导朴素贝叶斯基本方法通过训练数据集T={(x_1,y_1),(x_2,y_2),(x_N,y_N)...,(x_1,y_1)}学习联合概率分布P(X,Y),
机器学习算法与Python实战
·
2022-11-22 19:43
统计学习方法
第四章 朴素贝叶斯法公式推导
文章目录第四章朴素贝叶斯法朴素贝叶斯法的学习与分类后验概率最大化朴素贝叶斯的参数估计朴素贝叶斯算法流程第四章朴素贝叶斯法基于贝叶斯定理和特征条件独立假设的分类方法朴素贝叶斯法与贝叶斯估计是不同的概念生成模型与判别模型{生成模型:P(Y∣X)=P(X,Y)P(X)X,Y为随机变量判别模型:Y=f(X),P(Y∣X)\left\{\begin{aligned}&\text{生成模型}:P(Y|X)=\
亲持红叶
·
2022-11-22 19:13
统计学习方法公式推导
学习
机器学习
概率论
算法
人工智能
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他