E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
周志华西瓜书
机器学习-DAY1-2
机器学习(
西瓜书
)-------
周志华
著所有图片公式均来自Datawhale。
fancccyyy
·
2023-01-18 14:12
机器学习
模式识别——0.绪论
第一章绪论主要是针对考试的复习,和一些重点内容的标注,对书本内容做了删减,加了自己的笔记和思考注:该系列参考的是机械工业出版社的模式分类和
周志华
老师的
西瓜书
。
Druid_C
·
2023-01-18 09:48
模式识别
模式识别
【机器学习】AGNES层次聚类算法
数据集来源:
周志华
西瓜书
数据集4.01.读取文件:importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltdata=pd.read_csv(
每天进步一点丶
·
2023-01-17 16:26
机器学习
聚类
算法
python
《
西瓜书
》学习笔记第一章、第二章
《
西瓜书
》个人笔记绪论1.1概念机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。机器学习的主要内容:关于在计算机上从数据中产生“模型”的算法,即学习算法。
weixin_48382034
·
2023-01-17 08:34
算法
机器学习
人工智能
西瓜书
学习笔记(第一章)
基本术语数据集(dataset):所有数据的集合样本(sample):描述某个事件或对象的记录属性(attribute):事件或对象的某个性质属性值(attributevalue):性质的取值属性空间(attributespace):性质所有取值的集合特征向量(featurevector):由多个性质组成的一条记录训练数据(trainingdata):训练过程中使用的数据训练样本(training
丿October
·
2023-01-17 08:33
二狗编程入门之路
机器学习
机器学习入门-
西瓜书
总结笔记第十二章
西瓜书
第十二章-计算学习理论一、基础知识二、PAC学习三、有限假设空间1.可分情形2.不可分情形四、VC维五、Rademacher复杂度六、稳定性一、基础知识计算学习理论(computationallearningtheory
一入材料深似海
·
2023-01-17 08:02
学习笔记
机器学习
西瓜书
学习笔记 第1章 绪论
目录第1章绪论1.3假设空间1.4归纳偏好参考文献本文仅针对个人不熟知识点进行整理,已知内容或过于简单的就不整理了。第1章绪论1.3假设空间假设空间:所有假设组成的空间版本空间:现实问题中我们常面临很大的假设空间,但学习过程是基于有限样本训练集进行的,因此,可能有多个假设与训练集一致,即存在着一个与训练集一致的假设集合,我们称之为版本空间(versionspace)。也就是说这多个假设的集合就是假
二三TP
·
2023-01-17 08:59
读书笔记
机器学习
西瓜书
学习笔记 第二章
2.1经验误差与过拟合m个样本中有a个样本分类错误错误率(errorrate):E=a/m精度(accuracy)=1-错误率=1-E=1-a/m误差(误差期望):学习器的预测输出与样本的真实输出的差异;训练误差(trainingerror)或经验误差(empiricalerror):学习器在训练集上的误差;泛化误差(generalizationerror):学习器在新样本上的误差。泛化性能过拟合
程序圆圆圆
·
2023-01-17 07:51
机器学习
西瓜书
学习笔记第九章聚类
文章目录1知识脉络2内容补充9.1节聚类任务9.2节性能度量9.3节距离计算9.4节原型聚类9.4.1k均值算法9.4.2学习向量量化9.4.3高斯混合聚类9.5节密度聚类9.6节层次聚类9.7节阅读材料3课后题4代码实现5参考1知识脉络2内容补充9.1节聚类任务9.2节性能度量9.3节距离计算9.4节原型聚类9.4.1k均值算法9.4.2学习向量量化9.4.3高斯混合聚类9.5节密度聚类9.6节
UEVOLIshy
·
2023-01-17 07:18
西瓜书学习笔记
聚类
西瓜书第九章
西瓜书
学习笔记-第二章 模型评估与选择
第二章模型评估与选择2.1经验误差与过拟合错误率(errorrate):分类错误的样本数占样本总数的比例m个样本中有a个样本分类错误,则错误率E=a/m1-a/m称为精度(accuracy),即精度=1-错误率,精度常写为百分比形式误差(error):学习器的实际预测输出与样本的真实输出之间的差异学习器在训练集上的误差称为“训练误差”(trainingerror)/“经验误差”(empirical
Dove_Dan
·
2023-01-17 07:15
西瓜书笔记
机器学习
西瓜书
学习笔记(第一、二章)
本博客是用来记录个人认为的重要的知识点,但因为知识点繁多而复杂,因此大多数情况下知识在这里列一个提纲,或者在这里写自己的理解第一章绪论(此部分来自南瓜书)一些概念“算法”产出的结果称为“模型”,通常是具体的函数或者可抽象地看作为函数样本:也称为“示例”,是关于一个事件或对象的描述,一般是把事物或对象抽象为某种数学形式,常见于抽象成线性代数中的向量(因为任何事物都可以由若干“特征”——或称为“属性”
weixin_44613018
·
2023-01-17 07:44
学习笔记
学习
多粒度级联森林算法解读
多粒度级联森林解读本博文简单解读一下
周志华
教授的多粒度级联森林算法。废话不多说,多粒度级联森林的结构主要分为两部分,一部分是多粒度扫描部分,还有就是级联森林部分。
卷了个积
·
2023-01-16 09:06
算法
机器学习:偏差、噪声的几点认识
最近在看
周志华
老师的机器学习的书籍(俗称
西瓜书
)。因为数学功底差,在理解起来困难重重,但是冥思苦想后还有自己的看法,记录一下并和大家分享讨论。几点理解:0.吹年之前,先说个人们容易忽略的概念真值!
Destin055
·
2023-01-16 08:19
机器学习
偏差噪声
机器学习中的数学基础(四):概率论
二维随机变量4.2.1离散型4.2.2连续型4.3边缘分布4.3.1离散型边缘分布4.3.2连续型边缘概率密度4.4期望4.4.1一维期望4.4.2二维期望4.5马尔可夫不等式4.6切比雪夫不等式在看
西瓜书
的时候有些地方的数学推导
三耳01
·
2023-01-15 18:38
杂七杂八的学习笔记
概率论
人工智能
大佬新书首发 | 《机器学习 公式推导与代码实现》正式出版!
关注过这本书的公众号读者应该知道,这本书在系列原创机器学习30讲的基础上,并参考了李航老师的《统计学习方法》和
周志华
老师的
西瓜书
《机器学习》的理论体系,从公式推导和代码实现两个维度来展示机器学习的基本内涵
人工智能与算法学习
·
2023-01-15 11:09
算法
人工智能
机器学习
编程语言
python
新书首发 | 《机器学习 公式推导与代码实现》正式出版!
关注过这本书的公众号读者应该知道,这本书在系列原创机器学习30讲的基础上,并参考了李航老师的《统计学习方法》和
周志华
老师的
西瓜书
《机器学习》的理论体系,从公式推导和代码实现两个维度来展示机器学习的基本内涵
算法channel
·
2023-01-15 11:09
算法
人工智能
机器学习
python
编程语言
人生第二本书!
关注过这本书的公众号读者应该知道,这本书在系列原创机器学习30讲的基础上,并参考了李航老师的《统计学习方法》和
周志华
老师的
西瓜书
《机器学习》的理论体系,从公式推导和代码实现两个维度来展示机器学习的基本内涵
Datawhale
·
2023-01-15 11:08
算法
机器学习
人工智能
python
编程语言
新书首发 | 《机器学习 公式推导与代码实现》正式出版!(文末送书)
关注过这本书的公众号读者应该知道,这本书在系列原创机器学习30讲的基础上,并参考了李航老师的《统计学习方法》和
周志华
老师的
西瓜书
《机器学习》的理论体系,从公式推导和代码实现两个维度来展示机器学习的基本内涵
风度78
·
2023-01-15 11:08
算法
人工智能
机器学习
python
编程语言
周志华
《机器学习》(
西瓜书
)——学习笔记
第1章绪论1.1引言因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声这几个特征我们就可以做出相当好的判断.类似的,我们从以往的学习经验知道,下足了工夫、弄清了概念、做好了作业,自然会取得好成绩.可以看出,我们能做出有效的预判?是因为我们已经积累了许多经验,而通过对经验的利用?就能对新情况做出有效的决策.机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型"(model)的算法,即"学习
ManRock
·
2023-01-14 15:38
机器学习
深度学习
周志华
《机器学习》——学习笔记
基本术语欲预测的是离散值,此类学习任务称为分类(classification)若为连续值,则称为回归(regression)根据训练数据是否有标记信息,学习任务分为:监督学习(supervisedlearning),无监督学习(unsupervisedlearning)。分类和回归是监督学习的代表,聚类(clustering)是无监督学习的代表归纳(induction)是从特殊到一般的泛化(gen
Jangyu_Du
·
2023-01-14 15:34
学习笔记
机器学习
周志华
——机器学习 第三章笔记
第三章线性模型3.1基本形式给定由d个属性描述的示例x=(x1,x2,...xd),其中xi是x在第i个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测的函数,即f(x)=w1x1+w2x2+...+wdxd+b一般用向量形式写成f(x)=wTx+b其中w=(w1,w2,...wd).w和d学得之后,模型就得以确定。线性模型形式简单,易于建模,但却蕴含着机器学习中一些重要的基本思想许
m0_62833130
·
2023-01-14 15:00
机器学习
人工智能
周志华
——机器学习 第一二章笔记
周志华
—机器学习(
西瓜书
)1.1引言机器学习是研究“学习算法”的学问机器学习:假设用P来评估计算机程序在某任务T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对
m0_62833130
·
2023-01-14 15:29
机器学习
人工智能
《机器学习》及实战一、模型评估与选择
Python版本:Python3.x运行平台:WindowsIDE:PyCharm参考资料:《机器学习》(
西瓜书
)《机器学习实战》(王斌)转载请标明出处:https://blog.csdn.net/tian121381
Yuuuuu丶Tian
·
2023-01-14 09:09
机器学习
机器学习
机器学习
周志华
--自助法bootstrapping中的极限公式
在
西瓜书
的第二章,讲了几种常用的对数据集进行划分而产生训练集S\mathit{S}S和测试集T\mathit{T}T的方法,其中就有一个自助法。
蓝域小兵
·
2023-01-13 21:27
机器学习
西瓜书
数学
机器学习
概率论
人工智能
计算机中bootstrapping 是很没意思_Bootstrapping算法(附python代码)
在
西瓜书
第二章提到,自助法在数据集较小、难以有效划分训练/测试集时很有用,将多次随机抽样作为训练集,将初始数据作为测试集。
weixin_39966130
·
2023-01-13 21:27
是很没意思
机器学习(5)——
周志华
泛化能力泛化误差:在未来样本上的误差经验误差:在训练集上的误差训练误差并不是越小越好,因为会出现过拟合的现象过拟合和欠拟合模型错误的把一些特征当成一般规律就叫做过拟合欠拟合:模型未能很好的学习样本的特征。例如机器学习中的机器学习三大问题
臭小子222
·
2023-01-12 18:10
笔记
人工智能
深度学习
机器学习(6)——
周志华
评估方法留出法通产用Holdout方法是要进行100次实验才能保证实验结果的可靠性留出法看似简单其实比较麻烦,有100个数据做数据集是我们想要的是100个数据训练出的模型,但是全部数据用作训练我们就没办法对模型的误差进行估计,所以我们要对数据集进行划分,测试集和训练集都不能太小,当划分完成模型训练结束以后,我们还需要用所有数据再训练一次,这才是我们要求得模型留出法还有一个缺点就是可能会有一部分数据
臭小子222
·
2023-01-12 18:54
人工智能
深度学习
【机器学习-
周志华
】学习笔记-第十五章
记录第一遍没看懂的记录觉得有用的其他章节:第一章第三章第五章第六章第七章第八章第九章第十章十一章十二章十三章十四章十五章十六章从形式语言表达能力而言,规则可分为两类:“命题规则”和"一阶规则"。前者是由"原子命题"和逻辑连接词“与”(∧\land∧)、“或”(∨\lor∨)、“非”(¬\lnot¬)和“蕴含”(←\gets←))构成的简单陈述句;后者的基本成分是能描述事物的属性或关系的"原子公式"
vircorns
·
2023-01-12 10:18
#
机器学习
机器学习
规则学习
归纳逻辑
【
周志华
机器学习】十五、规则学习
3.1REP3.2IREP4.一阶规则学习4.1FOIL5.归纳逻辑程序设计5.1最小一般泛化5.2逆归结参考资料Machine-learning-learning-notesLeeML-NotesML-NLP本博客根据
周志华
的
西瓜书
和参考资料
CHH3213
·
2023-01-12 10:48
机器学习
机器学习
人工智能
机器学习(
周志华
) 第十五章规则学习
关于
周志华
老师的《机器学习》这本书的学习笔记记录学习过程本博客记录Chapter15文章目录1基本概念2序贯覆盖3剪枝优化1基本概念一条规则形如:⊕←f1∧f2∧⋯∧fL\oplus\leftarrow
YJY131248
·
2023-01-12 10:40
机器学习(NLP
神经网络等)
机器学习
【机器学习、深度学习与强化学习】机器学习(1)---机器学习简介
前言中的前言那么我们今天开始更机器学习、深度学习和强化学习,请注意强化学习需要ML与DL的一部分基础,不要直接跳到RL去学习,效率很低,参考资料很多,我先列一些我会用到的机器学习、深度学习的参考资料吧:1.
西瓜书
旋转跳跃我闭着眼
·
2023-01-11 20:05
ML
DL和RL
机器学习
深度学习
特征锦囊:今天一起搞懂机器学习里的L1与L2正则化
从
西瓜书
????里我们可以了解到正则项的作用,那就是降低模型过拟合的风险,通常常用的有L1范数正则化与L2范数正则化,作
Pysamlam
·
2023-01-11 07:46
机器学习
数据分析
人工智能
深度学习
计算机视觉
CNCC2022全面启动,共同期待贵阳相聚!
第一行左起梅宏、王怀民、唐卫清、景亚萍、毛胤强第二行左起金海、
周志华
、李轩涯、刘云浩、张晓辉第三行左起
QbitAl
·
2023-01-11 07:52
人工智能
微软
网易
大数据
spreadsheet
训练集,验证集,测试集比例
(
西瓜书
中描述常见的做法是将大约2/3~4/5的样本数据用于训练,剩余样本用于测试)当数据量非常大时,可以使用98:1:1训练数据,验证数据和测试数据。
青山青
·
2023-01-11 02:24
深度视觉
深度学习
西瓜书
习题 - 9.聚类
1.聚类1、下面哪一项属于聚类的作用?寻找数据内在的分布结构作为其他学习任务的前驱过程帮助寻找潜在的概念或者类别以上都是2、下面哪一项机器学习任务不属于无监督学习?分类聚类密度估计主成分分析3、聚类问题与下列哪一项监督学习任务更加相近?____(分类/回归)分类2.聚类方法概述1、k均值聚类属于下列哪一种聚类算法?原型聚类密度聚类层次聚类以上都是2、为了得到树形的聚类结构,应该使用下列哪一种聚类算
加油呀,哒哒哒
·
2023-01-10 10:46
西瓜书习题
聚类
机器学习
算法
周志华
《机器学习》第一章课后习题
1.1、在下面这张图片中若只包含编号为1和4的两个样例,试给出相应的版本空间。分析:什么叫版本空间?现实问题中我们常面临很大的假设空间,但学习过程是基于有限样本训练集进行的,因此,可能有多个假设与训练集一致,即存在着一个与训练集一致的“假设集合”,我们称之为“版本空间”(versionspace).例如,在西瓜问题中,与表1.1训练集所对应的版本空间如图1.2所示.注意的是表1.1的训练数据集对应
An efforter
·
2023-01-10 07:10
python
周志华
教授手把手教你如何做研究与写论文!!!(附完整的PPT全文)
本文整理了著名人工智能学者
周志华
教授《做研究与写论文》的PPT(时间比较早,但方法永远不会过时)。其详细介绍了关于
深度学习技术前沿
·
2023-01-10 02:31
机器学习(4)——
周志华
归纳偏好若非必要,勿增实体若多个算法都能解决同一个问题,则选取最简单的算法当前什么样的偏好与问题更匹配,必须对问题有一个清楚的认识
臭小子222
·
2023-01-09 14:18
笔记
(
西瓜书
)简单线性回归公式推导
因此,由最小二乘法导出损失函数===(此即为
西瓜书
式3.4后面部分)下面,我们先考虑
想去的远方
·
2023-01-09 13:39
机器学习
简单线性回归公式推导
西瓜书
机器学习
最小二乘法
《机器学习》理论——速读学习1 基础知识
Time:2021-12-05学习目标:我需要了解神经网络除了工程化部分之外的更多内容,以便于在实际有效数据中可以获得抽象模型的能力;目录清华-
周志华
2016年出版的,从时间上看,算是比较古老的一本书;
baby_hua
·
2023-01-09 11:00
深度学习
机器学习
人工智能
数据挖掘
深度学习时代您应该阅读的10篇文章了解图像分类
AI博士笔记系列推荐
周志华
《机器学习》手推笔记正式开源!可打印版本附pdf下载链接本文为联盟学习笔记参与:王博kings,Sophia前言计算机视觉是将图像和视频转换成机器可理解的信号的主题。
SophiaCV
·
2023-01-09 10:38
网络
神经网络
大数据
编程语言
计算机视觉
【学习笔记】吴恩达老师《深度学习工程师》一
从吴恩达老师的深度学习工程师课程入手,配合
周志华
老师的《机器学习》“
西瓜书
”,打好基本功,再战TensorFlow!放一张吴恩达老师的照片,开开光,认真学完微专业!(吴恩达老师英语太好听了!
Masec
·
2023-01-09 00:20
神经网络入门知识
吴恩达老师公开课
听课笔记
机器学习(
西瓜书
)10、降维与度量学习
样本的特征数称为维数(dimensionality),当维数非常大时,也就是现在所说的“维数灾难”,具体表现在:在高维情形下,数据样本将变得十分稀疏,因为此时要满足训练样本为“密采样”的总体样本数目是一个触不可及的天文数字,谓可远观而不可亵玩焉...训练样本的稀疏使得其代表总体分布的能力大大减弱,从而消减了学习器的泛化能力;同时当维数很高时,计算距离也变得十分复杂,甚至连计算内积都不再容易,这也是
Handsome_Zpp
·
2023-01-08 19:55
机器学习
机器学习
数据挖掘
人工智能
周志华
《机器学习》——降维与度量学习
有些数据集是包含非常多的属性的,这使得后续数据处理和计算非常困难。因此需要对数据进行降维,需要找到一种合理的方法,在减少需要分析的属性同时,尽量减少信息的损失。由于各变量之间存在一定的相关关系,因此可以考虑将关系紧密的变量变成尽可能少的新变量,使这些新变量是两两不相关的,那么就可以用较少的综合指标分别代表存在于各个变量中的各类信息。根据对降维后数据的要求不同,有如下几种常用的数据降维方法:1、MD
zzmmhxs
·
2023-01-08 15:26
机器学习
周志华
《机器学习》——模型的评估与选择
在一幅图解释机器学习中,我们假设要进行分辨西瓜好坏的任务。如何从众多的评判方法中,选出更好的方法呢(也就是从假设空间到版本空间)这个过程需要解决三个问题:1、如何判断哪个方法更好?——越好的方法,其判断结果应该越符合真实世界(设置合理的性能度量指标,衡量判断结果和真实世界的差距)2、在什么数据集上测试方法的好坏?——测试集应该能够代表真实世界,且不会影响到模型训练(合理分割测试集和训练集)3、毕竟
zzmmhxs
·
2023-01-08 15:26
机器学习
【
周志华
机器学习】集成学习补充——XGBoost
文章目录参考资料1.概念2.核心算法思想3.正则项:树的复杂度4.树的生长4.1停止树的循环生成5.XGBoost与GBDT有什么不同6.为什么XGBoost要用泰勒展开,优势在哪里?参考资料ML-NLPXGBoost本博客根据参考资料所做的笔记,主要用于学习,非技术类博客,因此存在大量复制粘贴,请见谅。XGBoost代码实现示例见于github仓库1.概念XGBoost是陈天奇等人开发的一个开源
CHH3213
·
2023-01-08 15:55
机器学习
机器学习
人工智能
xgboost
机器学习——
周志华
(2)
1.错误率、精度、误差把分类错误的样本数占样本总数的比例称为"错误率""精度=1一错误率"学习器的实际预测输出与样本的真实输出之间的差异称为"误差"(error),学习器在训练集上的误差称为"训练误差"(trainingerror)或"经验误差"(empiricalerror),在新样本上的误差称为"泛化误差"(generalizationerror)2.过拟合、欠拟合当学习器把训练样本学得"太好
Intelligenth
·
2023-01-08 15:51
机器学习
人工智能
深度学习
机器学习——
周志华
读书笔记
1、模型评估方法:留出发:数据集分割为两部分,data=测试集+训练集;2/3~4/5作为训练集,其余测试集交叉验证:数据集分割为k组,k-1组为训练集,剩余1组为测试集。共k中情况,对k种情况的训练结果求平均作为最终结果。为了避免分割的影响,对上述过程进行p次,求p次总均值。称为p次k折交叉验证。自助法:m个原始数据集D,进行又放回抽样,每次抽1个,抽取m次,得到一个新样本D1。原始数据D中始终
flying_meteor
·
2023-01-08 15:50
机器学习(1)
西瓜书
啃书日记:机器学习(
周志华
)思维导图绪论篇
打开
西瓜书
,看着第一章绪论中基本术语的部分,我陷入了沉思,这着实让我混乱,心想这是什么跟什么,我还是跟着视频学吧。
WikHPure
·
2023-01-08 15:49
机器学习
人工智能
学习
机器学习是什么——
周志华
机器学习现在是一大热门,研究的人特多,越来越多的新人涌进来。不少人其实并没有真正想过,这是不是自己喜欢搞的东西,只不过看见别人都在搞,觉着跟大伙儿走总不会吃亏吧。问题是,真有个“大伙儿”吗?就不会是“两伙儿”、“三伙儿”?如果有“几伙儿”,那到底该跟着“哪伙儿”走呢?很多人可能没有意识到,所谓的machinelearningcommunity,现在至少包含了两个有着完全不同的文化、完全不同的价值观
csshuke
·
2023-01-08 15:19
机器学习
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他