E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
机器学习系列
机器学习系列
十三:数据降维
一、算法原理降维方法一般分为线性降维方法和非线性降维方法,如下图所示:我们主要主要介绍PCA、LDA、LLE方法。1.PCA主成分分析(PCA)是另一种常用的数据降维方法,它属于无监督学习算法。PCA旨在找到数据的主成分,并利用这些主成分表征原始数据,从而达到降维的目的。(1)PCA的推导1)最大方差理论在信号处理领域,我们认为信号具有较大方差,噪声具有较小方差,信号与噪声之比称为信噪比。信噪比越
小小小读书匠
·
2023-04-14 02:56
机器学习
python
书单分享|数据分析看这些就够了❗️
我将书籍划分为几个段位和类别,把每本书的优缺点和重点都整理出来了,大家可自行挑选:1️⃣数据分析小白入门系列2️⃣统计学入门系列3️⃣数据处理入门系列4️⃣大数据分析进阶系列5️⃣数据可视化系列6️⃣
机器学习系列
Leo.yuan
·
2023-04-11 04:29
数据分析
信息可视化
python
机器学习系列
之——Knn算法 kd树详解
关于knn算法,对特征空间进行划分的方法为计算新的输入实例与训练实例之间的距离,因为在特征空间中2个特征实例的相似程度可以用距离来表示。一般我们采用的是欧式距离,也就是说每个新的输入实例都需要与所有的训练实例计算一次距离并排序。当训练集非常大的时候,计算就非常耗时、耗内存,导致算法的效率降低。以上是对knn算法的简单理解。kd树(k-dimensional树的简称)是一种对k维空间中的实例点进行存
Nick_Dizzy
·
2023-04-11 01:14
机器学习算法
机器学习
机器学习系列
- 8. 决策树
1.初识决策树1.1什么是决策树:决策树是一种常见的机器学习算法,它的思想十分朴素,类似于我们平时利用选择做决策的过程。它是类似流程图的结构,其中每个内部节点表示一个测试功能,即类似做出决策的过程(动作),每个叶节点都表示一个类标签,即在计算所有特征之后做出的决定(结果)。用决策树分类:从根节点开始,对实例的某一特征进行测试,根据测试结果将实例分配到其子节点,此时每个子节点对应着该特征的一个取值,
小蘑菇1962
·
2023-04-08 08:22
《Machine Learning in Action》—— Taoye给你讲讲Logistic回归是咋回事
在手撕
机器学习系列
文章的上一篇,我们详细讲解了线性回归的问题,并且最后通过梯度下降算法拟合了一条直线,从而使得这条直线尽可能的切合数据样本集,已到达模型损失值最小的目的。
玩世不恭的Coder
·
2023-04-05 10:11
matlab均值量化函数_【MATLAB
机器学习系列
】——主成份分析(PCA)在量化投资中的应用...
原标题:【MATLAB
机器学习系列
】——主成份分析(PCA)在量化投资中的应用编辑部我们会再接再厉1PAC核心思想PCA算法也叫主成分分析(principalcomponentsanalysis),用来减少数据集的维数
Lucy-露西娅
·
2023-04-03 01:34
matlab均值量化函数
机器学习笔记(4.1)
机器学习系列
文章目录文章目录
机器学习系列
文章目录第九节一个例子算法原理算法的优缺点优点缺点关于K的选取尝试动手总结第十节一个例子算法原理算法的优缺点几个版本的决策树的比较优点缺点关于剪枝尝试动手扩展内容总结十一节一个例子算法原理如何处理连续值关于平滑算法的优缺点优点缺点尝试动手扩展内容总结第九节你好
临渊——摸鱼
·
2023-03-30 13:50
算法
数学建模
python
机器学习
算法
人工智能
机器学习系列
3:概率模型、朴素贝叶斯和sigmod函数推导
一、贝叶斯公式推导1.条件概率设是任意两个事件,已知发生的条件下,发生的条件概率为:2.全概率公式设为有限或无限个事件,他们两两互斥,即:被称为一个完备事件群。对于一个事件,可以得出:因为两两互斥,所以也两两互斥,由加法定理可知:根据条件概率:,代入上式可得:上式即为全概率公式。全概率公式的意义在于,直接计算不容易的时候,可以通过构造一系列来简化计算。3.贝叶斯公式在全概率公式的基础上可推导得:若
_世界和平_
·
2023-03-28 20:19
机器学习系列
4:逻辑回归与softmax回归详解
一、Logisticregression中sigmod函数推导sigmod函数的推导1.伯努利分布一个事件x,其结果只有两种:x=1or0,比如抛硬币。when,when,伯努利分布的概率质量函数为:可以写成2.指数族分布如果一个分布能用以下的方式写出,就设这类分布属于指数族:伯努利分布可以表示成:可以发现,伯努利分布是指数族分布,其中:3.sigmod函数的推导标准的逻辑回归问题中,是二分类的,
_世界和平_
·
2023-03-11 15:00
机器学习系列
(十二)——衡量回归算法性能的标准
MSE,RMSE,MAE(MeanSquareError,Root~,MeanAbsoluteError)在分类算法中,我们用准确率作为评价模型好坏的标准。在回归问题中,由于是拟合,自然没有准确率这样的说法,以简单线性回归为例,下面介绍常用的回归衡量指标。在简单线性回归中,我们的目标是找到a和b,使得尽可能小。为了测试模型性能,需要看模型在测试集上的预测与真实值的误差:不过这个表达式与m有关,假如
Ice_spring
·
2023-03-11 04:41
Machine Learning-感知器分类算法详解
机器学习系列
专栏选自python-machine-learning-bookonGitHub作者:SebastianRaschka翻译&整理bySam最近在GitHub上面发现了一个炒鸡赞的项目,果然直接拿过来消化一波
Pysamlam
·
2023-03-10 03:17
MATLAB
机器学习系列
-6 竞争神经网络与SOFM(SOM)神经网络原理及其例子代码
竞争神经网络结构上和RBF等网络是比较像的。这里的距离是负数距离,||ndist||中带一个n,表示negative。在matlab中计算方法是ngedist。它的计算过程是:待分类样本输入后,和样本(就是输入权值向量IW)计算负距离。||ndist||计算后输出是S1x1维的列向量,列向量中每个元素为输入向量p和IW距离的负数。之后,再和一个阈值b1相加,得到n1。接下来就进入了最重要的竞争层,
总裁余(余登武)
·
2023-02-07 08:17
C++和MATLAB系列
matlab
神经网络
机器学习系列
4:期望到底是个啥?
一说明概率学、或统计学有许多概念无法直观想象,而我们这些搞AI的,必须将这些概念学成一种直觉,啥叫直觉,就是无需过大脑,直接想象成结论。这里引出一个概念---期望,本文对其专门讨论。二、举个常识例子这里不先给出定义,拿一个常识进行讨论。【1】假如有一个骰子,有六面。如果丢出“1”来,给你一块钱,那么丢100次能获取多少钱?答案是100/6块钱,这个答案你能接受吗?如果接受上述事实,那么写成公式:其
无水先生
·
2023-02-06 15:39
基础理论
机器学习
概率论
机器学习系列
04——贝叶斯决策(Bayes)
贝叶斯决策(Bayes)【前言】前面几天一直比较忙,写了机器学习的前几篇文章,中间还研究了下微信订阅号开发,简单的做了个微信订阅号,每天发布一天好的文章给大家,希望多少对大家有点帮助,今天继续写贝叶斯决策,这个算法涉及到概率论中的内容比较多,大家耐心看哈!【摘要】本文主要讲解“贝叶斯决策”算法,本算法是机器学习中应用非常广泛的算法之一,尤其在文本分类中的应用,例如在垃圾文件分类中的应用,本文从一定
jonsen_hb
·
2023-02-05 07:03
机器学习系列
贝叶斯决策
文本分类
机器学习算法
bayes
无监督学习k-means算法思想及代码实现附数据集
机器学习系列
文章目录文章目录
机器学习系列
文章目录前言一、算法步骤k-means介绍二、优化目标总结代码数据集ex7data2.mat参考链接:https://blog.csdn.net/qq_54804745
万有瘾力Joker
·
2023-02-04 17:37
python
经验分享
机器学习
kmeans
k-means
机器学习系列
之最小二乘法
最小二乘法最小二乘法,又称最小平方法,是机器学习中基础的算法之一,它是一种优化算法,通过最小化误差的平方来寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。在机器学习中,还可以使用最小二乘法来进行曲线拟合。上图介绍的上海市长宁区部分房价的信息,从散点图可以发现,房子的大小和房价彼此之间有一些依赖关系,由房子大小可以决定房子的价格,
leo_fengj
·
2023-02-04 13:42
机器学习
最小二乘法
机器学习
优化算法
机器学习系列
|基于随机森林的生存分析模型-R实战
机器学习系列
|基于随机森林的生存分析模型-R实战随机生存森林随机生存森林通过训练大量生存树,以表决的形式,从个体树之中加权选举出最终的预测结果。
凡卿
·
2023-02-04 07:59
【经典】吴恩达——机器学习笔记001
【经典】吴恩达——机器学习笔记001机器学习(MachineLearning)笔记001学习地址:[中英字幕]吴恩达
机器学习系列
课程文字版参考及PPT来源:Coursera-ML-AndrewNg-Notes
superME1226
·
2023-02-02 10:40
机器学习
机器学习
算法
Spark2.0
机器学习系列
之4:随机森林介绍、关键参数分析
概述随机森林是决策树的组合算法,基础是决策树,关于决策树和Spark2.0中的代码设计可以参考本人另外一篇博客:http://blog.csdn.net/qq_34531825/article/details/52330942随机森林Spark中基于Pipeline和DataFrame的代码编写和决策树基本上是一样的,只需要将classifer换一下可以了,其它部分是一模一样的,因此本文不再对代码
千寻千梦
·
2023-02-02 09:58
spark
spark
机器学习系列
(吴恩达版)
机器学习笔记(0)常见概念&一些术语(随学习进度更新,部分个人理解)监督学习(SupervisedLearning)给定训练集后,通过算法让机器学习分类、标识等操作。无监督学习(UnsupervisedLearning)根据没有被标记的训练样本,来自动完成分类等操作。支持向量机(SupportVectorMachine,简称SVM)是一类按监督学方式对数据进行二元分类的广义线性分类器(genera
MDRG_Learning
·
2023-01-31 11:34
机器学习
机器学习
深度学习
人工智能
算法
机器学习系列
3:运行一个demo
本文开始,我们运行一个真实的机器学习模型。ok,StepbyStep。0x00:启动docker上篇文章已经介绍过sudodockerrun--nameming-tensortflow-it-p8888:8888-v~/pythonstudy:/studytensorflow/tensorflow正常情况下,你能够看到terminal里给出一个url把URL复制到浏览器里登录即可,如果使用云服务器
chinie3305
·
2023-01-30 07:30
人工智能
开发工具
运维
吴恩达
机器学习系列
五(聚类和降维)
吴恩达
机器学习系列
五聚类(Clustering)无监督学习K-均值算法优化目标随机初始化选择聚类数降维(DimensionalityReduction)动机一:数据压缩动机二:数据可视化主成分分析问题主成分分析算法选择主成分的数量重建的压缩表示主成分分析法的应用建议聚类
酸菜鱼_2323
·
2023-01-24 15:37
机器学习
【CV】吴恩达机器学习课程笔记第18章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片机器学习|Coursera吴恩达
机器学习系列
课程_bilibili目录18应用案例:照片OCR18-1问题描述与流程(pipeline)18-
Fannnnf
·
2023-01-24 11:07
吴恩达机器学习课程笔记
机器学习
人工智能
吴恩达
机器学习系列
课程笔记——第五章:Octave教程(Octave Tutorial)
提示:这章选学,可以去学python,第六节可以看看。5.1基本操作https://www.bilibili.com/video/BV164411b7dx?p=26本章学习以种编程语言:Octave语言。你能够用它来非常迅速地实现这门课中我们已经学过的,或者将要学的机器学习算法。过去我一直尝试用不同的编程语言来教授机器学习,包括C++、Java、Python、Numpy和Octave。我发现当使用
Lishier99
·
2023-01-20 17:00
机器学习
机器学习
人工智能
吴恩达
机器学习系列
课程笔记——第十四章:降维(Dimensionality Reduction)
14.1动机一:数据压缩https://www.bilibili.com/video/BV164411b7dx?p=79这个视频,我想开始谈论第二种类型的无监督学习问题,称为降维。有几个不同的的原因使你可能想要做降维。一是数据压缩,后面我们会看了一些视频后,数据压缩不仅允许我们压缩数据,因而使用较少的计算机内存或磁盘空间,但它也让我们加快我们的学习算法。但首先,让我们谈论降维是什么。作为一种生动的
Lishier99
·
2023-01-20 17:30
机器学习
机器学习
人工智能
算法
学习
吴恩达
机器学习系列
课程笔记——第十一章:机器学习系统的设计(Machine Learning System Design)
11.1首先要做什么https://www.bilibili.com/video/BV164411b7dx?p=65在接下来的视频中,我将谈到机器学习系统的设计。这些视频将谈及在设计复杂的机器学习系统时,你将遇到的主要问题。同时我们会试着给出一些关于如何巧妙构建一个复杂的机器学习系统的建议。下面的课程的的数学性可能不是那么强,但是我认为我们将要讲到的这些东西是非常有用的,可能在构建大型的机器学习系
Lishier99
·
2023-01-20 17:59
机器学习
机器学习
人工智能
算法
吴恩达机器学习(十六)—— 聚类
吴恩达
机器学习系列
内容的学习目录→\rightarrow→吴恩达
机器学习系列
内容汇总。
大彤小忆
·
2023-01-20 17:50
机器学习
聚类
机器学习
【机器学习基础】数学推导+纯Python实现机器学习算法27:EM算法
Python机器学习算法实现Author:louwillMachineLearningLab从本篇开始,整个
机器学习系列
还剩下最后三篇涉及导概率模型的文章,分别是EM算法、CRF条件随机场和HMM隐马尔科夫模型
风度78
·
2023-01-17 12:34
算法
python
机器学习
人工智能
深度学习
吴恩达机器学习课程笔记:监督学习、无监督学习
1.吴恩达机器学习课程笔记:监督学习、无监督学习吴恩达
机器学习系列
课程:监督学习吴恩达
机器学习系列
课程:无监督学习仅作为个人学习笔记,若各位大佬发现错误请指正机器学习的学习算法:监督学习、无监督学习、半监督学习
Uncertainty!!
·
2023-01-16 17:31
机器学习基础
监督学习
无监督学习
机器学习(正在更新)
目录自己疑问-----容易错误的点:训练集、验证集、测试集训练集验证集测试集以下视频地址:[中英字幕]吴恩达
机器学习系列
课程_哔哩哔哩_bilibili第二章2.1线性回归2-2代价函数(类似误差一样)
小小怪将军!
·
2023-01-15 11:23
机器学习
机器学习
深度学习
LightGBM+OPTUNA超参数自动调优教程(附代码框架)
原创系列持续更新,欢迎微信搜一搜「Python数据科学」阅读
机器学习系列
文章。最近在kaggle上有一个调参神器非常热门,在top方案中频频出现,它就是OPTUNA。
Python数据科学
·
2023-01-12 21:11
机器学习笔记
Python数据科学
python
人工智能
机器学习
LightGBM
optuna
机器学习系列
-- 异常检测(Anomaly Detection)
目录1、问题的动机2、高斯分布3、异常检测算法4、开发和评价一个异常检测系统5、异常检测与监督学习对比6、特征选择1、问题的动机这一部分介绍异常检测(Anomalydetection)问题。这是机器学习算法的一个常见应用。这种算法的一个有趣之处在于:它虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。什么是异常检测呢?为了解释这个概念,举一个例子吧:假想你是一个飞机引擎制造商
已退游,勿扰
·
2023-01-12 20:49
机器学习
人工智能
异常检测
【
机器学习系列
】EM算法第一讲:EM算法相关概述及收敛性证明
作者:CHEONG公众号:AI机器学习与知识图谱研究方向:自然语言处理与知识图谱阅读本文之前,首先注意以下两点:1、
机器学习系列
文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文的重要结论
CHEONG_KG
·
2023-01-11 20:03
机器学习
机器学习
算法
EM算法
收敛性
机器学习 笔记(继续更新)
学习内容跟随“吴恩达
机器学习系列
课程”。
M有在认真学习
·
2023-01-11 09:00
机器学习
python
吴恩达---机器学习的流程(持续更新)
参考:吴恩达机器学习的视频视频链接:[中英字幕]吴恩达
机器学习系列
课程_哔哩哔哩_bilibili本文用于我自己的内容总结以及层次理解。
M有在认真学习
·
2023-01-11 09:30
机器学习
回归
逻辑回归
机器学习系列
(2)——CART算法
本文主要介绍CART算法,包括CART分类树/回归树的详细步骤和在sklearn中的参数等。0x01、CART算法简介CART(ClassificationandRegressionTree,分类与回归树)算法是决策树的一种实现,既可用于分类也可用于回归。它是一种二分递归分割技术,即把当前样本划分为两个子样本(即使特征有多个取值,也把数据分为两部分,当前被划分进同一部分的特征在之后的分割过程中将有
陌简宁
·
2023-01-11 01:49
机器学习
机器学习系列
(14)——K均值聚类
本文介绍K均值(KMeans)聚类算法。0x01、k均值聚类简介K均值聚类是基于样本集合划分的聚类算法。K均值聚类将样本集合划分为K个子集,构成K个类,将n个样本分到K个类中,每个样本到其所属类的中心的距离最小。每个样本只能属于一个类,所以K均值聚类是硬聚类。1、模型给定个样本的集合,每个样本由一个特征向量表示,特征向量的维数是。均值聚类的目标是将个样本分到个不同的类或簇中,这里假设。个类形成对样
陌简宁
·
2023-01-11 01:18
机器学习
【
机器学习系列
】概率图模型第四讲:变量消除法和Belief Propagation算法
作者:CHEONG公众号:AI机器学习与知识图谱研究方向:自然语言处理与知识图谱阅读本文之前,先注意一下两点:1、
机器学习系列
文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文的重要结论,
CHEONG_KG
·
2023-01-10 11:08
机器学习
机器学习
概率图
变量消除法
belief
propagation
概率
【
机器学习系列
】浙大机器学习课程-第一章概述
文章目录机器学习的定义监督学习机器学习入门机器学习的定义机器学习是一种非显著式编程。显著式编程是程序固定了程序的输入输出,但是非显著式编程可以让机器进行不断学习。以机器人路径规划为例,机器人根据经验E来提升性能指标P的过程。在人脸识别任务中,经验E往往指训练样本以及对应标签的集合。这些输入的数据都是人为手动添加标签,被称为监督学习。在自动驾驶任务中,经验E往往需要计算机和环境互动获得,计算机产生行
lrchang
·
2023-01-09 15:15
机器学习系列
机器学习
人工智能
算法
【
机器学习系列
】浙大机器学习课程-第二章支持向量机
文章目录1.支持向量机线性可分情况1.1线性可分的定义1.2线性可分下的优化问题2.支持向量机算法2.1核函数的定义2.2原问题和对偶问题3.度量系统性能的标准3.1识别率3.2混淆矩阵3.3ROC曲线4.支持向量机的多分类问题1.支持向量机线性可分情况1.1线性可分的定义线性可分指的是可以使用一条直线分开两个不同的类别,否则为线性不可分。二维特征空间中可视化的例子:三维特征空间可视化的例子:1.
lrchang
·
2023-01-09 15:15
机器学习系列
机器学习
支持向量机
人工智能
《Machine Learning in Action》—— 剖析支持向量机,优化SMO
手撕
机器学习系列
文章就暂时更新到此吧,目前已经完成了支持向量机SVM、决策树、KNN、贝叶斯、线性回归、Logistic回归,其他算法还请允许Taoye在这里先赊个账,后期有机会有时间再给大家补上。
玩世不恭的Coder
·
2023-01-09 12:51
Python
NumPy
机器学习
机器学习
机器学习系列
(一)之算法相关数学符号
算法相关数学符号表(资料1)1、字母表2、数学符号表3、公式和输入符号表4、运算符号表1、字母表2、数学符号表3、公式和输入符号表4、运算符号表
知行SUN
·
2023-01-09 08:17
机器学习
机器学习
机器学习-半监督学习-思维导图
点击进入:
机器学习系列
目录其后附有清晰的pdf版本下载链接哦。整理不易,如果您觉得有用的话,请点个赞吧
DevilXiao-CVer
·
2023-01-08 10:48
机器学习
机器学习
吴恩达机器学习(十七)—— 降维
吴恩达
机器学习系列
内容的学习目录→\rightarrow→吴恩达
机器学习系列
内容汇总。
大彤小忆
·
2023-01-08 02:18
机器学习
pca降维
机器学习
机器学习系列
手记(七):优化算法之随机梯度下降法
优化算法随机梯度下降法在机器学习中,优化问题的目标函数通常可以表示成其中θ\thetaθ是待优化的模型参数,xxx是模型输入,f(x,θ)f(x,\theta)f(x,θ)是模型的实际输出,yyy是模型的目标输出,函数LLL刻画了模型在数据(x,y)(x,y)(x,y)上的损失,PdataP_{data}Pdata表示数据的分布,EEE表示期望。因此,L(θ)L(\theta)L(θ)刻画了当参数
岳小刀
·
2023-01-07 08:13
机器学习系列手记
机器学习
算法
人工智能
100天搞定机器学习|Day7 K-NN
坚持是多么重要,又是多么艰难,目前事情都告一段落,我们继续100天搞定
机器学习系列
。想要继续做这个是因为,一方面在具体应用中,发现很多之前遗漏的点,可
机器学习算法与Python实战
·
2023-01-07 07:27
吴恩达机器学习(十八)—— ex7:K-means Clustering and Principal Component Analysis (MATLAB + Python)
吴恩达
机器学习系列
内容的学习目录→\rightarrow→吴恩达
机器学习系列
内容汇总。
大彤小忆
·
2023-01-06 07:12
机器学习
机器学习
kmeans算法
pca降维
机器学习系列
之最大后验估计(MAP)
解决该问题,一般有两类方法:极大似然估计与最大后验估计,关于极大似然估计,可以看我这篇博客:
机器学习系列
之极大似然估计(MLE)。
筱踏云
·
2023-01-05 19:09
机器学习
【
机器学习系列
】高斯分布-最大似然估计求解
作者:CHEONG公众号:AI机器学习与知识图谱研究方向:自然语言处理与知识图谱前言:
机器学习系列
文章常含有大量公式,若需获取本文全部的手书版原稿资料,扫码关注公众号【AI机器学习与知识图谱】,回复:高斯分布第一讲即可获取
CHEONG_KG
·
2023-01-05 11:39
机器学习
机器学习
高斯分布
算法
最大似然估计
概率论
R语言
机器学习系列
-随机森林多分类代码解读
多分类问题指的是因变量或者被预测变量是分类变量,且其取值水平有多个水平的情形,比如预测病人糖尿病分期的情形。整个代码大致可以分为包、数据、模型、预测评估4个部分,接下来逐一解读。1、包部分,也就是加载各类包,包括随机森林包randomForest,数据相关包tidyverse、skimr、DataExplorer,模型评估包caret、pROC。2、数据部分,主要是读取数据,处理缺失值,转换变量类
Mrrunsen
·
2023-01-05 02:21
R语言大学作业
机器学习
决策树
算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他