E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
机器学习学习笔记
机器学习学习笔记
--迁移学习
迁移学习,故名思意,就是将已经训练完成模型的一部分参数迁移到新的模型中来。我们都知道,训练一个复杂的神经网络是非常费时费力的过程。往往我们需要收集大量已经标注好的训练集,使用昂贵的GPU提供算力,再花费不少的时间,才能训练出一个表现不错的模型。如果两个任务如果存在一定的相关性,比如已经训练好的一个非常优秀的猫狗识别模型,现在需要完成猫兔识别。我们就无需从头开始训练新模型,可以将原模型中的一些权值和
松爱家的小秦
·
2020-03-14 19:11
机器学习学习笔记
(七)PCA
概念主成分分析PrincipalComponentAnalysis(1)一个非监督的机器学习算法(2)主要用于数据的降维(3)通过降维,可以发现更便于人类理解的特征(4)其他应用:可视化;去燥如何找到这个让样本间间距最大的轴?如何定义样本间间距?使用方差(Variance):一个目标函数的最优化问题:使用梯度上升法解决(1)demeandefdemean(X):returnX-np.mean(X,
下雨天的小白鞋
·
2020-03-14 01:36
机器学习学习笔记
--SVM区分僵尸网络
引入一个概念,杰卡德距离(JaccardDistance),是用来衡量两个集合差异性的一种指标。两个集合交集的元素个数除以并集的元素个数。Jaccardindex[1],又称为Jaccard相似系数(Jaccardsimilaritycoefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。隐马尔可夫模型(HiddenMarkovModel,HMM)
松爱家的小秦
·
2020-03-13 23:59
斯坦福大学
机器学习学习笔记
(二)
监督学习应用与梯度下降分类问题:离散变量回归问题:连续变量回归方法问题有一个房屋销售的数据:image.png是否可以根据这样的数据预测未来的房价?plot:image.pngm:训练样本数目x:输入变量(特征)y:输出变量(目标变量)(x,y):样本i(th):第i个训练样本(x(i),y(i)):训练样本中的第i行,第i列监督学习过程(模型)1、先找到一个训练集合(trainingset)2、
朴有天虹
·
2020-03-04 10:52
机器学习学习笔记
--手写数字识别聚类
fromsklearnimportdatasets#导入数据集模块importmatplotlib.pyplotasplt#导入绘图模块#载入数据集digits_data=datasets.load_digits()#绘制数据集前5个手写数字的灰度图forindex,imageinenumerate(digits_data.images[:5]):plt.subplot(2,5,index+1)p
松爱家的小秦
·
2020-03-03 06:42
机器学习学习笔记
(六)梯度下降法
基础(1)梯度下降法本身不是一个机器学习算法(2)梯度下降法是一种基于搜索的最优化方法(3)梯度下降法的作用:最小化一个损失函数(4)梯度上升法:最大化一个效用函数学习率eta如果太小,减慢收敛学习速度;太大的话,会导致不收敛。梯度下降eta并不是所有函数都有唯一的极致点。解决方案:多次运行,随机化初始点梯度下降法的初始点也是一个超参数。原理封装:defgradient_descent(initi
下雨天的小白鞋
·
2020-03-02 03:02
机器学习学习笔记
--主成分分析(PCA降维)
主成分分析是多元线性统计里面的概念,它的英文是PrincipalComponentsAnalysis,简称PCA。主成分分析旨在降低数据的维数,通过保留数据集中的主要成分来简化数据集。简化数据集在很多时候是非常必要的,因为复杂往往就意味着计算资源的大量消耗。通过对数据进行降维,我们就能在不较大影响结果的同时,减少模型学习时间。主成分分析的数学基原理非常简单,通过对协方差矩阵进行特征分解,从而得出主
松爱家的小秦
·
2020-02-20 02:09
机器学习学习笔记
--K-mean聚类算法
设计思路:1.准备好初始数据2.pandas库导入,初步处理数据3.matplotlib库处理数据,把数据画成图4.从sklearn库里调用K-mean算法,处理数据,分类5.对数据再次画图importpandasaspd#导入数据处理模块file=pd.read_csv("cluster_data.csv",header=0)#导入数据文件printfile#输出文件X=file['x']#定义
松爱家的小秦
·
2020-02-15 03:01
机器学习学习笔记
--朴素贝叶斯检测DGA域名
DGA(域名生成算法)是一种利用随机字符来生成C&C域名,从而逃避域名黑名单检测的技术手段。例如,一个由Cryptolocker创建的DGA生成域xeogrhxquuubt.com,如果我们的进程尝试其它建立连接,那么我们的机器就可能感染Cryptolocker勒索病毒。#-*-coding:utf-8-*-importsysimporturllibimporturlparseimportrefr
松爱家的小秦
·
2020-01-05 18:55
机器学习学习笔记
1(Ng吴恩达cs229)
什么是机器学习作为机器学习领域的先驱,ArthurSamuel在IBMJournalofResearchandDevelopment期刊上发表了一篇名为《SomeStudiesinMachineLearningUsingtheGameofCheckers》的论文中,将机器学习非正式定义为:”在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。”TomMitchell在他的《Mach
o慢慢o
·
2019-12-16 03:59
机器学习学习笔记
2(Ng吴恩达cs229)
牛顿方法简单的来说就是通过求当前点的导数得到下一个点.用到的性质是导数值等于该点切线和横轴夹角的正切值.极大似然估计收敛速度:quadraticconversions二次收敛θ为矩阵时image.png每次迭代都需要重新计算H->nxn特征较多时计算量比较大复习:极大似然估计高斯分布=>最小二乘法伯努利分布=>logistic回归指数分布族exponentialfamilydistribution
o慢慢o
·
2019-12-15 17:17
机器学习学习笔记
--分类鸢尾花数据集
markdown效果在这https://www.zybuluo.com/Qinxianshen/note/990758我们首先要理解什么叫做学习?人在学习的过程中,特别是遇到陌生的事物的时候,通常会观察新事物的特征我们把各种特征用一个表画好|颜色鲜艳|外表黏滑|生长地湿润|花萼长度|花萼宽度|花瓣长度|花瓣宽度||--------|-----:|-----:|-----:|-----:|-----
松爱家的小秦
·
2019-11-08 05:11
机器学习学习笔记
--SVM识别XSS
XSS是什么?XSS又称CSS,全称CrossSiteScript,跨站脚本攻击,是Web程序中常见的漏洞,XSS属于被动式且用于客户端的攻击方式,所以容易被忽略其危害性。其原理是攻击者向有XSS漏洞的网站中输入(传入)恶意的HTML代码,当其它用户浏览该网站时,这段HTML代码会自动执行,从而达到攻击的目的。如,盗取用户Cookie、破坏页面结构、重定向到其它网站等。这里可以用SVM的SVC分类
松爱家的小秦
·
2019-11-03 20:43
吴恩达
机器学习学习笔记
(二)多变量回归模型
在这篇博客中,我们将会讲到单变量回归模型的扩展模型——多变量回归模型。在上一篇博客中,我们讲到了一个房价预测的例子,在该例子中我们用到了一个特征“房屋面积”x1,如下图:在上图中,我们构建了一单变量回归函数来预测数据,现在,如果我们不止只有一个房子的特征来预测房屋的价格,而是多了“卧室的数量”、“房子的楼层数”以及“房子的年龄”这三个特征来帮助我们预测房价,如下图:在上图中,我们使用n来表示特征的
脸红因为风太烫
·
2019-01-14 17:33
吴恩达机器学习
吴恩达
机器学习学习笔记
(一)单变量回归模型
近来,在网易云课堂观看了吴恩达机器学习的视频,写下该系列博客让自己在未来能够观看复习知识。如上图所示,这是一幅关于房子尺寸与房子的价格之间关系的散点图,假如你有一位朋友想要出售他的房子,那么你就可以根据这些数据来为你的朋友评估他的房子的价格。现在观察图像,我们似乎能够在这张图上画出一条倾斜的直线来拟合这些点,如下图:通过这条直线,我们就可以来根据你朋友房子的尺寸来估计他房子的价格,但问题来了?你可
脸红因为风太烫
·
2019-01-09 20:55
吴恩达机器学习
机器学习学习笔记
之二——大数定律、中心极限定理以及极大似然估计理解与用法
极大似然估计法常常出现在机器学习算法的推导过程中,其使用场景或者说功能正是:以已有样本、已有公式去估计参数,最大可能的那个参数。这样来理解,极大似然估计法其实和机器学习算法的目标都是一样的。那么极大似然估计法如何来用呢?(1)、写出已有公式:L(θ)。(2)、对L(θ)取对数:lnL(θ)。这一步的目的是将L(θ)中的连乘操作转化为连加。(3)、对lnL(θ)求关于θ的导数,设d(lnL(θ))/
落在地上的乐乐
·
2018-11-26 11:50
机器学习
机器学习学习笔记
一:线性回归(一)
线性回归作为监督学习中经典的回归模型之一,是初学者入门非常好的开始。宏观上考虑理解性的概念,我想我们在初中可能就接触过,y=ax,x为自变量,y为因变量,a为系数也是斜率。如果我们知道了a系数,那么给我一个x,我就能得到一个y,由此可以很好地为未知的x值预测相应的y值。这很符合我们正常逻辑,不难理解。那统计学中的线性回归是如何解释的呢? 对于统计模型线性回归,我想从以下六个方面来展开,并分两篇文章
机器骡子
·
2018-11-12 00:00
机器学习
机器学习学习笔记
(2)-目标检测与识别算法
1.基于区域建议的目标检测与识别算法R-CNN(SelectiveSearch+CNN+SVM)SPP-net(ROIPooling)FastR-CNN(SelectiveSearch+CNN+ROI)FasterR-CNN(RPN+CNN+ROI)具体可参见这里1.一文读懂目标检测:R-CNN、FastR-CNN、FasterR-CNN、YOLO、SSD2.深度学习之目标检测与目标识别2.基于回
摩天轮的守候
·
2018-11-07 16:05
机器学习学习笔记
(3)-机器学习的项目流程
完整机器学习项目的流程1抽象成数学问题明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题,如果都不是的话,如果划归为其中的某类问题。2获取数据数据决定了机器学习结果的上限,而算法只是尽可能逼近这个上限。数据要有代表性,否则必然会过拟合。而且对于分
摩天轮的守候
·
2018-11-07 16:26
机器学习学习笔记
(1)
1.分词方法中文分词方法可以分为以下几种:1)基于统计的分词方法基于统计的分词法的基本原理是根据字符串在语料库中出现的统计频率来决定其是否构成词。词是字的组合,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映它们成为词的可信度。常用的方法有HMM(隐马尔科夫模型),MAXENT(最大熵模型),MEMM(最大熵隐马尔科夫模型),CRF(条件随机场)。2)
摩天轮的守候
·
2018-11-07 16:17
百面
机器学习学习笔记
特征归一化为了消除数据特征之间的量纲影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性。k维度的低纬度向量表示。word2vec实际是一种浅层的神经网络结构,cbow和skip-gramLDA,线性回归分析还是文档主题生成模型。GAN生成式对抗网络。准确率的局限性,分类器把所有的样本都预测为负样本也可以获得99%的准确率。准确率不适用于正负样本分布不均匀的场景,平均准确率代替。精确率不
lennonmwy
·
2018-11-02 10:02
机器学习基础
机器学习学习笔记
一
本笔记是根据吴恩达教授开设的MachingLearning的公开课学习记录。一、矩阵和向量矩阵和向量(MatricesandVectors)是如何计算的?二、矩阵矩阵相乘矩阵矩阵相乘(Matrix-matrixmultiplication)矩阵与矩阵的乘法运算矩阵计算公式:矩阵相乘,两个矩阵只有当左边的矩阵的行数等于右边矩阵的列数时,两个矩阵才可以进行矩阵的乘法运算。示例,可以将另一个矩阵拆
Corwien
·
2018-09-14 00:00
机器学习
机器学习学习笔记
(三)Jupyter Notebook ,numpy
快捷键:Help-keyboardshortcuts一.魔法命令%run:加载py脚本例如:%runE:/pythonprogram/hello.py%timeit:测量代码消耗的时间例如:%timeitL={i**2foriinrange(1000000)}%lsmagic:查看魔法命令目录二.numpy2.1创建(1)引入numpy包:Importnumpy或者importnumpyasnp(
下雨天的小白鞋
·
2018-08-29 10:14
机器学习学习笔记
(一)
题外话---------------------好像很久没有更新了,这学期事比较多,然后之前的几篇博客写的也不是很好的样子,会尽量在假期整理一下。写在前面------------------言归正传,这个学习笔记会长期更新,具体内容以及图片之类的来源主要依赖于同类型的博客以及正在听的B站上的公开课(地址如下:https://www.bilibili.com/video/av14111147?fro
Karen_Yu_
·
2018-07-25 20:04
那些我所不了解的新操作
吴恩达
机器学习学习笔记
第二章:单变量线性回归
模型描述:训练集(trainingset):是监督学习中独有的概念,由我们人喂给电脑的既有既有特征x又有结果y的数据。下图x是房子面积,y是房屋对应的价格符号记法解释:(x^(1),y^(1))代表训练集的第一行的数据x表示输入y表示输出监督学习算法的工作流程:2.假设函数(Hypothesis):里面有θ0和θ1两个参数,参数的改变将会导致假设函数的变化数据会以很多点的形式给我们,我们想要解决回
Rei12345678
·
2018-07-18 13:07
机器学习
吴恩达
笔记
机器学习学习笔记
(一):Numpy基础操作(一)
写在前面的废话因为在机器学习中经常需要对数据进行一些操作,Numpy提供了许多非常方便的数组和矩阵的操作,但是系统地介绍Numpy这个包的课程并不多,所以就把最近在学习的课程里面关于Numpy的内容整理出来。首先,在Python中使用importnumpy引入numpy包,可通过importnumpyasnp将numpy简写为np,下面的代码中都使用np代表numpy.Numpy数组Python中
李先生家的猫
·
2018-07-15 12:42
机器学习
吴恩达
机器学习学习笔记
(四)(附作业代码注释)
吴恩达
机器学习学习笔记
(四)标签:机器学习吴恩达
机器学习学习笔记
四代价函数与反向传播CostfunctionandBackpropagation一代价函数1逻辑分类的评价函数神经网络的评价函数1note
蚍蜉_
·
2018-01-14 00:04
机器学习
机器学习学习笔记
--逻辑回归检测java溢出攻击
#-*-coding:utf-8-*-importreimportmatplotlib.pyplotaspltimportosfromsklearn.feature_extraction.textimportCountVectorizerfromsklearnimportcross_validationimportnumpyasnpfromsklearn.neural_networkimportM
松爱家的小秦
·
2017-12-08 16:40
机器学习学习笔记
--随机森林算法
1.Hello随机森林#-*-coding:utf-8-*-fromsklearn.model_selectionimportcross_val_scorefromsklearn.datasetsimportmake_blobsfromsklearn.ensembleimportRandomForestClassifierfromsklearn.ensembleimportExtraTreesCl
松爱家的小秦
·
2017-12-07 19:23
机器学习学习笔记
--反向传播神经网络
转载自:http://www.hankcs.com/ml/back-propagation-neural-network.html单个神经元神经网络是多个“神经元”(感知机)的带权级联,神经网络算法可以提供非线性的复杂模型,它有两个参数:权值矩阵{Wl}和偏置向量{bl},不同于感知机的单一向量形式,{Wl}是复数个矩阵,{bl}是复数个向量,其中的元素分别属于单个层,而每个层的组成单元,就是神经
Qin_xian_shen
·
2017-11-07 20:38
python学习笔记
机器学习
机器学习学习笔记
:决策树归纳算法(ID3)
前言:决策树是机器学习分类方法中的一个重要的算法。决策树分类一般只适用于小数据。什么是决策树?决策树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性的输出,而每个树叶结点代表类或类结点。树的最顶层是根节点。(根节点的选取十分重要)熵(entropy)概念:信息熵计算是决策树中的计算环节。1948年,香农提出了“信息熵”的概念。一条信息的信息量大小和它的不确
qq_18254385
·
2017-11-05 14:55
深度学习
机器学习学习笔记
——Logistic Regression
LogisticRegression——逻辑回归它其实是一种分类算法。Logisticfunction(逻辑函数),也叫sigmoid函数,可以表示成:它的图像可大致表示为:(图转自维基百科)显然,它具有可导且导数非负的特性。对于二项分类而言(假设结果为0或1):逻辑回归的模型为其中wT为权值向量,b为偏置bias;x=(x1,x2,...,xn),w=(w1,w2,...,wn)对于给定的输入x
wanglilin0628
·
2017-07-08 16:26
机器学习学习笔记
机器学习
机器学习学习笔记
(二)
线性模型给定d个属性描述的示例x=(x1,x2,…,xd)T,其中xi是x在第i个属性上的取值,线性模型试图学习一个通过属性的线性组合来进行预测的函数,即f(x)=w1x1+w2x2+…+wdxd+b一般用向量形式写成f(x)=wTx+b其中w=(w1,w2…,wd)T,学得w和b后,模型就得以确定。优点:线性模型具有形式简单、易于建模和很好的可解释性。常见线性模型:线性回归模型,logistic
dinkwad
·
2017-05-14 15:59
机器学习学习笔记
(4)-----学习器的性能度量
·错误率(errorrate)&精度(accuracy)分类错误的样本数占样本总数的比例,即如果在m个样本中有n个样本分类错误,则错误率E=n/m;相应的,精度是分类正确的样本数占样本总数的比例,1-n/m称为“精度”。即精度=1-错误率·查准率(precision)&查全率(recall)初学机器学习,概念看到这里是有点懵的,询问过老师,恍然大悟。上例子:我们对一堆西瓜进行采样分类,我们用训练好
小青年阿坚
·
2017-04-02 20:58
机器学习
机器学习学习笔记
(4)-----学习器的性能度量
·错误率(errorrate)&精度(accuracy)分类错误的样本数占样本总数的比例,即如果在m个样本中有n个样本分类错误,则错误率E=n/m;相应的,精度是分类正确的样本数占样本总数的比例,1-n/m称为“精度”。即精度=1-错误率·查准率(precision)&查全率(recall)初学机器学习,概念看到这里是有点懵的,询问过老师,恍然大悟。上例子:我们对一堆西瓜进行采样分类,我们用训练好
小青年阿坚
·
2017-04-02 20:58
机器学习
机器学习学习笔记
(3)----模型评估与选择
几个不熟悉的概念1.NPC问题,P问题与NP问题NPC问题:无多项式级算法可求解(Hamilton回路)P问题:可以找到一个能在多项式的时间里解决它的算法NP问题:可以在一个多项式的时间里验证一个解的问题2.过拟合与欠拟合过拟合指学习器把样本训练的“太好了”,把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质。如:误以为树叶必须要有锯齿,把圆叶归到非叶子那边去欠拟合指学习器学习的不够,对
小青年阿坚
·
2017-03-31 09:20
机器学习
机器学习学习笔记
(3)----模型评估与选择
几个不熟悉的概念1.NPC问题,P问题与NP问题NPC问题:无多项式级算法可求解(Hamilton回路)P问题:可以找到一个能在多项式的时间里解决它的算法NP问题:可以在一个多项式的时间里验证一个解的问题2.过拟合与欠拟合过拟合指学习器把样本训练的“太好了”,把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质。如:误以为树叶必须要有锯齿,把圆叶归到非叶子那边去欠拟合指学习器学习的不够,对
小青年阿坚
·
2017-03-31 09:20
机器学习
机器学习学习笔记
(二)——回归
回归(ressgression)我对回归的认识线性回归局部加权回归logistic回归4.softmax回归总结代码实现(机器学习实战Python代码):特别感谢回归(ressgression)我对回归的认识在我现在的认识中,回归是找到反映一系列事物的各个特征之间的联系和规律的方法,以充分了解这一系列事物,发现其内部存在的规律,得到回归模型。比如房价预测中房价与面积、地段、楼层等之前的关系,首先对
Bing_Cao
·
2015-12-23 00:00
机器学习
Python
机器学习学习笔记
- 梯度下降
梯度下降算法的思维过程: x为训练数据输入值。y为训练数据输出值。θ 为 x的系数,也就是要求的。 1.预测公式 h(x) = ∑θixi 。“使 θ尽可能的准确”,可以理解为理想情况下对每一组样本都有 ( h(x(i)) - y(i) )2 = 0 ,非理想情况下希望 J(θ) = ∑( ( h(x(i)) - y(i) )2 /2 )尽可能
·
2015-10-21 10:08
机器学习
机器学习学习笔记
——单变量线性回归的python实现
# -*- coding:utf-8 -*- #!/usr/bin/python import numpy import operator import pylab #从文本文件中读取数值并转换为mx2矩阵,返回矩阵和矩阵的行数 def File2Matrix(filename): fr = open(filename) arrayOfLines = fr.readlines() numberO
Cheng允权
·
2015-05-12 15:00
R语言与
机器学习学习笔记
(分类算法)
转载自:http://www.itongji.cn/article/0P534092014.html人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来
u013524655
·
2014-11-07 22:00
机器学习学习笔记
(2)---感知器学习算法
机器学习学习笔记
(2)---感知器学习算法
机器学习学习笔记
(2)---感知器学习算法上文所说的学习过程中,要有用来学习的数据和一个用于学习的假设函数h。
WO125654193
·
2014-01-20 20:00
人工智能
R语言与
机器学习学习笔记
(分类算法)(6)logistic回归
写在前面的废话2014,又到了新的一年,首先祝大家新年快乐,也感谢那些关注我的博客的人。现在想想数据挖掘课程都是去年的事了,一直预告着,盘算着年内完工的分类算法也拖了一年了。本来打算去年就完成分类算法,如果有人看的话也顺带提提关联分析,聚类神马的,可是,。借着新年新气象的借口来补完这一系列的文章,可是,这明明就是在发。尽管这个是预告里的最后一篇,但是我也没打算把这个分类算法就这么完结。尽管每一篇都
yujun7654321
·
2014-01-06 20:00
R语言与
机器学习学习笔记
(分类算法)(5)神经网络
算法五:神经网络(优化算法) 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。 人工神经网络从以下四个方面去模拟人的智能行
xuchaohit
·
2013-12-13 00:00
R语言与
机器学习学习笔记
(分类算法)(4)支持向量机
算法四:支持向量机 说到支持向量机,必须要提到july大神的《支持向量机通俗导论》,个人感觉再怎么写也不可能写得比他更好的了。这也正如青莲居士见到崔颢的黄鹤楼后也只能叹“此处有景道不得”。不过我还是打算写写SVM的基本想法与libSVM中R的接口。一、SVM的想法 回到我们最开始讨论的KNN算法,它占用的内存十分的大,而且需要的运算量也非常大。那么我们有没有可能找到几个最有代表性的点(
yujun7654321
·
2013-11-29 13:00
R语言与
机器学习学习笔记
(分类算法)(3)朴素贝叶斯算法
算法三:朴素贝叶斯算法 前两个算法都被要求做出一个艰难的决定,给出数据所属分类的明确答案,但往往因为分类特征统计不足,或者分类特征选择有误导致了错误的分类结果,哪怕是训练集也有可能出现不能正确分类的情形。这时,前两种方法都如同现实生活一样是用“少数服从多数”的办法来做出决策。正如帕斯卡指出的:“少数服从多数未必是因为多数人更正义,而是多数人更加强力”,所以为了保证“少数人的权利”,我们要
yujun7654321
·
2013-11-16 13:00
R语言与
机器学习学习笔记
(分类算法)(2)决策树算法
算法二:决策树算法决策树定义 首先,我们来谈谈什么是决策树。我们还是以鸢尾花为例子来说明这个问题。 观察上图,我们判决鸢尾花的思考过程可以这么来描述:花瓣的长度小于2.4cm的是setosa(图中绿色的分类),长度大于1cm的呢?我们通过宽度来判别,宽度小于1.8cm的是versicolor(图中红色的分类),其余的就是virginica(图中黑色的分类) 我们用图形来形象的展示我
yujun7654321
·
2013-11-10 16:00
R语言与
机器学习学习笔记
(分类算法)(1)K-近邻算法
前言 最近在学习数据挖掘,对数据挖掘中的算法比较感兴趣,打算整理分享一下学习情况,顺便利用R来实现一下数据挖掘算法。 数据挖掘里我打算整理的内容有:分类,聚类分析,关联分析,异常检测四大部分。其中分类算法主要介绍:K-近邻算法,决策树算法,朴素贝叶斯算法,支持向量机,神经网络,logistic回归。 写这份学习笔记主要以学校datamining课程的课件为主,会参考一堆的baidu,一堆
yujun7654321
·
2013-11-09 16:00
Standford
机器学习学习笔记
线性回归(Linear Regission)
本节内容主要包含单变量(OneVariable)和求解costfunction的最优值的学习算法—梯度下降法(Gradientdescent)以及多变量(multipleVariable)的线性回归。1. 单变量的线性回归(LinearRegissionwithonevariable) 监督学习的样本中都含有对于每个输入变量的输出值,通过建立模型并且学习得到一个
usingnamespace_std
·
2013-05-03 21:00
机器学习
线性回归
上一页
1
2
3
4
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他