大头雨山

Deep learning：一(基础知识_1)

作者：tornadomeet 出处：http://www.cnblogs.com/tornadomeet 欢迎转载或分享，但请务必声明文章出处。（新浪微博：tornadomeet,欢迎交流！）

Deep learning：一(基础知识_1)

　　前言:

　　最近打算稍微系统的学习下deep learing的一些理论知识，打算采用Andrew Ng的网页教程UFLDL Tutorial，据说这个教程写得浅显易懂，也不太长。不过在这这之前还是复习下machine learning的基础知识，见网页：http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=DeepLearning。内容其实很短，每小节就那么几分钟，且讲得非常棒。

　　教程中的一些术语:

　　Model representation:

　　其实就是指学习到的函数的表达形式，可以用矩阵表示。

　　Vectorized implementation:

　　指定是函数表达式的矢量实现。

　　Feature scaling：

　　指是将特征的每一维都进行一个尺度变化，比如说都让其均值为0等。

　　Normal equations:

　　这里指的是多元线性回归中参数解的矩阵形式，这个解方程称为normal equations.

　　Optimization objective:

　　指的是需要优化的目标函数，比如说logistic中loss function表达式的公式推导。或者多元线性回归中带有规则性的目标函数。

　　Gradient Descent、Newton’s Method：

　　都是求目标函数最小值的方法。

　　Common variations:

　　指的是规则项表达形式的多样性。

　　一些笔记：

　　模型表达就是给出输入和输出之间的函数关系式，当然这个函数是有前提假设的，里面可以含有参数。此时如果有许多训练样本的话，同样可以给出训练样本的平均相关的误差函数，一般该函数也称作是损失函数（Loss function）。我们的目标是求出模型表达中的参数，这是通过最小化损失函数来求得的。一般最小化损失函数是通过梯度下降法（即先随机给出参数的一组值，然后更新参数，使每次更新后的结构都能够让损失函数变小，最终达到最小即可）。在梯度下降法中，目标函数其实可以看做是参数的函数，因为给出了样本输入和输出值后，目标函数就只剩下参数部分了，这时可以把参数看做是自变量，则目标函数变成参数的函数了。梯度下降每次都是更新每个参数，且每个参数更新的形式是一样的，即用前一次该参数的值减掉学习率和目标函数对该参数的偏导数（如果只有1个参数的话，就是导数），为什么要这样做呢？通过取不同点处的参数可以看出，这样做恰好可以使原来的目标函数值变低，因此符合我们的要求（即求函数的最小值）。即使当学习速率固定(但不能太大)，梯度下降法也是可以收敛到一个局部最小点的，因为梯度值会越来越小，它和固定的学习率相乘后的积也会越来越小。在线性回归问题中我们就可以用梯度下降法来求回归方程中的参数。有时候该方法也称为批量梯度下降法，这里的批量指的是每一时候参数的更新使用到了所有的训练样本。

Vectorized implementation指的是矢量实现，由于实际问题中很多变量都是向量的，所有如果要把每个分量都写出来的话会很不方便，应该尽量写成矢量的形式。比如上面的梯度下降法的参数更新公式其实也是可以用矢量形式实现的。矢量形式的公式简单，且易用matlab编程。由于梯度下降法是按照梯度方向来收敛到极值的，如果输入样本各个维数的尺寸不同（即范围不同），则这些参数的构成的等高线不同的方向胖瘦不同，这样会导致参数的极值收敛速度极慢。因此在进行梯度下降法求参数前，需要先进行feature scaling这一项，一般都是把样本中的各维变成0均值，即先减掉该维的均值，然后除以该变量的range。

接下来就是学习率对梯度下降法的影响。如果学习速率过大，这每次迭代就有可能出现超调的现象，会在极值点两侧不断发散，最终损失函数的值是越变越大，而不是越来越小。在损失函数值——迭代次数的曲线图中，可以看到，该曲线是向上递增的。当然了，当学习速率过大时，还可能出现该曲线不断震荡的情形。如果学习速率太小，这该曲线下降得很慢，甚至在很多次迭代处曲线值保持不变。那到底该选什么值呢？这个一般是根据经验来选取的，比如从…0.0001,0.001,.0.01,0.1,1.0…这些参数中选，看那个参数使得损失值和迭代次数之间的函数曲线下降速度最快。

同一个问题可以选用不同的特征和不同的模型，特征方面，比如单个面积特征其实是可以写成长和宽2个特征的。不同模型方面，比如在使用多项式拟合模型时，可以指定x的指数项最多到多少。当用训练样本来进行数据的测试时，一般都会将所有的训练数据整理成一个矩阵，矩阵的每一行就是一个训练样本，这样的矩阵有时候也会叫做是“design matrix”。当用矩阵的形式来解多项式模型的参数时，参数w=inv(X’*X)*X’*y,这个方程也称为normal equations. 虽然X’*X是方阵，但是它的逆不一定存在（当一个方阵的逆矩阵不存在时，该方阵也称为sigular）。比如说当X是单个元素0时，它的倒数不存在，这就是个Sigular矩阵，当然了这个例子太特殊了。另一个比较常见的例子就是参数的个数比训练样本的个数还要多时也是非可逆矩阵。这时候要求解的话就需要引入regularization项，或者去掉一些特征项（典型的就是降维，去掉那些相关性强的特征）。另外，对线性回归中的normal equations方程求解前，不需要对输入样本的特征进行feature scale（这个是有理论依据的）。

　　上面讲的函数一般都是回归方面的，也就是说预测值是连续的，如果我们需要预测的值只有2种，要么是要么不是，即预测值要么是0要么是1，那么就是分类问题了。这样我们需要有一个函数将原本的预测值映射到0到1之间，通常这个函数就是logistic function，或者叫做sigmoid function。因为这种函数值还是个连续的值，所以对logistic函数的解释就是在给定x的值下输出y值为1的概率。

　　Convex函数其实指的是只有一个极值点的函数，而non-convex可能有多个极值点。一般情况下我们都希望损失函数的形式是convex的。在分类问题情况下，先考虑训练样本中值为1的那些样本集，这时候我的损失函数要求我们当预测值为1时，损失函数值最小（为0），当预测值为0时，此时损失函数的值最大，为无穷大，所以这种情况下一般采用的是-log(h(x)),刚好满足要求。同理，当训练样本值为0时，一般采用的损失函数是-log(1-h(x)).因此将这两种整合在一起时就为-y*log(h(x))-(1-y)*log(1-h(x))，结果是和上面的一样，不过表达式更紧凑了，选这样形式的loss函数是通过最大释然估计(MLE)求得的。这种情况下依旧可以使用梯度下降法来求解参数的最优值。在求参数的迭代公式时，同样需要求损失函数的偏导，很奇怪的时，这时候的偏导函数和多元线性回归时的偏导函数结构类似，只是其中的预测函数一个是普通的线性函数，一个是线性函数和sigmoid的复合的函数。

　　梯度下降法是用来求函数值最小处的参数值，而牛顿法是用来求函数值为0处的参数值，这两者的目的初看是感觉有所不同，但是再仔细观察下牛顿法是求函数值为0时的情况，如果此时的函数是某个函数A的导数，则牛顿法也算是求函数A的最小值（当然也有可能是最大值）了，因此这两者方法目的还是具有相同性的。牛顿法的参数求解也可以用矢量的形式表示，表达式中有hession矩阵和一元导函数向量。

　　下面来比较梯度法和牛顿法，首先的不同之处在于梯度法中需要选择学习速率，而牛顿法不需要选择任何参数。第二个不同之处在于梯度法需要大量的迭代次数才能找到最小值，而牛顿法只需要少量的次数便可完成。但是梯度法中的每一次迭代的代价要小，其复杂度为O(n),而牛顿法的每一次迭代的代价要大，为O(n^3)。因此当特征的数量n比较小时适合选择牛顿法，当特征数n比较大时，最好选梯度法。这里的大小以n等于1000为界来计算。

　　如果当系统的输入特征有多个，而系统的训练样本比较少时，这样就很容易造成over-fitting的问题。这种情况下要么通过降维方法来减小特征的个数（也可以通过模型选择的方法），要么通过regularization的方法，通常情况下通过regularization方法在特征数很多的情况下是最有效，但是要求这些特征都只对最终的结果预测起少部分作用。因为规则项可以作用在参数上，让最终的参数很小，当所有参数都很小的情况下，这些假设就是简单假设，从而能够很好的解决over-fitting的问题。一般对参数进行regularization时，前面都有一个惩罚系数，这个系数称为regularization parameter，如果这个规则项系数太大的话，有可能导致系统所有的参数最终都很接近0，所有会出现欠拟合的现象。在多元线性回归中，规则项一般惩罚的是参数1到n（当然有的也可以将参数0加入惩罚项，但不常见）。随着训练样本的增加，这些规则项的作用在慢慢减小，因此学习到的系统的参数倾向而慢慢增加。规则项还有很多种形式，有的规则项不会包含特征的个数，如L2-norm regularization(或者叫做2-norm regularization).当然了，还有L1-norm regularization。由于规则项的形式有很多种，所以这种情形也称为规则项的common variations.

　　在有规则项的线性回归问题求解中，如果采用梯度下降法，则参数的更新公式类似（其中参数0的公式是一样的，因为规则项中没有惩罚参数0），不同之处在于其它参数的更新公式中的更新不是用本身的参数去减掉后面一串，而是用本身参数乘以（1-alpha*lamda/m）再减掉其它的，当然了这个数在很多情况下和1是相等的，也就很前面的无规则项的梯度下降法类似了。它的normal equation也很前面的类似，大致为inv(X’*X+lamda*A)*X’*y,多了一项，其中A是一个对角矩阵，除了第一个元素为0外，其它元素都为1（在通用规则项下的情形）。这种情况下前面的矩阵一般就是可逆的了，即在样本数量小于特征数量的情况下是可解的。当为logistic回归的情况中（此时的loss函数中含有对数项），如果使用梯度下降法，则参数的更新方程中也和线性回归中的类似，也是要乘以（1-alpha*lamda/m），nomal equation中也是多了一个矩阵，这样同理就解决了不可逆问题。在牛顿法的求解过程中，加了规则项后的一元导向量都随着改变，hession矩阵也要在最后加入lamda/m*A矩阵，其中A和前面的一样。

　　logistic回归与多充线性回归实际上有很多相同之处，最大的区别就在于他们的因变量不同，其他的基本都差不多，正是因为如此，这两种回归可以归于同一个家族，即广义线性模型（generalized linear model）。这一家族中的模型形式基本上都差不多，不同的就是因变量不同，如果是连续的，就是多重线性回归，如果是二项分布，就是logistic回归，如果是poisson分布，就是poisson回归，如果是负二项分布，就是负二项回归，等等。只要注意区分它们的因变量就可以了。logistic回归的因变量可以是二分类的，也可以是多分类的，但是二分类的更为常用，也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。

　　参考资料：

http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=DeepLearning

http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial

作者：tornadomeet 出处：http://www.cnblogs.com/tornadomeet 欢迎转载或分享，但请务必声明文章出处。（新浪微博：tornadomeet,欢迎交流！）

【机器学习理论基础】一文看尽朴素贝叶斯算法大数据AI Machine Learning 机器学习
在所有的机器学习分类算法中，朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法，比如决策树,KNN,逻辑回归，支持向量机等，他们都是判别方法，也就是直接学习出特征输出Y和特征X之间的关系，要么是决策函数Y=f(X)Y=f(X)Y=f(X),要么是条件分布P(Y∣X)P(Y|X)P(Y∣X)。但是朴素贝叶斯却是生成方法，也就是直接找出特征输出YYY和特征XXX的联合分布P(X,Y)P(X
【机器学习第十二章——计算学习理论】方寸星河yu 机器学习人工智能
机器学习第十二章——计算学习理论12.计算学习理论12.1基础知识12.1可能学习近似正确假设（PAC）12.3有限假设空间12.4VC维12.计算学习理论12.1基础知识从理论上刻画了若干类型的机器学习问题中的困难和若干类型的机器学习算法的能力这个理论要回答的问题是:在什么样的条件下成功的学习是可能的?在什么条件下某个特定的学习算法可保证成功运行?机器学习理论的一些问题:是否可能独立于学习算法确
一篇文章预览数据挖掘比赛入门 MycountryMyhome
很多学习机器学习的同学来参加数据挖掘比赛,发现数据挖掘比赛和自己学过的机器学习理论完全不一致.所以,我决定写一篇入门文章给那些新人。必须掌握的库scikit-learnscipyseabornmatplotlibpandasHyperopt特征分类:连续数字特征序数特征类别特征时间特征坐标特征文本特征序数特征:定义为无限循环有限个数字。比如某一列只有123类别特征:类别特征和序数特征相似只不过表现
[笔记]机器学习之机器学习理论及案例分析《二》聚类二进制怪兽人工智障聚类机器学习算法
#21天学习挑战赛—机器学习#活动地址：CSDN21天学习挑战赛文章目录前言聚类聚类定义什么是簇聚类分类离群点聚类算法实例K-Means算法(k-均值算法)寻找质心最佳位置关于均值关于距离函数维度灾难定义产生的问题解决办法总结前言聚类聚类是在无标记样本的条件下将数据进行分组，从而发现天然的结构。聚类是无监督学习的主要任务，分类是监督学习的主要任务。聚类主要应用在：发现数据的潜在结构对数据进行自然分
Python数据分析的入门路线皮皮大
最近发现了一个自学Python数据分析的好地方，这里的原创文章高达200+篇，大家一起来看看，可以关注学习起来喔❤️公众号的原创文章涉及：Python数据分析、爬虫、机器学习、kaggle案例分享、MySQL、可视化等，下面是部分原创文章：一、机器学习+kaggle案例机器学习和数据分析案例分享是尤而小屋的核心内容，主要包含机器学习理论+kaggle比赛+数据分析的分享：机器学习（1）部分关于机器
【机器学习理论】2023 Spring 期中考试 CSCI5030 Midterm 叼辣条闯天涯机器学习理论机器学习人工智能
Date&Time:16/03/2023,12:30-2:00pmQuestion1(True/False,20Points):Forthisquestion,youneedtoanswerwhichofthefollowingstatementsaretrueandwhichonesarefalse.Youalsoneedtoprovideashortexplanationforyourtrue
【机器学习理论】2023 Spring Homework 1 叼辣条闯天涯机器学习理论机器学习概率论人工智能
PleaselogintoGradescopeviayourCUHKaccountandusetheentrycode:6ZWGYDProblem1(GaussianDistributionasanExponentialFamily):WeshowedGaussiandistributionN(μ,σ2)\mathcal{N}\left(\mu,\sigma^{2}\right)N
【机器学习理论】人工神经网络之神经元的MP模型 Li Yuexi 机器学习理论神经网络人工智能机器学习人工智能神经网络
神经元的MP模型1神经元的生理结构2神经元的数学模型2.1从生理结构到MP模型的构建过程2.2MP模型的直观图示2.3MP模型的标准形式2.4MP模型的向量形式2.5小结3MP模型的加权求和的数学意义4总结人工神经网络是人工智能仿生学派的一大创造，人工神经网络的诞生极大地受到人体内的真实的神经元的生理结构的启发，并且最初的神经元的数学模型就是仿照真实的神经元的结构来设计的，所以在介绍神经元的MP模
【机器学习理论】2023 Spring 期末考试 CSCI5030 Finalterm 叼辣条闯天涯机器学习理论机器学习人工智能
CSCI5030:FinalSolutionsDate&Time:May4,2:00-4:00pmQuestion1(True/False,20Points):Forthisquestion,youneedtoanswerwhichofthefollowingstatementsaretrueandwhichonesarefalse.Youalsoneedtoprovideashortexplan
适合进阶学习的机器学习开源项目（可快速下载） GitCode官方开源项目学习机器学习开源
目录开源项目合集[>>开源的机器学习平台：mlflow/mlflow](https://gitcode.com/mlflow/mlflow)[>>机器学习路线图：mrdbourke/machine-learning-roadmap](https://gitcode.com/mrdbourke/machine-learning-roadmap)[>>机器学习理论和实践的合集：ben1234560/A
2020-07-23计算学习理论 BOLDRainbow
1.章节主要内容机器学习理论（computationallearningtheory）研究的是关于通过“计算”来进行“学习”的理论，即关于机器学习的理论基础，其目的是分析学习任务的困难本质，为学习算法提供理论保证，并根据分析结果指导算法设计。这章内容相对比较抽象，它关注的更多是算法能产生的数据与结果之间的映射与实际映射的贴近程度和稳定程度，而不是具体的算法的优劣。这是一个在更高层面审视机器学习算法
Python数据挖掘与机器学习实践技术应用思考的小猴子机器学习 python 数据挖掘机器学习
近年来，Python编程语言受到越来越多科研人员的喜爱，在多个编程语言排行榜中持续夺冠。同时，伴随着深度学习的快速发展，人工智能技术在各个领域中的应用越来越广泛。机器学习是人工智能的基础，因此，掌握常用机器学习算法的工作原理，并能够熟练运用Python建立实际的机器学习模型，是开展人工智能相关研究的前提和基础。为各领域人员量身定制课程内容，让你畅学Python编程及机器学习理论与代码实现方法，从“
初步认识cortex（CTXC） hp_6482
一、资料1、白皮书（EN）http://www.cortexlabs.ai/Cortex_AI_on_Blockchain_EN.pdf2、官方网站（EN）http://www.cortexlabs.ai/3、团队+顾问CEO——陈子祺，清华大学、卡耐基梅隆大学、加州大学圣克鲁斯分校学习。在早期的学习经历中，师从DavidP.Helmbold研究机器学习理论和各种算法应用，精通共识算法和共有链生态
8.1 有监督学习算法 adamlay 大课笔记——数据分析
有监督学习算法0.机器学习理论基础根据酒精浓度、颜色深度判断红酒类别常用机器学习算法体系有监督学习无监督学习半监督学习强化学习输入/输出空间、特征空间过拟合与欠拟合1.KNN/K近邻算法1.1算法原理1.2算法的优缺点1.3算法的变种1.4Python代码实现1.5SCIKIT-LEARN算法库实现主要设计原则：案例1.6选择最优K值绘制学习曲线1.7交叉验证1.7.1泛化能力1.7.2K折交叉验
对偶理论：基本概念札记三翼鸟数字化技术团队人工智能机器学习算法
1.前言在读论文或者学习机器学习理论时，常常看到对偶的身影。但因为对对偶问题的理解不够透彻，在看机器学习理论相关理论时也是懵懵懂懂。所以本文整理了对偶理论的基本概念，帮助理解记忆。本文主要描述：优化问题的标准形式，即原问题的基本定义；介绍Lagragian函数，Lagrage对偶函数/对偶函数，Lagrage对偶问题/对偶问题等基本概念；介绍将原问题转化为对偶问题的方法。优化问题的标准形式（原问题
一、大数据与机器学习-概述-笔记火蓝棋大数据机器学习-笔记
一、什么是机器学习？机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。二、机器学习应用场景举例1.Gam
TensorFlow03-实现线性回归 __流云
deftest01_liner():#用numpy生成100个点x_data=np.random.rand(100)y_data=x_data*0.1+0.2#构造一个线程模型#k:斜率;b:偏置值b=tf.Variable(0.)k=tf.Variable(0.)y=k*x_data+b#定义二次方差损失函数，用于优化计算结果，机器学习理论部分#求得预测值和实际值的平方差，用于判断计算结果的损失
机器学习和python学习之路吐血整理技术书从入门到进阶(珍藏版) rocling 人工智能人工智能
极客侠网站导航（全部书单资源导航页）：https://pymlovelyq.github.io/archives/“机器学习／深度学习并不需要很多数学基础！”也许你在不同的地方听过不少类似这样的说法。对于鼓励数学基础不好的同学入坑机器学习来说，这句话是挺不错的。不过，机器学习理论是与统计学、概率论、计算机科学、算法等方面交叉的领域，对这些技术有一个全面的数学理解对理解算法的内部工作机制、获取好的结
001、torch笔记 Here we are——wxl torch 笔记
之——开始目录之——开始初衷杂谈正文1.大致框架2.数据操作基础2.1数组2.2广播机制2.4不常用的原地内存操作2.5numpy与tensor相互转换所属专栏会不断更新初衷学而时习之，太多东西来得杂乱，不用就忘，浅记一下，一些小的心得和想法杂谈2023.10.3，笑死是生日不过新的一年开始也很不错本科阶段学了很多模式识别机器学习理论，多部署少研究和编写，现在刚开始系统化动手。用上了jupyter
基于支持向量机 (SVM) 和稀疏表示理论 (SRC) 的人脸识别比较西部小狼_
一背景1.1支持向量机简介支持向量机（SupportVectorMachine，SVM）是AT&TBell实验室的V.Vapnik等人提出的一种机器学习算法，是迄今为止最重要的机器学习理论和方法之一，也是应用最广泛、综合效果最好的模式分类技术之一。到目前为止，支持向量机已应用于孤立手写字符识别、网页或文本自动分类、说话人识别、人脸检测、性别分类、计算机入侵检测、基因分类、遥感图象分析、目标识别、函
python 知乎 sklearn_sklearn：Python语言开发的通用机器学习库 weixin_39723678 python 知乎 sklearn
深入理解机器学习并完全看懂sklearn文档，需要较深厚的理论基础。但是，要将sklearn应用于实际的项目中，只需要对机器学习理论有一个基本的掌握，就可以直接调用其API来完成各种机器学习问题。sklearn介绍scikit-learn是Python语言开发的机器学习库，一般简称为sklearn，目前算是通用机器学习算法库中实现得比较完善的库了。其完善之处不仅在于实现的算法多，还包括大量详尽的文
近期微软重大论文----《通用人工智能的火花：GPT-4的早期实验》小林猿~ chatgpt 人工智能深度学习 microsoft python stable diffusion
这篇论文是最近讨论度极高的一篇论文，推特上几乎被这篇论文刷屏，作者SebastienBubeck是微软机器学习基础组的研究经理。他本人之前的研究主要集中在机器学习理论，凸优化，对抗鲁棒性方法，下面是该大佬的个人主页：虽然作者是做理论ML出身，但是这篇论文中却没有利用机器学习的方法来对GPT-4进行分析，而是从心理学，哲学的角度出发来探讨评估GPT-4的智能。我个人认为这篇论文会是今年最重要的论文之
机器学习中为什么需要梯度下降_机器学习理论（四）线性回归中的梯度下降法... weixin_39607423 机器学习中为什么需要梯度下降线性分组码的最小汉明距为6 线性回归梯度下降法python
(小小：机器学习的经典算法与应用)(小小：机器学习理论（一）KNN-k近邻算法)(小小：机器学习理论（二）简单线性回归)(小小：机器学习理论（三）多元线性回归)(小小：机器学习理论（四）线性回归中的梯度下降法)(小小：机器学习理论（五）主成分分析法)(小小：机器学习理论（六）多项式回归)(小小：机器学习理论（七）模型泛化)(小小：机器学习理论（八）逻辑回归)(小小：机器学习理论（九）分类算法的评价
Robocup 仿真2D 学习笔记（一） ubuntu16.04 搭建 robocup 仿真2D环境 markchalse robocup2D robocup 仿真 2D ubuntu16 环境搭建
前言robocup2D是一个仿真机器人足球比赛，也是一个研究多智能体强化学习等机器学习理论算法的优秀平台，在接下来的一段时间，通过学习如何在robocup2D仿真比赛中运用机器学习算法，提高一个球队底层的实力。本文将在ubuntu16.04系统中搭建robcup2D开发环境，因为手中只有15版本的开发环境，但是在安装中与在ubuntu12.04的环境搭建过程有一些不同。本文介绍的搭建过程比较粗略，
量化：基于支持向量机的择时策略无名J0kзr 量化支持向量机算法机器学习
文章目录参考机器学习简介策略简介SVM简介整体流程收集数据准备数据建立模型训练模型测试模型调节参数参考Python机器学习算法与量化交易利用机器学习模型，构建量化择时策略机器学习简介机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也
机器学习理论笔记（二）：数据集划分以及模型选择蓝色是天蓝色是天的机器学习笔记机器学习笔记人工智能数据集验证数据集
文章目录1前言2经验误差与过拟合3训练集与测试集的划分方法3.1留出法（Hold-out）3.2交叉验证法（CrossValidation）3.3自助法（Bootstrap）4调参与最终模型5结语1前言欢迎来到蓝色是天的机器学习笔记专栏！在上一篇文章《机器学习理论笔记（一）：初识机器学习》中，我们初步了解了机器学习，并探讨了其定义、分类以及基本术语。作为继续学习机器学习的进一步之旅，今天我们将进一
机器学习里面数学知识，到底对数学水平要求多高？ yoku酱
过去几个月里，有不少人联系我，向我表达他们对数据科学、对利用机器学习技术探索统计规律性，开发数据驱动的产品的热情。但是，我发现他们中有些人实际上缺少为了获取有用结果的必要的数学直觉和框架。这是我写这篇文章的主要原因。最近，许多好用的机器和深度学习软件变得十分易得，例如scikit-learn，Weka，Tensorflow，等等。机器学习理论是与统计学、概率论、计算机科学、算法等方面交叉的领域，它
机器学习理论笔记（一）：初识机器学习蓝色是天蓝色是天的机器学习笔记机器学习笔记人工智能 NFL 西瓜书
文章目录1前言：蓝色是天的机器学习笔记专栏1.1专栏初衷与定位1.2本文主要内容2机器学习的定义2.1机器学习的本质2.2机器学习的分类3机器学习的基本术语4探索"没有免费的午餐"定理（NFL）5结语1前言：蓝色是天的机器学习笔记专栏尊敬的读者们，大家好！欢迎来到我的全新专栏：《蓝色是天的机器学习笔记》。我感到无比兴奋，能够在这里与各位分享我对机器学习的热爱与探索。这个专栏将成为我记录机器学习知识
Python 数据挖掘与机器学习 xiao5kou4chang6kai4 农业生态气象 python 数据挖掘机器学习
近年来，Python编程语言受到越来越多科研人员的喜爱，在多个编程语言排行榜中持续夺冠。同时，伴随着深度学习的快速发展，人工智能技术在各个领域中的应用越来越广泛。机器学习是人工智能的基础，因此，掌握常用机器学习算法的工作原理，并能够熟练运用Python建立实际的机器学习模型，是开展人工智能相关研究的前提和基础。畅学Python编程及机器学习理论与代码实现方法，从“基础编程→机器学习→代码实现”逐步
Python数据分析宝藏地带！计算机视觉研究院可视化聚类数据分析 python 机器学习
给大家推荐一个Python机器学习、数据分析的好地方：尤而小屋。这里的原创文章高达260+篇，主要内容涉及：Python机器学习、数据分析、爬虫、kaggle案例分享、Pandas、MySQL、可视化、工具利器等，大家一起来看看，可以关注学习起来喔❤️下面是部分优质原创文章：一、机器学习+kaggle案例机器学习和数据分析案例分享是尤而小屋的核心内容，主要包含机器学习理论+kaggle比赛+数据分
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

Deep learning：一(基础知识_1)

Deep learning：一(基础知识_1)

你可能感兴趣的:(机器学习理论)