逆袭的小学生

机器学习算法入门(一)

前言:本课程是在慕课网上学习 Python3入门机器学习经典算法与应用课程时所做的笔记,供本人复习之用.学习这个的主要目的是为了应付这学期的机器学习选修课.所以只会大概讲解算法的意思,不会深入的进行实践或讲解原理.另外因为主要是供本人复习以及不打算仔细学,所以不保证写的一定对,只提供一个基本的理解.

第一章机器学习基础

1.1关于数据

1.2 机器学习的主要任务

1.2.1 分类任务

1.2.2 回归任务

1.3 什么是机器学习

1.4 监督学习,非监督学习,半监督学习和增强学习

1.4.1 监督学习

1.4.2 非监督学习

1.4.3 半监督学习

1.4.4 增强学习

1.5 批量学习,在线学习,参数学习,非参数学习

1.5.1 批量学习(Batch Learning)

1.5.2 在线学习(Online Learing)

1.5.3 参数学习(parametric Learning)

1.5.4 非参数学习(Nonparametric Learning)

1.6 和机器学习相关的哲学思考

1.6.1 数据的重要性

1.6.2 算法的选择

1.6.3 其它思考

第二章 k近邻算法 kNN

第三章线性回归法

3.1 简单线性回归

3.2 衡量线性回归方法的指标

3.2.1 MSE

3.2.2 RMSE

3.2.3 MAE

3.2.4 R Squared

3.3 多元线性回归

第四章梯度下降法(Gradient Descent)

4.1 线性回归中的梯度下降法

第五章多项式回归

5.1 自己实现多项回归

5.2 过拟合和欠拟合

5.3 模型的正则化

第六章逻辑回归

6.1 逻辑回归的损失函数

6.2 逻辑回归的决策边界

6.3 逻辑回归的正则化

第一章机器学习基础

1.1关于数据

我们使用著名的鸢尾花数据来说明,在这里有三个不同种类的鸢尾花.

总共有150个鸢尾花的数据信息,每个数据信息包括四个方面的信息.分别是萼片的长度与宽度,花瓣的长度与宽度.

整个数据就可以表示成这个样子.种类中我们标识了几个数,因为在计算机中我们希望将它们数字化.

我们根据三行的数据集来阐述一下在机器学习领域和数据相关的基本概念.

我们完成一个机器学习的任务,手里肯定是有数据的,通常我们管这些数据的整体叫做数据集.
对于一个数据集,通常我们可以写成一个表格的形式,在表格中每一行数据称为一个样本.具体到鸢尾花的数据中,每一行数据其实就是一朵花的信息.包含这一朵花的萼片的长度宽度.那么这一朵花就是一个样本.
除了最后一列,每一列都表达了样本的一个特征.可以简单的把一个特征理解成一个属性.比如说萼片的长度是一个特征,萼片的宽度是另外一个特征.
对这个数据来说,除了最后一列,其余的部分都是在描述数据整体的特征,通常在机器学习任务中,我们管这一部分用X来表示,之所是X是因为通常这部分是一个矩阵,这个矩阵有多少行就说明有多少样本,有多少列就说明有多少个特征,通过我们把第i个样本写作,第i个样本第j个特征值 $^{}$
最后一列是特殊的一列,它是我们机器学习真正想去学的内容,称为标记.在表示上,我们通常用y来表示.第i个样本的标记写作
对于数据的每一行本身也组成了一个向量,通常我们管这个向量叫做特征向量,在数学中我们通常会把向量表示为列向量如图1,正因如此我们的矩阵可以写成图2所示

图1 图2

我们抽出数据的前两个特征,即萼片的长度与宽度,用萼片的长度作为横轴,萼片的宽度作为纵轴,可以想象,对于每一个样本来说,都会在横纵轴组成的坐标系中表示成一个点.当然这是为了我们可视化方便,所以我们选了两个轴在一个平面上来表示它.如果我们有3个维度就可以在三维空间中表示它,如果有四个维度就可以在四维空间中表示它,甚至有1000维度的话我们就可以在1000维空间中表示它,每一个样本的本质就是在这个空间中的一个点,这个空间我们称之为特征空间(feature space).

我们在下图中可以看出两类鸢尾花的特征分布是有极大的不同的,分类任务的本质就是在特征空间切分,不论低维还是高维空间.

这里花瓣的长度宽度都是有明确的语义的,即我们知道每一个数字代表什么意思,但是在机器学习领域中,特征可以是非常抽象的一个东西.举个例子对于图像识别来说,每一个像素点都是一个特征,对于28*28的图像有784个特征,换句话说,我们为了描述这个图像,我们可以使用784个数,每个数都代表着从左上角到右下角每一个像素点把它排开这个点对应的灰度值的深浅.然后利用这些特征来进行数字的识别.

如果是彩色图像特征更多.特征工程研究之一就是怎么喂给机器比较好的特征.

1.2 机器学习的主要任务

1.2.1 分类任务

比如判断一张图片是猫是狗,判断一个数字是0到9中的哪一个,分类任务就是将给定的任务进行分类.分类任务包括以下几种

二分类任务:

是猫是狗?是否是垃圾邮件?发给客户信用卡有没有风险?良性肿瘤恶性肿瘤?股票涨跌?

多分类任务:

数字识别,图像识别(猫狗鸟鳄鱼),信用卡风险评级(高中低)

很多复杂的问题也可以转化成多分类问题,比如玩2048时,是往上下左右哪个方向移动?下围棋的时候因为棋盘的大小是有限的,所以机器就是根据现在的棋盘信息选一个方向进行落子,甚至现在大红大紫的无人车,我们可以将它转换成方向盘向左向右打多少度,油门分成几个程度,具体踩多深等等.

当然这些问题是可以转换成多分类问题,但不一定使用多分类来解决这些问题是最好的.

后续的学习过程中,我们会了解到:

多标签分类:

之前的图片是放在一个类别中进行分类,比较高级的机器学习系统能放在多个类别中进行比较.这是比较前沿的话题.

1.2.2 回归任务

我们之前的标签列都是一个类别,但是在这个数据中,我们最终是一个价格.价格不是一个类别是一个连续的数字,这一类任务就是机器学习可以处理的另外一类任务了,叫做回归任务.

比如房屋价格,市场分析,学生成绩,股票价格.

一些情况下,回归任务可以简化成分类任务,比如刚才提到的无人驾驶.方向盘打的角度是一个连续的数值,只不过我们将每一度看作一个类别.我们就将回归任务简化成了分类任务.

1.3 什么是机器学习

大量的学习资料就是数据集,我们将数据集喂给我们的机器学习算法,我们的机器学习算法将根据我们的数据集训练一个模型,当有了新的样本资料以后,是通过这个模型来得到输出结果的.这个输出结果有两类,一个是样本的类别,另外一类是具体的数值.

我们的模型其实就是一个函数,这里我们的函数需要的每一个小的x就是一个样本资料.我们机器学习算法本质是获得一个新的f(x).这样当我们有新的样本资料x时,只要把它送给我们训练好的f(x),这个f(x)就会根据它的函数规则得到一个结果.如果结果时0,1,2,3,4这样的类别的话,我们解决的就是一个分类问题,如果f(x)得到的是一个具体的数值的话,我们解决的就是一个回归问题.

上面我们说了分类和回归问题,其实是监督学习主要解决的是分类和回归问题,机器学习还可以解决很多其它的问题.

1.4 监督学习,非监督学习,半监督学习和增强学习

我们之前是根据能机器学习能解决的问题进行了分类,现在我们将根据机器学习的算法进行分类.

1.4.1 监督学习

给机器的训练数据拥有标记或者答案.

监督学习算法:

k临近,线性回归和多项式回归,逻辑回归,SVM,决策树和随机森林.

1.4.2 非监督学习

很多时候非监督学习是辅助监督学习的运行.

给机器的的训练数据是没有任何"标记"或者答案.

非监督学习可以完成分类任务.

比如电商网站上的人群分类,某些人是理智型消费者,有些人是冲动型,有些人更在乎性价比等等...

非监督学习可以对数据进行降维处理和异常检测.

降维处理包含两部分内容,特征提取和特征压缩.

特征提取:当我面对一个数据时,这个数据有很多特征,有时候根据经验或深入分析,认为某一些特征对我们预测或者计算的结果是没有贡献的,比如银行需要用收集的个人信息对个人信用进行评级,而个人的胖瘦与信用评级是没有关系的,这叫做特征提取.

特征压缩:PCA,我们并不扔掉任何特征,下图是一个二维的特征平面,这个二维的特征平面上分布很多的数据点,但这些点是呈直线的形式,如果我们画一根直线的话,把所有的点都映射在倾斜的直线上,那么这些点的直线信息并没有丢失多少,但是经过这样的处理后,二维的点就变成了一维的点.

之前我们说28*28的图片要784个特征,经过特征压缩后,只需要十几个特征就行了.

降维处理的意义:方便可视化.对于人类来说是无法理解四维以上的信息的,有的时候我们可以把很高维的数据降到三维甚至二维,降到这么低的维度可能已经丢失了很多信息,我们降到这么低的维度主要是为了对信息进行可视化.

异常检测:有时候在我们的数据中存在一些点,这些点是存在异常的,这种点对于让我们的算法发现一般性规律是没有帮助的,对于二维的我们可以肉眼看到,对于高维的我们就需要用非监督学习算法剔除这些点.

1.4.3 半监督学习

一部分数据有"标记"或者"答案",另一部分数据没有.因为在实际生活种会因各种原因产生数据的缺失.

通常是使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测.

1.4.4 增强学习

我们机器学习的算法通常叫做agent,我们机器学习的算法要根据周围的环境来采取行动,在采取去了行动之后,我们的算法就会收到一些反馈,这个返回有时候是使用reward,有时候是使用state机制来进行反馈,agent算法得到了反馈之后就会改进自己的行为模式,之后在面对环境的其它的情况下,根据改进的算法再做出相应的action.然后环境再反馈给我们的agent.依此类推,可以看出我们的agent在一轮一轮的行动反馈中逐渐增强自己的智能.所以称之为增强学习.

前沿领域的无人驾驶与机器人都需要增强学习.

监督学习与半监督学习是基础.

1.5 批量学习,在线学习,参数学习,非参数学习

1.5.1 批量学习(Batch Learning)

批量学习就是收集一定量的样本资料,送给我们的机器学习算法,我们的机器学习算法就可以训练出一个模型,当我们训练出这个模型后就可以直接投入到生产环境中了.在具体应用的时候可能又有新的样例送进来,通过我们的模型来预测出相应的结果.这个过程中我们的模型不会再发生变化了.

优点:简单

问题:

如何适应环境变化?如垃圾邮件,每年都会有新的种类的垃圾邮件

解决方案:定时重新批量学习,运算量巨大.

缺点:每次重新批量学习,运算量巨大.在某些环境变化非常快的情况下,甚至是不可能的.如股市.

1.5.2 在线学习(Online Learing)

在线学习就是每次我们输入样例到模型得到输出结果之后,我们的输入样例并不浪费掉,有时我们会很快拿到输入样例的正确结果,如对股市进行预测,我们很快就能拿到样例的真实结果,我们拿真实结果和预测结果进行比较,这些信息仍然是机器学习算法需要的学习资料.我们可以将这些信息迭代进机器学习算法.改进我们的模型,以此类推,这个过程不断地循环,相当于在线的过程不仅是应用模型得到我们想要的结果,与此同时我们还再不断训练我们的模型,进行学习.

优点:及时反映新的环境的变化

问题:

有些不正常的新的数据带来不好的变化.

解决方案:需要加强对数据进行监控.

其它:有时也适用于数据量巨大,无法完全批量学习的环境.

1.5.3 参数学习(parametric Learning)

如下图所示,横坐标是房屋的面积,纵坐标是房屋的价格,对应每一个房屋在这个特征空间中就有一个点,基于这些数据点我们可以假设房屋的价格之间是一个线性的关系,即我们假设房租的价格是f(x)=a*x+b,当我们拥有了这个假设之后,我们整个机器学习的过程就是找到合适的a和b来描述房屋的面积和价格之间的关系.a和b就是参数.基于这样的学习特点,相应的机器学习算法就叫做参数学习,那么我们刚才描述的学习的方法就是最为基础的线程回归机器学习方法.

刚才我们预测是线性关系,事实上我们可以做出非常多的假设,在统计学领域有非常多的统计模型,我们可以假设我们的特征和要预测的结果之间是某种统计模型可以涵盖的,之后我们的任务就是学习统计模型中的参数.一旦学习到了这些参数之后,我们的预测相对是非常简单的.不再需要原有数据集的参与.

1.5.4 非参数学习(Nonparametric Learning)

不对模型进行过多的假设,通常在预测的过程中,我们喂给算法的数据集也要参与进预测的过程中,要注意的是非参数不代表没有参数,在后续的学习中会发现,很多非参数学习里面的参数并不少.两个种类的主要区别就是不把整个问题进行一个建模,不把整个问题理解成是学习一些参数.但是在学习过程中依然是需要一些参数来参与的.

1.6 和机器学习相关的哲学思考

1.6.1 数据的重要性

2001年微软的一篇论文,这篇论文大意是指对于四个不同的机器学习算法,从算法的角度它们是有优有劣的,但是如果喂以足够多的数据,横坐标是数据的规模,所有算法的准确率都在稳定的上升,纵坐标是准确率.当数据大到一定程度后,算法的准确率相差并不多.

所以数据非常重要.

但是在2017年人工智能界有了新的突破,AlphaGo Zero不需要喂任何数据,所有数据都是由算法产生的,即使没有数据,也可以人工生成数据,当然围棋有它的特殊性,但是也说明了一些问题.

1.6.2 算法的选择

奥卡姆的剃刀原则:

简单的就是好的.对于一个问题,不要进行过多的假设,不要进行过多的复杂化.

可是容易引发争议的问题是,到底在机器学习领域中,什么叫"简单"?

在这里只是想说,机器学习处理的是不确定的世界中的真实的问题,对于很多问题来说,并没有标准的答案.

没有免费的午餐定理:

整个定理讲述的是,可以严格地数学推导出:任意两个算法,他们的期望性能是相同的.

既然任意算法的期望性能是相同的,那么我们为什么还要学习新的算法呢?

因为这里值得是期望,但是具体到某个特定特定的问题,有些算法可能更好.所以我们还是要真正的去寻找,在我们要解决的领域里,哪个算法更好.

但没有一种算法,绝对比另一种算法好.脱离具体问题,谈算法的好坏是没有意义的.

在面对一个具体的我呢提的时候,尝试使用多种算法进行对比实验,是很有必要的.

1.6.3 其它思考

面对不确定的世界,怎么看待使用机器学习进行预测的结果?比如美国的大选,有的团队预测对了,有的团队预测错了,那么预测对的到底是机器学习算法起到了重要作用还是仅仅是一个巧合?这同样也类似于预测股票经济历史等等.

还有预测根据人的长相预测人成为罪犯的概率,是否会得某种病的概率.我们该怎么看待这种预测结果.

这种思考甚至会产生出一门新的学科,机器伦理学.

第二章 k近邻算法 kNN

主要解决的是分类为题.

下图是肿瘤病人相关的数据,横轴代表一个特征是发现肿瘤病人肿块的大小,纵轴是发现肿块的时间.对于每一个病人,它的肿块大小和发现的时间都成为了特征平面中的一个点,对于这个点我们又知道了它是一个恶性的肿瘤还是一个良性的肿瘤,恶性肿瘤用蓝色来表示,良性肿瘤用红色来表示.这样如果新来了一个病人,用绿色的点表示,那么我们怎么知道他的肿瘤是良性的还是恶性的呢?

k临近算法是这样的,先选定一个k值,假设是3,对于每一个新的数据点,k近邻算法做的就是在所有的点中,寻找离这个点最近的三个点,如果最近的点蓝的多,那么这个点就是蓝的,红的亦然.这里蓝色比红色是3:0,所以这个肿瘤是恶性的.

第三章线性回归法

对于分类问题问题,我们上面讲的是横轴代表肿瘤大小,纵轴代表肿瘤时间,样本的输出标记是被样本是红色的点还是蓝色的点所表示的,蓝色的点代表是恶性的,红色的点代表是良性的.我们在这一小节举得例子中,只有横轴是样本的特征,纵轴就已经是样本的输出标记了也就是房租的价格,因为在回归问题中我们真正要预测的是一个具体的数值,这个具体的数值是在一个连续的空间中,而不是可以用简单的颜色来表示的,如果我们要想看有两个样本特征的回归问题,我们需要在三维空间中观察.在接下来的讲解中为了便于理解,我们对于线性回归这种可视化的讲解使用只有一个特征来讲解.

3.1 简单线性回归

对于样本的特征只有一个使用线性回归法进行预测,我们可以用简单线性回归来称呼它,简单线性回归,顾名思义,相对来说是比较简单的,我们可以通过对简单线性回归的学习推广到多个,样本特征有多个的话就叫多元线性回归.

下面是评估线性回归法性能的方法,因为绝对函数不可导,所以我们这里用平方的方法.

3.2 衡量线性回归方法的指标

对于一个数据集,我们把它分为训练数据和测试数据,在线性回归中,我们用我们的训练数据找出最好的a,b,用测试数据来测试a,b的好坏.

现在有两个训练出的a,b那么哪个比较好呢?

3.2.1 MSE

我们之前说的是将误差的平方和相加,但是可能一个是1000个样本数据误差的累加,一个是100的误差的累加,这样难以说明问题,所以我们取样本的平均值.

3.2.2 RMSE

我们之前用的是平方,但是这样有可能会有量纲的问题,比如误差是万元,那现在的误差是万元的平方.一个简单的优化方法是把MSE的值开一个平方.

3.2.3 MAE

之前在训练的过程中我们不用相减绝对值去求是因为绝对值不好求导,现在可以用它来评估误差.

3.2.4 R Squared

RMSE与MAE还是有它们的问题,

当我们用房产数据进行预测的时候,用RMSE或MAE得到的数据是5万元,而我们预测学生的成绩,预测的最终结果是10分,那么这种情况就难以说明我们的算法是作用在预测房产上好,还是预测学生成绩上好.

这种情况是可以解决的,解决的方法是用一个新的指标R方.

看着比较麻烦,其实ssresidual就是预测结果减去真值平方和,sstotal就是平均结果减去真值的平方和.

另外:

3.3 多元线性回归

和之前讲的简单线性回归类似,只是这里的特征变成了n个.

当有n个特征的时候,方程可以表示为如下, $\Theta 0$ 表示的就是b, $\Theta1$ 表示的就是a.

预测值为如下:

求解的思路也和简单线性回归类似.主要是使损失函数尽量小

$\Theta$ 可变成一个列向量,X可以变成一个行向量,为了保持一致性这里我们加了一个X0.

上面只是一个样本的预测,我们可以把X推广到所有的样本上.这个Xb有m行n+1列. $\Theta$ 是一个列向量.y hat(带尖角的y)是一个列向量,是所有样本的预测值.

这样就能解出 $\Theta$ ,但是时间复杂度过高.O(n^3)(优化O(n^2.4)),有更快的方法,如梯度下降法等.

第四章梯度下降法(Gradient Descent)

梯度下降法不是一个机器学习算法,是一种基于搜索的最优化算法,作用是最小化一个损失函数.

我们的参数 $\Theta$ 每次加上就能保证向损失函数减少的方向移动,这样一次次移动就能找到损失函数的最小值.比如在这里我们的导数是负值,乘上－ $\eta$ , $\Theta$ 便会增大,损失函数就会减小.

这里是二维函数,对应的是导数, $\Theta$ 与x对应.如果是多维函数,对应的就是梯度.

$\eta$ 成为学习率, $\eta$ 的取值影响获得最优解的速度, $\eta$ 取值不合适,甚至得不到最优解, $\eta$ 是梯度下降法的一个超参数.

并不是所有函数都有唯一的极值点.

解决方案:

多次运行,随机化初始点,梯度下降法的初始点也是一个超参数.

4.1 线性回归中的梯度下降法

现在我们的样本特征变成了n个,之前是对一个求导,现在未知数多了,要对某个未知数求偏导.

我们希望我们求出来的值与m的个数是无关的,所以我们加上m分之一来消除m的影响.

按照上面这样就求出来对应的梯度 $\bigtriangledown$ J( $\Theta$ )了,然后根据每次向梯度的方向进行一定的移动,直到找到极值就行了.基本步骤和二维的差不多.

第五章多项式回归

之前学习线性回归的时候,需要预测的是直线,有的数据需要曲线等等拟合.这样我们就需要多项式回归.我们可以把二次项看作另外一个特征.

5.1 自己实现多项回归

添加一层x^2特征,然后利用原来的线性回归去做就行了.

我们可以用sklearn来生成新的特征,degree表示我们要为原本的数据集添加几次幂这样的特征.如果添加2次的话,一个

[2.44,2.59,-1.34,-0.33,-2.33]的矩阵就变成下图所示.

值得注意的是sklearn不只是生成一个特征,而是生成多个,当degree为3,原本有x1,x2两个特征,用sklearn生成的特征如下.

5.2 过拟合和欠拟合

如上面所说,按degree的不同会生成不同的特征,如果degree过大,则预测的结果会过于拟合我们的测试数据集,如果过小,则会对测试数据集拟合结果不好.

过拟合

欠拟合

5.3 模型的正则化

机器学习的主要挑战,来自于方差.解决的方法有挺多,降低模型复杂度,减少数据维度,增加样本数,使用验证集等等,除了这些,解决高方差的一个主要手段就是模型正则化.

当我们过拟合时,模型的系数 $\Theta$ 往往非常的大,下面是一个100次幂的系数.当系数过大时,就会越陡.如下左图是系数,可以看到有10^11次方出现.

考虑到我们我们在计算结果的时候会使方差尽量小,我们又不希望 $\Theta$ 过大,我们可以在方差中加入 $\Theta$ 来进行平衡.下图我们在方差上加上了α $\Theta$ ^2,这样我们计算方差的时候 $\Theta$ 便不会过大.

下图是随着α逐渐增大,函数图像的变化.

除了加上 $\Theta$ 平方,还有一种方式.

第六章逻辑回归

逻辑回归虽然是回归.但解决的却是分类问题.这里用了一个比较巧妙地函数将一个连续的值变成了0与1之间的值,我们还是通过刚才的方法预测值,只不过预测的值要带进sigmod函数中,可以看到sigmod函数 $\sigma$ 的范围在(0,1)之间,所以我们将预测的带入后也将是一个(0,1)之间的值,所以可以作为概率预测.

6.1 逻辑回归的损失函数

如果真值是1,那么我们预测的p越小,cost越大.

如果真值是0,那么我们预测的p越大,cost越大.

下面的两个函数可以实现上诉要求,既越接近0,cost越大,与越接近1,cost越大.

为了方便我们可以将上面两式子合成一个.

这个式子没有公式解,只能用梯度下降法求解.但这个损失函数是凸函数,没有局部最优解,只有全局最优解,所以不用担心求到的解不是最优解.

6.2 逻辑回归的决策边界

决策边界就是p等于二分之一,即 $\Theta$ ^T * Xb =0 的X的取值.

如果有两个特征

刚才的决策边界是直线,我们可以直接将特征带入公式去计算,但是如果边界是不规则的,如下面的圆形边界,我们就需要按照多项式回归那样,去自己构造特征.可以用sklearn去生成特征.

6.3 逻辑回归的正则化

这个我也不大懂,看看就好.

你可能感兴趣的:(机器学习)

[Python从零到壹] 七十七.图像识别及经典案例篇之目标检测入门普及和ImageAI对象检测详解 Eastmount Python从零到壹 python 目标检测 ImageAI 图像是被基础系列
欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家，希望对您有所帮助，文章中不足之处也请海涵。Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智
kaggle上面有哪些适合机器学习新手的比赛和项目 xiamu_CDA 机器学习人工智能
Kaggle上面有哪些适合机器学习新手的比赛和项目？在当今数据驱动的时代，机器学习已经成为一门炙手可热的技能。Kaggle作为全球最大的数据科学竞赛平台，不仅汇聚了众多顶尖的数据科学家和机器学习工程师，也为初学者提供了丰富的学习资源和实战机会。对于机器学习新手来说，选择合适的比赛和项目是至关重要的第一步。本文将为你推荐一些适合新手的Kaggle比赛和项目，并提供一些实用的建议，帮助你在机器学习的道
python鸢尾花数据集knn_【python+机器学习1】python 实现 KNN weixin_39629269 python鸢尾花数据集knn
欢迎关注哈希大数据微信公众号【哈希大数据】1KNN算法基本介绍K-NearestNeighbor(k最邻近分类算法)，简称KNN，是最简单的一种有监督的机器学习算法。也是一种懒惰学习算法，即开始训练仅仅是保存所有样本集的信息，直到测试样本到达才开始进行分类决策。KNN算法的核心思想：要想确定测试样本属于哪一类，就先寻找所有训练样本中与该测试样本“距离”最近的前K个样本，然后判断这K个样本中大部分所
【机器学习】使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测加德霍克机器学习人工智能 python 学习作业
一、KNN算法概念K最近邻(K-NearestNeighbor,KNN)分类算法是数据挖掘分类技术中最简单的方法之一，是著名的模式识别统计学方法，在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一，也是基于实例的学习方法中最基本的，又是最好的文本分类算法之一。二、对鸢尾花数据集进行预测1、代码示例：fromsklearn.datasetsimportl
Julia语言的计算机基础 Code侠客行包罗万象 golang 开发语言后端
Julia语言的计算机基础引言随着数据科学、机器学习和高性能计算的快速发展，对编程语言的需求也日益增加。在众多编程语言中，Julia语言因其独特的设计理念和高性能而迅速崛起。本文将详细探讨Julia语言的基础知识，包括其历史背景、安装与环境配置、基本语法、数据结构、函数与模块、以及性能优化等方面，旨在为对Julia感兴趣的读者提供一份全面的入门指南。一、Julia语言简介1.1历史背景Julia是
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
机器学习问题：AttributeError: ‘NoneType‘ object has no attribute ‘split‘ 解决办法零零鲎机器学习人工智能
参考博客：本次博客参考http://t.csdnimg.cn/8E7eH。写下来主要是为了整理自己在学习过程中遇到的问题并把解决办法列出来。学习内容：如果运行出现：AttributeError:‘NoneType’objecthasnoattribute'split’这样的问题。网上有很多解决办法是降级numpy到1.21.4。然后上面博客给出的解决方案是升级threadpoolctl。可以使用命
AI Agent：一场智能革命的开始机器人openai区块链
在当今科技日新月异的时代，AI（人工智能）技术正以前所未有的速度改变着我们的生活和工作方式。其中，AIAgent作为AI领域的一个新兴分支，正逐渐展现出其巨大的潜力和价值。本文将深入探讨AIAgent的发展现状、核心优势以及未来的发展方向，带您领略这一前沿技术的无限魅力。一、AIAgent的发展现状：技术突破与广泛应用近年来，随着大数据、云计算和机器学习等技术的飞速发展，AIAgent的技术水平得
【杂谈】-为什么Python是AI的首选语言视觉与物联智能杂谈 python 人工智能开发语言深度学习机器学习
为什么Python是AI的首选语言文章目录为什么Python是AI的首选语言1、为何Python引领人工智能发展1.1可用性和生态系统1.2用户群和用例1.3效率辅助2、AI项目对Python开发人员的要求3、如何开启你的AI学习之旅人工智能的广泛应用正在软件工程领域引发范式转变。Python凭借其易用性、成熟的生态系统以及满足人工智能和机器学习(ML)工作流数据驱动需求的能力，迅速成为人工智能开
新质生产力与核心竞争力提升 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
新质生产力、人工智能、机器学习、深度学习、算法优化、数据驱动、核心竞争力、数字化转型1.背景介绍在当今数字化时代，科技创新正以惊人的速度推动着社会发展。人工智能（AI）作为科技发展的重要驱动力，正在深刻地改变着生产方式和生活方式。从自动驾驶汽车到智能语音助手，从个性化推荐系统到医疗诊断辅助，AI技术的应用场景日益广泛，为人类社会带来了前所未有的机遇。然而，AI技术的应用并非一帆风顺。如何有效地利用
智能工单分配在技术支持中的应用 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
智能工单分配,技术支持,机器学习,算法优化,效率提升,客户满意度1.背景介绍在当今数字化时代，技术支持部门扮演着至关重要的角色，为用户提供及时有效的技术帮助，确保业务的正常运行。然而，随着用户数量和技术需求的不断增长，传统的人工工单分配方式面临着诸多挑战：分配效率低下:人工分配工单需要耗费大量时间和人力，且难以做到精准匹配，导致工单处理效率低下。资源分配不均衡:经验丰富的技术人员可能承担过多的工作
计算广告（一）爱学习的菜鸟罢了搜广推人工智能
计算广告学是一个十分庞大的学科，里面涵盖了自然语言处理、机器学习、推荐系统等众多研究方向。而且广告作为互联网行业的三大盈利模式（广告、电商、游戏）之一，也是这三大模式中最有技术含量的，计算广告学一直都吸引着无数学术界/工业界的精英投入其中（ps：计算广告学也是机器学习在商业界最成功的应用之一）。行业分类例子盈利搜索引擎Google百度广告社交网络腾讯facebook广告增值服务游戏电商网站亚马逊阿
如何从Oracle Autonomous Database加载文档 fGVBSAbe 数据库 oracle python
OracleAutonomousDatabase是一种云数据库，利用机器学习来自动化数据库调优、安全性、备份、更新以及其他传统由数据库管理员(DBAs)执行的例行管理任务。在本文中，我们将演示如何从OracleAutonomousDatabase加载文档。我们将使用连接字符串或TNS配置来进行连接。技术背景介绍OracleAutonomousDatabase通过自动化的方式极大地简化了数据库管理的
基于数据可视化+SpringBoot+Vue的医院综合管理平台设计和实现(源码+论文+部署讲解等) java李杨勇 Java精品毕设实战案例 Java毕业设计实战案例信息可视化 spring boot vue.js 医院综合管理平台 Java毕业设计
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
自动检测和机器审核系统实现 ╰つ゛木槿 java easyui javascript python java 自然语言处理
目录一、自动检测和机器审核实现步骤1.文本预处理步骤细节：2.关键词检测步骤细节：3.情感分析与情境理解步骤细节：4.机器学习模型训练步骤细节：5.深度学习模型步骤细节：6.多模态审查步骤细节：7.用户行为分析与违规预测步骤细节：总结二、常用的分词工具1.jieba2.THULAC3.HanLP4.SnowNLP5.LAC（LexicalAnalysisofChinese）6.PyLDAvis（结
【CV】25.1.7 arxiv更新速递 hinmer arxiv CV每日更新 python 人工智能计算机视觉 chatgpt 目标检测 ai AIGC
—第1篇----关键词:手势识别,计算机视觉,低光照条件,机器学习,RaspberryPi,OpenCV论文链接-摘要:手势识别是一种基于计算机视觉技术的感知用户界面，允许计算机将人类动作解释为命令，使用户无需使用手与计算机交流，从而使鼠标和键盘变得多余。手势识别的主要弱点是光线条件，因为手势控制依赖于摄像头。摄像头用于在2D和3D中解释手势，因此提取的信息可能因光源而异。系统的限制是无法在黑暗环
【包邮送书】你好！Python Mindtechnist 粉丝福利 python 网络开发语言机器学习
欢迎关注博主Mindtechnist或加入【智能科技社区】一起学习和分享Linux、C、C++、Python、Matlab，机器人运动控制、多机器人协作，智能优化算法，滤波估计、多传感器信息融合，机器学习，人工智能等相关领域的知识和技术。关注公粽号《机器和智能》回复关键词“python项目实战”即可获取美哆商城视频资源！博主介绍：CSDN博客专家，CSDN优质创作者，CSDN实力新星，CSDN内容
基于遗传算法的城市旅行问题（TSP）求解 NovakG_ 深度学习 python 算法深度学习神经网络
1.遗传算法背景介绍遗传算法是一种基于生物进化论中的自然选择和遗传机制的优化算法，模拟了生物进化过程以搜索最优解。通过仿真染色体的交叉、变异等操作，遗传算法将求解过程转换为类似生物进化的迭代运算。该算法在解决复杂的组合优化问题时，通常比常规优化算法更高效，且具有广泛应用，包括组合优化、机器学习、信号处理、自适应控制和人工生命等领域2.遗传算法基本解题思路遗传算法的设计思路主要受到大自然中生物体进化
【2025 ODA teigha .NET系列开发教程第五章】给CAD实体添加附属数据XDATA，包括源码三好学生～张旺 ODA Teigha .NET开发教程 .net
系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档2025ODAteigha.NET系列开发教程系列文章目录AutoCADXData扩展数据开发指南什么是XData？XData的两种存储方式1.全局字典存储(XRecord)2.实体附加存储步骤1：注册应
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
让旅游更智能：基于AR的旅游导览应用解析 Echo_Wish Python 笔记 Python算法旅游 ar restful
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶人工智能机器学习深度学习
摘要随着系统规模的扩大和复杂性增加，传统基于规则的日志分析方法难以识别隐藏的复杂异常模式。本文将介绍基于机器学习的日志异常检测技术，包括模型选择、特征工程及实现步骤。通过具体的代码示例与图表，展示如何高效检测异常日志，并提供应用场景与优化策略。引言日志是系统运行状态的关键数据来源，但面对海量日志数据，传统规则式分析显得力不从心。机器学习能够根据日志的历史数据和行为模式，通过训练模型检测异常情况，不
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
下载马斯克Grok-1模型的实战代码 herosunly 大模型 grok-1 下载模型实战代码
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了下载马斯克Grok-1模型的实战代码，希望能对学习大模型的同学们有所帮助
吴恩达深度学习笔记（七）——机器学习策略子非鱼icon 深度学习自学笔记深度学习机器学习人工智能神经网络吴恩达
一、正交化通俗的理解就是：要能够诊断出系统性能瓶颈在哪里，以有策略刚好解决这个问题。一个“按钮”只负责解决一件事情。二、单一数字评估指标准确率（precision）：在分类器中标记为猫的例子中，有多少是真的猫召回率（recall）：对于所有的真猫图片，你的分类器正确识别了多少。但如果有两个评估指标，就很难去选择一个更好的分类器，如下图所示。所以有一个结合这两个指标的标准方法，也即F1分数，定义如下
数据挖掘：定义、挑战与应用黑色叉腰丶大魔王数据挖掘人工智能
一、数据挖掘的定义（一）概念阐述数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它融合了数据库技术、统计学、机器学习、人工智能等多学科的理论和方法，旨在通过对数据的深入分析和处理，发现有价值的模式、关联、趋势等，从而为决策提供支持。（二）与相关概念的区别与联系数据库管理：数据库管理侧重于数据的存储、组织、检索和维护
使用Google Vertex AI Search进行企业级高级搜索 hgSdaegva 人工智能 python
技术背景介绍GoogleVertexAISearch（前称为EnterpriseSearchonGenerativeAIAppBuilder）是GoogleCloud提供的VertexAI机器学习平台的一部分。VertexAISearch允许组织快速建立由生成式AI驱动的搜索引擎，为客户和员工提供服务。它基于各种GoogleSearch技术，包括语义搜索，通过使用自然语言处理和机器学习技术来推断内
在EverlyAI上运行LLM模型——以LLAMA为例 HGWAcsdgvs llama python
在EverlyAI上运行LLM模型——以LLAMA为例技术背景介绍EverlyAI是一个强大的云平台，允许你在云中大规模运行机器学习模型。它还提供了对多种大型语言模型（LLM）的API访问。在这篇文章中，我们将展示如何使用EverlyAI的API来调用LLAMA模型。通过这种方式，你可以在云端轻松地运行和测试你的语言模型。核心原理解析LLAMA模型是一个强大的变压器模型，它具有数十亿个参数，能够处
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

机器学习算法入门(一)

第一章 机器学习基础

1.1关于数据

1.2 机器学习的主要任务

1.2.1 分类任务

1.2.2 回归任务

1.3 什么是机器学习

1.4 监督学习,非监督学习,半监督学习和增强学习

1.4.1 监督学习

1.4.2 非监督学习

1.4.3 半监督学习

1.4.4 增强学习

1.5 批量学习,在线学习,参数学习,非参数学习

1.5.1 批量学习(Batch Learning)

1.5.2 在线学习(Online Learing)

1.5.3 参数学习(parametric Learning)

1.5.4 非参数学习(Nonparametric Learning)

1.6 和机器学习相关的哲学思考

1.6.1 数据的重要性

1.6.2 算法的选择

1.6.3 其它思考

第二章 k近邻算法 kNN

第三章 线性回归法

3.1 简单线性回归

3.2 衡量线性回归方法的指标

3.2.1 MSE

3.2.2 RMSE

3.2.3 MAE

3.2.4 R Squared

3.3 多元线性回归

第四章 梯度下降法(Gradient Descent)

4.1 线性回归中的梯度下降法

第五章 多项式回归

5.1 自己实现多项回归

5.2 过拟合和欠拟合

5.3 模型的正则化

第六章 逻辑回归

6.1 逻辑回归的损失函数

6.2 逻辑回归的决策边界

6.3 逻辑回归的正则化

你可能感兴趣的:(机器学习)

第一章机器学习基础

第三章线性回归法

第四章梯度下降法(Gradient Descent)

第五章多项式回归

第六章逻辑回归