Icevivina

《机器学习实战》整理--分类算法（1）

12月中旬到1月下旬，花了一个半月的时间，终于将《机器学习实战》这本书配合《cs229》课程学完了。现将这本书的主要内容线整理如下。

每看一本书，我会很仔细看书的第一章，相当于论文的introduction部分，会介绍这本书主要讲了些什么，以及书的组成逻辑是什么。从这本的第一章《机器学习基础》中可以了解到，机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的专业知识。机器学习就是把无用的数据转换成有用的信息。随着近代移动计算和传感器越来越多，从海量数据中抽取有用信息变得越来越困难，在工程领域中，如何获取有用特征其实就是“特征工程”所要解决的主要问题。机器学习分为监督学习和无监督学习，监督学习的任务主要包括分类和回归；无监督学习中，将数据集合分成由类似的对象组成的多个类的过程称为聚类，将寻找描述数据统计值的过程称为密度估计，此外，无监督学习还可以减少数据特征的维度（PCA,LDA）。

如何选择一个适合的算法呢？需要从两点入手，第一：使用机器学习算法的目的来判断，根据是否需要预测目标变量的值来判断是监督学习算法还是无监督学习算法，根据目标变量类型判断是分类任务还是回归任务；第二，从数据入手，特征值是离散变量还是连续变量，特征值中是否存在缺失值，异常值等。我们只能在一定程度上缩小算法的选择范围，一般并不存在最好的算法或者可以给出最好结果的算法，同时还要尝试不同算法的执行结果。一般来说发现最好算法的关键环节是反复试错的迭代过程。

开发机器学习应用程序的步骤：1.收集数据：可以通过爬虫，但一般在实际工程中会有公开数据；2.准备输入数据：使用python代码读取；3.分析输入数据：特征工程（可以说是最重要的一步）！人工分析得到的数据，确保数据集中没有垃圾数据；4.训练算法：只对监督学习算法适用；5.测试算法：使用上一步得到的知识信息评估算法，当结果不满意时需要回到上一步或者第三步；6.使用算法。

为什么使用python语言：1.python语法清晰，可执行伪代码；2.易于操作纯文本文件；3.使用广泛，存在大量的开发文档。python语言唯一的不足是性能问题，python程序运行的速率不如Java或者C代码高。python中的numpy函数库可以实现线性代数处理，numpy函数库中存在两种不同的数据类型：矩阵matrix和数组array,两者虽然看起来相似，但在这两个数据类型上执行相同的数学运算可能得到不同的结果。

进入书中的算法部分，前六章分别介绍了6个分类算法：K-近邻算法（KNN），决策树，朴素贝叶斯算法（NB），logistics回归，支持向量机(SVM)和adaboost，接着介绍了两种回归算法：线性回归和树回归，三个无监督学习算法：K-均值，Apiori算法，FP-growth算法。(红色标注的8个算法加上最大期望算法，PageRank算法就是数据挖掘十大重要算法。)最后一章介绍了机器学习中的其他工具：PCA,SVD,大数据与MapReduce。下面将简单整理各个算法的适用实例来说明它们的不同运用场景。

K-近邻算法
优点：精度高、对异常值不敏感、无数据输入假定
缺点：计算复杂度高、空间复杂度高
适用数据范围：数值型和标称型
原理是按照与当前点距离的远近排序，选择与当前点距离最小的k个点，确定这k点所在类别的出现频率，返回出现频率最高的类别作为当前点的预测分类。对每一个测试值都需要与其他的样本值做距离运算，因此没有训练过程，计算复杂度高。
这里给出的例子是“电影的分类”，特征是打斗镜头的个数和接吻镜头的个数，label是电影类型：爱情片和动作片。当使用k近邻算法时，输入是特征值，输出是k个与目标类型最接近的类,从这k个类中得到目标类型。
同样给出的例子有“改进约会网站的配对效果”，目标类是：不喜欢的人，魅力一般的人，极具魅力的人。样本特征有：每年获得的飞行常客里程数，玩视频游戏所耗时间百分比，每周消费的冰淇淋公升数。“手写识别系统”，目标类是0~9的数字，样本特征：由32*32的二进制图像矩阵转换成的1*1024的向量。

决策树
优点：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理不相关特征数据
缺点：可能会出现过度匹配问题
适用数据类型：数值型和标称型，但需要将数值型数据离散化
原理：每次选择获得信息增益最高的特征来划分数据集，对划分数据集后的每一个分支上递归地创建树分支，当每个分支上类别完全相同或遍历完所有特征时（这是采用多数表决）停止。每次选择出一个最佳特征之后就可以删除该特征，当构建好整棵树之后，测试数据的过程就是对树结构的一个匹配过程，结果的好坏根据经验树计算错误率得出。
给出的例子是“判断海洋生物数据是否是鱼类”，样本特征是：不浮出水面是否可以生存，是否有脚蹼。输出类是：yes,no。
另外给出的一个实例是“预测隐形眼睛类型”，样本特征有：tearRate，astimatic,prescript,age，输出类是：硬材质，软材质和不适合佩戴隐形眼镜。

朴素贝叶斯
优点：在数据较少的情况下依然有效，可以处理多类别问题
缺点：对于输入数据的准备方式比较敏感
适用数据类型：标称型数据
原理：贝叶斯决策理论：数据点（x,y）属于类别1的概率p1(x,y)>属于类别2的概率p2(x,y)，那么类别为1，反之成立。贝叶斯分类准则为：如果p(c1|x,y)>p(c2|x,y),那么属于类别1，反之成立。其中p(c1|x,y)=p(x,y|c1)p(c1)/p(x,y)。朴素贝叶斯分类器通常有两种实现方式：一种基于伯努利模型实现，一种基于多项式模型实现，前一种方式不考虑词在文档中出现的次数，只考虑出不出现，而多项式模型考虑词在文档中的出现次数。“朴素”：特征之间的条件独立性假设，每个特征同等重要。
给出的例子是“使用朴素贝叶斯进行文档分类”，将每个词的出现或者不出现作为一个特征，这样得到的特征数目就会跟词汇表中的数目一样多，输出类是：属于垃圾邮件的概率，非垃圾邮件的概率，对比得出最终类。首先将文本解析为词向量，将所有文本组成字典集，根据字典中的每个词是否出现将样本转换为一个词向量，这里有两种转换模型--词集模型和词袋模型，词集模型只看每个词是否出现，而词袋模型中每个单词可以出现多次；计算字典中每一个词在不同类别中出现的概率。测试时，先将测试数据转换为对应的词向量，然后根据公式算出该词向量属于各类别的概率p(ci|w)=p(w|ci)p(ci)/p(w),这里对概率取自然对数避免下溢出（概率值太小）。训练过程与测试过程相独立。

Logistic回归
优点：计算代价不高，易于理解和实现
缺点：容易欠拟合，分类精度可能不高。
适用数据类型：数值型和标称型数据。
主要思想是：根据现有数据对分类边界线建立回归公式，以此进行分类。训练分类器时的做法就是寻找最佳拟合参数，使用的是最优化算法。最优化算法包括：基本的梯度上升法和改进的随机梯度上升法。梯度上升算法用来求函数的最大值，而梯度下降法用来求函数的最小值。分类结果预测使用到Sigmoid函数，近似为阶跃函数。
使用的实例是"数据集的0,1分类"，这里的最优化算法给出了三种：基本的梯度上升法，随机梯度上升法和改进的随机梯度上升法。改进体现在：1.alpha值每次迭代时都会调整；2.通过随机选取样本更新回归系数，减少周期性的波动。这三种优化算法中梯度上升法运算量最大，改进的随机梯度上升法其次，随机梯度上升最小但效果不佳。当从训练数据集中训练得到各回归系数后，测试数据时直接代入该函数就可以得到属于“1”类的概率，得到其最终结果。
另外一个实例是“从疝气病症预测病马的死亡率”，处理特征值缺失时，用实数0来替换所有缺失值，因为1.该特征的系数将不做更新；2.sigmoid(0)=0.5，说明它对结果的预测不具有任何倾向性。处理类别标签缺失时，选择将该条数据丢弃。当然，对不同的算法，处理缺失值的方法也不同，比如对KNN算法可能不会丢弃该值。注意：每次运行改进的随机梯度算法会产生不同的误差率，因此一般要重复运行该算法多次取均值得到最终结果。

支持向量机SVM
优点：泛化错误率低，计算开销不大，结果易解释
缺点：对参数调节和核函数的选择敏感，原始分类器不加修改仅适用于处理二类问题
适用数据类型：数值型和标称型数据。
原理：寻找最大间隔（这里的间隔一个是函数间隔，一个是几何间隔，几何间隔经过了归一化，更能说明问题）--超平面。找到具有最小间隔的数据点，然后对该间隔最大化，在求解过程中会发现它需要满足的约束。对它直接求解比较困难，于是这里引入拉格朗日乘子求解，化为该问题的对偶算法，这样做的优点，一是对偶问题往往更容易求解，二是自然引入核函数，进而推广到非线性分类问题。数据线性可分时（对应硬间隔）和线性不可分（对应软间隔）时，对偶问题的目标函数不改变，改变的仅仅是约束条件。SVM的求解实际就是求解拉格朗日乘子，然后通过他们求解出分离超平面系数。在决定分离超平面的时候只有支持向量在起作用，支持向量所在的超平面称为间隔边界，两者之间的距离称为间隔。SVM的一个快速实现算法是序列最小最优化算法（SMO）。
在SVM中使用的类别标签是1，-1，而不是0,1，这是因为使用1，-1仅仅相差一个符号，方便数学上的处理。
示例：手写识别系统，之前用KNN实现过，但它需要的存储数据量太大，使用SVM时只需要存储支持向量

Adaboost元算法
首先解释一下何为元算法：我们可以将不同的分类器组合起来，而这种组合结果则被称为集成方法或者元算法。使用集成方法时会有多种形式：可以是不同算法的集成，也可以是同一算法在不同设置下的集成，还可以是数据集不同部分分配给不同分类器之后的集成。
优点：泛化错误率低，易编码，可以应用在大部分分类器上，无参数调整。
缺点：对离群点敏感。
适用数据类型：数值型和标称型。
bagging：基于数据随机重抽样的分类器构建方法，是一种并行集成方式。
boosting：不同的分类器是通过串行训练而获得的，每个新分类器都根据已训练出的分类器的性能来进行训练。boosting是通过集中关注被已有分类器错分的那些数据来获得新的分类器。boosting分类的结果是基于所有分类器的加权求和结果的。
adaboost的运行过程如下：训练数据中的每个样本，并赋予一个权重，这些权重构成了向量D。一开始，这些权重都初始化为相等值。首先在训练数据上训练出一个弱分类器并计算该分类器的错误率，然后在同一数据集上再次训练弱分类器，在这次训练中将会调整每个样本的权重，其中第一次分对的样本的权重将会被降低，而分错的样本的权重被提高（通过初始权值，错误率公式）。为了从所有弱分类器中得到最终的分类结果，adaboost为每个分类器都分配了一个权重值alpha,这些alpha值是基于每个分类器的错误率进行计算的。
示例将单层决策树作为弱分类器，每次选择一个特征中的一个数值作为分类标准，循环训练多次得到多个弱分类器组合。另一个示例是logistics回归中的“从疝气病症预测病马的死亡率”，类标签同样为1，-1，因为在集成的时候要通过加权运算结果是否大于0来判断。在这个示例中可以看到：adaboost中的弱分类并不是越多越好。许多人认为adaboost和SVM是监督机器学习中最强大的两种方法。

总结：以上6种方法中，只有KNN方法没有训练算法这一步，对每一个测试样本都需要遍历所有的训练样本，其他5种算法的大部分时间都用在训练算法上，一旦从训练样本中得到标准模型之后，测试样本会变得十分容易。
只有adaboost和SVM的类别标签使用1，-1，前者是为了数学表示距离的方便，后者是因为集成过程判决的方便。

Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
Python学习指南——1.常用库说明 r135792uuuu python-机器学习 python
说在前面在开发之前，要去python库官网上查看是否有帮助的库。结合百度和pypi.org网站直接寻找需要的库。库安装方法：1pip安装2.文件安装：UCI页面需要https://www.lfd.uci.edu/~gohlke/pythonlibs或者conda提供的那些网站也行。文件安装：下载UCI、whl文件之后，又要使用pipinstall文件来安装放到lib文件夹vscode特殊：通常把要
Python学习笔记-Day05 snape00
Python学习笔记Day_05-构造程序逻辑作者的话学完前面的几个章节后，我觉得有必要在这里带大家做一些练习来巩固之前所学的知识，虽然迄今为止我们学习的内容只是Python的冰山一角，但是这些内容已经足够我们来构建程序中的逻辑。对于编程语言的初学者来说，在学习了Python的核心语言元素（变量、类型、运算符、表达式、分支结构、循环结构等）之后，必须做的一件事情就是尝试用所学知识去解决现实中的问题
小猿圈python学习-内置函数小猿圈IT教育
Python的len为什么你可以直接用？肯定是解释器启动时就定义好了内置参数详解https://docs.python.org/3/library/functions.html?highlight=built#ascii每个函数的作用我都帮你标好了abs#求绝对值all#ReturnTrueifbool(x)isTrueforallvaluesxintheiterable.Iftheiterabl
python学习笔记第5节-类和函数梁鋐俐
我们在前面的学习中学会了一个叫type（）的函数，用它来判断变量的类型，变量和它当下存储的数据绑定在一起。例如a=[4,5,6,7]print(type(a)）输出a=range（10，20，2）print（type（a））输出a=Trueprint（type（a））输出a={‘a54’：56}print（type（a））输出a={‘a54’，56}print（type（a））输出a=‘tyuio
Python学习笔记--列表、字典、集合、元组小黄酥 Python python 学习笔记
Python学习笔记43-列表#列表主要是用来存储多个数据.列表是有序的集合list_1=[]#创建一个空的列表list_2=[12,34,56,True,'abc']#创建一个列表#列表的访问，通过下标访问列表中的元素，下标默认从0开始，0表示第一个元素，-1表示最后一个元素list_3=[1,2,3,False,True,'abc']print(list_3[0])#1print(list_3
机器学习与深度学习的区别 eqa11 机器学习
文章目录机器学习与深度学习的区别一、引言二、机器学习概述1、机器学习定义1.1、机器学习的应用2、机器学习算法三、深度学习概述1、深度学习定义1.1、深度学习的应用2、深度学习算法四、机器学习与深度学习的区别1、学习方法2、数据需求3、应用领域五、总结机器学习与深度学习的区别一、引言在人工智能的浪潮中，机器学习和深度学习无疑是最耀眼的两颗明星。它们在许多领域都取得了令人瞩目的成就，从自动驾驶汽车到
「python学习——小白篇」python函数中不定长参数的写法小天真_5eeb
那么作为新手该如何上手这门语言？一切不敲代码的学编程手段都是扯淡先来给大家来一个福利吧！python语法入门视频免费共享出来加q-u-n--227+435+450获取
MATLAB车牌识别系统清风明月来几时图像算法处理 matlab 开发语言
MATLAB车牌识别系统是一个基于MATLAB开发的用于识别和提取车牌信息的系统。该系统使用图像处理和机器学习算法来实现车牌的定位和字符识别。以下是一个基本的MATLAB车牌识别系统的工作流程：图像预处理：首先，将输入的图像进行预处理，包括灰度化、高斯平滑、边缘检测等操作，以提高后续的车牌定位和字符识别的准确性。车牌定位：在预处理后的图像中，使用形态学运算和边缘检测算法来寻找车牌的位置。这可以通过
python学习——conda install Python库时报PackagesNotFoundError:的错误的解决方案，很实用 _Oak_Tree_ python基础 python
安装完成Anaconda之后，我们可以在AnacondaPrompt交互式窗口中通过“condainstall库名称”实现Python库的安装，但是有时候在运用该命令进行安装时会提示PackagesNotFoundError:Thefollowingpackagesarenotavailablefromcurrentchannels:的错误，现在以Pydap库的安装为例，提供在Windows系统下
十大机器学习算法-梯度提升决策树（GBDT） zjwreal 机器学习 GBDT 机器学习梯度提升提升树梯度提升决策树
简介梯度提升决策树（GBDT）由于准确率高、训练快速等优点，被广泛应用到分类、回归合排序问题中。该算法是一种additive树模型，每棵树学习之前additive树模型的残差。许多研究者相继提出XGBoost、LightGBM等，又进一步提升了GBDT的性能。基本思想提升树-BoostingTree以决策树为基函数的提升方法称为提升树，其决策树可以是分类树或者回归树。决策树模型可以表示为决策树的加
通俗理解线性回归(Linear Regression) 小夏refresh 机器学习数据挖掘机器学习算法人工智能数据挖掘
线性回归,最简单的机器学习算法,当你看完这篇文章,你就会发现,线性回归是多么的简单.首先,什么是线性回归.简单的说,就是在坐标系中有很多点,线性回归的目的就是找到一条线使得这些点都在这条直线上或者直线的周围,这就是线性回归(LinearRegression).是不是有画面感了?那么我们上图片:![1.png][1]那么接下来,就让我们来看看具体的线性回归吧首先,我们以二维数据为例:我们有一组数据x
Python学习：执行系统shell命令 chaos-god python python shell
1.问题python可以作为shell替代，代码比较直观，易于维护。python支持调用外部shell命令。不过，这个问题没有看上去简单，要完美的解决此问题，比较复杂，就连标准库也不见得处理得很好。2.方案2.1.方案一首先最简单的方法就是调用system方法，直接执行系统shell命令，代码如下：importosos.system('ls-l')system主要问题，就是无法获取shell命令的
25道Python练手题（附详细答案），赶紧收藏！Python入门|Python学习豆本-豆豆奶 python 学习数据挖掘开发语言爬虫人工智能
题目1：水仙花数水仙花数（Narcissisticnumber）也被称为超完全数字不变数（pluperfectdigitalinvariant,PPDI）、自恋数、自幂数、阿姆斯壮数或阿姆斯特朗数（Armstrongnumber）水仙花数是指一个3位数，它的每个位上的数字的3次幂之和等于它本身。例如：1^3+5^3+3^3=153。foriinrange(100,1000):i1=i//100#取
python学习笔记08_赋值运算、逻辑运算、表达式、短路原则 flamingocc
python笔记081.赋值运算符num+=1等价于num=num+1num-=1等价于num=num-1num*=1等价于num=num*1num/=1等价于num=num/1num//2等价于num=num//2num%=2等价于num/2的余数num**2等价于num=num*num2.逻辑运算符逻辑运算符包含：not、and、or2.1and的用法：(且、并且)写法：条件1and条件2eg
Python学习笔记（三）：列表的定义、访问及修改 RANDY_Sw Python入门 python
今天学习了有关列表的定义、访问及修改的方法，在此整理一下。列表的定义与访问name_list=['zhangsan','lisi','wangwu']#创建一个列表name_list[0]='xiaobai'#修改列表中的单个元素print(name_list)#遍历的方式打印列表1foriteminname_list:print(item)#遍历的方式打印列表2i=0foriinrange(le
Python学习2：一定要注意用pycharm创建Python package和Pythonfile而不是普通路径和文件土小帽软件测试 Python学习
2019年5月7日23:30:02今天久违地再续上断了好久差点又半途而废的Python基础，结果跟着写继承，明明引入了父类，可还是运行报错，下面父类是Person，子类是Student，模块文件名小写。person文件：classPerson(object):def__init__(self,name,age):self.name=nameself.age=agedefrun(self):prin
Linux中检查网络问题的常用命令程序员喵哥 Linux 网络 linux php 服务器运维
更多Python学习内容：ipengtao.com在Linux系统中，网络问题是常见的挑战之一。无论是服务器管理员还是普通用户，都可能遇到各种网络故障，如连接问题、DNS解析问题、网络延迟等。为了快速诊断和解决这些问题，掌握一些常用的网络故障排查命令是至关重要的。本文将介绍一些在Linux系统中常用的网络故障排查命令，并提供详细的示例代码，方便更好地理解和应用这些命令。ping命令ping命令是最
python安全渗透笔记红云谈安全 python编程学习 python 安全
Python学习python常见错误UnicodeDecodeError:‘gbk’codeccan’tdecodebyte0x8cinposition22:illegalmultibytesequence//打开的文件未编码encoding='UTF-8'expectedanindentedblock未缩进，ifforcontinue又进入一次新的循环%将其他变量置入字符串特定位置以生成新字符串
Pyhton抓取BOSS直聘职位描述和数据清洗，很简单没有那么难嗨学编程
一、抓取详细的职位描述信息详情页分析Python学习资料或者需要代码、视频加Python学习群：960410445在详情页中，比较重要的就是职位描述和工作地址这两个由于在页面代码中岗位职责和任职要求是在一个div中的，所以在抓的时候就不太好分，后续需要把这个连体婴儿，分开分析。爬虫用到的库使用的库有：requestsBeautifulSoup4pymongoPython代码代码easy，初学者都能
Python基础（十二）：字典的详细讲解 m0_60707685 程序员 python 学习面试
感谢每一个认真阅读我文章的人，看着粉丝一路的上涨和关注，礼尚往来总是要有的：①2000多本Python电子书（主流和经典的书籍应该都有了）②Python标准库资料（最全中文版）③项目源码（四五十个有趣且经典的练手项目及源码）④Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤Python学习路线图（告别不入流的学习）网上学习资料一大堆，但如果学到的知识不成体系，遇到问题
Python基础（十五）：推导式的讲解_python基础(十五) 推导式的讲解 m0_60707685 程序员 python 学习面试
（1）Python所有方向的学习路线（新版）这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。（2）Python学习视频包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门
c++ +Opencv实现车牌自动识别听忆. 人工智能计算机视觉
c+++Opencv实现车牌自动识别1.图像预处理2.车牌定位3.字符分割4.字符识别完整流程概述：边走、边悟迟早会好要用C++和OpenCV实现车牌自动识别，主要流程分为几个步骤：图像预处理：提高车牌区域的可见度，方便后续的车牌定位与字符识别。车牌定位：通过图像处理和特征提取，定位车牌在图像中的位置。字符分割：将车牌区域中的字符逐个分割出来。字符识别：利用机器学习算法或者OCR（光学字符识别）技
socket网络编程python_python学习-socket网络编程张文岳
作业：多用户在线的FTP程序要求：用户加密认证允许同时多用户登录每个用户有自己的家目录，且只能访问自己的家目录对用户进行磁盘配额，每个用户的可用空间不同允许用户在ftpserver上随意切换目录允许用户查看当前目录下文件允许上传和下载文件，保证文件一致性文件传输过程中显示进度条附加功能：支持文件的断点续传(仅下载)README###功能实现作业：开发一个支持多用户在线的FTP程序要求：用户加密认证
python学习第六节：使用python制作九九乘法表和学生管理系统一只会敲代码的小灰灰经验总结 python 学习开发语言 pycharm
python学习第六节：使用python制作九九乘法表和学生管理系统通过前面五节的了解，已经大概知道python的语法以及基础函数，下面是简单的两个小程序。不会做没关系，看得懂就可以了，如果能够自己加工举一反三那就更好了。ps:前面五节只是简单讲解了python的基础语法和函数，也就是混个脸熟，没有进行深入讲解，如果展开来讲的话每一个单独的语法和函数都能将几大章，而很多语法和函数的用法我们根本用不
NPU技术总结技术学习分享 webgl processon
NPUs简介定义:NPUs是一种专门为执行机器学习算法和神经网络操作而设计的处理器。起源:随着人工智能和深度学习的发展，NPUs应运而生，以满足对高效率和高能效的计算需求。NPUs的设计架构:NPUs通常采用不同于传统CPU或GPU的架构，优化了矩阵运算和并行处理。指令集:它们拥有专门的指令集，用于加速神经网络中的常见操作，如卷积和激活函数。NPUs的核心技术并行性:NPUs利用数据并行性和任务并
python函数全局变量和局部变量_Python学习（六）—— 函数、全局变量与局部变量... weixin_39654917
函数函数的定义1deftest(x):2"Thefunctiondefinition"3x+=14returnxdef：定义函数的关键字test：函数名()：内可定义形参“”：文档描述，非必要，但添加后可使得函数更易理解x+=1：泛指代码块或程序处理逻辑，最好不要过多，让函数的功能简洁明了return：定义返回值调用运行：可以带参数也可以不带函数名()1deftest(x):2"Thefuncti
机器学习面试题目分享面试经验分享机器学习算法工程师深度学习经典问题好家伙VCC 面试机器学习面试经验分享 stm32 嵌入式硬件单片机 fpga开发
标题机器学习面经总结的常见面试题目等作业帮实习视觉算法一面凉凉经3.16号投递图像算法实习生，昨天hr打电话约了今早上牛客面试面试官还是很和蔼的，问了很多基础和细节，平时我都没有注意到的，肯定凉了，在这里记录一下，分享给大家由于我本科研究生都是计算机的，因此问了一些计算机基础的东西，但是由于年代久远，我都不记得了机器学习方面知识因为缺少一些动手实践，因此很多细节都不了解感谢面试官让我了解到这么多不
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

《机器学习实战》整理--分类算法（1）

你可能感兴趣的:(python学习,机器学习算法)