从兮

Python学习-机器学习实战-ch07 AdaBoost

终于完成答辩了，抓紧最后学生时光学习

----------------------------------------------------------------------------------

这章里书中首先介绍了几个概念：

一、元算法(meta-algorithm)

元算法也叫集成方法（ensemble method），其思想是使用其他算法进行组合，也是常说的“三个臭皮匠凑成一个诸葛亮”。AdaBoost是其中最流行的元算法。使用集成方法时可以有多种形式：可以是不同算法的集成，也可以是同一算法在不同设置下的集成，还可以是数据集不同部分分配给不同分类器的集成。

集成方法主要有两种：bagging方法和boosting方法。

bagging方法

自举汇聚法（boostrap aggregating），也称bagging方法。

Bagging的策略【来源】：

- 从样本集中用Bootstrap采样选出n个样本

- 在所有属性上，对这n个样本建立分类器（CART or SVM or ...）

- 重复以上两步m次，i.e.build m个分类器（CART or SVM or ...）

- 将数据放在这m个分类器上跑，最后vote看到底分到哪一类

bagging方法是一种从原始数据及选择S次后得到S个新数据集的一种技术。新数据集和原数据集的大小相等。每个数据集都是通过在原始数据集中随机选择一个样本进行替换而得到的。（替换的方法可以是随机选择一个样本，再随机选择一个样本替换。）所以，新数据集中可以存在重复的值，同时，原始数据集的部分值在新数据集中不再出现。

bagging方法在S个数据集建好之后，将某个学习算法分别作用于每个数据集就得到了S个分类器。要对新数据进行分类时，就可以应用这S个分类器进行分类。选择分类器投票最多的类别作为分类结果。

-------【来源】--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Random forest(Breiman1999):

随机森林在bagging基础上做了修改。

- 从样本集中用Bootstrap采样选出n个样本，预建立CART

- 在树的每个节点上，从所有属性中随机选择k个属性，选择出一个最佳分割属性作为节点

- 重复以上两步m次，i.e.build m棵CART

- 这m个CART形成Random Forest

随机森林可以既可以处理属性为离散值的量，比如ID3算法，也可以处理属性为连续值的量，比如C4.5算法。

这里的random就是指

1. Bootstrap中的随机选择子样本

2. Random subspace的算法从属性集中随机选择k个属性，每个树节点分裂时，从这随机的k个属性，选择最优的

结果证明有时候Random Forest比Bagging还要好。今天微软的Kinect里面就采用了Random Forest，相关论文Real-time Human Pose Recognition in Parts from Single Depth Images是CVPR2011的best paper。

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

boosting方法

boosting方法是一种用来提高弱分类器算法准确度的方法。boosting方法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数。他是一种框架算法,主要是通过对样本集的操作获得样本子集,然后用弱分类算法在样本子集上训练生成一系列的基分类器。

与bagging方法相比，后者是不同分类器是通过串行训练而获得，每个分类器都根据已训练出的分类器的性能来进行训练。boosting方法是集中关注被已有分类器误分的数据来获得新的分类器。bagging方法的分类器的权重是相等的，boosting方法的分类器权重并不相等，每个权重代表其对应分类器在上一轮迭代中的成功度。

AdaBoost方法是boosting方法中最流行的一个。

优点：泛化错误率低，易编码，可以用在大部分的分类器上，无参数调整。

缺点：对离群点敏感。

AdaBoost是adaptive boosting的缩写，基本思想是由若干个弱分类器组合而成一个强分类器。“弱”意味着该分类器的性能只比随机猜测要略好，但也不会好太多。，其方法是：给训练数据中的每个样本赋予一个权重，初始时权重都是相等的。首先在训练数据上训练从一个弱分类器并计算分类器的错误率。对样本的权重进行修改，分类正确的样本权重会降低，分类错误的样本权重会提高。对权重修改后的样本再次训练出一个分类器。每个弱分类器自身也有一个权重值，由分类器的错误率决定。在更新样本的权重后进入下一次迭代。最终的强分类器由弱分类器加权求和而成。

def loadSimpleData():
    datMat=matrix([[1.,2.1],[2.,1.1],[1.3,1.],[1.,1.],[2.,1.]])
    classLabel=[1.0,1.0,-1.0,-1.0,1.0]
    return datMat,classLabel

基础数据函数，可视化结果如下：

书中的可视化图有错误。

n=shape(dataMat)[0]
xcord1=[];ycord1=[]
xcord2=[];ycord2=[]
for i in range(n):
    if int(classLabel[i])== 1:
        xcord1.append(dataMat[i,0]);ycord1.append(dataMat[i,1])
    else:
        xcord2.append(dataMat[i,0]);ycord2.append(dataMat[i,1])
fig=plt.figure()
ax=fig.add_subplot(111)
ax.scatter(xcord1,ycord1,s=30,c='red',marker='s')
ax.scatter(xcord2,ycord2,s=30,c='green')
plt.show()

可视化代码如上所示。

接着开始实现adaboost，首先使用单层决策树作为弱分类器。

def stumpClassify(dataMatrix,dimen,threshVal,threshIneq):
    #函数在数据与阈值比较进行分类
    retArray=ones((shape(dataMatrix)[0],1))
    if threshIneq=='lt':
        retArray[dataMatrix[:,dimen]<=threshVal]=-1.0
    else:
        retArray[dataMatrix[:,dimen]>threshVal]=-1.0
    return retArray

这是一个简单的根据阈值进行分类的函数。

def buildStump(dataArr,classLabels,D):
    #找到数据集上最佳单层决策树，D是数据对应的权重向量
    dataMatrix=mat(dataArr)
    labelMat=mat(classLabels).T
    m,n=shape(dataMatrix)
    #获得数据行列数
    numSteps=10.0
    #设置步数
    bestStump={}
    bestClassEst=mat(zeros((m,1)))
    #初始化最佳
    minError=inf
    for i in range(n):
    #遍历每个特征维度
        rangeMin=dataMatrix[:,i].min()
        rangeMax=dataMatrix[:,i].max()
        stepSize=(rangeMax-rangeMin)/numSteps
        #根据该特征的最大最小值设置步长
        for j in range(-1,int(numSteps)+1):
            #循环在步长上进行遍历
            for inequal in ['lt','gt']:
                threshVal=(rangeMin+float(j)*stepSize)
                #根据步长设置阈值
                predictedVals=stumpClassify(dataMatrix,i,threshVal,inequal)
                #按照阈值分类，最简单的分类方法
                errArr=mat(ones((m,1)))
                errArr[predictedVals==labelMat]=0
                #统计错误个数
                weightedError=D.T*errArr
                #错误样本的加权求和
                print("split: dim %d, thresh %.2f, thresh inequal:%s, the weighted error is %.3f" %(i,threshVal,inequal,weightedError))
                if weightedError

 
  
 一个简单版单层决策树函数。 
   
  构建完简单版的决策树节点作为弱分类器之后，开始在此基础上完成AdaBoost训练 
   
  def adaBoostTrainDS(dataArr,classLabels,numIt=40):
    #adaboost函数，numIt表示迭代次数
    weakClassArr=[]
    m=shape(dataArr)[0]
    #获得数据个数
    D=mat(ones((m,1))/m)
    #初始化权重，平均值
    aggClassEst=mat(zeros((m,1)))
    for i in range(numIt):
        bestStump,error,classEst=buildStump(dataArr,classLabels,D)
        #选择弱分类器
        print("D:",D.T)
        alpha=float(0.5*log((1.0-error)/max(error,1e-16)))
        #alpha是每个弱分类器对应的权重
        #此处max(error,1e-16)是防止error为0导致溢出
        bestStump['alpha']=alpha
        weakClassArr.append(bestStump)
        #把当前弱分类器加入到弱分类器数组里
        print("classEst:",classEst.T)
        expon=multiply(-1*alpha*mat(classLabels).T,classEst)
        #根据是否被错分是不一样的，分对权重低、分错权重高。
        D=multiply(D,exp(expon))
        D=D/D.sum()
        #更新权重向量D，D表示样本的权重，根据是否被错分会进行调整
        aggClassEst+=alpha*classEst
        #每个数据点的类别累计值
        print("aggClassEst:",aggClassEst.T)
        aggError=multiply(sign(aggClassEst)!=mat(classLabels).T,ones((m,1)))
        #累加错误
        errorRate=aggError.sum()/m
        print("total error:",errorRate,"\n")
        if errorRate==0.0:break
        #如果错误率为0也停止循环
    return weakClassArr,aggClassEst 
  
 这样就能完成AdaBoost的训练了，接着构造一个分类函数 
   
   
  def adaClassify(datToClass,classifierArr):
    dataMatrix=mat(datToClass)
    m=shape(dataMatrix)[0]
    aggClassEst=mat(zeros((m,1)))
    #对应的结果
    for i in range(len(classifierArr)):
        classEst=stumpClassify(dataMatrix,classifierArr[i]['dim'],\
                               classifierArr[i]['thresh'],classifierArr[i]['ineq'])
        #由分类函数可以得到每个弱分类器的分类结果
        aggClassEst+=classifierArr[i]['alpha']*classEst
        #将每个结果加权求和得到最终的分类结果
        print(aggClassEst)
    return sign(aggClassEst) 
  
 上述函数已经能够实现训练和分类功能了。下面在一个较难数据集上使用： 
   
   
  def loadDataSet(fileName):
    numFeat=len(open(fileName).readline().split('\t'))
    #获得特征的维数
    dataMat=[]
    labelMat=[]
    fr=open(fileName)
    for line in fr.readlines():
        lineArr=[]
        curLine=line.strip().split('\t')
        for i in range(numFeat-1):
            lineArr.append(float(curLine[i]))
        dataMat.append(lineArr)
        labelMat.append(float(curLine[-1]))
    return dataMat,labelMat 
  
 
  def plotROC(predStrengths,classLabels):
    import matplotlib.pyplot as plt
    cur=(1.0,1.0)
    ySum=0.0
    numPosClas=sum(array(classLabels)==1.0)
    #统计真正例个数
    yStep=1/float(numPosClas)
    #1/正例个数为Y轴步长
    xStep=1/float(len(classLabels)-numPosClas)
    #1/反例个数为X轴步长
    sortedIndicies=predStrengths.argsort()
    #argsort返回的是从小到大排列后的索引值
    fig=plt.figure()
    fig.clf()
    ax=plt.subplot(111)
    for index in sortedIndicies.tolist()[0]:
        if classLabels[index]==1.0:
            delX=0
            delY=yStep
        else:
            delX=xStep
            delY=0
            ySum+=cur[1]
        #划线时如果是正例，y轴改变，如果是反例，x轴改变。
        ax.plot([cur[0],cur[0]-delX],[cur[1],cur[1]-delY],c='b')
        #plot([x1,x2],[y1,y2])表示从(x1,y1)画到(x2,y2)
        cur=(cur[0]-delX,cur[1]-delY)
        #从右往左画
    ax.plot([0,1],[0,1],'b--')
    plt.xlabel('False Positive Rate')
    plt.ylabel('True Positive Rate')
    plt.title('ROC curve for AdaBoost Horse Colic Detection System')
    ax.axis([0,1,0,1])
    plt.show()
    print('the Area Under the Curve is :',ySum*xStep) 
  
 上面这个函数实现的是一个绘制ROC曲线的功能，ROC曲线的横轴是假阳率（=FP/(FP+TN)），纵轴是真阳率(=TP/(TP+FN))。至于TP、TN、FP、FN的概念就比较简单了。 
   
         TP和TN比较简单，T表示TRUE就是判断正确的意思。 
  那么FP和FN表容易搞错，F表示FALSE。既然是false，FP直译就是错误的正例。错误的正例是什么？就是一个反例啊。也就是一个反例被误判成了正例。同理，FN表示一个正例被误判成了反例。 
  FP+TN等同于数据集里真实的反例个数。TP+FN表示数据集里真实的正例个数。 
  
 
  
 
  
 
  本章对非均衡分类问题稍微提了一下，总结了处理非均衡问题的数据抽样方法： 
  除了对分类器进行调整，还可以从训练数据上下手。一般通过欠抽样或过抽样来实现。过抽样是通过复制样例，而欠抽样是删除样例。 
  例如，信用卡欺诈案例中，正例类别属于罕见类别，希望能对这种罕见类别尽可能多的保留更多的信息。所以，可以保留所有整理，欠抽样处理反例。但是这样的问题在于，无法确定哪些样例需要剔除。解决这个问题的方法可以是选择那些离决策边界较远的样例进行删除。但是，当正反例样本数量相差巨大时，需要另一种替代策略是使用反例类别的欠抽样和正例类别的过抽样混合的方法。正例样本进行过抽样可以通过复制已有样例或加入已有样例相似样本。一种是加入已有数据的插值点，但这种可能导致过拟合的问题。

python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
Python学习指南——1.常用库说明 r135792uuuu python-机器学习 python
说在前面在开发之前，要去python库官网上查看是否有帮助的库。结合百度和pypi.org网站直接寻找需要的库。库安装方法：1pip安装2.文件安装：UCI页面需要https://www.lfd.uci.edu/~gohlke/pythonlibs或者conda提供的那些网站也行。文件安装：下载UCI、whl文件之后，又要使用pipinstall文件来安装放到lib文件夹vscode特殊：通常把要
Python学习笔记-Day05 snape00
Python学习笔记Day_05-构造程序逻辑作者的话学完前面的几个章节后，我觉得有必要在这里带大家做一些练习来巩固之前所学的知识，虽然迄今为止我们学习的内容只是Python的冰山一角，但是这些内容已经足够我们来构建程序中的逻辑。对于编程语言的初学者来说，在学习了Python的核心语言元素（变量、类型、运算符、表达式、分支结构、循环结构等）之后，必须做的一件事情就是尝试用所学知识去解决现实中的问题
小猿圈python学习-内置函数小猿圈IT教育
Python的len为什么你可以直接用？肯定是解释器启动时就定义好了内置参数详解https://docs.python.org/3/library/functions.html?highlight=built#ascii每个函数的作用我都帮你标好了abs#求绝对值all#ReturnTrueifbool(x)isTrueforallvaluesxintheiterable.Iftheiterabl
python学习笔记第5节-类和函数梁鋐俐
我们在前面的学习中学会了一个叫type（）的函数，用它来判断变量的类型，变量和它当下存储的数据绑定在一起。例如a=[4,5,6,7]print(type(a)）输出a=range（10，20，2）print（type（a））输出a=Trueprint（type（a））输出a={‘a54’：56}print（type（a））输出a={‘a54’，56}print（type（a））输出a=‘tyuio
Python学习笔记--列表、字典、集合、元组小黄酥 Python python 学习笔记
Python学习笔记43-列表#列表主要是用来存储多个数据.列表是有序的集合list_1=[]#创建一个空的列表list_2=[12,34,56,True,'abc']#创建一个列表#列表的访问，通过下标访问列表中的元素，下标默认从0开始，0表示第一个元素，-1表示最后一个元素list_3=[1,2,3,False,True,'abc']print(list_3[0])#1print(list_3
「python学习——小白篇」python函数中不定长参数的写法小天真_5eeb
那么作为新手该如何上手这门语言？一切不敲代码的学编程手段都是扯淡先来给大家来一个福利吧！python语法入门视频免费共享出来加q-u-n--227+435+450获取
python学习——conda install Python库时报PackagesNotFoundError:的错误的解决方案，很实用 _Oak_Tree_ python基础 python
安装完成Anaconda之后，我们可以在AnacondaPrompt交互式窗口中通过“condainstall库名称”实现Python库的安装，但是有时候在运用该命令进行安装时会提示PackagesNotFoundError:Thefollowingpackagesarenotavailablefromcurrentchannels:的错误，现在以Pydap库的安装为例，提供在Windows系统下
Python学习：执行系统shell命令 chaos-god python python shell
1.问题python可以作为shell替代，代码比较直观，易于维护。python支持调用外部shell命令。不过，这个问题没有看上去简单，要完美的解决此问题，比较复杂，就连标准库也不见得处理得很好。2.方案2.1.方案一首先最简单的方法就是调用system方法，直接执行系统shell命令，代码如下：importosos.system('ls-l')system主要问题，就是无法获取shell命令的
25道Python练手题（附详细答案），赶紧收藏！Python入门|Python学习豆本-豆豆奶 python 学习数据挖掘开发语言爬虫人工智能
题目1：水仙花数水仙花数（Narcissisticnumber）也被称为超完全数字不变数（pluperfectdigitalinvariant,PPDI）、自恋数、自幂数、阿姆斯壮数或阿姆斯特朗数（Armstrongnumber）水仙花数是指一个3位数，它的每个位上的数字的3次幂之和等于它本身。例如：1^3+5^3+3^3=153。foriinrange(100,1000):i1=i//100#取
python学习笔记08_赋值运算、逻辑运算、表达式、短路原则 flamingocc
python笔记081.赋值运算符num+=1等价于num=num+1num-=1等价于num=num-1num*=1等价于num=num*1num/=1等价于num=num/1num//2等价于num=num//2num%=2等价于num/2的余数num**2等价于num=num*num2.逻辑运算符逻辑运算符包含：not、and、or2.1and的用法：(且、并且)写法：条件1and条件2eg
Python学习笔记（三）：列表的定义、访问及修改 RANDY_Sw Python入门 python
今天学习了有关列表的定义、访问及修改的方法，在此整理一下。列表的定义与访问name_list=['zhangsan','lisi','wangwu']#创建一个列表name_list[0]='xiaobai'#修改列表中的单个元素print(name_list)#遍历的方式打印列表1foriteminname_list:print(item)#遍历的方式打印列表2i=0foriinrange(le
Python学习2：一定要注意用pycharm创建Python package和Pythonfile而不是普通路径和文件土小帽软件测试 Python学习
2019年5月7日23:30:02今天久违地再续上断了好久差点又半途而废的Python基础，结果跟着写继承，明明引入了父类，可还是运行报错，下面父类是Person，子类是Student，模块文件名小写。person文件：classPerson(object):def__init__(self,name,age):self.name=nameself.age=agedefrun(self):prin
Linux中检查网络问题的常用命令程序员喵哥 Linux 网络 linux php 服务器运维
更多Python学习内容：ipengtao.com在Linux系统中，网络问题是常见的挑战之一。无论是服务器管理员还是普通用户，都可能遇到各种网络故障，如连接问题、DNS解析问题、网络延迟等。为了快速诊断和解决这些问题，掌握一些常用的网络故障排查命令是至关重要的。本文将介绍一些在Linux系统中常用的网络故障排查命令，并提供详细的示例代码，方便更好地理解和应用这些命令。ping命令ping命令是最
python安全渗透笔记红云谈安全 python编程学习 python 安全
Python学习python常见错误UnicodeDecodeError:‘gbk’codeccan’tdecodebyte0x8cinposition22:illegalmultibytesequence//打开的文件未编码encoding='UTF-8'expectedanindentedblock未缩进，ifforcontinue又进入一次新的循环%将其他变量置入字符串特定位置以生成新字符串
Pyhton抓取BOSS直聘职位描述和数据清洗，很简单没有那么难嗨学编程
一、抓取详细的职位描述信息详情页分析Python学习资料或者需要代码、视频加Python学习群：960410445在详情页中，比较重要的就是职位描述和工作地址这两个由于在页面代码中岗位职责和任职要求是在一个div中的，所以在抓的时候就不太好分，后续需要把这个连体婴儿，分开分析。爬虫用到的库使用的库有：requestsBeautifulSoup4pymongoPython代码代码easy，初学者都能
Python基础（十二）：字典的详细讲解 m0_60707685 程序员 python 学习面试
感谢每一个认真阅读我文章的人，看着粉丝一路的上涨和关注，礼尚往来总是要有的：①2000多本Python电子书（主流和经典的书籍应该都有了）②Python标准库资料（最全中文版）③项目源码（四五十个有趣且经典的练手项目及源码）④Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤Python学习路线图（告别不入流的学习）网上学习资料一大堆，但如果学到的知识不成体系，遇到问题
Python基础（十五）：推导式的讲解_python基础(十五) 推导式的讲解 m0_60707685 程序员 python 学习面试
（1）Python所有方向的学习路线（新版）这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。（2）Python学习视频包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门
socket网络编程python_python学习-socket网络编程张文岳
作业：多用户在线的FTP程序要求：用户加密认证允许同时多用户登录每个用户有自己的家目录，且只能访问自己的家目录对用户进行磁盘配额，每个用户的可用空间不同允许用户在ftpserver上随意切换目录允许用户查看当前目录下文件允许上传和下载文件，保证文件一致性文件传输过程中显示进度条附加功能：支持文件的断点续传(仅下载)README###功能实现作业：开发一个支持多用户在线的FTP程序要求：用户加密认证
python学习第六节：使用python制作九九乘法表和学生管理系统一只会敲代码的小灰灰经验总结 python 学习开发语言 pycharm
python学习第六节：使用python制作九九乘法表和学生管理系统通过前面五节的了解，已经大概知道python的语法以及基础函数，下面是简单的两个小程序。不会做没关系，看得懂就可以了，如果能够自己加工举一反三那就更好了。ps:前面五节只是简单讲解了python的基础语法和函数，也就是混个脸熟，没有进行深入讲解，如果展开来讲的话每一个单独的语法和函数都能将几大章，而很多语法和函数的用法我们根本用不
python函数全局变量和局部变量_Python学习（六）—— 函数、全局变量与局部变量... weixin_39654917
函数函数的定义1deftest(x):2"Thefunctiondefinition"3x+=14returnxdef：定义函数的关键字test：函数名()：内可定义形参“”：文档描述，非必要，但添加后可使得函数更易理解x+=1：泛指代码块或程序处理逻辑，最好不要过多，让函数的功能简洁明了return：定义返回值调用运行：可以带参数也可以不带函数名()1deftest(x):2"Thefuncti
python学习12：对txt/text类型的文件进行读写一名在八月份找工作的测试员前端 linux javascript
1.对txt类型的文件进行读写1）对text文件的操作打开文件-读/写文件-关闭文件1.1)打开文件open()1.2)读/写文件读:read(),readline(),rendlines()写:write()1.3)关闭文件close()#案例1:(读):mode='r'#filename='test004.txt'#同一个文件夹filename=r'D:\stdutyZiLiao\python
Python学习日记（Page.8）空手套不到_白狼学习 pycharm python
今日整理以便日后查看。如有错误欢迎指出。今天聊一下while循环语句。格式：while条件:条件满足时，做的事情1条件满足时，做的事情2条件满足时，做的事情3......案例：题目为求1累计加到100的和i＝1sum＝0whilei＜＝100sum+＝ii+＝1print("1到100的和为：%d"%sum)
基于python的游戏玩家行为数据分析与预测_python有付费数据如何做简单预测(1) 2401_84538391 程序员 python 游戏数据分析
学好Python不论是就业还是做副业赚钱都不错，但要学会Python还是要有一个学习规划。最后大家分享一份全套的Python学习资料，给那些想学习Python的小伙伴们一点帮助！一、Python所有方向的学习路线Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、学习软件工欲善其
Python常用的10个自动化脚本（附详细源码）！进击的六角龙 Python python 自动化自动化办公开发语言
前言Python是一种强大的编程语言，非常适合自动化各种任务。以下列出了Python常用于自动化的10个脚本示例，涵盖了文件管理、网络操作、数据处理等多个方面（文末附python学习资料）。1.文件备份脚本这个脚本可以定期备份指定目录下的所有文件到另一个位置。importshutilimportosimportdatetimedefbackup_files(src,dst):timestamp=d
Python递归爬取今日头条指定用户一个月内发表的所有文章，视频，微头条(2) 2401_84139095 程序员 python 开发语言
感谢每一个认真阅读我文章的人，看着粉丝一路的上涨和关注，礼尚往来总是要有的：①2000多本Python电子书（主流和经典的书籍应该都有了）②Python标准库资料（最全中文版）③项目源码（四五十个有趣且经典的练手项目及源码）④Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤Python学习路线图（告别不入流的学习）网上学习资料一大堆，但如果学到的知识不成体系，遇到问题
周报 | 24.8.26-24.9.1文章汇总双木的木 python拓展学习深度学习拓展阅读目标检测人工智能 python 计算机视觉 gpt transformer stable diffusion
为了更好地整理文章和发表接下来的文章，以后每周都汇总一份周报。周报|24.8.19-24.8.25文章汇总-CSDN博客python|提升代码迭代速度的Python重载方法-CSDN博客机器学习算法与Python学习|黑匣子被打开了？能玩的Transformer可视化解释工具！_研究别人的黑盒算法机器学习python-CSDN博客极市平台|语言图像模型大一统！Meta将Transformer和Di
Python学习日记（Pag.7）空手套不到_白狼学习 python pycharm
拿猜数字的案例说一下判断语句的嵌套。如有错误欢迎指正。题目：要求如下：1.数字随机产生，范围为1-102.有3次机会猜测数字，通过三层嵌套判断实现3.每次都猜不中的话，会提示猜大了还是小了示例：importrandomnum=random.randint(1,10)#随机生成1-10以内的数字guess_num=int(input("您所猜测的数字是:"))ifguess_num==num:pri
Python学习日志（1）—— IDE Strawberry96 python 学习 ide python
IDE，集成开发环境，帮助我们进行高效的开发。Python开发——IDE应用场景选择：适合本地开发：VSCode：适合初学者，轻量级PyCharm：适合有经验的程序员，多人合作，重量级适合远程开发：Jupter：适合数学科学家，AI开发VSCode和PyCharm的安装比较简单。Jupter是第一次听说，在进行AI的开发或者是图片处理之类的，可以在远程开发。安装Jupter//3.12是对应的py
Python学习和面试中的常见问题及答案写代码的M教授 Python学习计划 python 学习面试
整理了一些关于Python和机器学习算法的高级问题及其详细答案。这些问题涵盖了多个方面，包括数据处理、模型训练、评估、优化和实际应用。一、Python编程问题解释Python中的装饰器（Decorators）是什么？它们的作用是什么？答案：装饰器是一种高阶函数，能够在不修改函数定义的情况下扩展或修改函数的行为。它们通常用于日志记录、权限验证、缓存等场景。使用@decorator_name语法将装饰
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

Python学习-机器学习实战-ch07 AdaBoost

你可能感兴趣的:(python学习)