chuhang_zhqr

机器学习实战3--决策树

K近邻可以完成很多分类任务，但其无法给出数据的内在含义。
这次来阐述下决策树的原理及python实现，另有实例剖析。
决策树可以使用不熟悉的数据集合，从中提取一系列规则。

原理：在构造决策树时，需要找到当前数据集上哪个特征在划分数据分类时起决定作用。为了找到决定性的特征，划分出最好的结果，我们必须评估每个特征。找到最好的划分特征时，完成第一次分类，数据集被划分成几个数据子集，这些数据子集会分布在第一个决策点的所有分支上。如果某个分支下的数据属于同一类型，则无需再分割。若子集内的数据不属于同一类型，则要重新划分数据子集，直到在一个数据子集下的数据类型相同。

一般流程：收集数据后，因为树构造算法只适用于标称型数据，因此数值型数据必须离散化。构造树完成之后，应该检查图形是否符合预期。使用训练算法构造树的数据结构。使用经验树计算错误率用于测试算法。
一般决策树采用二分法，这里使用ID3算法划分数据集。以信息熵和信息增益度为衡量标准，从而实现对数据的归纳分类。每次划分数据集时我们只选取一个特征属性。
决策树学习采用的是自顶向下的递归方法，其基本思想是以信息熵为度量构造一棵熵值下降最快的树，到叶子节点处的熵值为零，此时每个叶节点中的实例都属于同一类。
事件ai发生的概率用p(ai)来表示，而-log2(p(ai))表示为事件ai的不确定程度，称为ai的自信息量，sum(p(ai)*I(ai))称为信源S的平均信息量—信息熵。

ID3的原理是基于信息熵增益达到最大，设原始问题的标签有正例和负例，p和n表示其相应的个数。则原始问题的信息熵为

其中N为该特征所取值的个数，比如{rain，sunny}，则N即为2
Gain = BaseEntropy – newEntropy
ID3的原理即使Gain达到最大值。信息增益即为熵的减少或者是数据无序度的减少。
ID3易出现的问题：如果是取值更多的属性，更容易使得数据更“纯”（尤其是连续型数值），其信息增益更大，决策树会首先挑选这个属性作为树的顶点。结果训练出来的形状是一棵庞大且深度很浅的树，这样的划分是极为不合理的。此时可以采用C4.5来解决
C4.5的思想是最大化Gain除以下面这个公式即得到信息增益率：

其中底为2

python实现：
1：计算给定数据集的香农熵.

from math import log #导入数学运算log
import operator
def calcShannonEnt(dataSet):
    numEntries = len(dataSet)#得到数据集的实例个数
    labelCounts = {}#初始化一个字典用于存储键值和对应的出现次数
    for featVec in dataSet:
        currentLabel = featVec[-1]#获取每行最后一个数值，作为键值
        if currentLabel not in labelCounts.keys():#如果当前键值不存在，则将键值添加进字典，键值对应的数值为0,意思是出现零次，若存在，则数值加1,代表出现次数多一次
            labelCounts[currentLabel] = 0
        labelCounts[currentLabel] += 1
    shannonEnt = 0.0#用所有标签的发生概率计算香农熵
    for key in labelCounts:#使用所有类标签的发生频率计算类别出现的概率。我们将用这个概率计算香农熵，统计所有类标签发生的次数
        prob = float(labelCounts[key])/numEntries
        shannonEnt -= prob*log(prob,2)# #以2为底数求对数 
    return shannonEnt

上面大致是求数据集中每个实例标签出现的频率，然后用这个频率计算香农熵。
这里作为测试构建一个测试数据集：

def createDataSet():
    dataSet = [[1,1,'yes'],#最后一列出现不同标签的数量越高，则熵越大，代表无序程序越高，我们在数据集中添加的分类就越多
               [1,1,'yes'],
               [1,0,'no'],
               [0,1,'no'],
               [0,1,'no']]
    labels = ['no surfacing','flippers']
    return dataSet,labels#在这里，数据集是针对标签的，第一个数据对应第一个标签，最后一个数据代表判断标签

2:得到香农熵后，就可以按照最大信息增益的方法划分数据集。
划分数据集，然后计算划分数据集的熵，对每个特征划分数据集的结果计算一次信息熵，判断按照哪个特征划分数据集是最好的划分方式。

def splitDataSet(dataSet,axis,value):#输入：待划分的数据集，划分数据集的特征，需要返回的特征的值
    retDataSet = []#python不考虑内存问题，在函数中传递的是列表的引用，在函数内部是对列表对象的更改，将会影响该列表对象的整个生存周期。为了消除影响，新建一个列表对象。
    for featVec in dataSet:
        if featVec[axis] == value:#数据集中每个元素都是列表，遍历每个元素，发现符合的就添加到列表中;当按照某个特征划分数据集时，需要将所有符合的元素抽取出来。感觉运行结果是第axis个元素的值为value时，抽取这个元素。
            reducedFeatVec = featVec[:axis]#当axis为0时，0：0是空;0：1是0的值
            reducedFeatVec.extend(featVec[axis+1:])#extend是把两个列表合并
            retDataSet.append(reducedFeatVec)#append是把后一个列表直接当作一个元素添加进前一个列表
    return retDataSet

这里只是选择了一个特征及特征值的子集合，是一个小程序，若划分整个数据集，则要反复调用这个函数，得到每一种情况的子集合。

3：遍历整个数据集，循环计算香农熵和splitDataSet()函数，找到最好的特征划分方式。

"""选取特征值，划分数据集，计算出最好的划分数据集的特征"""
def chooseBestFeatureToSplit(dataSet):#dataSet需是一种由列表元素组成的列表，所有的列表元素都要具有相同的数据长度;数据的最后一列或每个元素的做后一列都是当前元素的标签。list中数据类型不限，不影响。
    numFeatures = len(dataSet[0])-1#判定在每个元素列表中包含多少个特征属性，最后一个是标签，要去掉。
    baseEntropy = calcShannonEnt(dataSet)#计算整个数据集的原始熵，这个无序度用于与划分完之后的数据集的熵值进行比较。
    bestInfoGain = 0.0;bestFeature = -1#初始化最佳信息增益和最佳特征索引
    for i in range(numFeatures):#遍历所有特征
        featList = [example[i] for example in dataSet]#把第i个索引所对应的值提取出来
        uniqueVals = set(featList)#把提出来的值唯一化，set是集合数据类型，值不相同
        newEntropy = 0.0#初始化新熵
        for value in uniqueVals:#遍历当前特征中的唯一属性值，对每个特征划分一次数据集
            subDataSet = splitDataSet(dataSet,i,value)#计算数据集的新熵值，并对所有唯一特征值得到的熵求和
            prob = len(subDataSet)/float(len(dataSet))#子集占总集的元素数量百分比
            newEntropy += prob * calcShannonEnt(subDataSet)
        infoGain = baseEntropy - newEntropy#这就得到信息增益，是熵的减少，无序度的减少
        if (infoGain > bestInfoGain):#比较信息增益，得到最大值
            bestInfoGain = infoGain
            bestFeature = i
    return bestFeature#返回最好特征划分的索引值

这里就实现了一层树的最好划分方式，得到最好的划分特征的索引值。

4：递归构建决策树，就是一层层的进行划分，对原始数据集进行划分后，由于特征值可能大于两个，得到第二层的数据子集，再次划分，从而实现全划分，直到遍历完所有划分集的属性，或者每个分支下的实例都具有相同的分类，则得到一个叶子节点或者终止块。我们也可以设置算法可以划分的最大分组数目，若最后得到的数据子集中类标签依旧不唯一，则使用下面的程序，计算在这个子集中标签出现次数最多的，作为该子集的标签。

"""得到每个类标签出现的次数，返回出现次数最多的分类名称"""
def majorityCnt(classList):
    classCount={}
    for vote in classCount:
        if vote not in classCount.keys():classCount[vote] = 0
        classCount[vote] += 1
    sortedClassCount = sorted(classCount.iteritem(),key=operator.itemgetter(1),reverse = true) #对标签出现的频率按从大到小进行排序
    return sortedClassCount[0][0] #返回出现频率最大的那个标签作为子集的标签。

5：创建树的函数代码，这应该是一个主函数，调用以上的函数，对一个原始数据集创建决策树。

#递归构建决策树,这是这个文件的主函数，对已有的数据集，知调用这一个函数就创建了决策树******************************************
def createTree(dataSet,labels):#输入：数据集和标签列表，标签列表中集中所有特征的标签，算法本身不需要，只作为输入参数提供
    classList = [example[-1] for example in dataSet]#提取数据集最后一列数据
    if classList.count(classList[0]) == len(classList):#当计算在最后一列数据中与第一个值相同的元素个数与最后一列数据个数相同时，直接返回第一个元素值，意思是所有类标签都相同
        return classList[0]
    if len(dataSet[0]) == 1:#当数据集中第一个也代表所有元素的长度为1时，仍然类标签不相同，就挑选出现次数最多的作为返回值
        return majorityCnt(classList)
    bestFeat = chooseBestFeatureToSplit(dataSet)#返回最佳特征值划分的索引
    bestFeatLabel = labels[bestFeat]#得到最佳特征值索引的标签
    myTree = {bestFeatLabel:{}}#使用字典类型存储树的信息
    del(labels[bestFeat])#从标签列表中删除最好特征值对应的那个标签
    featValues = [example[bestFeat] for example in dataSet]#得到最佳特征值对应的数据集中的那一列数据组成列表
    uniqueVals = set(featValues)#唯一化
    for value in uniqueVals:#遍历唯一化列表
        subLabels = labels[:]#复制类标签，当函数参数是列表类型时，参数是按照引用方式传递的，保证每次调用函数时都不改变原始列表的内容，就是开一块新内存。
        myTree[bestFeatLabel][value] = createTree(splitDataSet(dataSet,bestFeat,value),subLabels)#等号前第一个中括号是指字典键值，键值可任意类型;第二个中括号是第一个键值延伸的嵌套的字典类型键值;在等号后，先把原数据集按特征值分开，然后递归调用该函数
    return myTree#返回最终的字典信息

6：使用决策树进行分类，依靠训练数据构造了决策树之后，可以将它用于实际数据的分类。在执行数据分类时，需要决策树以及用于构造树的标签向量。然后，程序比较测试数据与决策树上的数值，递归执行直到进入叶节点，最终给出测试数据的类型。
使用决策树的分类函数.

def classify(inputTree,featLabels,testVec):#根据已有的决策树，对给出的数据进行分类
    firstStr = inputTree.keys()[0]
    secondDict = inputTree[firstStr]
    featIndex = featLabels.index(firstStr)#这里是将标签字符串转换成索引数字
    for key in secondDict.keys():
        if testVec[featIndex] == key:#如果key值等于给定的标签时
            if type(secondDict[key]).__name__ == 'dict':
                classLabel = classify(secondDict[key],featLabels,testVec)#递归调用分类
            else: classLabel = secondDict[key]#此数据的分类结果
    return classLabel

存储决策树：

#由于构建决策树是很耗时的，但用创建好的决策树就可以很快解决分类问题，最好每次次执行分类时调用已构造好的决策树，pickle可以存储对象，也可以读出对象，字典对象也不例外，k近邻不能持久分类，必须每次都计算
def storeTree(inputTree,filename):
    import pickle
    fw  = open(filename,'w')
    pickle.dump(inputTree,fw)
    fw.close()

def grabTree(filename):
    import pickle
    fr = open(filename)
    return pickle.load(fr)

7：一个示例，使用决策树预测隐形眼镜类型

8：以下是使用Matplotlib注解绘制树形图的代码，包括我的注释

#-*- coding:utf-8 -*-
import matplotlib.pyplot as plt

decisionNode = dict(boxstyle="sawtooth",fc="0.8")#设置文本框的格式
leafNode = dict(boxstyle="round4",fc="0.8")
arrow_args = dict(arrowstyle="<-")#设置箭头
#annotate：第一个是要显示的文字，第二个是点的位置，第三个和第五个是表示坐标轴左下方是0，0;第四个是文字的中心位置，第六个和七个是表明文字相对于文字放置位置中心点的偏移，第八个是给文字画个什么样的边框，最后一个是箭头。
def plotNode(nodeTxt,centerPt,parentPt,nodeType):
    createPlot.ax1.annotate(nodeTxt,xy=parentPt,xycoords='axes fraction',\
            xytext=centerPt,textcoords='axes fraction',va="center",ha="center",bbox=nodeType,arrowprops=arrow_args)

def createPlot():
    fig = plt.figure(1,facecolor='white')#新建一个绘图区
    fig.clf()#清空绘图区
    createPlot.ax1 = plt.subplot(111,frameon=False)#ax是createPlot的一个属性，这里是定义这个属性
    plotNode('decisionNode',(0.5,0.1),(0.1,0.5),decisionNode)#调用
    plotNode('leafNode',(0.8,0.1),(0.3,0.8),leafNode)
    plt.show()

def getNumLeafs(myTree):#获取叶节点的数目
    numLeafs = 0
    firstStr = myTree.keys()[0]#这个是获得输入的树字典的第一个键值
    secondDict = myTree[firstStr]#得到第一个键值对应的值
    for key in secondDict.keys():#遍历这个字典里所有的键值
        if type(secondDict[key]).__name__ == 'dict':#如果测试键值对应的值仍然是字典，就递归调用本函数，得到最后的叶节点，累加起来
            numLeafs += getNumLeafs(secondDict[key])
        else: numLeafs += 1#若不是字典就是叶节点
    return numLeafs

def getTreeDepth(myTree):
    maxDepth = 0
    firstStr = myTree.keys()[0]
    secondDict = myTree[firstStr]
    for key in secondDict.keys():
        if type(secondDict[key]).__name__ == 'dict':
            thisDepth = 1 + getTreeDepth(secondDict[key])#这里是测试键值对应的值是字典的话就加一，然后递归调用，得到最后的深度
        else: thisDepth = 1
        if thisDepth > maxDepth:maxDepth = thisDepth#每一个节点得到一个深度，求最大深度就是要求的深度
    return maxDepth
def retrieveTree(i):
    listOfTrees = [{'no surfacing':{0:'no',1:{'flippers':{0:'no',1:'yes'}}}},{'no surfacing':{0:'no',1:{'flippers':{0:{'head':{0:'no',1:'yes'}},1:'no'}}}}]
    return listOfTrees[i]

def plotMidText(cntrPt,parentPt,txtString):#找到父节点和字节点之间的中间位置，放置0或1
    xMid = (parentPt[0]-cntrPt[0])/2.0 + cntrPt[0]
    yMid = (parentPt[1]-cntrPt[1])/2.0 + cntrPt[1]
    createPlot.ax1.text(xMid,yMid,txtString)

def plotTree(myTree,parentPt,nodeTxt):#计算所有叶节点的位置，并绘制叶节点以及0和1的位置
    numLeafs = getNumLeafs(myTree)#首先计算宽和高
    depth = getTreeDepth(myTree)
    firstStr = myTree.keys()[0]
    cntrPt = (plotTree.xOff + (1.0 + float(numLeafs))/2.0/plotTree.totalW,plotTree.yOff)#计算字节点的位置
    plotMidText(cntrPt,parentPt,nodeTxt)#绘制0或者1
    plotNode(firstStr,cntrPt,parentPt,decisionNode)#绘制最开始的父节点
    secondDict = myTree[firstStr]
    plotTree.yOff = plotTree.yOff - 1.0/plotTree.totalD#因为父节点在最上面，则需要往下减去偏移量
    for key in secondDict.keys():
        if type(secondDict[key]).__name__ == 'dict':
            plotTree(secondDict[key],cntrPt,str(key))#如果是字典则递归调用
        else:#如果不是字典，则计算x偏移，就是叶节点的位置，绘制叶节点以及0或者1
            plotTree.xOff = plotTree.xOff + 1.0/plotTree.totalW
            plotNode(secondDict[key],(plotTree.xOff,plotTree.yOff),cntrPt,leafNode)
            plotMidText((plotTree.xOff,plotTree.yOff),cntrPt,str(key))
    plotTree.yOff = plotTree.yOff + 1.0/plotTree.totalD#把所有的叶节点都计算完之后，将把y偏移加回来，使最后的y在父节点上

def createPlot(inTree):
    fig = plt.figure(1,facecolor='white')
    fig.clf()
    axprops = dict(xticks=[],yticks=[])
    createPlot.ax1 = plt.subplot(111,frameon=False,**axprops)
    plotTree.totalW = float(getNumLeafs(inTree))#这都是全局变量
    plotTree.totalD = float(getTreeDepth(inTree))
    plotTree.xOff = -0.5/plotTree.totalW; plotTree.yOff = 1.0
    plotTree(inTree,(0.5,1.0),'')#绘制节点树形图
    plt.show()

总结:有些决策树非常好的匹配了实验数据，然而这些匹配选项可能太多了，这样的称为过渡匹配。为了减少过度匹配的问题，我们可以裁剪决策树，去掉一些不必要的叶子节点，如果叶子节点只能增加少许信息，则可以删除该节点，将它并入到其他叶子节点中。
ID3无法直接处理数值型数据，尽管可以通过量化的方法将数值型数据转化为标称型数值，但若存在太多的特征划分，ID3仍然存在其他问题。

决策树开始处理数据时，我们首先需要测量集合中数据的一致性，也就是熵，然后寻找最优方案划分数据集，直到数据集中的所有数据归于一类。

python 查询sqlserver 视图_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39724748 python 查询sqlserver 视图
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目
python连sql server学生管理系统_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39529302 python连sql server学生管理系统
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目
python查询sqlserver视图_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39614874
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目
Python进阶与拾遗8：Python中的异常处理 jiongnima 进阶拾遗 Python python 面向对象编程大数据计算机视觉人工智能
Python进阶与拾遗8：Python中的异常处理异常相关概念异常的定义异常的角色常用的异常处理方法try/except/else/finally语句raise语句assert语句with/as环境管理器相关概念环境管理协议异常对象写在最后作为一门面向对象编程的语言，异常处理是Python中常用的技术。本篇博文主要讲解Python中的异常处理，下面开始干货。异常相关概念异常的定义异常，是可以改变程
使用Python将PDF文件转换为MOBI格式 choiiie 菜狗的怪问题合集 pdf python 经验分享
使用Python将PDF文件转换为MOBI格式引言在这篇文章中，我们将学习如何使用Python创建一个图形用户界面（GUI）应用程序，将PDF文件转换为MOBI格式。我们将使用tkinter作为GUI库，PyMuPDF或PyPDF2来处理PDF文件，以及Calibre的ebook-convert命令行工具来完成文件格式的转换。GitHub项目地址这个项目已经托管在GitHub上准备工作在开始之前，
JsonPath用法详解吴少凡 python 开发语言自动化 pycharm
JSONPath是一种信息抽取类库，是从JSON文档中抽取指定信息的工具，提供多种语言实现版本，包括Javascript、Python、PHP和Java。1、JSONPath安装:pipinstalljsonpath#如果安装太慢可以使用清华源来加速安装pipinstalljsonpath-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、JSONPath语法J
python批量转化pdf图片为jpg图片不懂python不懂R python python pdf
1.把pdf图片批量转为jpg；需要注意的是，需要先安装poppler这个软件，具体安装教程放在下面代码中了2.代码#poppler安装教程参考：https://blog.csdn.net/wy01415/article/details/110257130#windows上poppler下载链接：https://github.com/oschwartz10612/poppler-windowsfr
python程序中调用openai接口 MEMORYLORRY gpt openai gpt 人工智能机器学习 python transformer
调用openai接口1.openai例子（国内访问）2.解决思路3.搭建nginx3.1创建OpenSSL创建证书3.2nginx配置3.3验证效果4.python调用5.SSL:certificate_verify_failed错误1.openai例子（国内访问）fromopenaiimportOpenAIAPI_KEY='sk-api-key'client=OpenAI(api_key=API
python config使用 Soochow_NJU_Smile python config
config.cfg[test]filename=C:\\Users\\86188\\Desktop\\study\\configstudy\\fire.png[detect]number=1main.pyimportcv2importconfigparsercfg=configparser.ConfigParser()cfg.read('config.cfg')source=cfg.get('t
2024年最全办公室文员必备python神器，将PDF文件表格转换成excel表格！(1)，把面试官逗笑了 TOP级别安卓开发程序员 python pdf excel
如果你也是看准了Python，想自学Python，在这里为大家准备了丰厚的免费学习大礼包，带大家一起学习，给大家剖析Python兼职、就业行情前景的这些事儿。一、Python所有方向的学习路线Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、学习软件工欲善其必先利其器。学习Py
第 9 课 Python 异常处理嵌入式老牛 Python入门 python 开发语言
1.异常与错误程序错误是指语法错误（指令输入不正确）和逻辑错误（程序执行结果不正确），而程序异常是一个意外事件，该事件会在程序执行过程中发生，影响了程序的正常执行，比如：打开的文件不存在、被除数为0、操作的数据类型不对、存储错误，互联网请求错误等等。一般情况下，在Python无法正常处理程序时就会发生一个异常。异常是Python对象，表示一个错误。当Python脚本发生异常时我们需要捕获处理它，否
华为OD机试E卷 -boss的收入（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++c语言华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述一个XX产品行销总公司，只有一个boss，其有若干一级分销，一级分销又有若干二级分销，每个分销只有唯一的上级分销。规定，每个月，下级分销需要将自己的总收入（自己的+下级上交的）每满100元上交15元给自己的上级。现给出一组分销的关系，和每个分销的收入，请找出boss并计算出这个boss的收入。比如：收入100元，上交1
如何用Python将pdf文件转化为高清图片张登杰踩 pdf
最近在整理文档，需要将文档进行OCR识别，然后结构化。直接解析pdf文档，行不通，因为文档里面是图片。于是采取先转图片，然后OCR，然后结构化。下面是pdf文档转图片的方法。importfitz#PyMuPDFdefpdf_to_images(pdf_path,images_folder):#打开PDF文件document=fitz.open(pdf_path)forpage_numinrange
华为OD机试E卷 --选修课--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述现有两门选修课，每门选修课都有一部分学生选修，每个学生都有选修课的成绩，需要你找出同时选修了两门选修课的学生，先按照班级进行划分，班级编号小的先输出，每个班级按照两门选修课成绩和的降序排序，成绩相同时按照学生的学号升序排序。输入描述第一行为第一门选修课学生的成绩，第二行为第二门选修课学生的
Python调用open ai接口蓝天星空编程人工智能 python
要使用Python调用OpenAI的接口，您需要完成以下几个步骤：1.**注册并获取API密钥**2.**安装OpenAI的Python库**3.**编写Python代码以调用API**以下是详细的步骤说明：---###1.注册并获取API密钥首先，您需要在[OpenAI官方网站](https://beta.openai.com/signup/)注册一个账户。注册完成后，您需要创建一个API密钥：
Linux搭建wordpress 长江空自流 vps linux wordpress 安装
Linux搭建wordpress一、环境vps：Centos6x86minimal512ram小内存xshell5：ssh远程连接主机首先搭建lamp环境（linuxapachemysqlphp或python等）二、apache1安装yuminstallhttpd2启动apacheservicehttpdstart直接在浏览器中输入IP地址，应该就可以访问到Apache的欢迎页面了三、mysql1
python中strip()和split()的使用方法（学习笔记）木子_李轩笔记
1.strip()：用于移除字符串头、尾指定的字符(默认空格)，不能删除中间部分的字符。#未使用strip()path=r"C:\Users\67539\Desktop\22\11.txt"f=open(path,"r")forlineinf:#按行读取print(line)f.close()#结果cat22airplane23dog58mug86#########################
Flask基础和URL映射終不似少年遊* python进阶学习 flask python 后端开发框架
目录1.Flask介绍2.Flask第一个应用程序3.Flask运行方式4.Flask中DEBUG模式5.Flask环境参数的加载6.Flask路径参数的使用7.Flask路径参数类型8.Flask路径参数类型转换底层9.Flask自定义路由转换器自定义步骤：10.自定义转换to_python函数11.Postman的使用功能：使用示例：12.查询参数的使用13.请求体参数的使用14.上传文件的使
python strip() 函数和 split() 函数的详解 xinyuerr java python python java 数据库
本文主要介绍了pythonstrip()函数和split()函数的详解及实例的相关资料,需要的朋友可以参考下pythonstrip()函数和split()函数的详解及实例一直以来都分不清楚strip和split的功能，实际上strip是删除的意思；而split则是分割的意思。因此也表示了这两个功能是完全不一样的，strip可以删除字符串的某些字符，而split则是根据规定的字符将字符串进行分割。下
CH4 - Python开发技术—流程控制之分支结构（头歌） MSY～学习日记分享 python python 开发语言
目录第1关：英制单位英寸与公制单位厘米互换第2关：百分制成绩转换为等级制成绩第3关：约瑟夫环问题第1关：英制单位英寸与公制单位厘米互换"""英制单位英寸和公制单位厘米互换"""defcmin(value,unit):''':paramvalue:长度，:paramunit:单位'''#请在此处添加代码##*************begin************#ifunit=='cm'orun
Python中strip()函数和split()函数用法：半吊子烟酒僧函数
pythonstrip()函数和split()函数：strip是删除的意思；split则是分割的意思。strip可以删除字符串的某些字符，而split则是根据规定的字符将字符串进行分割。1Pythonstrip()函数介绍:声明：s为字符串，x为要删除的字符序列s.strip(x)删除s字符串中开头、结尾处为x的序列字符s.lstrip(x)删除s字符串中开头处为x的序列字符s.rstrip(x)
python面试情景题_50道python笔试面试真题大集合我是史迪仔 python面试情景题
Python爬虫人工智能100GBweb爬虫数据分析人工智能视频免费领题目后面有50道题答案领取方式哦1、一行代码实现1--100之和利用sum()函数求和2、如何在一个函数内部修改全局变量利用global修改全局变量3、列出5个python标准库os：提供了不少与操作系统相关联的函数sys:通常用于命令行参数re:正则匹配math:数学运算datetime:处理日期时间4、字典如何删除键和合并两
Error in py_run_file_impl(file, local, convert) : ModuleNotFoundError: No module named ‘igraph‘ hyena_7 Python R 服务器配置 python r语言开发语言
在HPC平台上跑我的R语言代码，结果一直报错说：Errorinpy_run_file_impl(file,local,convert):ModuleNotFoundError:Nomodulenamed'igraph'我就知道是我R语言里面导入python包那里出现了问题，对应的python环境没有这个包，我进入了R环境，使用命令如下：library(reticulate)py_module_av
python strip() 详解薇远镖局 Python python 开发语言
strip()是Python字符串方法之一，用于移除字符串开头和结尾的空白字符（包括空格、制表符、换行符等）或指定字符。它不会影响字符串中间的空白字符。语法str.strip([chars])参数chars（可选）：一个字符串，表示要移除的字符集合。如果未指定，默认移除空白字符。返回值返回一个新的字符串，表示移除了开头和结尾指定字符后的结果。示例1、移除空白字符：s="Hello,World!"p
Python--字符串小丁丁_ddxdd 技术层-python
描述Pythonstrip()方法用于移除字符串头尾指定的字符（默认为空格）。语法strip()方法语法：str.strip([chars]);参数chars--移除字符串头尾指定的字符。返回值返回移除字符串头尾指定的字符生成的新字符串。实例以下实例展示了strip()函数的使用方法：#!/usr/bin/pythonstr="0000000thisisstringexample....wow!!
使用uWSGI将Flask应用部署到生产环境 liuhongyue flask python 后端
使用uWSGI将Flask应用部署到生产环境：1、安装uWSGIcondainstall-cconda-forgeuwsgi（pipinstalluwsgi会报错）2、配置uWSGI在python程序的同一文件夹下创建uwsgi.ini文件，文件内容如下表。需要按照实际情况修改文件名称地址，log文件保存路径，启动的进程数和线程数等3、启动服务，执行命令：uwsgi--iniuwsgi.ini4、
centos7中报错ModuleNotFoundError: No module named ‘_ctypes‘解决方法丢失想象 centos python
分析:python3中有个内置模块叫ctypes，它是python3的外部函数库模块，提供了兼容C语言的数据类型，并通过它调用Linux系统下的共享库(Sharedlibrary)，此模块需要使用centos7系统中外部函数库(Foreignfunctionlibrary)的开发链接库(头文件和链接库)。由于在centos7系统中没有安装外部函数库(libffi)的开发链接库软件包，所以在安装pi
Python酷库之旅-第三方库Pandas(008) 神奇夜光杯 python pandas 人工智能开发语言 excel 标准库及第三方库学习和成长
目录一、用法精讲16、pandas.DataFrame.to_json函数16-1、语法16-2、参数16-3、功能16-4、返回值16-5、说明16-6、用法16-6-1、数据准备16-6-2、代码示例16-6-3、结果输出17、pandas.read_html函数17-1、语法17-2、参数17-3、功能17-4、返回值17-5、说明17-6、用法17-6-1、数据准备17-6-2、代码示例1
Python 中的 strip() 和 split() 方法详解 Ryann6 python 开发语言
目录一、strip()方法1.什么是strip()？2.基本语法3.基本用法示例1）去除空白字符2）移除指定字符4.lstrip()和rstrip()5.注意事项二、split()方法1.什么是split()？2.基本语法3.基本用法示例1）按空格分割字符串2）指定分隔符3）限制分割次数4.rsplit()方法5.splitlines()方法三、strip()与split()的结合使用1）移除空格
安装auto_gptq解决办法 Ven% 简单说深度学习 Ubuntu 深度学习基础动手人工智能深度学习机器学习 python
这个错误表明在安装auto_gptq包时，生成QiGen内核时失败了。具体来说，setup.py脚本尝试运行一个Python脚本来生成内核，但该脚本不存在或无法访问。以下是一些可能的解决方案：1.确保依赖项已安装首先，确保你已经安装了所有必要的依赖项。你可以尝试以下命令来安装auto_gptq的依赖项：pipinstalltorchtransformers2.使用预编译的二进制文件如果你不需要从源
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

机器学习实战3--决策树

你可能感兴趣的:(python)