cxjoker

《机器学习实战》之logistic回归

一、Logistic回归算法
　　Logistic回归是一种线性拟合的分类算法，其中回归是指通过一条线对点进行拟合（该线称为最佳拟合曲线），即通过一条线使尽量多的点都在线上或离线最近（误差最小）。而logistic回归算法就是先获得所有特征的最佳拟合曲线的参数

然后再根据sigmod函数进行分类

sigmod函数是最典型的S曲线，它看起来很像一个阶跃函数，即当z>0时，sigmod(z)>0.5,且当z无限大时，sigmod(z)无限接近于1，相反则无限接近于0，故可采用sigmod函数进行分类，即当z>0时将其分为1类，小于0时分为0类，故logistic回归算法便成了求最佳拟合曲线的参数w的分类算法。
二、基于梯度上升法的拟合参数计算
　　梯度上升/下降和牛顿法是最常用的无约束最优参数的计算方法，此处采用其中梯度上升法。梯度上升的最基本的思想：不管是上升还是下降，如果一个函数是可微的，那么沿着它的一阶导数的方向（即梯度方向）上升和下降是最快的，如果梯度为▽，则函数ｆ（ｘ，ｙ）的梯度可表示为：
　　
　　　在此处求参数时，先利用最大似然估计求得似然函数，然后再利用梯度上升算法求最大似然函数得参数值，从而求得ｚ的参数值，故在此处梯度上升算法的迭代公式为：

，其中α是迭代的步长，或者叫做学习率。
　　故对于logistic回归算法来说，设：
　　
　　为了求最优参数ｗ，令其代价函数为：
　　
　　对其取对数似然函数有：
　　
　　故当采用梯度上升算法求最优ｗ值时，只需要求得对数似然函数的导数，即可获得梯度上升的梯度，然后就知道迭代公式。具体推导步骤见下图：

故根据图片上的推导可知，梯度上升的迭代公式为：

这就是为什么在代码函数gradAscent中采用weights = weights + alpha * dataMatrix.transpose()* error 这句代码的原因，当时想了半天，查了好久终于推导出来了。
三、代码
　　对于logistic回归算法来说，理解sigmod函数和理解基于梯度上升求最优化参数w之后就没什么好讲的了，其中对于随机梯度上升算法来说就是改进了原来每次遍历所有数据集而变成每次只取一个数据集进行迭代，并且迭代过的数据集以后便不再使用，其他的就没什么好说的了。然后有什么问题的话，代码都加上了注解，直接上代码吧：

# -*- coding: utf-8 -*-
"""
Created on Mon Sep 17 20:15:27 2018

@author: chenxi
"""
from matplotlib.font_manager import FontProperties
import matplotlib.pyplot as plt
import numpy as np
import random

def loadDataSet():   #加载数据函数
    dataMat = []; labelMat = []
    fr = open('testSet.txt')
    for line in fr.readlines():#直接读取全部数据作为list，然后对每个元素进行处理
        lineArr = line.strip().split()#去空格、分割
        dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])])#将1.0，lineArr的第一、二个元素（转换为float类型）加入到dataMat列表
        labelMat.append(int(lineArr[2]))#获取标签
    return dataMat,labelMat

def sigmoid(inX):
    return 1.0/(1+np.exp(-inX))#inx回归系数与特征的乘积

def gradAscent(dataMatIn, classLabels):#梯度提升方法
    dataMatrix = np.mat(dataMatIn)             #将数据列表转化为矩阵np.mat
    labelMat = np.mat(classLabels).transpose() #将标签列表转化为矩阵，transpose()为转置函数
    m,n = np.shape(dataMatrix)#获取dataMatrix行数和列数，m为行数，shape(datamatrix)[0]表示获得datmat的行数，
    alpha = 0.001#步长为0.001
    maxCycles = 500#循环次数
    weights = np.ones((n,1))    #初始化系数矩阵，初始化为1,n是dataMatrix列数，即特征个数
    weights_array = np.array([])
    for k in range(maxCycles):              #
        h = sigmoid(dataMatrix*weights)     #矩阵内部的元素相乘并相加，然后输入到sigmod函数并返回值，最后形成一个列向量，每一列代表一个样本的z=w1x1+w2x2通过sigmod函数之后获得的值                            
        error = (labelMat - h)              #错误率代表样本标签和sigmod函数的差值，{0,1}，距离越远，说明错的越大
        weights = weights + alpha * dataMatrix.transpose()* error #通  过逻辑回归的似然函数求参数最优值，采用梯度上升法最后获得的迭代公式为α*（y-h（x））x
        weights_array = np.append(weights_array,weights)
    weights_array=weights_array.reshape(maxCycles,n)
    return weights,weights_array
    
def plotBestFit(weights):
    import matplotlib.pyplot as plt
    dataMat,labelMat=loadDataSet()
    dataArr = np.array(dataMat)
    n = np.shape(dataArr)[0] 
    xcord1 = []; ycord1 = []
    xcord2 = []; ycord2 = []
    for i in range(n):
        if int(labelMat[i])== 1:
            xcord1.append(dataArr[i,1]); ycord1.append(dataArr[i,2])#获得分类为1的横纵坐标
        else:
            xcord2.append(dataArr[i,1]); ycord2.append(dataArr[i,2])#获得分类为0的横纵坐标
    fig = plt.figure()
    ax = fig.add_subplot(111)#将画布分割成1行1列，图像画在从左到右从上到下的第1块
    #画点
    ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')#分类为1的画入图中  s是大小，c为颜色
    ax.scatter(xcord2, ycord2, s=30, c='green')
    #画线
    x = np.arange(-3.0, 3.0, 0.1)   #x的坐标从-3到3，步长为0.1
    y = (-weights[0]-weights[1]*x)/weights[2]#0=w0x0+w1x1+w2x2
    y1=y.transpose()
    ax.plot(x, y1 )
    plt.xlabel('X1'); plt.ylabel('X2');
    plt.show()   

def stogradacent0(datamatrix,classlebels):
   
    m,n=np.shape(datamatrix)
    alpha=0.01
    weights=np.ones(n)
    x=[]
    for i in range(m):
        h=sigmoid(sum(weights*datamatrix[i]))
        error=classlebels[i]-h
        weights=weights+alpha*error*datamatrix[i]
        x.append([i,weights[0],weights[1],weights[2]])
    return weights,x

def stocGradAscent1(dataMatrix, classLabels, numIter=150):
    m,n = np.shape(dataMatrix)
    weights = np.ones(n)   #初始化权重矩阵
   # weights_array=np.array([])
    for j in range(numIter):#迭代次数
        dataIndex = list(range(m))
        for i in range(m):
            alpha = 4/(1.0+j+i)+0.0001    #随着i，j的增大，步长逐渐减小，更加精细 
            randIndex = int(random.uniform(0,len(dataIndex)))#每次都是随机选取样本来作为更新权重矩阵的数据,不放回抽样，因为每次抽完之后就把该数据删除
            h = sigmoid(sum(dataMatrix[randIndex]*weights))
            error = classLabels[randIndex] - h
            weights = weights + alpha * error * dataMatrix[randIndex]
           # weights_array=np.append(weights_array,weights,axis=0)
            del(dataIndex[randIndex])
    #weights_array=weights_array.reshape(numIter*m,n)
    return weights
 
def plotWeights(weights_array1,weights_array2):
    #设置汉字格式,windows自带的汉字
    font = FontProperties(fname=r"c:\windows\fonts\simsun.ttc", size=14)
    #将fig画布分隔成1行1列,不共享x轴和y轴,fig画布的大小为(13,8)
    #当nrow=3,nclos=2时,代表fig画布被分为六个区域,axs[0][0]表示第一行第一列
    fig, axs = plt.subplots(nrows=3, ncols=2,sharex=False, sharey=False, figsize=(20,10))
    x1 = np.arange(0, len(weights_array1), 1)
    #绘制w0与迭代次数的关系
    axs[0][0].plot(x1,weights_array1[:,0])
    axs0_title_text = axs[0][0].set_title(u'梯度上升算法：回归系数与迭代次数关系',FontProperties=font)
    axs0_ylabel_text = axs[0][0].set_ylabel(u'W0',FontProperties=font)
    plt.setp(axs0_title_text, size=20, weight='bold', color='black') 
    plt.setp(axs0_ylabel_text, size=20, weight='bold', color='black')
    #绘制w1与迭代次数的关系
    axs[1][0].plot(x1,weights_array1[:,1])
    axs1_ylabel_text = axs[1][0].set_ylabel(u'W1',FontProperties=font)
    plt.setp(axs1_ylabel_text, size=20, weight='bold', color='black')
    #绘制w2与迭代次数的关系
    axs[2][0].plot(x1,weights_array1[:,2])
    axs2_xlabel_text = axs[2][0].set_xlabel(u'迭代次数',FontProperties=font)
    axs2_ylabel_text = axs[2][0].set_ylabel(u'W1',FontProperties=font)
    plt.setp(axs2_xlabel_text, size=20, weight='bold', color='black') 
    plt.setp(axs2_ylabel_text, size=20, weight='bold', color='black')
    x2 = np.arange(0, len(weights_array2), 1)
    #绘制w0与迭代次数的关系
    axs[0][1].plot(x2,weights_array2[:,0])
    axs0_title_text = axs[0][1].set_title(u'改进的随机梯度上升算法：回归系数与迭代次数关系',FontProperties=font)
    axs0_ylabel_text = axs[0][1].set_ylabel(u'W0',FontProperties=font)
    plt.setp(axs0_title_text, size=20, weight='bold', color='black') 
    plt.setp(axs0_ylabel_text, size=20, weight='bold', color='black')
    #绘制w1与迭代次数的关系
    axs[1][1].plot(x2,weights_array2[:,1])
    axs1_ylabel_text = axs[1][1].set_ylabel(u'W1',FontProperties=font)
    plt.setp(axs1_ylabel_text, size=20, weight='bold', color='black')
    #绘制w2与迭代次数的关系
    axs[2][1].plot(x2,weights_array2[:,2])
    axs2_xlabel_text = axs[2][1].set_xlabel(u'迭代次数',FontProperties=font)
    axs2_ylabel_text = axs[2][1].set_ylabel(u'W1',FontProperties=font)
    plt.setp(axs2_xlabel_text, size=20, weight='bold', color='black') 
    plt.setp(axs2_ylabel_text, size=20, weight='bold', color='black')

    plt.show()           
  
def classifyVector(inX, weights):
    prob = sigmoid(sum(inX*weights))
    if prob > 0.5: return 1.0  #以0.5为分类线，大于0.5分类为1
    else: return 0.0

def colicTest():
    frTrain = open('horseColicTraining.txt'); frTest = open('horseColicTest.txt')
    trainingSet = []; trainingLabels = []
    for line in frTrain.readlines():
        currLine = line.strip().split('\t')
        lineArr =[]
        for i in range(21):#获取样本特征数据，转化为float数据类型
            lineArr.append(float(currLine[i]))
        trainingSet.append(lineArr)#获取样本特征数据，
        trainingLabels.append(float(currLine[21]))#获取样本标签
    trainWeights = stocGradAscent1(np.array(trainingSet), trainingLabels, 1000)#获得样本特征权值
    errorCount = 0; numTestVec = 0.0
    for line in frTest.readlines():
        numTestVec += 1.0
        currLine = line.strip().split('\t')
        lineArr =[]
        for i in range(21):
            lineArr.append(float(currLine[i]))
        if int(classifyVector(np.array(lineArr), trainWeights))!= int(currLine[21]):#计算分类错误数量
            errorCount += 1
    errorRate = (float(errorCount)/numTestVec)
    print ("the error rate of this test is: %f" % errorRate)
    return errorRate

def multiTest():
    numTests = 10; errorSum=0.0
    for k in range(numTests):
        errorSum += colicTest()
    print ("after %d iterations the average error rate is: %f" % (numTests, errorSum/float(numTests))   )
 

if __name__=="__main__":
    multiTest()
 
'''
#对比改进的梯度下降算法和未改进的梯度下降算法的回归系数与迭代次数之间的关系  
if __name__=="__main__":    
    dataMat,labelMat=loadDataSet()
    weights0,a0=gradAscent(np.array(dataMat),labelMat)
    weights,a=stocGradAscent1(np.array(dataMat),labelMat)
    plotWeights(a0,a)   
'''

以上代码中 plotWeights函数参考了https://blog.csdn.net/c406495762/article/details/77851973这篇博客，所以在gradAscent和stogradAscent函数中会多返回一个weights_array的值。
然后测试了采用随机梯度上升和梯度上升算法对于分类正确率的影响，
这幅图是采用梯度上升算法的结果：

这幅图是采用随机梯度上升算法的结果：

　　可见，采用随机梯度上升算法的结果并不如采用梯度上升算法的好（迭代次数都设置为５００次）所以对于小样本数据来说采用梯度上升算法效果可能比随机题都上升的更好，因为它每次都遍历了数据。
　　同时，遇到了一个小错误，就是每次运行都会出现这个：
　　
　　查了半天不知道怎么解决，呕心。

四、画的一些图
（1）采用iris数据集画的图（采用logistic回归分类器在该数据集上获得的回归系数-梯度上升算法）：
　　
（2）改进之后的随机梯度提升算法获得的结果（随机梯度上升算法）　

（3）参考博客画的梯度上升和改进的梯度上升算法之间迭代次数和收敛性关系的图，画出来的图比较丑，我也不想改了

（4）一些小问题
问题1：为什么在做iris矩阵时要在第一列加入1.0这个元素
因为回归函数w=w1x1+w2x2，第一个w相当于w*1

问题2： weights_array.append(weights,axis=0)报错’numpy.ndarray’ object has no attribute ‘append’
改成了 weights_array=np.append(weights_array,weights,axis=0)即可，所以以后都用import numpy as np坚决不用from numpy import *

五、总结
　
　logistic属于一种线性分类算法，《机器学习实战》还加入了梯度上升和随机梯度上升进行参数求解，所以内容比较多，其实看上去的话还是比较简单的，就是理解sigmod函数，再懂得利用最大似然函数求最优值，然后再利用梯度上升求当似然函数取最优值时所采用的参数的求解方法即可。

学C++还是学Java？做软件研发还需掌握哪些知识和技能？_c+ 2401_84160087 程序员 c++java c语言
1.1、Java和C++都很有前途1.2、Java的应用领域与使用场景1.3、C++的应用领域与使用场景1.4、如何选择2、需要掌握的知识和技能2.1、掌握一些基础的网络知识2.2、熟悉一些常用的SQL语句2.3、了解Linux系统，掌握常用的Linux命令2.4、学习汇编语言相关的内容2.5、学习一些其他的专业课程3、最后最近和一些高校的学生朋友交流，他们打算毕业后从事软件研发的工作，但目前有些
软考高级《系统架构设计师》知识点（五） Ritchie里其系统架构
计算机网络网络概述和模型计算机网络是计算机技术与通信技术相结合的产物，它实现了远程通信、远程信息处理和资源共享。计算机网络的功能：数据通信、资源共享、管理集中化、实现分布式处理、负载均衡。网络性能指标：速率、带宽(频带宽度或传送线路速率)、吞吐量、时延、往返时间、利用率。网络非性能指标：费用、质量、标准化、可靠性、可扩展性、可升级性、易管理性和可维护性。通信技术：计算机网络是利用通信技术将数据从一
c#模拟鼠标点击左键王焜棟琦 C#c#
c#模拟鼠标点击左键，这里调用的是windows系统函数，usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Runtime.InteropServices;usingSystem.Text;usingSystem.Threading.Tasks;namespaceWindowsFormsAppHalco
python小白的word转excel W~J~L python python
大概流程为：一、首先导入docx库以及xlwt库二、需要用到的文档的名称三、设置一个函数来写入excel，转为可识别通用的“utf8”，然后创建一个表格来将文档里的内容写入到表里去四、利用for循坏来设置表里多少个为一行五、在最后设置表的保存路径以及提示是否创建成功importdocximportxlwtdocFile="青年大学习.docx"defwrite_excel(path):doc=do
golang代码规范几窗花鸢 golang golang 代码规范单元测试
golang代码规范1.gofmt和goimports格式化：所有的代码都需要用gofmt格式化。换行：一行代码不超过120列括号和空格：运算符和操作数之间要留空格；作为输入参数或者数组下标时，运算符和运算数之间不需要空格import:使用goimports自动格式化引入的包名2.error处理error作为函数的返回值，必须对error进行处理，或者将返回值赋值给明确忽略error作为函数的值返
python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）... weixin_39576066 python 学习曲线函数
LSTM是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。《LongShortTermMemoryNetworkswithPython》是澳大利亚机器学习专家JasonBrownlee的著作，里面详细介绍了LSTM模型的原理和使用。该书总共分为十四个章节，具体如下：第一章：什么是LSTMs？第二章：怎么样训练
html 字体图标不显示不出来了,h5页面字体图标显示不正常微基因WeGene html 字体图标不显示不出来了
问题描述开发的是微信公众号的纯静态H5页面，测试发现在iOS上面首次打开会出现字体图标无法显示的问题，并且切换到其它页面，字体图标也是一样无法显示：只能使用微信的右上角内的刷新选项，所有页面的图标就可正常显示，浏览其它页也正常：P.S.所有页面在iOS自带的safari或者chrome浏览器均可正常显示，在android也是正常显示。相关代码HTML:CSS:@charset"UTF-8";@fo
python程序设计案例教程胡国胜第二章答案_Python程序设计案例教程长发在船头舞蹈
章Python基础知识1.1Python简介1.1.1Python语言特点1.1.2Python版本1.1.3Python语言的实现1.1.4安装Python1.2Python开发环境1.2.1启动IDLE1.2.2Python代码编辑器1.2.3个小程序习题1第2章数据类型2.1数值2.1.1数值类型2.1.2变量章Python基础知识1.1Python简介1.1.1Python语言特点1.1.
华为初面 + 综合面试，附上面试题，share 给大家~ Java布道者华为面试职场和发展
华为面试整体流程大致分为笔试，性格测试，面试，综合面试，回学校等结果。笔试来说，华为的难度较中等，选择题难度和网易腾讯差不多。最后的代码题，相比下来就简单很多，一共3道题目，前2题很容易就AC，题目已经记不太清楚，不过难度确实不大。最后一题最后提交的代码过了75%的样例，一直没有发现剩下的25%可能存在什么坑。笔试部分太久远，我就不怎么回忆了。直接将面试。面试如果说腾讯的面试是挥金如土（毕竟每个面
揭秘！考 BDA 所需强度指南东总学长同济预备研0 数据分析信息可视化 python 求职招聘
宝子们，初级BDA我已顺利拿下～迫不及待来和大家分享热乎乎的备考历程，希望能给正在备考或打算考的小伙伴一些参考。我选择BDA数据分析师证书，是因为它由中国信息协会市场研究业分会&中经数（北京）数据应用技术研究院联合认证，对想进入数据分析行业、提升专业水平的人超有帮助！下面给大家分享我的学习攻略：业务知识（1周左右）深入了解业务知识，能为数据分析提供更深层次支持。推荐书籍《深入浅出数据分析》《精益数
Golang的代码质量评估苹果酱0567 面试题汇总与解析课程设计 spring boot layui 毕业设计 java
Golang的代码质量评估一、代码质量的重要性在软件开发过程中，代码质量是至关重要的，它直接关系到软件的稳定性、可维护性和安全性。而Golang作为一门快速发展的编程语言，其代码质量也备受关注。因此，对Golang代码的质量进行评估至关重要。二、静态代码分析工具在评估Golang代码质量时，我们可以使用静态代码分析工具来帮助我们发现潜在的问题。其中比较知名的工具包括：是Golang的官方静态代码分
PHP 超级全局变量 lly202406 开发语言
PHP超级全局变量引言在PHP编程中，超级全局变量（Superglobals）是一类特殊的变量，它们在任何函数、类或文件中都可以访问。这些变量在PHP的全局作用域中始终可用，为开发者提供了处理HTTP请求和响应的强大工具。本文将详细介绍PHP中的超级全局变量，包括其作用、使用场景以及注意事项。超级全局变量列表PHP中常见的超级全局变量包括：$$_GET：获取通过URL传递的GET参数。$$_POS
Ajax基础学习喜欢代码的新之助 ajax 学习 okhttp
AJAX浏览器本身就具备网络通信的能力，但在早期浏览器并没有把这个能力开放给JS最早是微软在IE浏览器中把这一能力向JS开放，让JS可以在代码中实现发送请求，这项技术在2005年被正式命名为AJAX（AsynchronousJavascriptAndXML）这套API主要依靠一个构造函数完成；该构造函数的名称为XMLHttpRequest，简称为XHR由于XHRAPI有着诸多缺陷，在HTML5和E
c++之类和对象(first) 番茄牛肉面呀 c++c++开发语言
目录导入：类的定义：定义方法：类的访问限定符及封装：访问限定符：c++中struct和class的区别？封装：类的作用域：类的实例化：类的大小：存储方式：大小：this指针导入：在C语言中,结构体内只能定义变量，无法定义函数，需要通过调用相应的接口才能完成c++中，结构体（类）内可以定义变量和函数，实现封装的思想，是一门面向对象的过程。（当然不是完全面向对象）类的定义：classclassname
【漫话机器学习系列】041.信息丢失（dropout） IT古董漫话机器学习系列专辑机器学习人工智能深度学习
信息丢失（Dropout）Dropout是一种广泛应用于神经网络训练中的正则化技术，旨在减少过拟合（overfitting），提高模型的泛化能力。虽然"信息丢失"（dropout）这个术语在某些情况下可能引起误解，指的并非是数据的丢失，而是训练过程中故意“丢弃”神经网络中的部分神经元。这种做法可以避免模型过于依赖于某些特定的神经元，从而提高模型在新数据上的表现。Dropout的工作原理在神经网络的
第二章：12.3 建立表现基准望云山190 基准性能水平人工智能机器学习
背景介绍语音识别是一种常见的机器学习应用，用户通过语音输入代替键盘输入，系统需要将语音转换为文本。在这个过程中，算法的性能可以通过训练误差和交叉验证误差来评估。误差定义训练误差（Jtrain）：指算法在训练数据集上无法正确转录的音频片段的百分比。在这个例子中，训练误差是10.8%，意味着算法在训练数据上犯了10.8%的错误。交叉验证误差（Jcv）：指算法在未见过的数据（交叉验证集）上无法正确转录的
第二章：12.4 学习曲线望云山190 深度学习机器学习人工智能
学习曲线的基本概念学习曲线是展示机器学习模型性能如何随着训练数据量增加而变化的图表。它们可以帮助我们理解模型在不同数据量下的表现，以及模型是否过拟合或欠拟合。二阶模型的学习曲线交叉验证错误（Jcv）：这条绿色曲线表示模型在未见过的数据上的表现。它反映了模型的泛化能力，即模型对新数据的预测能力。训练错误（Jtrain）：这条红色曲线表示模型在训练数据上的表现。它反映了模型对训练数据的拟合程度。学习曲
Pytorch官方文档英语翻译 yanzhiwen2 深度学习Pyrotch pytorch 机器学习 python 人工智能深度学习
深度学习Pytorch-Pytorch官方文档英语翻译1.a-e1.1span跨度1.2blended混合的1.3criterion标准1.4deprecated弃用的1.5clamp钳制1.6arbitraryshapes任意形状1.7explodinggradients梯度爆炸1.8converge收敛1.9approximate近似1.10arg参数1.11argument参数1.12con
打印机显示检查打印服务器,win10系统打开打印机提示再次检查打印机的名称怎么办... 項羽Sama 打印机显示检查打印服务器
打印机是办公室经常会用到的打印设备，可是有不少用户在升级到win10系统之后，发现打开打印机提示再次检查打印机的名称，导致无法使用打印机，该怎么办呢，现在为大家分享一下win10系统打开打印机提示再次检查打印机的名称的具体解讲方法吧。1、打开电脑的控制面板-管理工具-服务(win+R打开运行，键入services.msc点击确定打开服务)-PrintSpooler。在服务里找到printspoo
软考~系统规划与管理师考试——真题篇——2019年5月——综合知识——解析 fo安方软考~系统规划与管理师考试管理学习生活软考
文章目录真题（2019-05-01）真题（2019-05-02）真题（2019-05-03）真题（2019-05-04）真题（2019-05-05）真题（2019-05-06）真题（2019-05-07）真题（2019-05-08）真题（2019-05-09）真题（2019-05-10）真题（2019-05-11）真题（2019-05-12）真题（2019-05-13）真题（2019-05-14）
【探索C++】友元祐言QAQ 探索C++编程开发语言 c++linux java https 网络
(꒪ꇴ꒪)，Hello我是祐言QAQ我的博客主页：C/C++语言，数据结构，Linux基础，ARM开发板，网络编程等领域UP快上，一起学习，让我们成为一个强大的攻城狮！送给自己和读者的一句鸡汤：集中起来的意志可以击穿顽石!作者水平很有限，如果发现错误，请在评论区指正，感谢在C++中，友元（friend）是一种特殊的关系，它允许一个类或函数访问另一个类的私有成员。通过友元关系，一个类可以将其他类或函
图论- Dijkstra算法左灯右行的爱情图论算法 python
Dijkstra算法前言概念BFS基础模版DijkstraDijkstra函数签名State类distTo记录最短路径伪代码模版第一个问题解答第二个问题解答第三个问题解答前言学习这个算法之间,必须要对BFS遍历比较熟悉,它的本质就是一个特殊改造过的BFS算法.概念Dijkstra算法是一种计算图中单源最短路径算法,本质上是一个经过特殊改造的BFS算法,改造点有两个:使用优先队列,而不是普通队列进行
操作系统-实例详解fork()的工作原理（超详细版） Refulic. linux 系统架构
讲解这一主题的帖子很多，但是对于初学者来说依然很难理解。所以本文会先贴出完整的实例代码，然后逐句讲解。重点在于理解函数的工作逻辑。读者可以直接从代码段后开始阅读。#include#include#include#includeintmain(){pid_tpid=fork();//创建一个子进程if(pid0)块。子进程复制了父进程的PC，所以从fork()的返回点开始执行。操作系统在子进程中将f
手搓操作系统-如何创建虚拟磁盘并装载内核(超详细版） Refulic. linux bootstrap 系统架构系统安全
写在前面：本篇是完整的在Linux环境下，创建一个虚拟磁盘，并且将内核安装到磁盘并用虚拟机运行的过程。需要对bootstrap过程有一定的基础知识。遇到不懂的概念，如MBR，Grub等请务必参考笔者的另一篇文章操作系统架构-Linux主机从按下电源键到加载内核，都经历了什么？（超详细版）此外，读者还需要对文件系统有基本的理解。1.创建磁盘镜像1）通过在Shell提示符下输入以下命令创建磁盘镜像（提
stm32 DMA 每天学点 MCU stm32 DMA
stm32DMA介绍的定义存储器到存储器main.c存储器到外设main.cusart_dma.cusart_dma.h外设到存储器main.cusart_dma.cusart_dma.h中断函数对比理解介绍的定义存储器：用来存储程序代码和数据。易失性存储器：存储器断电后，它存储的数据内容丢失。易失性存储器存取速度快，如内存。非易失性存储器：存储器断电后，它存储的数据内容不丢失。非易失性存储器可长
连锁订货系统的订单处理流程解析连锁企业管理系统连锁收银系统连锁订货系统
连锁订货系统的订单处理流程，是确保商品从供应商高效流转至各连锁门店的关键环节，涉及多个紧密相扣的步骤。以下将以核货宝连锁订货系统为例，详细解析其订单处理流程：1.订单创建：连锁门店工作人员通过核货宝系统，依据门店库存状况、销售预测以及顾客需求，挑选所需商品，录入商品数量、规格等信息，完成订单创建。比如某连锁便利店发现薯片库存不足，店员在系统中选中对应品牌、口味的薯片，输入补货数量，提交订单。2.订
5、pod 详解（kubernetes） Sundayday47 k8s kubernetes 容器云原生 harbor
pod详解（kubernetes）Pod的基础概念pause容器Pod的分类与创建自主式Pod控制器管理的Pod静态PodPod容器的分类基础容器（infrastructurecontainer）初始化容器（initcontainers）应用容器（Maincontainer）镜像拉取策略（imagePullPolicy）k8s部署harbor创建私有项目部署harbor仓库harbor登录凭据资源
类的讲解2(继承) 上位机小白*** c#开发语言
--继承:子类实例化的时候,父类构造函数也会跟随执行继承:属于面向对象三大特性之一(封装,继承,多态)/**父类中抽离"公共成员"*子类中"扩展"特殊的成员**基类:父类Animal*派生类:子类Dog**继承的核心思想:子类使用父类公开的属性和方法,同时拓展自己的特性*/先定义一个Animal类,之后用Dog类继承Animal类//调用了无参的构造函数Animallaohu=newAnimal(
机器学习相关基础星辰瑞云机器学习
1.预备知识人工智能:用人工的方法在机器(计算机)上实现的智能;或者说是人们使机器具有类似于人的智能。人工智能学科:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。2.日常生活中的机器学习:①称为RGB(由红色，绿色，蓝色组成)，这种是欠拟合欠拟合和过拟合区别:•欠拟合（Underfitting）：模型在训练数据上表现不佳，无法很好地捕捉数据中的规律。通
TCP三次握手与四次挥手 hello-linux 以太网驱动开发 TCP 三次握手四次挥手
1.三次握手（建立连接）(1)客户端发送一个SYN段（SYN标志位置位），包含初始序号ISN，在图中，这个序号的值seq=2379453243.在这个过程中，客户端是通过connect函数发起连接请求的，此时connect函数阻塞，等待服务器发回ACK应答。(2)服务器端接收到SYN段后（listen），知道有新的连接请求到来，于是初始化一个序号ISN，在上面的例子中这个值是seq=4269857
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

《机器学习实战》之logistic回归

你可能感兴趣的:(数据挖掘,知识发现,机器学习,分类,线性回归分类,logistic回归,梯度上升,似然函数)