zsffuture

机器学习--详解基于梯度下降的Logistic回归算法原理

先给出Logistic回归的sigmod函数数学表达式：

$\large f(x)=\frac{1}{1+e^{-x}}$

很简单的表达式，再看看它的性质，当 $\large x\rightarrow +\infty$ 时， $\large e^{-x}\rightarrow0$ ,因此 $\large f(x)\rightarrow 1$

当 $\large x\rightarrow- \infty$ 时， $\large e^{-x}\rightarrow+ \infty$ ，因此 $\large f(x)\rightarrow 0$

Logistic回归之所以称为Logistic是因为只有两个状态即0和1，这也是数电中的逻辑数即布尔数，那么为什么需要这样的回归呢？因为针对二分类问题，有两个这样的输出是最好不过了，但是具有逻辑性质还有其他函数，为什么就选择这这个函数呢？

现实中确实存在这样的信号，通信专业的同学都知道有一个信号是阶跃函数，该函数在0这一点瞬间改变到1，但是这个信号的瞬间跳跃很难处理，或者说频率太高而无法处理，而sigmod函数很好的处理了高频特性，他虽不是一瞬间改变状态，但是当数很大时很接近了，同时在0的左右处于非线性区间，这对后面的深度学习的激活函数很有用，今天就不深入讲了，等到后面实战深度学习在好好探讨该函数的其他性质。

实现Logistic回归的分类器，我们可以在每个特征上都乘以一个回归系数，然后所有的结果相加，将这个总和代入上面的sigmod函数中，进而得到0~1的数值，把大于0.5 的数据分为1类，把小于0.5的分为0类，所以Logistic回归也是一种概率估计。

确定好分类器后，剩下的就是找到一组最佳回归系数，这个回归系数如何找？这属于优化问题，优化问题，经常使用的是梯度下降算法，在上篇的博客中，详细的探讨了什么是梯度，为什么梯度总是沿着函数增加的方向，梯度下降又是什么？在上篇博客中详细的解说了，不懂的可以查看我的这篇博客。

我们知道了，所谓梯度其实就是一阶函数的一阶偏导所组成的向量，因此我们只需要求出一阶偏导，代入x，梯度就找到了，但是呢我们的函数是含有未知数的即 $\large z = w_{0}x_{0}+w_{1}x_{1}+w_{2}x_{2}+.....+w_{n}x_{n}$ ，其中【 $\large w_{0},w_{1},,,,,w_{n}$ 】是未知数

，有未知数怎么求导，又怎么求该点的梯度呢？这时候就需要我们概率论的方面的知识了即最大释然估计了，这个先不展开讲了，以后自然语言处理还会大量的使用最大释然法，到那里在深入总结，想知道的可以自行学习一下，我直接给出最大释然的推倒工程的公式了：

这个公式学过概率论的想必大家不陌生把，不懂的去百度，搞懂什么是释然估计，有什么用？什么条件下使用，这个在自然语言处理里经常使用的，有时间我单独写一篇释然估计方面的博客。废话不多说了，继续往下：

先解释一下上面的符号意义，如果知道释然估计的同学，应该都能理解所谓的 $\large \Theta$ 其实就是我们要求的权值向量了，因为最大释然估计的意义就在于找到一组参数 $\large \Theta$ ，使得发生的概率最大，例如Logistic回归的分为0或者1的概率最大，那既然已经求得表达式了。此时就可以求梯度了，根据上一篇的梯度理解可知对 $\large \Theta$ 求偏导就好了：

需要解释一下，下面属于链式求导。

到这里梯度的上升的理论说明就结束了，现在对比一下关键代码进行详解：

 h = sigmoid(datamattrix.dot(weights))
 error = (labelmat - h)
weights = weights + alpha * (datamattrix.transpose() @ error)

其中error = (labelmat - h)就是上式中的 $\large y^{(i)}-h_{\Theta }(x^{i})$ 了，而datamattrix.transpose()就是 $\large x_{j}^{(i)}$ 了，alpha就是步进系数了，结果很简单，代码也很简单，但是得到这个结果的过程不简单，虽然我们可以不用理解这些过程，但是理解原理会使你走向更高的高度，反之永远是个码农，最可怕的是当你移植别人的代码时，如果你不懂原理，你敢尝试修改代码吗？即使你可以修改代码，但是调优的过程也是很可怕的，因为你没有理解本质的东西，如果原理你懂了，调优就很容易了，另外就是开源代码那么多，我为什么还要写算法呢？不是想使用自己写的代码进行工作，想知道这个算法的实现过程，从理论到实践的转换是如何了，一旦搞明白这些了，以后调优也就知道如何下手了，您说呢？

还需强调一下梯度下降算法，其实主要区别就是加一个负号，这个符号的可以在这个方面体现，这是上升的 $\large y^{(i)}-h_{\Theta }(x^{i})$ ，即标签值减去预测值为上升，，下降的话，把二者调换位置就可以了。如果以后遇到梯度下降发现别人没添加负号啊，其实隐藏在这个式子里了 $\large h_{\Theta }(x^{i}) - y^{(i)}$

至于随机的就不解释了，很简单，不是所有的样本都参与训练，只是抽取一部分进行训练。

下面是机器学习实战手写代码：

#!/usr/bin/env/python
# -*- coding: utf-8 -*-
# Author: 赵守风
# File name: log_regres.py
# Time:2018/10/9
# Email:[email protected]

import numpy as np


# 加载数据使用
def load_data_set():
    data_mat = []
    label_mat = []
    fr = open('testSet.txt') # 数据为（100,3）
    for line in fr.readlines():
        lines = line.strip().split()
        # 把数据转换成列表字符串形式，strip只能删除开头和结尾的字符，默认删除两边的空白符，例如：/n, /r, /t, ' '
        # split切片，默认为所有的空字符，包括空格、换行(\n)、制表符(\t)等
        data_mat.append([1.0, float(lines[0]), float(lines[1])])  # 此时data的维度还是（100,3）
        label_mat.append(int(lines[2]))  # 标签维度为1行100列
    return data_mat, label_mat

# sigmoid函数
def sigmoid(inx):
    return 1.0/(1 + np.exp(- inx))


# 梯度提升算法
def grad_ascent(data_mat_in, class_labels):
    datamattrix = np.mat(data_mat_in)  # 转换为numpy可以处理的数据类型
    labelmat = np.mat(class_labels).transpose()  # 100行1列
    m,n = np.shape(datamattrix)  # 得到数组的维度100,3
    print(m, n)
    alpha = 0.001
    maxcycles = 500
    weights = np.ones((n, 1))  # 权值为（3,1）的，初始为1
    for k in range(maxcycles):
        # 在这里会出错，在python3中的矩阵运算为mat1.dot(mat2)或者是mat1@mat2
        h = sigmoid(datamattrix.dot(weights))  # 此时为矩阵计算（100,3）*（3，1）因此会得到（100,1）维度的矩阵
        error = (labelmat - h)    # 计算差值，这应该是最小二乘法啊？，但是为什么会是梯度，晚点博客详解
        weights = weights + alpha * (datamattrix.transpose() @ error)  # 矩阵相乘，和上面一样的错误
        # 这一句是这段代码最不好理解的，，其实很简单，首先要明确，weights的维度为（3,1），而alpha为数值常数，
        # datamattrix的维度为（100,3）的，经过转置以后为（3,100），而error为（100,1）
        # 因此datamattrix.transpose() * error的维度就是（3,1）的，从数据意义解释一下，因为error是训练值和真实值
        # 的差，此时有100行一列，即每个样本对应一个误差值，然后和原始数据相乘的意义就是梯度了，因为梯度的基本
        # 形式为：datamattrix.transpose() * error或者是datamattrix.transpose() * (labelmat - h)
    return weights

# 画图
def plotbestfit(weights):
    import matplotlib.pyplot as plt
    datamat, labelmat = load_data_set()
    dataarr = np.array(datamat)
    n = np.shape(datamat)[0]
    xcord1 = []; ycord1 = []
    xcord2 = []; ycord2 = []
    for i in range(n):
        if int(labelmat[i]) == 1:
            xcord1.append(dataarr[i, 1]);
            ycord1.append(dataarr[i, 2])
        else:
            xcord2.append(dataarr[i, 1]);
            ycord2.append(dataarr[i, 2])
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')
    ax.scatter(xcord2, ycord2, s=30, c='blue')
    x = np.arange(-3.0, 3.0, 0.1)
    # 画出直线，weights[0]*1.0+weights[1]*x+weights[2]*y=0
    y = (-weights[0] - weights[1] * x) / weights[2]
    ax.plot(x, y.transpose()) # 出错，原因是维度不对，需要转置一下
    plt.xlabel('X1')
    plt.ylabel('X2')
    plt.show()

本人不喜欢这种自己画图的风格，需要自己敲代码，我使用另外一种画图工具seaborn画，也是基于matplotlib的更高级的画图接口函数。

data = pd.read_table('testSet.txt', names=['x1','x2','labely']) # 把数据转换成dataframe类型数据，共后面的画图使用
dataarr, labelmat = load_data_set() #调用上面写的读取数据函数，共训练使用
weights = grad_ascent(dataarr, labelmat) # 调用上面的函数，返回权值

sns.relplot(x='x1', y='x2',data=data,hue='labely') # 先画散点图，这里先使用relplot函数进行画，后面使用专门的回归函数作对比
# 和 机器学习实战一样
x = np.arange(-3.0, 3.0, 0.1)
# 画出直线，weights[0]*1.0+weights[1]*x+weights[2]*y=0
y = (-weights[0] - weights[1] * x) / weights[2]
plt.plot(x, y.transpose())  # 把图形添加到图上即可
plt.show()

使用seaborn画图自带的回归和使用自己写的对比一下，红色是函数自带的回归，蓝色是自己写的函数的回归

sns.regplot(x='x1', y='x2',data=data,color='red',marker='x')
x = np.arange(-3.0, 3.0, 0.1)
y = (-weights[0] - weights[1] * x) / weights[2]
plt.plot(x, y.transpose()) 
plt.show()

sns.lmplot(x='x1', y='x2',data=data,hue='labely',height=8,)
x = np.arange(-3.0, 3.0, 0.1)
y = (-weights[0] - weights[1] * x) / weights[2]
plt.plot(x, y.transpose()) 
plt.show()

随机梯度上升法：

调试了一个多小时，问题出现在数据类型不一致，首先传进来的数据是list类型，可以查看加载
数据的返回值，而传进来以后呢，定义的weights是numpy数组型的，他们是不同的数据格式，
而且他们肯定不能进行计算处理的，报错千奇百怪，还有就是每次计算只计算一个样本，不是矩阵，
上面那个是矩阵计算，他们的计算方式也不同，需要格外留意
同过这次会加深理解列表、np.narray、pd.Series、pd.Datafram的数据类型的重要区别

# 随机梯度上升算法，即不全部加载数据，而是分批次加载，好处是当数据量很大时，这样做计算量降低
def stoc_gra_ascent0(datamatrix, classlabels):
    datamatrix = np.array(datamatrix)  # 出错原因相同，类型不匹配
    m,n = np.shape(datamatrix)
    alpha = 0.01
    weights = np.array([1,1,1])
    # print('weights', weights)
    for i in range(m):
       #  print('datamatrix[i] * weights = ',datamatrix[i] * weights)
        h = sigmoid(np.sum(datamatrix[i] * weights))  # 每次运行一个样本
        error = classlabels[i] - h
       #  print("error : ",error)
        weights = weights + alpha * error * datamatrix[i]
    return weights
# 调试了一个多小时，问题出现在数据类型不一致，首先传进来的数据是list类型，可以查看加载
# 数据的返回值，而传进来以后呢，定义的weights是numpy数组型的，他们是不同的数据格式，
# 而且他们肯定不能进行计算处理的，报错千奇百怪，还有就是每次计算只计算一个样本，不是矩阵，
# 上面那个是矩阵计算，他们的计算方式也不同，需要格外留意
# 同过这次会加深理解列表、np.narray、pd.Series、pd.Datafram的数据类型的重要区别

sns.lmplot(x='x1', y='x2',data=data,hue='labely',height=8,)
weights = stoc_gra_ascent0(dataarr, labelmat)
x = np.arange(-3.0, 3.0, 0.1)
y = (-weights[0] - weights[1] * x) / weights[2]
plt.plot(x, y.transpose(),color='red') 
plt.show()

回归系数对比

def stoc_gra_ascent0(datamatrix, classlabels):
    datamatrix = np.array(datamatrix)  # 出错原因相同，类型不匹配
    m,n = np.shape(datamatrix)
    alpha = 0.01
    weights = np.array([1,1,1])
    weights_temp = []
    i_temp = []
    for j in range(5): # 增加迭代次数，后面就是通过这里进行增加迭代次数的，现在次数为5*m = 5*100 =500次
        for i in range(m):
            h = sigmoid(np.sum(datamatrix[i] * weights))  # 每次运行一个样本
            error = classlabels[i] - h
            weights = weights + alpha * error * datamatrix[i]
           # 收集权值变化信息，和迭代次数
            weights_temp.append(weights)
            i_temp.append(j*m+i)
    return weights, weights_temp, i_temp

调用函数打印信息


dataarr, labelmat = log_regres.load_data_set()
weights , weights_temp ,i_temp= log_regres.stoc_gra_ascent0(dataarr, labelmat)
data = pd.DataFrame(weights_temp, columns=['x0','x1','x2']) # 把数据转化为pandas格式
data['i'] = i_temp # 把迭代次数也添加进去，目的是容易画图呀，不加进去还有写for循环
print(data.head()) # 看前5行数据
# 下面三句是画回归图的
x = np.arange(-3.0, 3.0, 0.1)
y = (-weights[0] - weights[1] * x) / weights[2]
log_regres.plotbestfit(weights)

# 下面是画权值变化图的
plt.subplot(3, 1, 1)
plt.plot(data['i'], data['x0'])
plt.xlabel('i')
plt.ylabel('X0_w')

plt.subplot(3, 1, 2)
plt.plot(data['i'], data['x1'])
plt.xlabel('i')
plt.ylabel('X1_w')

plt.subplot(3, 1, 3)
plt.plot(data['i'], data['x2'])
plt.xlabel('i')
plt.ylabel('X2_w')
plt.show()

print(data.head()) # 看前5行数据

x0 x1 x2 i
0 0.990000 1.000176 0.859469 0
1 0.990266 0.999805 0.860708 1
2 0.980294 1.007306 0.795506 2
3 0.970342 1.020466 0.724320 3
4 0.960342 1.016233 0.613782 4

迭代次数增加到5000次：

从增加迭代次数发现，迭代次数越多，分类越准确，同时权值趋于稳定。大家可以试试多迭代几次看看。

改进的随机梯度上升算法

# 改进梯度上升算法
def stoc_gra_ascent1(datamatrix, classlabels, numiter=50):
    datamatrix = np.array(datamatrix)  # 出错原因相同，类型不匹配
    m,n = np.shape(datamatrix)
    alpha = 0.01
    weights = np.array([1,1,1])
    weights_temp = []
    i_temp = []
    for j in range(numiter):
        dataindex = range(m)  # 获取数据的索引范围
        for i in range(m):
            alpha = 4/(1.0+j+i)+0.01  # 随着迭代次数的增加，alpha的值也会改变，且不是线性下降的，同时该参数
            # 不会降低为0，这样可以很好的处理系数波动
            randindex = int(np.random.uniform(0,len(dataindex)))
            # 获取索引范围内的任意一个值
            h = sigmoid(np.sum(datamatrix[randindex] * weights))  # 每次运行一个样本，这个样本是上面代码随机选取到的
            error = classlabels[randindex] - h
            weights = weights + alpha * error * datamatrix[randindex]
           # 收集权值变化信息，和迭代次数
            weights_temp.append(weights)
            i_temp.append(j*m+i)
            del(list(dataindex)[randindex])  # 删除这使用的值
            # TypeError: 'range' object doesn't support item deletion出错，原因是需要强制类型转换
    return weights, weights_temp, i_temp



# 调用画图
dataarr, labelmat = log_regres.load_data_set()
weights , weights_temp ,i_temp= log_regres.stoc_gra_ascent1(dataarr, labelmat)
data = pd.DataFrame(weights_temp, columns=['x0','x1','x2']) # 把数据转化为pandas格式
data['i'] = i_temp # 把迭代次数也添加进去，目的是容易画图呀，不加进去还有写for循环
print(data.head()) # 看前5行数据
# 下面三句是画回归图的
x = np.arange(-3.0, 3.0, 0.1)
y = (-weights[0] - weights[1] * x) / weights[2]
log_regres.plotbestfit(weights)

# 下面是画权值变化图的
plt.subplot(3, 1, 1)
plt.plot(data['i'], data['x0'])
plt.xlabel('i')
plt.ylabel('X0_w')

plt.subplot(3, 1, 2)
plt.plot(data['i'], data['x1'])
plt.xlabel('i')
plt.ylabel('X1_w')

plt.subplot(3, 1, 3)
plt.plot(data['i'], data['x2'])
plt.xlabel('i')
plt.ylabel('X2_w')
plt.show()

正确率明显提升了，seaborn就不画了，和前面差不多，有兴趣的同学可以多画画

下面给出机器学习实战的示例：从疝气病症预测病马死亡率

import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt

h_data_train = pd.read_table('horse-colic.data.txt',sep='\s+',header=None, na_values=['NULL']) # 载入原始数据
# 可以到这个网站下载原始数据https://archive.ics.uci.edu/ml/datasets/Horse+Colic

h_data_train.shape # 查看数据维度，该数据维度为(300, 28)，即300个数据，28个特征

h_data_train = h_data_train.replace('?',np.nan) # 把空缺值使用nan代替
h_data_train.head()# 查看数据 
	0	1	2	3	4	5	6	7	8	9	...	18	19	20	21	22	23	24	25	26	27
0	2	1	530101	38.50	66	28	3	3	NaN	2	...	45.00	8.40	NaN	NaN	2	2	11300	0	0	2
1	1	1	534817	39.2	88	20	NaN	NaN	4	1	...	50	85	2	2	3	2	2208	0	0	2
2	2	1	530334	38.30	40	24	1	1	3	1	...	33.00	6.70	NaN	NaN	1	2	0	0	0	1
3	1	9	5290409	39.10	164	84	4	1	6	2	...	48.00	7.20	3	5.30	2	1	2208	0	0	1
4	2	1	530255	37.30	104	35	NaN	NaN	6	2	...	74.00	7.40	NaN	NaN	2	2	4300	0	0	2
5 rows × 28 columns

horse_colic_train = h_data_train.fillna(0) # 把空缺值使用0值填充
data = horse_colic_train.dropna() # 把还没有处理完的空缺值剔除
data.head()
	0	1	2	3	4	5	6	7	8	9	...	18	19	20	21	22	23	24	25	26	27
0	2	1	530101	38.50	66	28	3	3	0	2	...	45.00	8.40	0	0	2	2	11300	0	0	2
1	1	1	534817	39.2	88	20	0	0	4	1	...	50	85	2	2	3	2	2208	0	0	2
2	2	1	530334	38.30	40	24	1	1	3	1	...	33.00	6.70	0	0	1	2	0	0	0	1
3	1	9	5290409	39.10	164	84	4	1	6	2	...	48.00	7.20	3	5.30	2	1	2208	0	0	1
4	2	1	530255	37.30	104	35	0	0	6	2	...	74.00	7.40	0	0	2	2	4300	0	0	2
5 rows × 28 columns

data.shape # 在查看数据维度为(300, 28)
data.to_csv('horse_train.csv') # 导出数据，可以是txt，使用data.to_table（）即可

上面处理的是训练数据，测试数据也是一样的，不过作者的数据只有22个特征，不知道去掉了哪些特征，也没去仔细分析，所以下面使用的还是作者处理好的数据，如果知道哪些特征，处理他们还是很简单的

数据预处理就结束了，下面给出测试代码，但是需要说明的几处就是，不能照搬上面的代码，需要修改一下代码，因为上面代码我插入了画权值的图形的数据代码，需要修改一下，大家务必小心，错误基本上是维度不对，相信的大家应该可以解决。

#!/usr/bin/env/python
# -*- coding: utf-8 -*-
# Author: 赵守风
# File name: log_regres.py
# Time:2018/10/9
# Email:[email protected]

import numpy as np
import  matplotlib.pyplot as plt


# 加载数据使用
def load_data_set():
    data_mat = []
    label_mat = []
    fr = open('testSet.txt') # 数据为（100,3）
    for line in fr.readlines():
        lines = line.strip().split()
        # 把数据转换成列表字符串形式，strip只能删除开头和结尾的字符，默认删除两边的空白符，例如：/n, /r, /t, ' '
        # split切片，默认为所有的空字符，包括空格、换行(\n)、制表符(\t)等
        data_mat.append([1.0, float(lines[0]), float(lines[1])])  # 此时data的维度还是（100,3）
        label_mat.append(int(lines[2]))  # 标签维度为1行100列
    return data_mat, label_mat

# sigmoid函数
def sigmoid(inx):
    return 1.0/(1 + np.exp(- inx))


# 梯度提升算法
def grad_ascent(data_mat_in, class_labels):
    datamattrix = np.mat(data_mat_in)  # 转换为numpy可以处理的数据类型
    labelmat = np.mat(class_labels).transpose()  # 100行1列
    m,n = np.shape(datamattrix)  # 得到数组的维度100,3
    print(m, n)
    alpha = 0.001
    maxcycles = 500
    weights = np.ones((n, 1))  # 权值为（3,1）的，初始为1
    for k in range(maxcycles):
        # 在这里会出错，在python3中的矩阵运算为mat1.dot(mat2)或者是mat1@mat2
        h = sigmoid(datamattrix.dot(weights))  # 此时为矩阵计算（100,3）*（3，1）因此会得到（100,1）维度的矩阵
        error = (labelmat - h)    # 计算差值，这应该是最小二乘法啊？，但是为什么会是梯度，晚点博客详解
        weights = weights + alpha * (datamattrix.transpose() @ error)  # 矩阵相乘，和上面一样的错误
        # 这一句是这段代码最不好理解的，，其实很简单，首先要明确，weights的维度为（3,1），而alpha为数值常数，
        # datamattrix的维度为（100,3）的，经过转置以后为（3,100），而error为（100,1）
        # 因此datamattrix.transpose() * error的维度就是（3,1）的，从数据意义解释一下，因为error是训练值和真实值
        # 的差，此时有100行一列，即每个样本对应一个误差值，然后和原始数据相乘的意义就是梯度了，因为梯度的基本
        # 形式为：datamattrix.transpose() * error或者是datamattrix.transpose() * (labelmat - h)
    return weights

def plotbestfit(weights):
    import matplotlib.pyplot as plt
    datamat, labelmat = load_data_set()
    dataarr = np.array(datamat)
    n = np.shape(datamat)[0]
    xcord1 = []; ycord1 = []
    xcord2 = []; ycord2 = []
    for i in range(n):
        if int(labelmat[i]) == 1:
            xcord1.append(dataarr[i, 1]);
            ycord1.append(dataarr[i, 2])
        else:
            xcord2.append(dataarr[i, 1]);
            ycord2.append(dataarr[i, 2])
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')
    ax.scatter(xcord2, ycord2, s=30, c='blue')
    x = np.arange(-3.0, 3.0, 0.1)
    y = (-weights[0] - weights[1] * x) / weights[2]
    ax.plot(x, y.transpose()) # 出错，原因是维度不对，需要转置一下
    plt.xlabel('X1')
    plt.ylabel('X2')
    plt.show()

# 随机梯度上升算法，即不全部加载数据，而是分批次加载，好处是当数据量很大时，这样做计算量降低
def stoc_gra_ascent0(datamatrix, classlabels):
    datamatrix = np.array(datamatrix)  # 出错原因相同，类型不匹配
    m,n = np.shape(datamatrix)
    alpha = 0.01
    weights = np.array([1,1,1])
    weights_temp = []
    i_temp = []
    for j in range(200):
        for i in range(m):
            h = sigmoid(np.sum(datamatrix[i] * weights))  # 每次运行一个样本
            error = classlabels[i] - h
            weights = weights + alpha * error * datamatrix[i]
           # 收集权值变化信息，和迭代次数
        weights_temp.append(weights)
        i_temp.append(j)
    return weights, weights_temp, i_temp
# 调试了一个多小时，问题出现在数据类型不一致，首先传进来的数据是list类型，可以查看加载
# 数据的返回值，而传进来以后呢，定义的weights是numpy数组型的，他们是不同的数据格式，
# 而且他们肯定不能进行计算处理的，报错千奇百怪，还有就是每次计算只计算一个样本，不是矩阵，
# 上面那个是矩阵计算，他们的计算方式也不同，需要格外留意
# 同过这次会加深理解列表、np.narray、pd.Series、pd.Datafram的数据类型的重要区别


# 改进梯度上升算法
def stoc_gra_ascent1(datamatrix, classlabels, numiter=50):
    datamatrix = np.array(datamatrix)  # 出错原因相同，类型不匹配
    m,n = np.shape(datamatrix)
    alpha = 0.01
    weights = np.ones(n)
    weights_temp = []
    i_temp = []
    for j in range(numiter):
        dataindex = range(m)  # 获取数据的索引范围
        for i in range(m):
            alpha = 4/(1.0+j+i)+0.01  # 随着迭代次数的增加，alpha的值也会改变，且不是线性下降的，同时该参数
            # 不会降低为0，这样可以很好的处理系数波动
            randindex = int(np.random.uniform(0,len(dataindex)))
            # 获取索引范围内的任意一个值
            h = sigmoid(np.sum(datamatrix[randindex] * weights))  # 每次运行一个样本，这个样本是上面代码随机选取到的
            error = classlabels[randindex] - h
            weights = weights + alpha * error * datamatrix[randindex]
           # 收集权值变化信息，和迭代次数
            weights_temp.append(weights)
            i_temp.append(j*m+i)
            del(list(dataindex)[randindex])  # 删除这使用的值
            # TypeError: 'range' object doesn't support item deletion出错，原因是需要强制类型转换
    return weights, weights_temp, i_temp
    # return weights   # 需要修改，原因是从疝气病症预测病马死亡率调用会出错，


#------------------------------从疝气病症预测病马死亡率------------------------------------------------#
# sigmod判断
def classifyvector(inx, weights):
    prob = sigmoid(sum(inx * weights))
    if prob > 0.5:
        return 1.0
    else:
        return 0


def colic_test():
    fr_train = open('horseColicTraining.txt')
    fr_test = open('horseColicTest.txt')
    training_set = []
    training_labels = []
    for line in fr_train.readlines():
        currline = line.strip().split('\t')
        linearr = []
        for i in range(21):
            linearr.append(float(currline[i]))
        training_set.append(linearr)
        training_labels.append(float(currline[21]))

    train_weights, weights_temp, i_temp = stoc_gra_ascent1(np.array(training_set), np.array(training_labels), 500) # 前面为了画图返回的参数
    errorcount = 0
    numtestvec = 0.0
    for line in fr_test.readlines():
        numtestvec += 1.0
        linearr = []
        currline = line.strip().split('\t')
        for i in range(21):
            linearr.append(float(currline[i]))
        if int(classifyvector(np.array(linearr), np.array(train_weights))) != int(currline[21]):  # 出错
            errorcount += 1.0
    errorrate = (float(errorcount) / numtestvec)
    print('错误率为： ', errorrate)
    return errorrate,weights_temp, i_temp 

def multitest():
    numtests = 10
    errorsum = 0.0
    for k in range(numtests):
        errorrate_tep, weights_temp, i_temp = colic_test()
        errorsum += errorrate_tep

    print('%d 次迭代后，平均错误率为： %f' % (numtests, errorsum/float(numtests)))

上面是整个可执行的代码，在jupyter notebook可运行。

multitest()

执行该函数后输出结果为：

错误率为：  0.2537313432835821
错误率为：  0.31343283582089554
错误率为：  0.3880597014925373
错误率为：  0.26865671641791045
错误率为：  0.2537313432835821
错误率为：  0.34328358208955223
错误率为：  0.3283582089552239
错误率为：  0.23880597014925373
错误率为：  0.2537313432835821
错误率为：  0.26865671641791045
10 次迭代后，平均错误率为： 0.291045

大家可以尝试把图画出来。

你可能感兴趣的:(机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本