压垮草的骆驼

深度学习——神经网络的学习

前言

神经网络的学习，这里所说的**“学习”是指从训练数据中自动获取最优权重参数的过程。为了使神经网络能进行学习，将引入损失函数这一指标。而学习的目的就是以该损失函数为基准**，找出能使它的值达到最小的权重参数。为了找出尽可能小的损失函数的值，本章我们将介绍利用了函数斜率的梯度法。

从数据中学习

神经网络的特征就是可以从数据中学习。所谓“从数据中学习”，是指可以由数据自动决定权重参数的值。从前文“感知机的学习”中，我们可以手动设置只有3个参数的神经网络，而在真是的神经网络中，参数成千上万，因此通过对神经网络的学习，利用数据决定参数值的方法。
（对于线性可分问题，可以通过有限次数的学习，实现自动学习，而非线性的问题无法通过自动学习来完成）

数据驱动

①数据是机器学习的核心
②神经网络或深度学习更能比机器学习方法更能避免人为介入
以“识别手写数字”为例子，如何识别数字“5”

对比机器学习和深度学习的两种方案：

机器学习：
先从图像中提取特征量，再用机器学习技术学习这些特征量的模式。这里所说的“特征量”是指可以从输入数据（输入图像）中准确地提取本质数据（重要的数据）的转换器。**图像的特征量通常表示为向量的形式。**在计算机视觉领域，常用的特征量包括SIFT、SURF和HOG等。使用这些特征量将图像数据转换为向量，然后对转换后的向量使用机器学习中的SVM、KNN等分类器进行学习。将图像转换为向量时使用的特征量仍是由人设计的。对于不同的问题，必须使用合适的特征量（必须设计专门的特征量）
————————————————————————
深度学习：
可以看到，使用此方法没有人为的介入。
深度学习有时也称为端到端机器学习，这里所说的端到端是指从一端到另一端的意思，也就是从原始数据（输入）中获得目标结果（输出）的意思。
**神经网络的优点是对所有的问题都可以用同样的流程来解决。**不管要求解的问题是识别5，还是识别狗，神经网络都是通过不断地学习所提供的数据。也就是说，与待处理的问题无关，神经网络可以将数据直接作为原始数据，进行“端对端”的学习

训练数据和测试数据

机器学习中，一般将数据分为训练数据和测试数据两部分来进行学习和实验等。首先，使用训练数据进行学习，寻找最优的参数；然后，使用测试数据评价训练得到的模型的实际能力。为什么需要将数据分为训练数据和测试数据呢？因为我们追求的是模型的泛化能力。为了正确评价模型的泛化能力，就必须划分训练数据和测试数据。泛化能力是指处理未被观察过的数据（不包含在训练数据中的数据）的能力。获得泛化能力是机器学习的最终目标。比如，在识别手写数字的问题中，泛化能力可能会被用在自动读取明信片的邮政编码的系统上。此时，手写数字识别就必须具备较高的识别“某个人”写的字的能力。注意这里不是“特定的某个人写的特定的文字”，而是“任意一个人写的任意文字”。如果系统只能正确识别已有的训练数据，那有可能是只学习到了训练数据中的个人的习惯写法。
因此，仅仅用一个数据集去学习和评价参数，是无法进行正确评价的。
这样会导致可以顺利地处理某个数据集，但无法处理其他数据集的情况。只对某个数据集过度拟合的状态称为过拟合（over fitting）。避免过拟合也是机器学习的一个重要课题。（监督数据又称为训练数据）

损失函数

神经网络的学习通过某个指标表示现在的状态。然后，以这个指标为基准，寻找最优权重参数。神经网络以某个指标为线索寻找最优权重参数。神经网络的学习中所用的指标称为损失函数（loss function）。这个损失函数可以使用任意函数，但一般用均方误差和交叉熵误差等。
注：损失函数是表示神经网络性能“恶劣程度”的指标。

均方误差

这里，yk是表示神经网络的输出，tk表示监督数据，k表示数据的维数。
比如，在手写数字识别的例子中，yk、tk是由如下10个元素构成的数据。

y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

神经网络的输出y是softmax函数的输出。由于softmax函数的输出可以理解为概率，因此上例表示“0”的概率是0.1，“1”的概率是0.05，“2”的概率是0.6等。t是监督数据，将正确解标签设为1，其他均设为0。标签“2”为1，表示正确解是“2”（对应正确解标签为2）。
将正确解标签表示为1，其他标签表示为0的表示方法称为one-hot表示
根据公式，均方误差会计算神经网络的输出和正确解监督数据的各个元素之差的平方，再求总和。用python实现均方误差公式如下：

def mean_squared_error(y, t):
 return 0.5 * np.sum((y-t)**2)

import numpy as np
def mean_squared_error(y, t):
    return 0.5 * np.sum((y - t)**2)
#设“2”为正确解
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
#设“2”的概率最高
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
print(mean_squared_error(np.array(y),np.array(t) )) 
#设“7”的概率最高
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(mean_squared_error(np.array(y),np.array(t) ))

通过均方误差公式的实验结果可以得出，第一个例子的损失函数的值更小，和监督数据（训练数据）的误差较小，显示出第一个例子的输出结果与监督数据更吻合。
———————————————————————————————

交叉熵误差

log表示以e为底数的自然对数（log e）。
tk中只有正确解标签的索引为1，其他均为0（one-hot表示）。
因此，式（4.2）实际上只计算对应正确解标签的输出的自然对数。
假设正确解标签的索引是“2”，与之对应的神经网络的输出是0.6，则交叉熵误差是−log 0.6 = 0.51。
交叉熵误差的值是由正确解标签所对应的输出结果决定的。

　自然对数y = log x的图像；
　当输出结果越接近“1”时（也就是softmax函数对应的概率越高），则该log x图像越接近“0”，换句话说误差接近0。
　使用python来实现交叉熵误差。

def cross_entropy_error(y, t):
 	delta = 1e-7
 return -np.sum(t * np.log(y + delta))

函数内部在计算np.log时，加上了一个微小值delta。这是因为，当出现np.log(0)时，np.log(0)会变为负无大的，这样一来就会导致后续计算无法进行。

def cross_entropy_error(y, t):
    delta = 1e-7
    return -np.sum(t * np.log(y + delta))
#设“2”为正确解
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
#设“2”的概率最高
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
print(cross_entropy_error(np.array(y),np.array(t)))
#设“7”的概率最高
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(cross_entropy_error(np.array(y),np.array(t)))

通过该实验得到的结果与均方误差相同，当正确解和对应索引的输出值“配对”时，误差最小。

mini—batch学习

计算损失函数时必须将所有的训练数据作为对象。也就是说，如果训练数据有100个的话，我们就要把这100个损失函数的总和作为学习的指标。前面损失函数的例子考虑的是针对单个数据的值，如果要考虑所有训练数据的损失函数总和，以交叉熵误差为例，可以写成下面的（4.3）
假设数据有N个，tnk表示第n个数据的第k个元素的值（ynk是神经网络的输出，tnk是监督数据）。通过除以N，可以求单个数据的“平均损失函数”。通过这样的平均化，可以获得和训练数据的数量无关的统一指标。
解决了大数据量的情况下也可以求得单个数据的平均损失函数。
当碰到海量数据时，我们会从数据中选出一部分，作为全部数据的“近似”，神经网络的学习也是从训练数据中选出一批数据（称为mini-batch），这种方式成为 mini-batch学习。
———————————————————————————————
现在做的是如何从训练数据中随机抽取10笔数据，可以使用NumPy的np.random.choice()。

train_size = x_train.shape[0]
batch_size = 10
#np.random.choice()可以从指定的数字中随机选择想要的数字。
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]

我们只需指定这些随机选出的索引，取出mini-batch，然后使用这个mini-batch计算损失函数即可。

mini-batch版交叉熵误差的实现

我们来实现一个可以同时处理单个数据和批量数据（数据作为batch集中输入）两种情况的函数。

def cross_entropy_error(y, t):
    #y的维度为1时，即求单个数据的交叉熵误差时，需要改变数据的形状。
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size
#设“2”为正确解
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
#设“2”的概率最高
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
cross_entropy_error(np.array(y),np.array(t))
#设“2”为正确解
t = [[0, 0, 1],[0,0,0],[0,0,0]]
#设“2”的概率最高
y = [[0.1, 0.05, 0.9], [0.0, 0.05, 0.1], [0.0, 0.1, 0.05]]
cross_entropy_error(np.array(y),np.array(t))

上述情况是当监督数据是one-hot形式，下面介绍标签形式（像“2”，“7”这类数字的情况）

def cross_entropy_error(y, t):
 	if y.ndim == 1:
		 t = t.reshape(1, t.size)
 		y = y.reshape(1, y.size)
 	batch_size = y.shape[0]
	return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size

比如当batch_size为5
时，np.arange(batch_size)会生成一个NumPy 数组[0, 1, 2, 3, 4]。因为
t中标签是以[2, 7, 0, 9, 4]的形式存储的，所以y[np.arange(batch_size),
t]能抽出各个数据的正确解标签对应的神经网络的输出（在这个例子中，
y[np.arange(batch_size), t] 会生成 NumPy 数组 [y[0,2], y[1,7], y[2,0],
y[3,9], y[4,4]]）

设定损失函数的原因

“导数”在神经网络中的作用。在神经网络的学习中，寻找最优参数（权重和偏置）时，要寻找使损失函数的值尽可能小的参数。为了找到使损失函数的值尽可能小的地方，需要计算参数的导数（确切地讲是梯度），然后以这个导数为指引，逐步更新参数的值。
什么是“调参”的过程：
假设有一个神经网络，现在我们来关注这个神经网络中的某一个权重参
数。此时，对该权重参数的损失函数求导，表示的是“如果稍微改变这个权重参数的值，损失函数的值会如何变化”。如果导数的值为负，通过使该权重参数向正方向改变，可以减小损失函数的值；反过来，如果导数的值为正，则通过使该权重参数向负方向改变，可以减小损失函数的值。不过，当导数的值为0时，无论权重参数向哪个方向变化，损失函数的值都不会改变，此时该权重参数的更新会停在此处。
———————————————————————————————
为什么不用识别精度作为调参的指标呢？
因为在此情况下，参数的导数绝大多数地方都会变成0。如果以识别精度为指标，即使稍微改变权重参数的值，识别精度可能也不会改变，即使发生改变改变，也会是变化成不连续、离散的值，而不是像，损失函数的值从0.9532变化到0.9532…这样发生连续的变化。这种不连续性和离散性导致不能选择识别精度作为指标。
前文中提到，作为激活函数的阶跃函数也有同样的情况。出于相同的原因，如果使用阶跃函数作为激活函数，神经网络的学习将无法进行。
（阶跃函数的导数在绝大多数地方（除了0以外的地方）均为0。也就是说，如果使用了阶跃函数，那么即便将损失函数作为指标，参数的微小变化也会被阶跃函数抹杀，导致损失函数的值不会产生任何变化。）
对于sigmoid函数作为激活函数时：
不仅函数的输出（竖轴的值）是连续变化的，曲线的斜率（导数）也是连续变化的。也就是说，sigmoid函数的导数在任何地方都不为0。

数值微分

梯度法使用梯度的信息决定前进的方向。将介绍绍梯度是什么、有什么性质等。

导数

导数就是表示某个瞬间的变化量。
用公式表示：

两个注意的地方：
①如何表示h这一个极小量（无限接近于0），在计算机中，当h很小时，会产生舍入误差。
②“真的导数”对应函数在x出的斜率（切线），而计算式求的结果，因为h不可能无限接近0的缘故，因此结果与“切线”在严格意义上不一致。

几个名词
中心差分：函数f在(x + h)和(x − h)之间的差分。
前向差分：(x + h)和x之间的差分。
优化后的导数式用python代码表示：

def numerical_diff(f, x):
	h = 1e-4 # 0.0001
	return (f(x+h) - f(x-h)) / (2*h)

利用微小的差分求导数的过程称为数值微分。而利用数学式的推导求导数的过程，称为“解析性求导”。比如，y=x^2的导数，得到y’=2x，当x=2时，y的导数为4,。

下面来实现一个数值微分：

import numpy as np
import matplotlib.pylab as plt
def function_1(x):
    return 0.01*x**2 + 0.1*x
x = np.arange(0.0, 20.0, 0.1) # 以0.1为单位，从0到20的数组x
y = function_1(x)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.plot(x, y)
plt.show()

函数图像如下：

下面来求x=5和x=10处的导数：

numerical_diff(function_1, 5)
0.1999999999990898
numerical_diff(function_1, 10)
0.2999999999986347

通过数学解析式求导，再带入x=5和x=10，分别得到0.2和0.3，无限近似，误差小到可以认为它们是相等的。
画出函数切线的代码：

import numpy as np
import matplotlib.pylab as plt
def function_1(x):
    return 0.01*x**2 + 0.1*x
def numerical_diff(f, x):
    h = 1e-4 # 0.0001
    return (f(x+h) - f(x-h)) / (2*h)

def tangent_line(f,x):
    k=numerical_diff(f,x)
    b=f(x)-k*x
    return lambda t:k*t+b
x = np.arange(0.0, 20.0, 0.1) # 以0.1为单位，从0到20的数组x
y = function_1(x)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.plot(x, y)
tf=tangent_line(function_1,5)
y2=tf(x)
plt.plot(x,y2)
plt.show()
print("函数在x=5处的导数为：",numerical_diff(function_1,5))

偏导数

def function_2(x):
return x[0]**2 + x[1]2
或者return np.sum(x2)

我们假定向参数输入了一个NumPy数组,先计算NumPy数组中各个元素的平方，再求它们的和。
下面是函数的图像

from mpl_toolkits.mplot3d import Axes3D
import numpy as np
from matplotlib import pyplot as plt

fig = plt.figure()
ax = Axes3D(fig)
x = np.arange(-10, 10, 0.1)
y = np.arange(-10, 10, 0.1)
X, Y = np.meshgrid(x, y) # 网格的创建，生成二维数组
Z=X**2+Y**2
plt.xlabel("x")
plt.ylabel("y")
ax.plot_surface(X, Y, Z, rstride=1, cstride=1)
plt.show()

怎么求偏导数：
拿上述的（4.6）式举例，要求x0=3，x1=4时，关于x0的偏导数。

def function_tmp1(x0):
    return x0*x0+4.0**2
numerical_diff(function_tmp1,3.0)

Out:6.00000000000378
偏导数和单变量的导数一样，都是求某个地方的斜率。不过，偏导数需要将多个变量中的某一个变量定为目标变量，并将其他变量固定为某个值。

梯度

现在，我们希望一起计算x0和x1的偏导数。比如，我们来考虑求x0 = 3, x1 = 4时(x0, x1)的偏导数。另外，像这样的由全部变量的偏导数汇总
而成的向量称为梯度（gradient）。
用python代码实现梯度计算公式

def numerical_gradient(f, x):
    h = 1e-4 # 0.0001
    grad = np.zeros_like(x) # 生成和x形状相同的数组
    for idx in range(x.size):
        tmp_val = x[idx]
 # f(x+h)的计算
        x[idx] = tmp_val + h
        fxh1 = f(x)
        print("---",fxh1)
 # f(x-h)的计算
        x[idx] = tmp_val - h
        fxh2 = f(x)
        print("---",fxh2)
        grad[idx] = (fxh1 - fxh2) / (2*h)
        x[idx] = tmp_val # 还原值
    return grad
def function_2(x):
    return x[0]**2+x[1]**2
numerical_gradient(function_2,np.array([3.0,4.0]))

通过结果可以看到，f（x+h）、f（x-h）的值，以及对应在（3,4）的梯度。
这个梯度意味着什么呢？
这里我们画的是元素值为负梯度的向量（负梯度方向是梯度法中变量的更新方向。）

梯度会指向各点处的函数值降低的方向。更严格地讲，梯度指示的方向
是各点处的函数值减小最多的方向。

梯度法

神经网络也必须在学习时找到最优参数（权重和偏置）。最优参数是指损失函数取最小值时的参数。
注意的是：梯度表示的是各点处的函数值减小最多的方向。无法保证梯度所指的方向就是函数的最小值或者真正应该前进的方向。

知识补充：函数的极小值、最小值以及被称为鞍点（saddle point）的地方，梯度为 0。
极小值是局部最小值，也就是限定在某个范围内的最小值。
鞍点是从某个方向上看是极大值，从另一个方向上看则是极小值的点。
梯度法是要寻找梯度为 0的地方，但是那个地方不一定就是最小值,也有可能是极小值或者鞍点。

虽然梯度的方向并不一定指向最小值，但沿着它的方向能够最大限度地
减小函数的值。
因此要以梯度的信息为线索，决定前进的方向！
在梯度法中，函数的取值从当前位置沿着梯度方向前进一定距离，然后在新的地方重新求梯度，再沿着新梯度方向前进，如此反复，不断地沿梯度方向前进。像这样，通过不断地沿梯度方向前进，逐渐减小函数值的过程就是梯度法（gradient method）。

寻找最小值的梯度法称为梯度下降法。
寻找最大值的梯度法称为梯度上升法。
但是通过反转损失函数的符号，求最小值的问题和求最大值的问题会
变成相同的问题。
一般来说，神经网络（深度学习）中，梯度法主要是指梯度下降法。

以下是用数学式来表示的梯度法：

η表示更新量，在神经网络的学习中，称为学习率。
学习率决定在一次学习中，应该学习多少，以及在多大程度上更新数。
式（4.7）是表示更新一次的式子，这个步骤会反复执行，逐渐减小函数值。
学习率需要事先确定为某个值，比如0.01或0.001。
以下是用python实现的梯度下降法（目的是求得函数的极小值，也可能是最小值）：

def gradient_descent(f, init_x, lr, step_num):
    #参数f是要进行最优化的函数，init_x是初始值，lr是学习率learning rate
    #step_num是梯度法的重复次数。
    #使用这个函数可以求函数的极小值
    x = init_x
    for i in range(step_num):
        grad = numerical_gradient(f, x)
        x -= lr * grad
    return x
init_x=np.array([-3.0,4.0])
#优化的函数是f(x1+x2)=x1^2+x2^2，初始值是[-3.0,4.0],学习率为0.1，下降次数是100
gradient_descent(function_2,init_x,0.1,100)

对于学习率而言，过大或者过小的学习率可能都不一定可以得到一个更好的结果！
学习率这样的参数也称为超参数，需要人工设定而不是像权重参数是通过训练数据获得的，往往超参数需要尝试多个值。

———————————————————————————————

神经网络的梯度

这里所说的梯度是指损失函数关于权重参数的梯度。
有一个只有一个形状为2 × 3的权重W的神经网络，损失函数用L表示。

下面，以一个简单的神经网络为例子，来实现求梯度的代码。
实现一个名为simpleNet的类。

import sys, os
sys.path.append(os.pardir)
import numpy as np
class simpleNet:
    def __init__(self):
        self.W = np.random.randn(2,3) # 用高斯分布进行初始化,随机的权重参数
    def predict(self, x):
        return np.dot(x, self.W)
    def loss(self, x, t):
        z = self.predict(x)
        y = softmax(z)
        loss = cross_entropy_error(y, t)
        return loss

net =simpleNet()
print(net.W)
x=np.array([0.6,0.9])
p=net.predict(x)
print(p)
t=np.array([0,1,0])
#神经网络的损失函数
net.loss(x,t)
def f(W):
    return net.loss(x,t)
dW = numerical_gradient(f, net.W)
print(dW)

学习算法的实现

第一步：mini-batch
从训练数据中随机选出一部分数据，称为mini-batch，我们的目标是减小mini-batch的损失函数的值。
第二步：计算梯度
为了减小mini-batch的损失函数的值，需要求出各个权重参数的梯度，梯度表示损失函数的值减小最多的方向。
第三步： 更新参数
将权重参数沿梯度方向进行微小的更新。
第四步：重复第一二三步
因为这里的数据选择的是mini batch，又称随机梯度下降法（stochastic gradient descent）。
随机梯度下降法一般由一个名为SGD的函数来实现

以下举例一个2层神经网络的类

TwoLayerNet：

import sys, os
sys.path.append(os.pardir)  # 为了导入父目录的文件而进行的设定
from common.functions import *
from common.gradient import numerical_gradient

class TwoLayerNet:

    def __init__(self, input_size, hidden_size, output_size, weight_init_std=0.01):
        # 初始化权重
        self.params = {}
        self.params['W1'] = weight_init_std * np.random.randn(input_size, hidden_size)
        self.params['b1'] = np.zeros(hidden_size)
        self.params['W2'] = weight_init_std * np.random.randn(hidden_size, output_size)
        self.params['b2'] = np.zeros(output_size)

    def predict(self, x):
        W1, W2 = self.params['W1'], self.params['W2']
        b1, b2 = self.params['b1'], self.params['b2']
    
        a1 = np.dot(x, W1) + b1
        z1 = sigmoid(a1)
        a2 = np.dot(z1, W2) + b2
        y = softmax(a2)
        
        return y
        
    # x:输入数据, t:监督数据
    def loss(self, x, t):
        y = self.predict(x)
        
        return cross_entropy_error(y, t)
    
    def accuracy(self, x, t):
        y = self.predict(x)
        y = np.argmax(y, axis=1)
        t = np.argmax(t, axis=1)
        
        accuracy = np.sum(y == t) / float(x.shape[0])
        return accuracy
        
    # x:输入数据, t:监督数据
    def numerical_gradient(self, x, t):
        loss_W = lambda W: self.loss(x, t)
        grads = {}
        grads['W1'] = numerical_gradient(loss_W, self.params['W1'])
        grads['b1'] = numerical_gradient(loss_W, self.params['b1'])
        grads['W2'] = numerical_gradient(loss_W, self.params['W2'])
        grads['b2'] = numerical_gradient(loss_W, self.params['b2'])
        return grads 
    def gradient(self, x, t):
        W1, W2 = self.params['W1'], self.params['W2']
        b1, b2 = self.params['b1'], self.params['b2']
        grads = {}
        batch_num = x.shape[0]
        # forward
        a1 = np.dot(x, W1) + b1
        z1 = sigmoid(a1)
        a2 = np.dot(z1, W2) + b2
        y = softmax(a2)
        # backward
        dy = (y - t) / batch_num
        grads['W2'] = np.dot(z1.T, dy)
        grads['b2'] = np.sum(dy, axis=0)
        da1 = np.dot(dy, W2.T)
        dz1 = sigmoid_grad(a1) * da1
        grads['W1'] = np.dot(x.T, dz1)
        grads['b1'] = np.sum(dz1, axis=0)
        return grads

对于__init__初始化方法。从第1个参数开始，依次表示输入层的神经元数、隐藏层的神经元数、输出层的神经元数。另外，因为进行手写数字识别时，输入图像的大小是784（28 × 28），输出为10个类别，所以指定参数input_size=784、output_size=10，将隐藏层的个数hidden_size设置为一个合适的值即可。
如何设置权重参数的初始值这个问题是关系到神经网络能否成功学习的重要问题。但在此次实验中权重使用符合高斯分布的随机数进行初始化，偏置使用0进行初始化。

mini-batch的实现

所谓mini-batch学习，就是从训练数据中随机选择一部分数据（称为mini-batch），再以这些mini-batch为对象，使用梯度法更新参数的过程。
下面以TwoLayerNet类为对象，使用MNIST数据集进行学习。

import sys, os
sys.path.append(os.pardir)  # 为了导入父目录的文件而进行的设定
import numpy as np
import matplotlib.pyplot as plt
from dataset.mnist import load_mnist

#读入数据
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)

network = TwoLayerNet(input_size=784, hidden_size=50, output_size=10)
# 超参数
iters_num = 10000  # 适当设定循环的次数
train_size = x_train.shape[0]
batch_size = 100
learning_rate = 0.1

train_loss_list = []
train_acc_list = []
test_acc_list = []
# 平均每个epoch的重复次数
iter_per_epoch = max(train_size / batch_size, 1)

for i in range(iters_num):
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = x_train[batch_mask]
    t_batch = t_train[batch_mask]
    
    # 计算梯度
    #grad = network.numerical_gradient(x_batch, t_batch)
    grad = network.gradient(x_batch, t_batch)
    
    # 更新参数
    for key in ('W1', 'b1', 'W2', 'b2'):
        network.params[key] -= learning_rate * grad[key]
    
    loss = network.loss(x_batch, t_batch)
    train_loss_list.append(loss)
    # 计算每个epoch的识别精度
    if i % iter_per_epoch == 0:
        train_acc = network.accuracy(x_train, t_train)
        test_acc = network.accuracy(x_test, t_test)
        train_acc_list.append(train_acc)
        test_acc_list.append(test_acc)
        print("train acc, test acc | " + str(train_acc) + ", " + str(test_acc))

 #绘制图形
markers = {'train': 'o', 'test': 's'}
x = np.arange(len(train_acc_list))
plt.plot(x, train_acc_list, label='train acc')
plt.plot(x, test_acc_list, label='test acc', linestyle='--')
plt.xlabel("epochs")
plt.ylabel("accuracy")
plt.ylim(0, 1.0)
plt.legend(loc='lower right')
plt.show()

基于测试数据的评价

我们确认了通过反复学习可以使损失函数的值
逐渐减小这一事实。不过这个损失函数的值，严格地讲是“对训练数据的某个mini-batch的损失函数”的值。训练数据的损失函数值减小，虽说是神经网络的学习正常进行的一个信号，但光看这个结果还不能说明该神经网络在其他数据集上也一定能有同等程度的表现。
必须确认是否能够正确识别训练数据以外的其他数据，即确认是否会发生过拟合。
过拟合是指，虽然训练数据中的数字图像能被正确辨别，但是不在训练数据中的数字图像却无法被识别的现象。
这里，每经过一个epoch，我们都会记录下训练数据和测试数据的识别精度。

epoch是一个单位。一个 epoch表示学习中所有训练数据均被使用过一次时的更新次数。
比如，对于 10000笔训练数据，用大小为 100笔数据的mini-batch进行学习时，重复随机梯度下降法 100次，所有的训练数据就都被“看过”了,此时，100次就是一个 epoch。

随着epoch的前进（学习的进行），我们发现使用训练数据和测试数据评价的识别精度都提高了，并且，这两个识别精度基本上没有差异（两条线基本重叠在一起）。因此，可以说这次的学习中没有发生过拟合的现象。

总结

①机器学习中使用的数据集分为训练数据和测试数据。
②神经网络用训练数据进行学习，并用测试数据评价学习到的模型的
泛化能力。
③神经网络的学习以损失函数为指标，更新权重参数，以使损失函数
的值减小。
④利用某个给定的微小值的差分求导数的过程，称为数值微分。
⑤利用数值微分，可以计算权重参数的梯度。
⑥数值微分虽然费时间，但是实现起来很简单。下一章中要实现的稍
微复杂一些的误差反向传播法可以高速地计算梯度

参考：

《深度学习入门：基于Python的理论与实现》斋藤康毅

你可能感兴趣的:(深度学习,深度学习,神经网络,学习)

RAG系列（二）：如何优化索引东临碣石82 kotlin android 开发语言
上篇文章总览了RAG的各个环节，这篇我们接着讲第一个环节也就是“索引”环节如何做优化。具体细节“人人都是产品经理”的这篇文章里有非常详细的说明，不过我对微软体系搜索优化了解的多些，看到过的一些优化方法这里没有提到，比如微软的AISearch还有DataverseSemanticSearch里用到一些优化方法这里就没看到。知识搜索是一个可以扣出很多细节的领域，这里做个备考、补充学习过程中的一些体会并
【用Java学习数据结构系列】初识泛型 Gu Gu Study 【用Java学习数据结构系列】java 数据结构机器学习人工智能
看到这句话的时候证明：此刻你我都在努力加油陌生人br/>个人主页：GuGuStudy专栏：用Java学习数据结构系列喜欢的一句话：常常会回顾努力的自己，所以要为自己的努力留下足迹喜欢的话可以点个赞谢谢了。作者：小闭前言好久没有更新文章了，大概断更了20天，想着今天就写一下文章吧！最近也是又温习了一下数据结构，其实之前我写过关于数据结构的一个专栏那个专栏是写了顺序表，链表，栈和队列，但是那时是用C语
软件测试中的AI-为什么它在软件自动化测试中很重要？测试界霄霄软件测试人工智能功能测试自动化测试软件测试程序人生职场和发展
通俗地说，人工智能（AI）是计算机科学的一个领域，它专注于使机器“智能化”。所谓智能，就是使系统能够像人类一样学习和做出决策。因此，人工智能机器将能够学习如何在特定情况下做出反应，然后根据其学习情况在未来场景中做出决策。人工智能（AI）在大多数领域的应用仍处于早期阶段，想要完美运行还需要很长时间。今天的人工智能（AI）技术可以帮助我们完成许多不需要复杂思考的重复性日常任务。接下来，让我们讨论软件测
遥感深度学习过程中图像分割的尺寸对模型训练结果的影响司南锤深度学习遥感深度学习人工智能
1.计算资源与显存占用大尺寸图像：需要更高的显存和计算资源，可能限制训练时的批大小（batchsize），甚至导致无法训练。解决方案：通常将大图裁剪为小尺寸的补丁（patches），例如256x256或512x512。小尺寸图像：显存占用低，但可能丢失全局上下文信息（如大面积地物分布），影响模型对复杂场景的理解。2.模型感受野与上下文信息小尺寸输入：模型感受野受限，可能无法捕捉大范围地物（如河流、
使用小尺寸的图像进行逐像素语义分割训练，出现样本不均衡训练效果问题司南锤深度学习遥感计算机视觉人工智能机器学习
在使用小尺寸图像进行逐像素语义分割训练时，确实可能出现样本不均衡问题，且这种问题可能比大尺寸图像更显著。1.小尺寸图像如何加剧样本不均衡？(1)局部裁剪导致类别分布偏差问题：遥感图像中某些类别（如道路、建筑）可能稀疏分布。小尺寸裁剪后，部分训练样本可能完全不含某些类别（例如一块纯农田的补丁），导致模型对这些类别缺乏学习机会。示例：原图中“道路”占比5%，若裁剪为256x256的小图，部分小图中可能
读书笔记--分布式服务架构对比及优势一望无际的大草原读书笔记服务中心后端读书笔记分布式架构共享服务
本篇是在上一篇的基础上，主要对共享服务平台建设所依赖的分布式服务架构进行学习，主要记录和思考如下，供大家学习参考。随着企业各业务数字化转型工作的推进，之前在传统的单一系统（或单体应用）模式中，每个系统都要做这些公共的功能或模块，比如用户管理，权限认证，日志，邮件，财务等等，随着企业各大应用系统的不断扩展，各垂直业务板块逐步沉淀形成各自的核心业务的数字化能力，提出了基于SOA理念的分布式服务架构，S
06-机器学习-数据预处理不会打代码呜呜呜呜机器学习机器学习人工智能
数据清洗数据清洗是数据预处理的核心步骤，旨在修正或移除数据集中的错误、不完整、重复或不一致的部分，为后续分析和建模提供可靠基础。以下是数据清洗的详细流程、方法和实战示例：一、数据清洗的核心任务问题类型表现示例影响缺失值数值型字段为空（NaN）模型无法处理缺失值，导致训练中断或偏差异常值年龄=200岁，房价=-100万扭曲统计指标（如均值），降低模型泛化性重复数据两行记录完全相同导致模型过拟合，降低
Linux学习笔记（复习版day008） ccnnlxc Liux学习复习笔记 linux 学习笔记
1.僵尸进程僵尸进程（ZombieProcess）是指那些已经终止（即完成执行）的进程，但其父进程尚未读取其退出状态信息的进程。简单来说，僵尸进程的生命周期已经结束，但它的进程描述符仍然存在于系统中，以便父进程能够获取其退出状态。处理：1.top命令查询是否有僵尸进程，此处1zombie表示有一个僵尸进程2.ps-aux|grepZ查询僵尸进程的pid,STAT状态为Z+的即为僵尸进程。3.pst
从零推导线性回归：最小二乘法与梯度下降的数学原理 Echo-Nie 机器学习机器学习线性回归人工智能梯度下降数学推导
欢迎来到我的主页：【Echo-Nie】本篇文章收录于专栏【机器学习】本文所有内容相关代码都可在以下仓库中找到：Github-MachineLearning1线性回归1.1什么是线性回归线性回归是一种用来预测和分析数据之间关系的工具。它的核心思想是找到一条直线（或者一个平面），让这条直线尽可能地“拟合”已有的数据点，通过这条直线，我们可以预测新的数据。eg：假设你想预测房价，你知道房子的大小（面积）
超实用的 30 段 Python 案例（上） Python之栈 python 开发语言
Python是目前最流行的语言之一，它在数据科学、机器学习、web开发、脚本编写、自动化方面被许多人广泛使用。它的简单和易用性造就了它如此流行的原因。如果你正在阅读本文，那么你或多或少已经使用过Python或者对Python感兴趣。在本文中，我们将会介绍30个简短的代码片段，你可以在30秒或更短的时间里理解和学习这些代码片段。1.检查重复元素下面的方法可以检查给定列表中是否有重复的元素。它使用了s
cv python_python里面cv是什么意思 weixin_40004659 cv python
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
Hadoop学习笔记 --- YARN执行流程与工作原理杨鑫newlfe 数据仓库大数据挖掘与大数据应用案例 YARN Hadoop 大数据资源调度数据仓库
一、YARN简述首先介绍一下YARN在Hadoop2.0版本引进的资源管理系统，直接从MapReduceV1演化而来(由于引擎的功能缺陷)；原因是将MapReduce1中的JobTracker的资源管理和作业调度两个功能分开，分别由ResourceManager和ApplicationMaster进行实现；ResourceManager：负责整个集群的资源管理和调度ApplicationMaste
#深度学习：从基础到实践 single_ffish 深度学习 gpt 神经网络生成对抗网络 1024程序员节
深度学习是人工智能领域近年来最为火热的技术之一。它通过构建由多个隐藏层组成的神经网络模型，能够从海量数据中自动学习特征和表征,在图像识别、自然语言处理、语音识别等领域取得了突破性进展。本文将全面介绍深度学习的基础知识、主要算法和实践应用,帮助您快速掌握这一前沿技术。1.深度学习的基础1.1人工神经网络深度学习是基于人工神经网络(ArtificialNeuralNetwork,ANN)的一种机器学习
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析 985小水博一枚呀深度学习地学应用深度学习人工智能
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析文章目录【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析前言一、使用高分6号遥感影像结合深度学习对梦柯冰川的研究方向1.冰川边界自动化提取2.冰川变化动态监测3.冰川分类与分布特征分析二、梦柯冰川（MunkuGlacier）的
TCP/IP协议族 dlz0836 网络 tcp/ip 网络协议
理解常见的网络协议，特别是TCP/IP协议族，对于网络通信的深入学习至关重要。TCP/IP协议族是支撑互联网通信的基础，涉及一系列协议来保证数据在网络上的正确传输。下面，我将对TCP/IP协议的工作原理进行深入浅出的讲解，分为多个部分来解释它的主要协议及其作用。一、TCP/IP协议族概述TCP/IP（TransmissionControlProtocol/InternetProtocol）是一个协
Vue学习第31天——编程式路由导航5种方法详解及案例练习（与声明式路由导航对比）离奇6厘米 vue 学习 javascript vue
目录一、编程式路由导航1、概念2、理解3、用法二、编程式路由导航的5种方法1、push2、replace3、forward4、back5、go三、案例练习四、编程式路由导航与声明式路由导航对比一、编程式路由导航1、概念除了使用创建a标签来定义导航链接，我们还可以借助router的实例方法，通过编写代码来实现。2、理解不借助实现路由跳转3、用法在vue组件中，可以通过$router访问路由实例，因此
练习题 - Django 4.x File 文件上传使用示例和配置方法 Mr数据杨 Python Web开发 django sqlite 数据库
在现代的web应用开发中，文件上传是一个常见的功能，无论是用户上传头像、上传文档，还是其他类型的文件，处理文件上传都是开发者必须掌握的技能之一。Django作为一个流行的Pythonweb框架，提供了便捷的文件上传功能和配置方法。学习如何在Django中实现文件上传，不仅有助于提升编程技能，还能帮助我们更好地理解web应用的开发流程。本次练习题的设计目的是通过真实的生活实例帮助自学编程的用户掌握D
华为机试HJ16：购物单系统的动态规划设计思路剖析Java最优解代码 _JC_Chris 华为动态规划 java 算法数据结构
0.写在前面“华为机试HJ16：购物单”是一道“物品间有依赖关系”的【01背包问题】，属于经典dp问题的变形。对于基础薄弱的同学来说，本题的思维难度不低，建议先了解“普通01背包问题”的基本求解思路——bilibili辅助学习视频（预计学习时间15min）1.题目描述王强决定把年终奖用于购物，他把想买的物品分为两类：主件与附件，附件是从属于某个主件的，下表就是一些主件与附件的例子：主件附件电脑打印
机器学习入门——机器学习基本概念四月是你的机器学习
@机器学习什么是机器学习机器学习(MachineLearning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎简单来说机器学习就是机
基于R-CNN深度学习的无人机目标检测系统：数据集、模型和UI界面的完整实现 2025年数学建模美赛 R-CNN检测系统深度学习 cnn 无人机计算机视觉目标检测人工智能
摘要随着无人机技术的迅猛发展，无人机在军事、农业、环境监测等多个领域的应用日益广泛。无人机目标检测系统的建设成为提升无人机自主飞行和环境感知能力的重要环节。本文将详细介绍如何构建一个基于深度学习的无人机目标检测系统，采用R-CNN（区域卷积神经网络）算法，通过用户界面设计和数据集处理，实现高效的目标检测功能。通过本项目，旨在为无人机目标检测提供一种可行的解决方案，并提高其在复杂环境下的工作效率。目
初识C语言(三) 九离十 C语言 c语言开发语言
感兴趣的朋友们可以留个关注，我们共同交流，相互促进学习。文章目录前言八、函数九、数组（1）数组的定义（2）数组的下标和使用十、操作符（1）算数操作符（2）移位操作符（3）位操作符（4）赋值操作符（5）单目操作符（6）关系操作符（7）逻辑操作符（8）条件操作符（9）逗号表达式（10）下标引用、函数调用和结构成员十一、常见关键字总结前言我们在上个文章学习了，常量变量的作用域，生命周期以及等等，我们了解
python学习系列之logging(一、基础教程) Idea King python3
文章目录1.什么是日志？为什么需要日志？2.什么时候使用什么级别的日志？2.1日志的级别3.logging基础教程3.1输出到控制台3.2记录日志到文件3.3从多个模块记录日志3.4记录变量数据3.5修改日志输出的格式参考文献按照官方使用说明进行编写1.什么是日志？为什么需要日志？日志是对软件执行时所发生事件的一种追踪方式。软件开发人员对他们的代码添加日志调用，借此来指示某事件的发生。一个事件通过
python 基本知识达达玲玲 python 开发语言
Python：背景知识及环境安装什么是Python？Python是一种解释型、面向对象的高级编程语言。它的设计哲学强调代码的可读性和简洁性，因此被广泛应用于各种领域，包括：数据科学与机器学习：NumPy,Pandas,Matplotlib,Scikit-learn等库让Python成为了数据分析和机器学习的首选语言。Web开发：Django,Flask等框架提供了高效的Web开发解决方案。自动化：
学习使用pymodbus模块实现Modbus通讯草莓仙生学习单片机嵌入式硬件
Modbus是一种工业领域广泛使用的通信协议，而PyModbus是一个在Python中实现Modbus通信的库。它支持多种Modbus模式，包括RTU（通过串行线路），ASCII和TCP/IP。1.建立通讯frompymodbus.clientimportModbusTcpClientclient=ModbusTcpClient('localhost',port=502)client.connec
力扣动态规划-12【算法学习day.106】南宫生算法 #动态规划算法 leetcode 动态规划 java 数据结构
前言###我做这类文章一个重要的目的还是给正在学习的大家提供方向（例如想要掌握基础用法，该刷哪些题？建议灵神的题单和代码随想录）和记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.乘积最大子数组题目链接:152.乘积最大子数组-力扣（LeetCode）题面:代码:classSolution{publicintmaxProd
力扣动态规划-10【算法学习day.104】南宫生算法 #动态规划算法 leetcode 动态规划 java 学习
前言###我做这类文章一个重要的目的还是给正在学习的大家提供方向（例如想要掌握基础用法，该刷哪些题？建议灵神的题单和代码随想录）和记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.环形子数组的最大和题目链接:918.环形子数组的最大和-力扣（LeetCode）题面:附上灵神代码:classSolution{publicin
学习yosys(一款开源综合器) qq85058522 自己动手写CPU fpga开发
安装sudoapt-getinstallyosys#ubuntu22.04仓库里面是yosys-0.9sudoinstallxdot创建脚本show_rtl.ysread_verilogcpu.vhierarchy-topcpuproc;opt;fsm;opt;memory;opt;show-prefixcpu调用脚本yosysshow_rtl.ysverilog代码modulecpu(input
NVIDIA Isaac Lab 入门教程（一） kuan_li_lyg 机器人最优控制工具人工智能机器人开发语言 python 强化学习模仿学习 Isaac
系列文章目录前言IsaacLab是一个用于机器人学习的统一模块化框架，旨在简化机器人研究中的常见工作流程（如RL、从演示中学习和运动规划）。它建立在英伟达IsaacSim的基础上，利用最新的仿真功能实现逼真的场景和快速高效的仿真。该框架的核心目标是模块化：轻松定制和添加新环境、机器人和传感器。灵活性：适应社区不断变化的需求。开放性：保持开源，允许社区贡献和扩展框架。包含电池：包含大量可随时使用的环
isaac lab 教程（二） weixin_44572777 机器人
关于看过的内容的备份，在初期学习开发过程中是不必要的原文链接开发人员指南—IsaacLabdocumentation(robotsfan.com)开发人员指南对于开发，我们建议使用MicrosoftVisualStudioCode(VSCode)。NVIDIAOmniverse也建议使用此方法，并且存在有关如何使用VSCode进行调试Omniverse扩展的教程。设置VisualStudioCod
Pytest Fixtures 介绍与用法香奈儿5号奶茶 pytest
PytestFixtures是Pytest框架中用于管理测试前置条件和后置清理的一种强大工具。可以帮助我们在测试中设置初始状态，减少重复代码，并提高测试的可维护性登录后复制下载代码查看我的示例gitclonehttps://gitee.com/Ac1998/pytest-fixtures-demo.git1.2.下面我们来学习一下如何使用它前置条件已经安装了最新版本已安装Python基本了解如何使
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS