add991004

深度学习基础之卷积神经网络

摘要

受Hubel和Wiesel对猫视觉皮层电生理研究启发，有人提出卷积神经网络（CNN），Yann Lecun 最早将CNN用于手写数字识别并一直保持了其在该问题的霸主地位。近年来卷积神经网络在多个方向持续发力，在语音识别、人脸识别、通用物体识别、运动分析、自然语言处理甚至脑电波分析方面均有突破。这听起来像是一个奇怪的生物学和数学的结合，但是这些网络已经成为计算机视觉领域最具影响力的创新之一。2012年是神奇网络成长的第一年，Alex Krizhevsky用它们赢得了当年的ImageNet竞赛（基本上是计算机视觉年度奥运会），把分类错误记录从26％降到了15％，这个惊人的提高从那以后，许多公司一直在以服务为核心进行深度学习。Facebook使用自动标记算法的神经网络，谷歌的照片搜索，亚马逊的产品推荐，Pinterest的家庭饲料个性化和Instagram的搜索基础设施。然而，经典的，可以说是最流行的，这些网络的用例是用于图像处理。在图像处理中，如何使用这些CNN进行图像分类，以下进行深度学习基础讲解，以及使用CNN卷积神经网络进行图像模拟训练。

一．引言

（1）问题空间

图像分类是获取输入图像和输出类（猫，狗等）或类的概率最好描述图像的任务。对于人类来说，承认这项任务是我们从出生那一刻起学到的第一个技能之一，并且是成年人自然而不费吹灰之力的人。即使没有两次思考，我们也能够快速无缝地识别我们所处的环境以及周围的物体。当我们看到一张图像或者只是看着周围的世界时，大部分时间我们都能够立刻刻画这个场景，给每个对象一个标签，所有这些都没有自觉地注意到。

图1-1

（2）输入和输出

当一台电脑看到一个图像（以图像作为输入）时，它会看到一个像素值的数组。根据图像的分辨率和大小，它将看到一个32×32×3的数字数组（3指的是RGB值）。为了说明这一点，假设我们有一个JPG格式的彩色图像，它的大小是480 x 480.代表性的数组将是480 x 480 x 3.这些数字中的每一个都有一个从0到255的值，它描述该点的像素强度。这些数字对于我们进行图像分类时毫无意义，这是计算机唯一可用的输入。这个想法是，你给计算机这个数组的数组，它会输出的数字，描述了图像是一个类的概率（0.80为猫，0.15为狗，0.05为鸟等）。

（3）如何实现

现在我们知道这个问题以及输入和输出了，我们来思考如何解决这个问题。我们希望计算机做的是能够区分所有的图像，并找出使狗成为狗或使猫成为猫的独特功能。这也是下意识地在我们的脑海中继续的过程。当我们看一张狗的照片时，如果照片具有可识别的特征，例如爪子或四条腿，我们可以将其分类。以类似的方式，计算机能够通过查找诸如边缘和曲线等低级特征来执行图像分类，然后通过一系列卷积层来构建更抽象的概念。这是一个CNN的一般概述。

（4）生物连接

第一次听说卷积神经网络这个术语的时候，可能已经想到了一些与神经科学或生物学有关的东西。CNN确实从视觉皮层中获得了生物启发。视觉皮层具有对视野特定区域敏感的细胞区域。这个想法是由1962年在一个迷人的实验由胡贝尔和威塞尔（在扩展视频）在那里他们表明，大脑中的一些个体神经元细胞只有在某个方位的边缘存在的情况下才会响应（或发射）。例如，一些神经元在暴露于垂直边缘时发射，而另一些在显示水平或对角边缘时发射。Hubel和Wiesel发现，所有这些神经元都是以柱状结构组织的，并且能够产生视觉感知。在具有特定任务的系统内部（视觉皮层中寻找特定特征的神经元细胞）内部的专门组件的想法也是机器使用的，并且是CNN背后的基础。

（5）.结构体

有关CNN做的更详细的概述是，您将图像传递给一系列卷积，非线性，汇聚（下采样）和完全连接的图层，并获得输出。正如我们前面所说的那样，输出可以是一个类或者一个最能描述图像的类的概率。现在，困难的部分是了解每个层次都做了什么。所以让我们进入最重要的一个。

二．系统结构

（一）了解神经网络和反向传播方法

1.神经网络

一个全连接(full connected, FC)神经网络，通过观察上面的图，我们可以发现它的规则包括:

（1）神经元按照层来布局。最左边的层叫做输入层，负责接收输入数据；最右边的层叫输出层，我们可以从这层获取神经网络输出数据。输入层和输出层之间的层叫做隐藏层，因为它们对于外部来说是不可见的。

（2）同一层的神经元之间没有连接。

（3）第N层的每个神经元和第N-1层的所有神经元相连(这就是full connected的含义)，第N-1层神经元的输出就是第N层神经元的输入。

（4）每个连接都有一个权值。

上面这些规则定义了全连接神经网络的结构。事实上还存在很多其它结构的神经网络，比如卷积神经网络(CNN)、循环神经网络(RNN)，他们都具有不同的连接规则。

2.计算神经网络的输出

神经网络实际上就是一个输入向量到输出向量的函数，即：

根据输入计算神经网络的输出，需要首先将输入向量的每个元素的值赋给神经网络的输入层的对应神经元，依次向前计算每一层的每个神经元的值，直到最后一层输出层的所有神经元的值计算完毕。最后，将输出层每个神经元的值串在一起就得到了输出向量。

如上图，输入层有三个节点，我们将其依次编号为1、2、3；隐藏层的4个节点，编号依次为4、5、6、7；最后输出层的两个节点编号为8、9。因为我们这个神经网络是全连接网络，所以可以看到每个节点都和上一层的所有节点有连接。

每一层的算法都是一样的。比如，对于包含一个输入层，一个输出层和三个隐藏层的神经网络，我们假设其权重矩阵分别为，每个隐藏层的输出分别是，神经网络的输入为，神经网络的输入为，如下图所示：

则每一层的输出向量的计算可以表示为：

3.神经网络的训练

以监督学习为例来解释反向传播算法。设神经元的激活函数f为函数。假设每个训练样本为，其中向量是训练样本的特征，而是样本的目标值。

首先，我们根据上一节介绍的算法，用样本的特征，计算出神经网络中每个隐藏层节点的输出，以及输出层每个节点的输出。然后，我们按照下面的方法计算出每个节点的误差项:

对于输出层节点i，

其中，是节点i的误差项，是节点i的输出值，是样本对应于节点i的目标值。举个例子，根据上图，对于输出层节点8来说，它的输出值是，而样本的目标值是，带入上面的公式得到节点8的误差项应该是：

对于隐藏层节点，

其中，是节点i的输出值，是节点i到它的下一层节点k的连接的权重，是节点i的下一层节点k的误差项。例如，对于隐藏层节点4来说，计算方法如：

最后，更新每个连接上的权值：

其中，是节点i到节点j的权重，是一个成为学习速率的常数，是节点j的误差项，是节点i传递给节点j的输入。例如，权重的更新方法如下：

4.神经网络的实现

先做一个基本的模型：

可以分解出5个领域对象来实现神经网络：

（1）Network 神经网络对象，提供API接口。它由若干层对象组成以及连接对象组成。

（2）Layer 层对象，由多个节点组成。

（3）Node 节点对象计算和记录节点自身的信息(比如输出值a、误差项等)，以及这个节点相关的上下游的连接。

（4）Connection 每个连接对象都要记录该连接的权重。

（5）Connections 仅仅作为Connection的集合对象，提供一些集合操作。

Node实现如下：

# 节点类，负责记录和维护节点自身信息以及与这个节点相关的上下游连接，实现输出值和误差项的计算。

1.import random  
2.from numpy import *  
3.from functools import reduce  
4.  
5.  
6.def sigmoid(inX):  
7.    return 1.0 / (1 + exp(-inX))  
8.  
9.  
10.class Node(object):  
11.    def __init__(self, layer_index, node_index):  
12.        self.layer_index = layer_index  
13.        self.node_index = node_index  
14.        self.downstream = []  
15.        self.upstream = []  
16.        self.output = 0  
17.        self.delta = 0  
18.  
19.    def set_output(self, output):  
20.        self.output = output  
21.  
22.    def append_downstream_connection(self, conn):  
23.        self.downstream.append(conn)  
24.  
25.    def append_upstream_connection(self, conn):  
26.        self.upstream.append(conn)  
27.  
28.    def calc_output(self):  
29.        # 每个节点的输出算法，N元一次方程求和  
30.        output = reduce(lambda ret, conn: ret + conn.upstream_node.output * conn.weight, self.upstream, 0)  
31.        # 结果放入激活函数  
32.        self.output = sigmoid(output)  
33.  
34.    def calc_hidden_layer_delta(self):  
35.        downstream_delta = reduce(  
36.            lambda ret, conn: ret + conn.downstream_node.delta * conn.weight,  
37.            self.downstream, 0.0)  
38.        self.delta = self.output * (1 - self.output) * downstream_delta  
39.  
40.    def calc_output_layer_delta(self, label):  
41.        self.delta = self.output * (1 - self.output) * (label - self.output)  
42.  
43.    def __str__(self):  
44.        node_str = '%u-%u: output: %f delta: %f' % (self.layer_index, self.node_index, self.output, self.delta)  
45.        downstream_str = reduce(lambda ret, conn: ret + '\n\t' + str(conn), self.downstream, '')  
46.        upstream_str = reduce(lambda ret, conn: ret + '\n\t' + str(conn), self.upstream, '')  
47.        return node_str + '\n\tdownstream:' + downstream_str + '\n\tupstream:' + upstream_str

ConstNode对象，为了实现一个输出恒为1的节点(计算偏置项时需要)

1.class ConstNode(object):  
2.    def __init__(self, layer_index, node_index):  
3.        self.layer_index = layer_index  
4.        self.node_index = node_index  
5.        self.downstream = []  
6.        self.output = 1  
7.  
8.    def append_downstream_connection(self, conn):  
9.        self.downstream.append(conn)  
10.  
11.    def calc_hidden_layer_delta(self):  
12.        downstream_delta = reduce(  
13.            lambda ret, conn: ret + conn.downstream_node.delta * conn.weight,  
14.            self.downstream, 0.0)  
15.        self.delta = self.output * (1 - self.output) * downstream_delta  
16.  
17.    def __str__(self):  
18.        node_str = '%u-%u: output: 1' % (self.layer_index, self.node_index)  
19.        downstream_str = reduce(lambda ret, conn: ret + '\n\t' + str(conn), self.downstream, '')  
20.        return node_str + '\n\tdownstream:' + downstream_str

Layer对象，负责初始化一层。此外，作为Node的集合对象，提供对Node集合的操作。

1.class Layer(object):  
2.    def __init__(self, layer_index, node_count):  
3.        self.layer_index = layer_index  
4.        self.nodes = []  
5.        # 初始化节点对象  
6.        for i in range(node_count):  
7.            self.nodes.append(Node(layer_index, i))  
8.        self.nodes.append(ConstNode(layer_index, node_count))  
9.  
10.    def set_output(self, data):  
11.        for i in range(len(data)):  
12.            self.nodes[i].set_output(data[i])  
13.  
14.    def calc_output(self):  
15.        for node in self.nodes[:-1]:  
16.            node.calc_output()  
17.  
18.    def dump(self):  
19.        for node in self.nodes:  
20.            print(node)

Connection对象，主要职责是记录连接的权重，以及这个连接所关联的上下游节点。

1.class Connection(object):  
2.    def __init__(self, upstream_node, downstream_node):  
3.        self.upstream_node = upstream_node  
4.        self.downstream_node = downstream_node  
5.        self.weight = random.uniform(-0.1, 0.1)  
6.        self.gradient = 0.0  
7.  
8.    def calc_gradient(self):  
9.        self.gradient = self.downstream_node.delta * self.upstream_node.output  
10.  
11.    def update_weight(self, rate):  
12.        self.calc_gradient()  
13.        self.weight += rate * self.gradient  
14.  
15.    def get_gradient(self):  
16.        return self.gradient  
17.  
18.    def __str__(self):  
19.        return '(%u-%u) -> (%u-%u) = %f' % (  
20.            self.upstream_node.layer_index,  
21.            self.upstream_node.node_index,  
22.            self.downstream_node.layer_index,  
23.            self.downstream_node.node_index,  
24.            self.weight)

Connections对象，提供Connection集合操作。

1.class Connections(object):  
2.    def __init__(self):  
3.        self.connections = []  
4.  
5.    def add_connection(self, connection):  
6.        self.connections.append(connection)  
7.  
8.    def dump(self):  
9.        for conn in self.connections:  
10.            print(conn)

Network对象，提供API。

1.class Network(object):  
2.    def __init__(self, layers):  
3.        self.connections = Connections()  
4.        self.layers = []  
5.        # 计算网络层数  
6.        layer_count = len(layers)  
7.        node_count = 0  
8.        # 初始化网络层，网错层对象append在self.layers 里面，而节点对象又在layer里面被初始化  
9.        # Connections 仅仅作为Connection的集合对象，提供一些集合操作, 而layer有是节点对象合集  
10.        for i in range(layer_count):  
11.            self.layers.append(Layer(i, layers[i]))  
12.        for layer in range(layer_count - 1):  
13.            connections = [Connection(upstream_node, downstream_node)  
14.                           for upstream_node in self.layers[layer].nodes  
15.                           for downstream_node in self.layers[layer + 1].nodes[:-1]]  
16.            for conn in connections:  
17.                self.connections.add_connection(conn)  
18.                conn.downstream_node.append_upstream_connection(conn)  
19.                conn.upstream_node.append_downstream_connection(conn)  
20.  
21.    def train(self, labels, data_set, rate, epoch):  
22.        for i in range(epoch):  
23.            for d in range(len(data_set)):  
24.                self.train_one_sample(labels[d], data_set[d], rate)  
25.                # print 'sample %d training finished' % d  
26.  
27.    def train_one_sample(self, label, sample, rate):  
28.        self.predict(sample)  
29.        self.calc_delta(label)  
30.        self.update_weight(rate)  
31.  
32.    def calc_delta(self, label):  
33.        output_nodes = self.layers[-1].nodes  
34.        for i in range(len(label)):  
35.            output_nodes[i].calc_output_layer_delta(label[i])  
36.        for layer in self.layers[-2::-1]:  
37.            for node in layer.nodes:  
38.                node.calc_hidden_layer_delta()  
39.  
40.    def update_weight(self, rate):  
41.        for layer in self.layers[:-1]:  
42.            for node in layer.nodes:  
43.                for conn in node.downstream:  
44.                    conn.update_weight(rate)  
45.  
46.    def calc_gradient(self):  
47.        for layer in self.layers[:-1]:  
48.            for node in layer.nodes:  
49.                for conn in node.downstream:  
50.                    conn.calc_gradient()  
51.  
52.    def get_gradient(self, label, sample):  
53.        self.predict(sample)  
54.        self.calc_delta(label)  
55.        self.calc_gradient()  
56.  
57.    def predict(self, sample):  
58.        self.layers[0].set_output(sample)  
59.        for i in range(1, len(self.layers)):  
60.            self.layers[i].calc_output()  
61.        return list(map(lambda node: node.output, self.layers[-1].nodes[:-1]))  
62.  
63.    def dump(self):  
64.        for layer in self.layers:  
65.            layer.dump()

梯度检查。如果我们想检查参数的梯度是否正确，我们需要以下几个步骤：

（1）首先使用一个样本对神经网络进行训练，这样就能获得每个权重的梯度。

（2）将加上一个很小的值()，重新计算神经网络在这个样本d下的。

（3）将减上一个很小的值()，重新计算神经网络在这个样本d下的。

（4）根据式6计算出期望的梯度值，和第一步获得的梯度值进行比较，它们应该几乎想等(至少4位有效数字相同)。

1.def gradient_check(network, sample_feature, sample_label):  
2.    ''''' 
3.    梯度检查 
4.    network: 神经网络对象 
5.    sample_feature: 样本的特征 
6.    sample_label: 样本的标签 
7.    '''  
8.    # 计算网络误差  
9.    network_error = lambda vec1, vec2: \  
10.        0.5 * reduce(lambda a, b: a + b,  
11.                     list(map(lambda v: (v[0] - v[1]) * (v[0] - v[1]),  
12.                              zip(vec1, vec2))))  
13.  
14.    # 获取网络在当前样本下每个连接的梯度  
15.    network.get_gradient(sample_feature, sample_label)  
16.  
17.    # 对每个权重做梯度检查      
18.    for conn in network.connections.connections:  
19.        # 获取指定连接的梯度  
20.        actual_gradient = conn.get_gradient()  
21.  
22.        # 增加一个很小的值，计算网络的误差  
23.        epsilon = 0.0001  
24.        conn.weight += epsilon  
25.        error1 = network_error(network.predict(sample_feature), sample_label)  
26.  
27.        # 减去一个很小的值，计算网络的误差  
28.        conn.weight -= 2 * epsilon  # 刚才加过了一次，因此这里需要减去2倍  
29.        error2 = network_error(network.predict(sample_feature), sample_label)  
30.  
31.        # 根据式6计算期望的梯度值  
32.        expected_gradient = (error2 - error1) / (2 * epsilon)  
33.  
34.        # 打印  
35.        print('expected gradient: \t%f\nactual gradient: \t%f' % (  
36.            expected_gradient, actual_gradient))

结果如下：

（二）cnn卷积层次结构

1.数学部分

CNN中的第一层始终是一个卷积层。首先要确保你记得这个转换（我将使用这个缩写很多）的输入是什么。就像我们之前提到的那样，输入是一个32×32×3的像素值数组。现在，解释一个conv层的最好方法就是想象一个闪烁在图像左上角的手电筒。假设这个手电筒照射的光线覆盖了5×5的区域。现在，让我们想象这个手电筒滑过输入图像的所有区域。在机器学习方面，这种手电筒被称为滤波器（有时也称为神经元或内核），而它所照射的区域称为接受场。现在这个过滤器也是一个数组数组（数字称为权重或参数）。一个非常重要的注意事项是，这个过滤器的深度必须和输入的深度相同（这可以确保数学运算出来），所以这个过滤器的尺寸是5 x 5 x 3。现在，我们来看看例如过滤器的第一个位置。这将是左上角。当滤波器在输入图像周围滑动或卷积时，它将滤波器中的值与图像的原始像素值相乘（也称为计算元素智能乘法）。所有这些乘法都被总结出来（从数学上讲，这将是总共75次乘法）。所以，现在你有一个单一的数字。记住，这个数字只是过滤器位于图像左上角的代表。现在，我们对输入音量上的每个位置重复这个过程。（下一步将过滤器向右移动1个单位，然后再向右移动1，依此类推）。输入卷上的每个唯一位置都会生成一个数字。将过滤器滑过所有位置后，您将发现所剩下的是一个28 x 28 x 1的数字数组，我们称之为激活图或功能图。你得到一个28×28阵列的原因是有一个5×5的滤波器可以放在一个32×32输入图像上的784个不同的位置。这784个数字被映射到一个28×28数组。

假设我们现在使用两个5 x 5 x 3滤镜而不是一个。那么我们的输出量将是28 x 28 x 2.通过使用更多的过滤器，我们能够更好地保留空间尺寸。在数学上，这是卷积层中发生的事情。

2.高层次的视角

每个这些过滤器都可以被认为是功能标识符。当我说功能时，我正在谈论的是直线边缘，简单的颜色和曲线。想想所有图像的共同点，最简单的特点。假设我们的第一个过滤器是7 x 7 x 3并且将成为曲线检测器。（在本节中，为了简单起见，让我们忽略过滤器深度为3单位的事实，并且只考虑过滤器和图像的顶部深度切片）。作为曲线检测器，过滤器将具有像素结构，沿曲线形状的区域是更高的数值（请记住，我们正在讨论的这些滤波器只是数字！）。

现在，回到数学上的可视化。当我们在输入体积的左上角有这个滤波器时，它将计算该区域的滤波器和像素值之间的乘法。现在让我们举一个想要分类的图像的例子，让我们把我们的过滤器放在左上角。

我们所要做的就是将滤镜中的值与图像的原始像素值相乘。

基本上，在输入图像中，如果有一个通常类似于这个滤波器所代表的曲线的形状，那么所有相乘的相加将会产生一个大的值！现在让我们看看当我们移动过滤器时会发生什么。

这个conv层的输出是一个激活图。因此，在单一滤波器卷积的简单情况下（如果该滤波器是曲线检测器），激活图将显示图片中最有可能是曲线的区域。在这个例子中，我们的26 x 26 x 1激活图的左上角（26是因为7x7滤镜而不是5x5）将是6600.这个高值意味着在输入中可能有某种曲线导致过滤器激活的音量。在我们的激活地图右上角的值将是0，因为没有任何东西在输入音量导致过滤器激活（或者更简单的说，在原始图像的该区域中没有曲线）。请记住，这只是一个过滤器。信息范范范读范范范亦内范亦会信息及信息范信信息范辛辛我们可以有其他的过滤器，用于向左弯曲或为直线边缘的线条。更多的过滤器，激活图的深度越大，我们对输入量的信息也越多。

在下面的图片中，将看到一些经过训练的网络的第一个conv层过滤器的实际可视化示例。尽管如此，主要论点仍然是一样的。第一层上的过滤器在输入图像周围进行卷积，并在其正在查找的特定功能位于输入体积中时"激活"（或计算高值）。

3.深入的网络

一个经典的CNN架构看起来就像这样

然而，最后一层是一个重要的层面。第一个conv层中的过滤器是用来检测的。他们检测低级功能，如边缘和曲线。正如人们所想象的，为了预测图像是否是一种对象，我们需要网络能够识别更高层次的特征，如手或爪子或耳朵。思考第一个conv层之后的网络输出结果。这将是一个28×28×3的体积（假设我们使用三个5×5×3滤波器）。当我们经过另一个conv层时，第一个conv层的输出成为第二个的输入conv层。现在，这看起来有点难以想象。当我们在谈论第一层时，输入只是原始图像。然而，当我们谈论第二层次的时候，输入是第一层产生的激活图。因此，输入的每一层都基本上描述了原始图像中某些低级特征出现的位置。现在当你在上面应用一组过滤器时（通过第二个过滤器）conv层），则输出将是代表更高级特征的激活。这些特征的类型可以是半圆（曲线和直边的组合）或正方形（几个直边的组合）。当您浏览网络并通过更多的转发层时，您将获得代表越来越复杂功能的激活地图。在网络结束时，您可能会有一些过滤器在图像中有手写时激活，过滤器在看到粉红色的物体时激活，等等。如果您想要了解关于在ConvNets中可视化过滤器的更多信息，Matt Zeiler和Rob Fergus一个很好的研究论文讨论的话题。杰森Yosinski也有一个视频在YouTube上提供了一个很好的视觉表现。另一个值得注意的事情是，当你深入到网络中时，过滤器开始具有越来越大的接受范围，这意味着他们能够从原始输入量的较大区域中考虑信息（另一种放置方式它们对像素空间的较大区域更敏感）。

4.完全连接层

这个图层基本上需要一个输入量（无论输出是在其之前的conv或ReLU还是pool层），并输出一个N维向量，其中N是程序必须从中选择的类的数量。例如，如果你想要一个数字分类程序，N将是10，因为有10个数字。这个N维向量中的每个数字表示某个类别的概率。例如，如果用于数字分类程序的结果向量是[0.1.175 0 0 0 0 0 .05]，那么这代表10％的概率，即图像是1，10％的概率图像是2，图像是3的概率是75％，图像是9的概率是5％（注意：还有其他方法可以表示输出，但我只是展示了softmax方法）。完全连接图层的工作方式是查看上一层的输出（我们记得它应该代表高级特征的激活图），并确定哪些特征与特定类最相关。例如，如果程序预测某些图像是狗，则在激活图中将具有高值，例如爪子或4条腿等的高级特征。类似地，如果程序预测某图像是鸟，它将在激活地图中具有很高的价值，代表像翅膀或喙等高级特征。基本上，FC层看着什么高级特征与特定类最强关联，并具有特定的权重，以便当你计算权重与上一层之间的乘积。

5.训练

以上提到的神经网络的一个方面，它可能是最重要的部分。第一个conv层中的过滤器如何知道要查找边和曲线？完全连接的图层如何知道要查看的激活图？每层中的过滤器如何知道有什么值？计算机能够调整其过滤值（或权重）的方式是通过称为反向传播的训练过程。

在我们进入反向传播之前，我们必须先退后一步，讨论神经网络的工作需求。现在我们都出生了，我们的思想是新鲜的。我们不知道什么是猫，狗或鸟。以类似的方式，在CNN开始之前，权重或筛选值是随机的。过滤器不知道寻找边缘和曲线。在更高层的过滤器不知道寻找爪子和喙。然而，随着年龄的增长，我们的父母和老师向我们展示了不同的图片和图片，并给了我们相应的标签。被赋予形象和标签的想法是CNN经历的培训过程。在深入研究之前，我们假设我们有一套训练集，其中包含成千上万的狗，猫和鸟的图像，每个图像都有一个这个图像是什么动物的标签。

所以反向传播可以分为4个不同的部分，正向传递，丢失函数，反向传递和权重更新。在正向传球过程中，您将会看到一张训练图像，我们记得这是一个32 x 32 x 3的数字数组，并将其传递给整个网络。在我们的第一个训练样例中，由于所有的权值或过滤值都是随机初始化的，因此输出结果可能类似[.1.1.1.1.1.1.1.1.1.1]，基本上是输出不特别优先考虑任何数字。网络以其当前的权重无法查找这些低级特征，因此无法就分类的可能性作出任何合理的结论。这转到损失功能反向传播的一部分。请记住，我们现在使用的是培训数据。这个数据有一个图像和一个标签。例如，假设输入的第一个训练图像是3，图像的标签是[0 0 0 1 0 0 0 0 0 0]。损失函数可以用许多不同的方式来定义，但常见的是MSE（均方误差），是实际预测的平方的1.5倍。

假设变量L等于该值。正如你可以想象的那样，第一对训练图像的损失将非常高。现在，让我们直观地思考这个问题。我们希望达到预测的标签（ConvNet的输出）与训练标签相同的点（这意味着我们的网络得到了预测权）。为了达到这个目的，我们希望最小化损失量我们有。将这看作是微积分中的一个优化问题，我们想要找出哪些输入（权重在我们的情况下）是最直接导致网络损失（或错误）的因素。

这是dL / dW的数学等价物，其中W是特定层的权重。现在，我们要做的是通过网络进行反向传递，即确定哪些权重对损失贡献最大，并设法调整损失，从而减少损失。一旦我们计算出这个导数，我们就会进入权重更新的最后一步。这是我们取得所有过滤器的权重，并更新它们，使它们在梯度的相反方向变化。

该学习速率是由程序员选择的参数。高学习率意味着在权重更新中采取更大的步骤，因此，模型可能花费较少的时间来收敛于最优权重集合。但是，如果学习速度过高，可能会导致跳跃过大，不够精确，无法达到最佳点。

正向传递，丢失函数，反向传递和参数更新的过程是一次训练迭代。程序将重复这个过程，对每组训练图像（通常称为批次）进行固定次数的迭代。一旦你完成了最后一个训练样例的参数更新，希望网络应该被训练得足够好，这样层的权重才能被正确地调整。

三.实现代码

（一）神经网络实战——手写数字识别

首先，我们需要把MNIST数据集处理为神经网络能够接受的形式。MNIST训练集的文件格式可以参考官方网站，这里不在赘述。每个训练样本是一个28*28的图像，我们按照行优先，把它转化为一个784维的向量。每个标签是0-9的值，我们将其转换为一个10维的one-hot向量：如果标签值为n，我们就把向量的第n维（从0开始编号）设置为0.9，而其它维设置为0.1。例如，向量[0.1,0.1,0.9,0.1,0.1,0.1,0.1,0.1,0.1,0.1]表示值2。

类：FullConnectedLayer，它实现了全连接层的前向和后向计算：

1.from functools import reduce  
2.  
3.import numpy as np  
4.  
5.from activators import SigmoidActivator  
6.  
7.  
8.# 全连接层实现类  
9.class FullConnectedLayer(object):  
10.    def __init__(self, input_size, output_size,  
11.                 activator):  
12.        ''''' 
13.        构造函数 
14.        input_size: 本层输入向量的维度 
15.        output_size: 本层输出向量的维度 
16.        activator: 激活函数 
17.        '''  
18.        self.input_size = input_size  
19.        self.output_size = output_size  
20.        self.activator = activator  
21.        # 权重数组W  
22.        self.W = np.random.uniform(-0.1, 0.1,  
23.                                   (output_size, input_size))  
24.        # 偏置项b  
25.        self.b = np.zeros((output_size, 1))  
26.        # 输出向量  
27.        self.output = np.zeros((output_size, 1))  
28.  
29.    def forward(self, input_array):  
30.        ''''' 
31.        前向计算 
32.        input_array: 输入向量，维度必须等于input_size 
33.        '''  
34.        # 式2  
35.        self.input = input_array  
36.        self.output = self.activator.forward(  
37.            np.dot(self.W, input_array) + self.b)  
38.  
39.    def backward(self, delta_array):  
40.        ''''' 
41.        反向计算W和b的梯度 
42.        delta_array: 从上一层传递过来的误差项 
43.        '''  
44.        # 式8  
45.        self.delta = self.activator.backward(self.input) * np.dot(  
46.            self.W.T, delta_array)  
47.        self.W_grad = np.dot(delta_array, self.input.T)  
48.        self.b_grad = delta_array  
49.  
50.    def update(self, learning_rate):  
51.        ''''' 
52.        使用梯度下降算法更新权重 
53.        '''  
54.        self.W += learning_rate * self.W_grad  
55.        self.b += learning_rate * self.b_grad  
56.  
57.    def dump(self):  
58.        print('W: %s\nb:%s' % (self.W, self.b))

Network类稍作修改，使之用到FullConnectedLayer：

1.# 神经网络类  
2.class Network(object):  
3.    def __init__(self, layers):  
4.        ''''' 
5.        构造函数 
6.        '''  
7.        self.layers = []  
8.        for i in range(len(layers) - 1):  
9.            self.layers.append(  
10.                FullConnectedLayer(  
11.                    layers[i], layers[i + 1],  
12.                    SigmoidActivator()  
13.                )  
14.            )  
15.  
16.    def predict(self, sample):  
17.        ''''' 
18.        使用神经网络实现预测 
19.        sample: 输入样本 
20.        '''  
21.        output = sample  
22.        for layer in self.layers:  
23.            layer.forward(output)  
24.            output = layer.output  
25.        return output  
26.  
27.    def train(self, labels, data_set, rate, epoch):  
28.        ''''' 
29.        训练函数 
30.        labels: 样本标签 
31.        data_set: 输入样本 
32.        rate: 学习速率 
33.        epoch: 训练轮数 
34.        '''  
35.        for i in range(epoch):  
36.            for d in range(len(data_set)):  
37.                self.train_one_sample(labels[d],  
38.                                      data_set[d], rate)  
39.  
40.    def train_one_sample(self, label, sample, rate):  
41.        self.predict(sample)  
42.        self.calc_gradient(label)  
43.        self.update_weight(rate)  
44.  
45.    def calc_gradient(self, label):  
46.        delta = self.layers[-1].activator.backward(  
47.            self.layers[-1].output  
48.        ) * (label - self.layers[-1].output)  
49.        for layer in self.layers[::-1]:  
50.            layer.backward(delta)  
51.            delta = layer.delta  
52.        return delta  
53.  
54.    def update_weight(self, rate):  
55.        for layer in self.layers:  
56.            layer.update(rate)  
57.  
58.    def dump(self):  
59.        for layer in self.layers:  
60.            layer.dump()  
61.  
62.    def loss(self, output, label):  
63.        return 0.5 * ((label - output) * (label - output)).sum()  
64.  
65.    def gradient_check(self, sample_feature, sample_label):  
66.        ''''' 
67.        梯度检查 
68.        network: 神经网络对象 
69.        sample_feature: 样本的特征 
70.        sample_label: 样本的标签 
71.        '''  
72.  
73.        # 获取网络在当前样本下每个连接的梯度  
74.        self.predict(sample_feature)  
75.        self.calc_gradient(sample_label)  
76.  
77.        # 检查梯度  
78.        epsilon = 10e-4  
79.        for fc in self.layers:  
80.            for i in range(fc.W.shape[0]):  
81.                for j in range(fc.W.shape[1]):  
82.                    fc.W[i, j] += epsilon  
83.                    output = self.predict(sample_feature)  
84.                    err1 = self.loss(sample_label, output)  
85.                    fc.W[i, j] -= 2 * epsilon  
86.                    output = self.predict(sample_feature)  
87.                    err2 = self.loss(sample_label, output)  
88.                    expect_grad = (err1 - err2) / (2 * epsilon)  
89.                    fc.W[i, j] += epsilon  
90.                    print('weights(%d,%d): expected - actural %.4e - %.4e' % (  
                        i, j, expect_grad, fc.W_grad[i, j]))

（二）图像MNIST手写数字识别测试

首先下载mnist datasets数据集

#download mnist datasets

#55000 * 28 * 28 55000image

1.import numpy as np  
2.import tensorflow as tf  
3.  
4.from tensorflow.examples.tutorials.mnist import input_data  
5.mnist=input_data.read_data_sets('mnist_data',one_hot=True)#参数一：文件目录。参数二：是否为one_hot向量

第一维度均一化

1.#one_hot is encoding format  
2.#None means tensor 的第一维度可以是任意维度  
3.#/255. 做均一化  
4.input_x=tf.placeholder(tf.float32,[None,28*28])/255.  
5.#输出是一个one hot的向量  
6.output_y=tf.placeholder(tf.int32,[None,10])  
7.  
8.#输入层 [28*28*1]  
9.input_x_images=tf.reshape(input_x,[-1,28,28,1])  
10.#从(Test)数据集中选取3000个手写数字的图片和对应标签  
11.  
12.test_x=mnist.test.images[:3000] #image  
13.test_y=mnist.test.labels[:3000] #label

#隐藏层

#conv1 5*5*32

#layers.conv2d parameters

#inputs 输入，是一个张量

#filters 卷积核个数，也就是卷积层的厚度

#kernel_size 卷积核的尺寸

#strides: 扫描步长

#padding: 边边补0 valid不需要补0，same需要补0，为了保证输入输出的尺寸一致,补多少不需要知道

#activation: 激活函数

1.conv1=tf.layers.conv2d(  
2.    inputs=input_x_images,  
3.    filters=32,  
4.    kernel_size=[5,5],  
5.    strides=1,  
6.    padding='same',  
7.    activation=tf.nn.relu)  
8.print(conv1)

#pooling layer1 2*2

#tf.layers.max_pooling2d

#inputs 输入，张量必须要有四个维度

#pool_size: 过滤器的尺寸

1.pool1=tf.layers.max_pooling2d(  
2.    inputs=conv1,  
3.    pool_size=[2,2],  
4.    strides=2)  
5.print(pool1)

flat(平坦化)

1.conv2=tf.layers.conv2d(  
2.    inputs=pool1,  
3.    filters=64,  
4.    kernel_size=[5,5],  
5.    strides=1,  
6.    padding='same',  
7.    activation=tf.nn.relu  
8.)  
9.  
10.pool2=tf.layers.max_pooling2d(  
11.    inputs=conv2,  
12.    pool_size=[2,2],  
13.    strides=2  
14.)  
15.  
16.flat=tf.reshape(pool2,[-1,7*7*64])

#densely-connected layers 全连接层 1024

#tf.layers.dense

#inputs: 张量

#units：神经元的个数

#activation: 激活函数

1.dense=tf.layers.dense(  
2.    inputs=flat,  
3.    units=1024,  
4.    activation=tf.nn.relu  
5.)  
6.print(dense)

#dropout

#tf.layers.dropout

#inputs 张量

#rate 丢弃率

#training 是否是在训练的时候丢弃

#输出层，不用激活函数（本质就是一个全连接层）

1.dropout=tf.layers.dropout(  
2.    inputs=dense,  
3.    rate=0.5,  
4.)  
5.print(dropout)  
6.  
7.logits=tf.layers.dense(  
8.    inputs=dropout,  
9.    units=10  
10.)  
11.print(logits)

#计算误差 cross entropy（交叉熵），再用Softmax计算百分比的概率

#tf.losses.softmax_cross_entropy

#onehot_labels: 标签值

#logits: 神经网络的输出值

# 用Adam 优化器来最小化误差,学习率0.001 类似梯度下降

#精度。计算预测值和实际标签的匹配程度

#tf.metrics.accuracy

#labels：真实标签

#predictions: 预测值

#Return: (accuracy,update_op)accuracy 是一个张量准确率，update_op 是一个op可以求出精度。

1.loss=tf.losses.softmax_cross_entropy(onehot_labels=output_y,  
2.                                     logits=logits)  
3.print(loss)  
4.  
5.train_op=tf.train.GradientDescentOptimizer(learning_rate=0.001).minimize(loss)  
6.  
7.accuracy_op=tf.metrics.accuracy(  
8.    labels=tf.argmax(output_y,axis=1),  
9.    predictions=tf.argmax(logits,axis=1)  
10.)

#创建会话

#初始化变量

#group 把很多个操作弄成一个组

#初始化变量，全局，和局部

1.sess=tf.Session()  
2.init=tf.group(tf.global_variables_initializer(),  
3.              tf.local_variables_initializer())  
4.sess.run(init)  
5.  
6.for i in range(1000):  
7.    batch=mnist.train.next_batch(50) #从Train（训练）数据集中取‘下一个’样本  
8.    train_loss,train_op_=sess.run([loss,train_op],{input_x:batch[0],output_y:batch[1]})  
9.    if i%100==0:  
10.        test_accuracy=sess.run(accuracy_op,{input_x:test_x,output_y:test_y})  
11.        print("Step=%d, Train loss=%.4f,[Test accuracy=%.2f]"%(i,train_loss,test_accuracy))

#测试：打印20个预测值和真实值

1.test_output=sess.run(logits,{input_x:test_x[:20]})  
2.inferenced_y=np.argmax(test_output,1)  
3.print(inferenced_y,'Inferenced numbers')#推测的数字  
4.print(np.argmax(test_y[:20],1),'Real numbers')  
5.sess.close()

四．实验

（一）神经网络实战——手写数字识别

我们每训练10轮，评估一次准确率。当准确率开始下降时（出现了过拟合）终止训练。结果如下：

（二）图像MNIST手写数字识别测试

为了看看我们的CNN是否有效，我们有一套不同的图像和标签（在训练和测试之间不能一蹴而就），并通过CNN传递图像。我们将输出与实际情况进行比较，看看我们的网络是否正常工作！

当range在1000时，测试结果如下：

当range在3000时，测试结果如下：

由此可见，进行的培训迭代次数越多，可以进行的权重更新越多，调整到网络的时间越长，则预测值和真实值的结果更为接近。

五．总结和展望

数据，数据，数据。为网络提供的训练数据越多，可以进行的培训迭代次数越多，可以进行的权重更新越多，调整到网络的时间越长。Facebook（和Instagram）可以使用目前拥有的十亿用户的所有照片，Pinterest可以使用其网站上500亿个引脚的信息，Google可以使用搜索数据，Amazon可以使用数百万个产品每天都买。

在这中没有讨论的东西包括非线性和合并层以及网络的超参数，如过滤器大小，步长和填充。还没有讨论网络架构，批量归一化，消失梯度，丢失，初始化技术，非凸优化，偏差，丢失函数的选择，数据增强，正则化方法，计算考虑，反向传播的修改等主题）。

参考文献：

[1]Tom M. Mitchell, "机器学习", 曾华军等译, 机械工业出版社

[2]CS 224N / Ling 284, Neural Networks for Named Entity Recognition

[3]LeCun et al. Gradient-Based Learning Applied to Document Recognition 1998

[4]RECURRENT NEURAL NETWORKS TUTORIAL

[5]Understanding LSTM Networks

[6]The Unreasonable Effectiveness of Recurrent Neural Networks

[7]Attention and Augmented Recurrent Neural Networks

[8]On the difficulty of training recurrent neural networks, Bengio et al.

[9]Recurrent neural network based language model, Mikolov et al.

[10]Neural Network Classification, Categorical Data, Softmax Activation, and Cross Entropy Error, McCaffrey

[11]CS231n Convolutional Neural Networks for Visual Recognition

[12]ReLu (Rectified Linear Units) 激活函数

[13]Jake Bouvrie, Notes on Convolutional Neural Networks, 2006

你可能感兴趣的:(机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio