weixin_30564785

吴裕雄--天生自然神经网络人工智能项目：基于深度学习TensorFlow框架的图像分类与目标跟踪报告...

1.概述 1

1.1 项目背景 1

客户端 3

Distributed Master 3

Worker Service 5

Kernel Implements 6

技术栈 7

一、神经网络的实现过程 8

二、前向传播 8

三、后向传播 10

四、搭建神经网络的过程 11

神经网络优化 12

1、神经元模型： 12

2、激活函数 13

3、神经网络的复杂度 13

4、神经网络的层数 13

5、神经网络待优化的参数 14

神经网络优化问题 14

1、损失函数（loss） 14

2、学习率 16

3、滑动平均（影子） 18

4、正则化 19

第一项是预测结果与标准答案的差距，第二项是正则化计算结果。 19

1.2 研究现状 20

AlexNet 21

更深一点的网络：VGGNet 22

再深一点的网络：GoogLeNet 和 Inception 模块 23

使用一个捷径来跳跃：ResNet 24

将捷径扩展到极致：DenseNet 25

深度学习未来将如何发展 26

从有监督学习到无监督学习 26

对抗学习 27

加快进展 27

1.3 项目计划 29

2.1 数据集介绍 29

2.2 数据可视化 30

1、导入相应要用到的python包： 30

2、读取相应路径下的文件 30

3、读取每个水果的子文件里面的水果图片的名字。 30

4、 a、定义一个保存所有训练集图片名称的列表 31

5、 a、逐个读取每个水果类的子文件夹名称 33

2.3深度学习的训练目标 35

3.1 读取图像数据 36

i、对r列表进行升序排序 37

3.2 图像数据预处理 39

（1）逐个子文件夹文件依次读取。 39

（2）将彩色的图片转变为灰度图 39

（3）接着再将灰度图片转变成64*64的大小 39

（4）依次将每个子文件夹里面处理过的灰度图片保存到one列表 39

（5）最后将每个子文件处理后的图片数据保存的trainData列表里 39

4.1深度学习网络结构 43

4.2 卷积、池化及参数定义 44

4.3 训练过程及结果 48

4.4 参数调整及优化 50

1、使用命令读取可视化文件 64

2、输入最后的http://acer:6006，使用Google浏览器打开 64

1、导入相应的python包 70

2、神经网络的搭建以及迁移学习的测试 70

1、神经网络的学习率太大，导致欠拟合 77

2、搭建的神经网络的层次太多，导致过拟合 77

3、图片的深度设置太小，导致欠拟合 77

4、图片的深度设置太大，导致过拟合 77

5、图片预处理时，裁剪得太多，导致图片许多关键的特征丢失 77

6、神经网络学习循环的次数太少，也会导致准确率低 77

7、神经网络优化器选定不当，导致准确率低 77

8、图片的标签与图片没有对应上 78

9、加载训练数据时，没有事先乱序处理 78

10、乱序时，图片数据与标签没有做相对应的变化 78

11、降低图片的通道数也会导致准确率低 78

1.概述

1.1 项目背景

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值（例如一幅图像）可以使用多种方式来表示，如每个像素强度值的向量，或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务（例如，人脸识别或面部表情识别）。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。同机器学习方法一样，深度机器学习方法也有监督学习与无监督学习之分．不同的学习框架下建立的学习模型很是不同．例如，卷积神经网络（Convolutional neural networks，简称CNNs）就是一种深度的监督学习下的机器学习模型，而深度置信网（Deep Belief Nets，简称DBNs）就是一种无监督学习下的机器学习模型。

神经网络深度学习常使用到的一种框架是TensorFlow，本项目主要也是基于此技术框架完成的，下面是对TensorFlow框架的详细介绍。

TensorFlow基于数据流图，用于大规模分布式数值计算的开源框架。节点表示某种抽象的计算，边表示节点之间相互联系的张量。TensorFlow的系统结构以C API为界，将整个系统分为「前端」和「后端」两个子系统：前端系统：提供编程模型，负责构造计算图；后端系统：提供运行时环境，负责执行计算图。Client是前端系统的主要组成部分，它是一个支持多语言的编程环境。它提供基于计算图的编程模型，方便用户构造各种复杂的计算图，实现各种形式的模型设计。Client通过Session为桥梁，连接TensorFlow后端的「运行时」，并启动计算图的执行过程。在分布式的运行时环境中，Distributed Master根据Session.run的Fetching参数，从计算图中反向遍历，找到所依赖的「最小子图」。然后，Distributed Master负责将该「子图」再次分裂为多个「子图片段」，以便在不同的进程和设备上运行这些「子图片段」。最后，Distributed Master将这些「子图片段」派发给Work Service；随后Work Service启动「子图片段」的执行过程。对于每以个任务，TensorFlow都将启动一个Worker Service。Worker Service将按照计算图中节点之间的依赖关系，根据当前的可用的硬件环境(GPU/CPU)，调用OP的Kernel实现完成OP的运算(一种典型的多态实现技术)。另外，Worker Service还要负责将OP运算的结果发送到其他的Work Service；或者接受来自其他Worker Service发送给它的OP运算的结果。Kernel是OP在某种硬件设备的特定实现，它负责执行OP的运算。

如上图所示，假设存在两个任务：/job:ps/task:0: 负责模型参数的存储和更新，/job:worker/task:0: 负责模型的训练或推理。

客户端

Client基于TensorFlow的编程接口，构造计算图。目前，TensorFlow主流支持Python和C++的编程接口，并对其他编程语言接口的支持日益完善。此时，TensorFlow并未执行任何计算。直至建立Session会话，并以Session为桥梁，建立Client与后端运行时的通道，将Protobuf格式的GraphDef发送至Distributed Master。也就是说，当Client对OP结果进行求值时，将触发Distributed Master的计算图的执行过程。如下图所示，Client构建了一个简单计算图。它首先将w与x进行矩阵相乘，再与截距b按位相加，最后更新至s。

Distributed Master

在分布式的运行时环境中，Distributed Master根据Session.run的Fetching参数，从计算图中反向遍历，找到所依赖的最小子图。然后Distributed Master负责将该子图再次分裂为多个「子图片段」，以便在不同的进程和设备上运行这些「子图片段」。最后，Distributed Master将这些图片段派发给Work Service。随后Work Service启动「本地子图」的执行过程。Distributed Master将会缓存「子图片段」，以便后续执行过程重复使用这些「子图片段」，避免重复计算。

如上图所示，Distributed Master开始执行计算子图。在执行之前，Distributed Master会实施一系列优化技术，例如「公共表达式消除」，「常量折叠」等。随后，Distributed Master负责任务集的协同，执行优化后的计算子图。

如上图所示，存在一种合理的「子图片段」划分算法。Distributed Master将模型参数相关的OP进行分组，并放置在PS任务上。其他OP则划分为另外一组，放置在Worker任务上执行。

如上图所示，如果计算图的边被任务节点分割，Distributed Master将负责将该边进行分裂，在两个分布式任务之间插入SEND和RECV节点，实现数据的传递。随后，Distributed Master将「子图片段」派发给相应的任务中执行，在Worker Service成为「本地子图」，它负责执行该子图的上的OP。

Worker Service

对于每个任务，都将存在相应的Worker Service，它主要负责如下3个方面的职责：处理来自Master的请求；调度OP的Kernel实现，执行本地子图；协同任务之间的数据通信。

Worker Service派发OP到本地设备，执行Kernel的特定实现。它将尽最大可能地利用多CPU/GPU的处理能力，并发地执行Kernel实现。

另外，TensorFlow根据设备类型，对于设备间的SEND/RECV节点进行特化实现：使用cudaMemcpyAsync的API实现本地CPU与GPU设备的数据传输；

对于本地的GPU之间则使用端到端的DMA，避免了跨host CPU昂贵的拷贝过程。

对于任务之间的数据传递，TensorFlow支持多协议，主要包括：gRPC over TCP和RDMA over Converged Ethernet。

Kernel Implements

TensorFlow的运行时包含200多个标准的OP，包括数值计算，多维数组操作，控制流，状态管理等。每一个OP根据设备类型都会存在一个优化了的Kernel实现。在运行时，运行时根据本地设备的类型，为OP选择特定的Kernel实现，完成该OP的计算。

其中，大多数Kernel基于Eigen::Tensor实现。Eigen::Tensor是一个使用C++模板技术，为多核CPU/GPU生成高效的并发代码。但是，TensorFlow也可以灵活地直接使用cuDNN实现更高效的Kernel。此外，TensorFlow实现了矢量化技术，使得在移动设备，及其满足高吞吐量，以数据为中心的应用需求，实现更高效的推理。如果对于复合OP的子计算过程很难表示，或执行效率低下，TensorFlow甚至支持更高效的Kernle实现的注册，其扩展性表现相当优越。

技术栈

最后，按照TensorFlow的软件层次，通过一张表格罗列TensorFlow的技术栈，以便更清晰地对上述内容做一个简单回顾。

一、神经网络的实现过程

1、准备数据集，提取特征，作为输入喂给神经网络
2、搭建神经网络结构，从输入到输出
3、大量特征数据喂给 NN，迭代优化 NN 参数
4、使用训练好的模型预测和分类

二、前向传播

前向传播就是搭建模型的计算过程，可以针对一组输入给出相应的输出。

举例：假如生产一批零件，体积为 x1，重量为 x2，体积和重量就是我们选择的特征，把它们喂入神经网络，当体积和重量这组数据走过神经网络后会得到一个输出。假如输入的特征值是：体积 0.7 ，重量 0.5 ，下图是搭建的神经网络框架图

由搭建的神经网络可得，隐藏层节点 a11=x1* w11+x2*w21=0.14+0.15=0.29，同理算得节点 a12=0.32， a13=0.38，最终计算得到输出层 Y=-0.015，这便实现了前向传播过程。

接下来推导图中的代码实现过程。

第一层：

（1）x是输入为1*2的矩阵：用x表示输入，是一个1行2列的矩阵，表示一次输入一组特征，这组特征包含了体积和重量两个元素。

（2）W前节点编号，后节点编号（层数）为待优化的参数：前面两个节点，后面三个节点。所以w应该是个两行三列的矩阵。表示为

注意：神经网络共有几层是指计算层，输入不算作计算层，所以上图中a 为第一层网络，a 是一个一行三列矩阵。

第二层：

（1）参数要满足前面三个节点，后面一个节点，所以W（2）是三行一列矩阵。表示为

把每层输入乘以线上的权重w，这样就可以用矩阵乘法输出y了。

三、后向传播

反向传播：训练模型参数，以减小loss值为目的，使用优化方法，使得 NN 模型在训练数据上的损失函数最小。

损失函数（loss）：计算得到的预测值 y 与已知答案 y_ 的差距。损失函数的计算有很多方法，均方误差（ MSE）是比较常用的方法之一。

均方误差 MSE：求前向传播计算结果与已知答案之差的平方再求平均。数学公式为：

用tensorflow函数表示为：loss_mse = tf.reduce_mean(tf.square(y_ - y))

反向传播训练方法：以减小 loss 值为优化目标。一般有梯度下降、 momentum 优化器、 adam 优化器等优化方法。这三种优化方法用 tensorflow 的函数可以表示为：

train_step=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

train_step=tf.train.MomentumOptimizer(learning_rate, momentum).minimize(loss)

train_step=tf.train.AdamOptimizer(learning_rate).minimize(loss) 三种优化方法的区别：

学习率：决定每次参数更新的幅度。

优化器中都需要一个叫做学习率的参数，使用时，如果学习率选择过大会出现震荡不收敛的情况（步子跨的太大），如果学习率选择过小，会出现收敛速度慢的情况。可以选个比较小的值填入，比如 0.01、0.001。

四、搭建神经网络的过程

（1）导入模块，生成模拟数据集

Import

常量定义

生成数据集

（2）前向传播：定义输入、参数和输出

x= y_=

w1= w2=

a= y=

（3）后向传播：定义损失函数、反向传播方法

loss=

train_step=

（4）生成会话，训练STEPS轮

with tf.Session as sess:

init_op = tf.global_variables_initializer()

sess.run(init_op)

STEPS =

for i in range(STEPS):

start =

end =

sess.run(train_step, feed_dict={ })

神经网络优化

1、神经元模型：

之前的神经元结构都采用线上的权重w直接乘以输入数据x，用数学表达式即，但这样的结构不够完善。完善的结构需要加上偏置，并加上激励函数。用数学公式表示为：。其中f为激励函数。神经网络就是由以这样的神经元为基本单位构成的。

2、激活函数

引入非线性激活因素，提高模型的表达力。

3、神经网络的复杂度

可以用神经网络的层数和神经网络待优化的参数个数来表示

4、神经网络的层数

层数=n个隐藏层 + 1个输出层

注意：一般不计入输入层

5、神经网络待优化的参数

神经网络所有参数w、b的个数

举例：下图为神经网络示意图

在该神经网络中，包含1个输入层、1个隐藏层和1个输出层，该神经网络的层数为2层。(不计入输入层)

在该神经网络中，参数的个数是所有参数w的个数加上所有参数b的总数，第一层参数用三行四列的二阶张量表示（即12个线上的权重w）再加上4个偏置b；第二层参数是四行两列的二阶张量（即8个线上的权重w）再加上2个偏置b。总参数=3*4+4+4*2+2=26。

神经网络优化问题

1、损失函数（loss）

用来表示预测值（y）与已知答案（y_）的差距。在训练神经网络时，通过不断改变神经网络中所有参数，使损失函数不断减小，从而训练出更高准确率的神经网络模型。

常用的损失函数有：

（1）均方误差（mse）

均方误差就是n个样本的预测值y与已知答案y_之差的平方和，再求平均值。数学公式为，在Tensorflow中表示为 tf.reduce_mean(tf.square(y-y_))

（2）自定义

上面的模型中，损失函数采用的是MSE，但根据事实情况我们知道，销量预测问题不是简单的成本和利润相等问题。如果预测多了，卖不出去，损失的是成本，反之预测少了，损失的是利润，现实情况往往利润和成本是不相等的。因此，需要使用符合该问题的自定义损失函数。自定义损失函数数学公式为：loss = Σnf(y_,y)

到本问题中可以定义成分段函数：

用tf的函数表示为：loss = tf.reduce_sum(tf.where(tf.greater(y,y_),cost(y-y_),PROFIT(y_-y)))

（3）交叉熵（Cross Entropy）

表示两个概率分布之间的距离，交叉熵越大，说明两个概率分布距离越远，两个概率分布越相异；交叉熵越小，说明两个概率分布距离越近，两个概率分布越相似。交叉熵计算公式为：H(y_,y)=-Σy_ * log10 y

在tf中表示为：ce = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y,1e-12,1.0))) # 确保y<1e-12为1e-2,y>1为1

举一个数学的例子，比如标准答案y_=(1,0)。y1=（0.6，0.4 ） y2=（0.8，0.2），哪个更接近标准答案呢。

在tf中，一般让模型的输出经过softmax函数，进而获得输出分类的概率分布，再与标准答案对比，求得交叉熵，得到损失函数，并且有专门的函数。

ce = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1))

cem = tf.reduce_mean(ce)

这也就代替了ce = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y,1e-12,1.0))) 这句函数。

2、学习率

学习率过大，会导致待优化参数在最小值附近波动，不收敛；学习率过小，导致训练次数增大，收敛缓慢。

(1)随机梯度下降算法更新参数

首先随机梯度下降方法更新参数的公式为：wn+1=wn - learning_rate * ▽ （▽表示损失函数关于参数的偏导）

如果参数初值为5，学习率为0.2，则参数更新情况为：

能看的出来，如果损失函数使用随机梯度下降优化器，loss的最小值应该是0，此时参数w为-1 。

（2）指数衰减学习率

指数衰减学习率就是指学习率会随着训练轮数变化而实现动态更新，它不再是一个定值。计算公式为：learning_rate = learning_rate_base * learning_rate_decay global_step/learning_rate_step，这里面的概念：

learning_rate_base:学习率基数，一般认为和学习率初始值相等

learning_rate_decay：学习率衰减率，范围是（0，1）

global_step:运行了几轮batch_size

learning_rate_step:多少论更新一次学习率=总样本数/batch_size

在tensorflow中，我们用这样的函数来表示：

首先要有一个值指向当前的训练轮数，这是一个不可训练参数，作为一个“线索”global_step = tf.Variable(0,trainable=False)

再来就是一个学习率的函数：learning_rate = tf.train.exponential_decay(LEARNING_RATE_BASE,global_step, LEARNING_RATE_STEP, LEARNING_RATE_DECAY,staircase=True/False)# 其他的参数已经在上面提到过，最后一个参数staircase，当设置为True时，表示global_step/learning_rate_step取整数，学习率阶梯型衰减；若为False，学习率是一条平滑下降的曲线。

3、滑动平均（影子）

滑动平均值（也有人称为影子值），记录了一段时间内模型中所有的参数w和b各自的平均值。使用影子值可以增强模型的泛化能力。就感觉是给参数加了影子，参数变化，影子缓慢跟随。

影子 = 衰减率*影子 + （1-衰减率）*参数

其中，影子初值 = 参数初值；衰减率 = min{moving_average_decay , (1+轮数)/(10+轮数) }

例如，moving_average_decay赋值为0.99，参数w设置为0，影子值为0

(1) 开始时，训练轮数为0，参数更新为1，则w的影子值为：

影子 = min(0.99,1/10)*0+(1-min(0.99,1/10))*1=0.9

(2) 当训练轮数为100时，参数w更新为10，则w的影子值为：

影子 = min(0.99,101/110)*0.9+(1– min(0.99,101/110)*10 = 0.826+0.818=1.644

(3) 当训练轮数为100时，参数w更新为1.644，则w的影子值为：

影子 = min(0.99,101/110)*1.644+(1– min(0.99,101/110)*10 = 2.328

(4) 当训练轮数为100时，参数w更新为2.328，则w的影子值为：

影子 = 2.956

用tensorflow函数可以表示为以下内容：

ema = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY， global_step)

ema_op = ema.apply(tf.trainable_variables())

with tf.control_dependencies([train_step, ema_op]):

train_op = tf.no_op(name='train')

4、正则化

正则化是解决神经网络过拟合的有效方法。

过拟合：神经网络模型在训练集上准确率高，在测试集进行预测或分类时准确率吧较低，说明模型的泛化能力差。

正则化：在损失函数中给每个参数w加上权重，引入模型复杂度指标，从而抑制模型噪声，减小过拟合。

根据正则化的定义，可以得出新的损失函数值：

loss = loss(y-y_) + regularizer* loss(w)

第一项是预测结果与标准答案的差距，第二项是正则化计算结果。

正则化有两种计算方法：(1)L1正则化：lossL1 = ∑i |wi|,tf函数表示为：loss(w) = tf.contrib.layers.l1_regularizer(regularizer)(w)。(2)L2正则化：lossL2 = ∑i |wi|2 , tf函数表示为：loss(w) = tf.contrib.layers.l2_regularizer(regularizer)(w)

正则化实现用tensorflow可以表示为：

tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(regularizer)(w)

loss = cem + tf.add_n(tf.get_collection('losses')) # cem即交叉熵损失函数的值

1.2 研究现状

神经网络有大量的参数，经常发生过拟合问题，即往往在训练集上准确率很高，而在测试集上效果差。这部分归因于当时的训练数据集规模都较小。而且计算资源有限，即便是训练一个较小的网络也需要很长的时间。总体而言，神经网络与其它模型相比并未在识别的准确率上体现出明显的优势，而且难于训练。因此更多的学者开始采用诸如支持向量机、Boosting、最近邻等分类器。这些分类器可以用具有一个或两个隐含层的神经网络模拟，因此被称作浅层机器学习模型。它们不再模拟大脑的认知机理；相反，针对不同的任务设计不同的系统，并采用不同的手工设计的特征。例如语音识别采用高斯混合模型和隐马尔可夫模型，物体识别采用SIFT特征，人脸识别采用LBP特征，行人检测采用HOG特征。

2006年，Geoffrey Hinton提出了深度学习，之后深度学习在诸多领域取得了巨大成功，受到广泛关注。神经网络能够重新焕发青春的原因有几个方面。首先是大数据的出现在很大程度上缓解了训练过拟合的问题。例如ImageNet[2]训练集拥有上百万有标注的图像。计算机硬件的飞速发展提供了强大的计算能力，使得训练大规模神经网络成为可能。一片GPU可以集成上千个核。此外神经网络的模型设计和训练方法都取得了长足的进步。例如，为了改进神经网络的训练，学者提出了非监督和逐层的预训练。它使得在利用反向传播对网络进行全局优化之前，网络参数能达到一个好的起始点，从而训练完成时能达到一个较好的局部极小点。

深度学习在计算机视觉领域最具影响力的突破发生在2012年，Hinton的研究小组采用深度学习赢得了ImageNet[2]图像分类的比赛[3]。ImageNet是当今计算机视觉领域最具影响力的比赛之一。它的训练和测试样本都来自于互联网图片。训练样本超过百万，任务是将测试样本分成1000类。自2009年，包括工业界在内的很多计算机视觉小组都参加了每年一度的比赛，各个小组的方法逐渐趋同。在2012年的比赛中，排名2到4位的小组都采用的是传统的计算机视觉方法，手工设计的特征，他们准确率的差别不超过1%。Hinton的研究小组是首次参加比赛，深度学习比第二名超出了10%以上。这个结果在计算机视觉领域产生了极大的震动，掀起了深度学习的热潮。

2012 年，一篇来自多伦多大学的文章引起了所有人的注意。这篇文章就是《ImageNet Classification with Deep Convolutional Networks》，发布在 NIPS 上。这篇文章随后成为了该领域最具影响力的论文，并且在 ImageNet 挑战赛上降低了 50% 的错误率，这是一个史无前例的进展。这篇文章建议使用深度卷积神经网络 (CNN) 来进行图像分类。相比于今天使用的各种卷积神经网络，它相对来说比较简单。这篇文章的主要贡献是：

第一次成功地将深度神经网络应用在大规模图像分类问题上。这其中的一部分原因是 ImageNet 中有大量带有标注的数据，同时，使用了两个 GPU 并行计算。

1、使用 ReLU 作为非线性激活函数，相比于 tanh 函数，ReLU 在获得更好的性能的同时还能减少训练时间。如今，ReLU 已经逐渐成为深度网络的默认激活函数。

2、使用数据增强技术，包括图像平移 (image translation)、水平翻转 (horizontal reflections) 和均值减法 (mean subtraction)。这些技术在如今的很多计算机视觉任务中都被广泛使用。

3、使用随机失活(dropout) 来防止模型对训练数据过拟合。

4、提出连续卷积、池化层及全连接层的网络结构，这一结构至今仍然是许多顶尖网络的基础。

总的来说，AlexNet 是一项里程碑式的工作，它提供了使用 CNN 完成计算机视觉任务的基准和基本技术。

论文《Very Deep Convolutional Neural Networks for Large-Scale Image Recognition》于 2014 年问世，文中的 VGGNet 进一步扩展了包含许多卷积层和 ReLu 的深度网络。它们的核心思想是，你并不需要很多新奇的技巧来获得很高的准确率，大量的 3x3 卷积核和非线性网络就可以做到这一点！这篇论文的主要贡献是：

1、使用了尺寸只有 3x3 的滤波器代替 AlexNet 中 11x11 的滤波器。他们认为，两个连续的 3x3 卷积和一个 5x5 的卷积核具有相同的接受域（receptive field）或者视场 (即可观测到的像素数量)；类似地，三个连续的 3x3 卷积核相当于一个 7x7 的卷积核。这样做的好处是，使用较小的滤波器尺寸就可以获得与更大的滤波器相同的效果。而较小的滤波器具有的一个好处是减少了参数的数量，其次是在每个卷积层之间使用 ReLU 函数可以在网络中引入更多的非线性，使决策函数更具有判别性。

2、随着每层输入量的空间尺寸减小（由于池化层的作用），它的深度在逐渐增加。原因是随着空间信息的减小（通过最大池化降采样），图像被编码为更具有判别性的特征来提高分类任务的准确率。因此特征图 (feature map) 的数量随着深度而增加，以便将这些特征图用在分类任务中。

3、它介绍了一种新的数据增强方式：抖动 (scale jittering)。

4、使用 Caffe 工具包搭建模型，从此深度学习库变得越来越流行。

再深一点的网络：GoogLeNet 和 Inception 模块

在文章《Going Deeper with Convolutions》中，GoogLeNet 框架首次真正解决了计算资源的问题，并提出了多尺度处理方法。当我们不断加深分类网络的深度，我们面临着需要使用大量内存的困境。另外，之前已经发展出了很多不同尺寸的滤波器：从 1x1 到 11x11，如何选择使用哪种滤波器？Inception 模块和 GoogLeNet 解决了这些问题，具体贡献如下：

1、通过在每个 3x3 和 5x5 卷积之前使用 1x1 卷积，Inception 模块有效地减少了每层特征图的数量，从而减少了计算量和内存损耗！

2、Inception 模块具有并行的 1x1、3x3 和 5x5 卷积操作。这背后的想法是让网络通过训练来决定哪些信息应当被学习和使用。它还可以进行多尺度处理：模型可以分别通过较小的卷积核和更大的卷积核获得局部特征与抽象特征。

3、GoogLeNet 首次引入这样的想法：CNN 的每一层并不总是要依次叠加。本文的作者表示，在追求更深层的网络结构的同时，增加网络宽度当然也可以获得更好的性能。

使用一个捷径来跳跃：ResNet

自从 2015 年《Deep Residual Learning for Image Recognition》首次发布，ResNet 在众多计算机视觉任务的精确度上获得了巨大的提升。ResNet 在 ImageNet 挑战赛上首次超越人类表现，并且残差学习 (residual learning) 如今被普遍应用于很多性能最好的网络：

1、证明单纯的堆积网络层使网络更深，这不见得总是好的，实际上这样有可能导致网络性能更差。

2、为了解决上面提到的这个问题，他们引入了跨越式连接的残差学习。这个想法通过使用跨越式连接作为一种捷径，网络的深层可以使用前面层的特征。这样使得特征信息可以更好地通过网络传播。同样，训练时梯度也能够更高效地反向传播。

3、第一个“超深”的网络，通常使用 100-200 层。

将捷径扩展到极致：DenseNet

在文章《Densely Connnected Convolutional Networks》中提出的 DenseNet 将快捷连接发展到了极致。DenseNet 扩展了 ResNet 中快捷连接的想法，但比其具有更稠密的连接：

1、DenseNet 将每一层与其它层通过前馈方式连接。这样网络的每一层可以使用前面所有层的特征图作为输入，并且它的特征图将会被后面所有层使用。

2、使用了串联的方式而不是类似于 ResNet 中直接相加的方式，原始特征因此可以直接通过这些层。

3、比 ResNet 取得了更好的效果。DenseNet 有效地抑制了梯度消失的问题，增强了特征传播，鼓励特征再利用，大幅减少了参数量。

以上就是过去几年中图像分类任务发展中的一些重要框架。令人激动的是，这些已取得的重大突破与进展已经被用于解决很多实际应用，但是仍然存在一个问题……

深度学习未来将如何发展

尽管深度学习已经取得了很多重大的进展，但是我们仍需保持谦虚的态度，力求让它变得更好。深度学习在图像分类问题中仍然存在很多挑战，如果我们想要获得更进一步的发展，如何解决这些挑战是至关重要的。这里我将回顾一些我认为重要的研究人员正在积极尝试解决的问题：

从有监督学习到无监督学习

如今，大部分图像分类任务使用的深度学习方法都是有监督的，即我们需要大量的标注数据来进行训练，这些数据是单调的，而且难以获得。比如 ImageNet 挑战赛有 130 万张训练样本，但是只有 1000 个不同的种类，并且需要人工获取和标注所有的图像，这是非常费时费力的工作。

很多时候，当公司想要将一个图像分类网络应用到他们自己的具体应用中，他们需要使用迁移学习的思想来微调在 ImageNet 上预训练过的网络。为了微调网络，他们还需要收集自己的数据并进行标注，这仍然是乏味且费时的过程。

研究人员目前正在积极努力地解决这个问题，并取得了一些进展。越来越多的工作开始转向这个方面，比如快速有效地迁移学习，半监督学习和小样本学习。我们可能无法直接进入无监督学习，但是这些方法的研究是朝着正确方向迈出的重要一步。

对抗学习

生成对抗网络 (GAN) 的流行带来了图像分类的一个新挑战：对抗图像。对抗图像的类别对人类来说是显而易见的，但是深度网络却不能正确地识别。比如上面的图像，只是加入了轻微的失真 (表观上的)，深度网络就将它从熊猫分到了长臂猿。

这张图像在人类看来这仍然是一只熊猫，但是由于某些原因导致深度网络进行了错误的分类。这在实际应用的时候是非常危险的：试想一下如果自动驾驶汽车没有识别出行人而直接开过去会怎样？导致这一问题的部分原因可能是由于我们对网络内部的原理和机制没有充分的理解，但是无论如何，研究人员正在积极地投身于解决这个具有挑战性的问题当中。

加快进展

深度学习方面的很多进步是由硬件（尤其是 GPU）的改进所驱动的，GPU 可以高速地处理并行计算程序。由于使用矩阵操作，深度网络需要大量的乘加运算，而 GPU 非常擅长这些运算。这对于深度学习的发展来说非常棒，但是并不是所有地方都有 GPU 可以用！

许多顶尖的网络，包括上面已经讨论过的网络，都只能在高端 GPU 上正常运行。移动设备是一个巨大的市场，如何让深度神经网络也能服务于这个市场是关键一步。此外，随着网络越来越深，它们往往需要更多的内存，这也限制了更多的设备来运行网络。

实际上，这方面的研究最近已经有了很大的提升，逐渐流行的 MobileNets 是一种可以直接在移动端运行深度网络的框架。它使用另一种卷积方式来减少内存消耗和推理时间。

转载于:https://www.cnblogs.com/tszr/p/11172224.html

你可能感兴趣的:(人工智能,python,后端)

从API到Agent：万字洞悉LangChain工程化设计 bpluo42657 langchain
——构建下一代AI应用的核心范式迁移一、传统API范式的局限性：为什么需要Agent？接口式AI的痛点python#传统NLPAPI调用示例response=openai.Completion.create(model="text-davinci-003",prompt="请翻译：Helloworld",max_tokens=50)单次请求/响应模式缺乏状态管理与上下文延续硬编码逻辑难以应对复杂场
【项目实战】在 Python 中，可以通过 `subprocess` 模块调用系统的压缩程序（如 7-Zip 或系统自带的zip命令）来实现文件或文件夹的压缩。本本本添哥 011 -Python python 7-zip 开发语言
在Python中，可以通过subprocess模块调用系统的压缩程序（如7-Zip或系统自带的zip命令）来实现文件或文件夹的压缩。通过subprocess调用系统压缩工具（如7-Zip）是最灵活的方式，支持多线程、密码保护和多种压缩格式。需注意路径配置和参数的正确性，并通过异常处理提升代码健壮性。对于轻量需求，可优先考虑zipfile或py7zr等库。以下是详细的实现方法和注意事项：1.使用7-
《Python 微服务架构实践指南：框架与工具的深度解析》清水白石008 python Python题库架构 python 微服务
《Python微服务架构实践指南：框架与工具的深度解析》开篇引入背景介绍：在现代应用开发中，微服务架构因其高扩展性、灵活性和模块化优势而备受关注。从电商平台到数据处理，微服务架构逐渐取代传统单体架构，成为开发者首选。而Python凭借其简洁优雅的语法和丰富的生态系统，为实现微服务架构提供了坚实的基础。为什么写这篇文章：作为一名资深开发者和教育者，我深切感受到许多开发者在微服务设计中的困惑。因此，本
使用uv工具高效管理Python版本安装指南庞翰烽
使用uv工具高效管理Python版本安装指南前言在现代Python开发中，多版本Python环境管理是每个开发者都会遇到的挑战。传统方式需要手动下载安装不同版本的Python，配置环境变量，过程繁琐且容易出错。uv工具提供了一套优雅的解决方案，让Python版本管理变得简单高效。uv工具简介uv是一个现代化的Python工具链管理器，它不仅能够管理Python包依赖，还能智能地管理Python解释
用python实现无限弹窗-五一劳动节快乐数据知道 python3案例和总结 python 开发语言
更多内容请见：python3案例和总结-专栏介绍和目录文章目录1.使用`tkinter`实现无限弹窗1.1实现代码1.2代码说明2.使用`pyautogui`实现无限弹窗2.1安装`pyautogui`2.2实现代码2.3代码说明3.使用`ctypes`实现无限弹窗3.1实现代码3.2代码说明4.注意事项5.总结使用tkinter库使用pyautogui库在Python中实现无限弹窗可以通过tki
鸿蒙应用App Linking优化：深度链接性能操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
鸿蒙应用AppLinking优化：深度链接性能关键词：鸿蒙系统、AppLinking、深度链接、性能优化、路由匹配、参数解析、冷启动优化摘要：本文深入探讨鸿蒙系统下AppLinking深度链接的性能优化策略。从核心概念解析出发，详细阐述深度链接在鸿蒙架构中的实现原理，包括Ability路由机制、链接解析算法和参数传递模型。通过数学模型分析路由匹配复杂度，结合Python算法示例演示链接解析过程。基
Eureka 为大数据领域服务治理带来的新思路大数据洞察大数据AI应用大数据与AI人工智能 eureka 大数据云原生 ai
Eureka为大数据领域服务治理带来的新思路关键词：Eureka，大数据，服务治理，分布式系统，微服务摘要：本文深入探讨了Eureka为大数据领域服务治理带来的新思路。首先介绍了大数据领域服务治理的背景和现状，阐述了Eureka的核心概念与工作原理。接着详细分析了Eureka核心算法原理，结合Python代码进行说明，并给出相关数学模型和公式。通过项目实战案例，展示了Eureka在大数据服务治理中
Python爬虫技术：高效采集开放数据的5种方法大数据洞察 python 爬虫 wpf ai
Python爬虫技术：高效采集开放数据的5种方法关键词：Python爬虫、开放数据采集、请求库、异步爬虫、分布式爬虫、动态网页解析、API直连摘要：本文围绕“如何用Python高效采集开放数据”展开，系统讲解5种主流爬虫方法（基础请求库、异步请求、动态网页渲染、分布式爬虫、API直连）的原理、适用场景与实战技巧。通过生活类比、代码示例和真实案例，帮助读者快速掌握不同场景下的爬虫策略，同时强调数据合
AI人才实在太抢手！顶级科学家年薪超7000万：中高级也能过千万程序员超超人工智能 transformer 深度学习 java spring boot ai 大模型
快科技7月2日消息，据媒体报道，激烈的人工智能人才争夺战，导致一些顶尖资深研究科学家的年薪超过1000万美元（约7167万元人民币）。而典型的薪资方案则处于300万至700万美元区间，相较于2022年，这一数字实现了约50%的增长。薪酬追踪网站Levels的统计数据显示，Meta给予AI工程师的薪酬范围为18.6万至320万美元，OpenAI则在21.2万至250万美元之间；若以薪酬中位数来衡量，
边缘计算与量子模型优化驱动医疗诊断新突破
内容概要在医疗人工智能领域，边缘计算与量子模型优化的协同演进正重构诊断系统的技术范式。通过将计算节点前置至医疗设备端，边缘架构有效解决了传统云端模型面临的实时性瓶颈，配合量子优化算法对复杂特征空间的快速寻优能力，使得CT、MRI等高维影像数据的解析效率提升显著。值得关注的是，框架选型直接影响着模型部署的可行性——TensorFlow在移动端推理优化方面的工具链完备性，与PyTorch动态图机制对迭
量子生成对抗网络：量子计算与生成模型的融合革命牧之112 量子计算生成对抗网络人工智能
引言：当生成对抗网络遇上量子计算在人工智能与量子计算双重浪潮的交汇处，量子生成对抗网络（QuantumGenerativeAdversarialNetworks,QGAN）正成为突破经典算力瓶颈的关键技术。传统生成对抗网络（GAN）在图像生成、数据增强等领域已取得辉煌成就，但其参数规模与计算复杂度随着数据维度呈指数级增长。量子计算的叠加性、纠缠性和并行性，为解决这一矛盾提供了全新思路。2025年，
LeetCode 633.平方数之和（python题解） wendong97 LeetCode从零起步 #双指针 leetcode python 算法
LeetCode633.平方数之和（python题解）题目示例分析题解用到的基础知识计算平方和平方根取整参考题目给定一个非负整数c，你要判断是否存在两个整数a和b，使得a2+b2=c示例输入:5输出:True解释:1*1+2*2=5分析本题与上一题LeetCode167.两数之和II非常相似，把两数之和变成了平方数之和，利用上一题答案的思路，同样设置两个一左一右的指针，很容易就可以解答出来。这里要
OpenAI模型可解释性工具：理解AI的黑箱 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能百度 ai
OpenAI模型可解释性工具：理解AI的黑箱关键词：OpenAI模型、可解释性工具、AI黑箱、模型理解、人工智能摘要：本文旨在深入探讨OpenAI模型可解释性工具，帮助大家理解AI这个“黑箱”。首先介绍了研究的背景、目的和预期读者，接着解释了核心概念，包括OpenAI模型、可解释性工具等，阐述了它们之间的关系。通过核心算法原理、数学模型和公式的讲解，让大家明白其内在机制。还给出了项目实战案例，包括
骗局套路：卧虎藏隆应天书府隆国强被骗无法提现！讲述背后事实！正义青天
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！近期作者接触到了很多投资者被所谓的“隆国强”（骗子假冒）在卧虎藏隆应天书府带单的案例。这些新平台打着
[特殊字符] 简易分贝仪制作（基于麦克风 + Python） qq_27684373 python 开发语言
一、基本原理1.什么是dBSPL？**声压级（SoundPressureLevel,SPL）**定义为：SPL(dB)=20⋅log⁡10(pp0)\text{SPL(dB)}=20\cdot\log_{10}\left(\frac{p}{p_0}\right)SPL(dB)=20⋅log10(p0p)ppp：声压值（单位Pa，帕斯卡）p0=20μPa=2×10−5Pap_0=20\mu\text
数据质量是机器学习项目的核心痛点，AI技术能提供智能化解决方案。 zzywxc787 python pandas numpy 人工智能自动化运维 AI编程
一、数据质量诊断系统（Python实现）importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearn.ensembleimportIsolationForestfromtensorflow.keras.modelsimportSequentialfromte
使用python对音频做去噪处理莫夭阏之 python 信号处理语音识别
要使用Python对音频进行去噪处理，您可以使用许多库和算法。以下是使用librosa和scipy库实现的基本去噪算法：首先，您需要安装所需的库。您可以使用以下命令安装它们：pipinstalllibrosascipynumpy接下来，您需要导入所需的库：importlibrosaimportscipy.signalassignalimportnumpyasnp加载音频文件并提取音频数据：y,sr
Python实现音频均衡和降噪 0Kilobyte 音视频
使用librosa库来读取音频文件，音频处理是一个复杂过程，这里只是简单的进行降噪和均衡。importlibrosaimportsoundfileassfdefimprove_audio_quality(input_file,output_file):#读取音频文件audio,sample_rate=librosa.load(input_file)sf.write(output_file,audi
Python的简单降噪应用 adaierya python 开发语言
音频降噪是使用Python进行信号处理的一个常见应用，通常会使用一些信号处理库，如NumPy和SciPy，以及一个用于音频处理的库，如Librosa。如下是一个简单的音频降噪实现步骤和代码示例：步骤1:安装必要的库若还没有安装这些库，请先使用pip进行安装：pipinstallnumpyscipylibrosasoundfile步骤2:导入必要的库在Python代码中，我们需要导入这些库：impo
python 源码安装_源码安装python weixin_39959794 python 源码安装
编译安装新版本python一般来说python是linux系统的标配，但是版本一般却很老，而系统上面的很多服务可能与老的python存在依赖关系，我们又不能直接卸载。所以一般，我们可以在一个单独的目录来安装python。python安装有两种方法：1.源码编译2.使用pyenv此处我们使用源码编译安装：1.下载源码：https://www.python.org/ftp/python/此处有各个版本
python 源码安装 thjinhao python
linux环境下python3.9安装yum-yinstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgdbm-develdb4-devellibpcap-develxz-devellibffi-develyum-yinstallgcc4.python环境的安装（安装pyenv
uvx.exe 跨环境 Python 工具执行器的原理与实战指南
在Windows安装uv时，系统会同时生成一个可执行文件uvx.exe。它并不是新的打包管理器，而是uvtoolrun命令的便捷别名：调用uvx.exe就能在瞬间解析依赖、构建隔离虚拟环境并执行来自Python生态的任意命令行工具，完成过程无需事先创建venv，也不会污染当前项目。官方文档把这种体验类比为npx或pipx的一次性执行，但uvx速度更快、磁盘开销更小，更能契合CI/CD流水线、临时脚
日精进40:最幸福的时刻往往就是那些不经意的时刻飞燕绝尘
今天和三五好友一起在家里做饭聚餐。这是没有任何目的，任何企图的一次聚餐。我们就是最后送NOBu的一次聚餐其他两个人。就是想吃有梨做的大盘鸡！图片发自App我们一起买菜，洗菜，一起做菜，一起准备所有的美食！最后端上桌，一起坐下来，倒上美酒！开始品尝自己亲手做的美味佳肴！2岁的淘气孩子，在大人之间，转来转去，偶尔这里捣蛋一下，偶尔那里调皮一下！扯着有梨刚刚扎的非洲辫子，数着辫子：1.2.5.8.3.2
vscode怎么装python_vscode如何安装python
vscode安装python的方法：1、在vscode的扩展中输入"extinstallpython"安装python插件打开VScode，Ctrl+p输入"extinstallpython"，搜索时间可能会比较长安装过程不能停止，否则重新安装；2、在配置文件“settings.json”修改python的安装路径修改用户设置-settings.json，将"python.pythonPath":
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
关于python的一些面试题
1.技术面试题（1）TCP与UDP的区别是什么？答：在工作机制上TCP采用三次握手四次挥手的机制保障信息传递的稳定性，更适合文件的传输和下载。而UDP采用的是直接传输和直接接受的机制提高信息传递的高效性，更适合点对点的实时交流的环境。（2）DHCP和DNS的作用是什么？答：DHCP相当于网络中的智能管家，他会自动将局域网内的设备进行配置包括但不限于：IP地址、子网掩码、DNS服务器地址。而DNS相
假冒振我中华第六届内部操盘群毛振华不正规!未来低碳项目不能提现难友真实经历告诉你! 法律咨询维权
随着互联网的普及和金融科技的发展，越来越多的人开始使用线上平台进行投资、交易等活动。然而，一些不法分子也利用这些平台实施诈骗行为，给投资者带来了巨大的损失。本文将介绍一种常见的骗局——黑平台无法出金，以帮助大家提高警惕性，避免上当受骗。推荐网上投资理财、数字经济、数字体育、人工智能，数字农业慈善投票网站买数字的等等都是，广大市民对此要提高警惕，遇到此类情况一概不要相信。（注明：该文章出现名字为网上
python里面ca_Python SSL服务器提供中间CA证书洗心岛 python里面ca
我使用Python(2.7)SSL模块编写一些服务器代码，如下所示：ssock=ssl.wrap_socket(sock,ca_certs="all-ca.crt",keyfile="server.key",certfile="server.crt",server_side=True,ssl_version=ssl.PROTOCOL_TLSv1)全部-约阴极射线管'包含签名CA证书和根CA证书：-
服务器搭建python响应https,python实现简单的https服务器
以下提供一个简单的方式快速部署一个https服务器，用于非生产环境的测试使用，如果是正式的生产环境，考虑到性能安全等因素，就不要使用这个了。1、使用pyOpenSSL库：#coding:utf-8fromBaseHTTPServerimportHTTPServer,BaseHTTPRequestHandlerfromSocketServerimportThreadingMixInfromSocke
Leetcode刷题笔记——哈希表篇 code_lover_forever Leetcode刷题笔记 leetcode 笔记散列表 python
Leetcode刷题笔记——哈希表篇一、哈希表在面试中的高频考题第一题：两数之和Leetcode1:两数之和：中等题（详情点击链接见原题）给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标python代码解法classSolution:deftwoSum(self,nums:List[int],target:int)->
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

吴裕雄--天生自然 神经网络人工智能项目：基于深度学习TensorFlow框架的图像分类与目标跟踪报告...