阿怪的小喵

神经网络

神经网络总体上可分为前馈神经网络和循环神经网络，其依据为网络中是否有环路。前馈神经网络包括多层感知机、自动编码机、受限玻尔兹曼机、BP神经网络、卷积神经网络等。其中BP神经网络虽然称为反向传播网络，其反向指的是误差反向传播，由于不存在环路，其也是前馈神经网络的一种。

一、深度学习中常用的损失函数

损失函数（loss function）是用来估量模型的预测值f(x)与真实值Y的不一致程度，它是一个非负实值函数,通常使用L(Y, f(x))来表示，损失函数越小，模型的鲁棒性就越好。监督学习分为回归和分类两大类，回归问题中常用的损失函数为均方误差，分类问题中常用的损失函数为交叉墒。深度学习的过程也就是使得模型损失函数不断变小，当损失函数达到做小值时，模型的参数最优，模型的输出与期望值更接近。神经网络的训练实际上就是对参数进行优化，让损失函数值最小。

1、均方误差。将目标值和预测值间差值的平方和最小化。

$M S E=\frac{1}{n} \sum_{i=1}^{n}\left(y_{i}-y_{i}'\right)^{2}$

2、交叉墒。交叉墒越小，模型越精确。

交叉墒一般与softmax函数结合使用，神经网络输出yi经过softmax后为：

$\operatorname{soft} \max \left(y_{i}\right)=\frac{e^{y_{i}}}{\sum_{j=1}^{n} e^{y_{j}}}$

即输出为被分为每一类的概率，取概率最大值所对应的类为最终分类。然后再计算交叉墒，公式如下：

$S=-\frac{1}{n} \sum_{i}[y_i \ln {y_i}'+(1-y_i) \ln (1-y_i')]$

二、感知机（MP）

感知机只有输入层和输出层，只有输出层具有计算功能，学习能力有限，是一个二分类的线性分类模型，只能用于解决线性任务，连简单的异或问题都不能解决。如果将计算层增加为两层，计算量又过大，由于没有有效的学习算法而受到限制。为了解决非线性分类问题引入了多层感知机（MLP），多层感知机由输入层、隐藏层、输出层组成，能很好地解决异或问题和非线性可分问题，隐藏层对原始数据进行空间变换，使得原始坐标从线性不可分转换为线性可分，输入层和输出层的节点要分别与特征维度、目标维度相匹配，中间层的结点由设计者决定，在神经网络中，除了输出层每一层都有一个偏置，偏置节点没有输入，只有存储功能，偏置节点是为了确保部分节点无论如何都能够被激活。BP神经网络就是一种典型的多层感知机。

三、BP神经网络

BP算法(即反向传播算法)是在有导师指导下，适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系：一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合，因此具有很强的函数复现能力。其缺点为收敛速度慢，容易陷入局部最小。

BP算法包括信号的前向传播和误差的反向传播两个过程。即计算误差输出时按从输入到输出的方向进行，而调整权值和阈值则从输出到输入的方向进行，使实际输出和期望输出间的误差均方值（即损失函数，损失函数也可用其它方式表示，比如交叉墒）最小。

BP神经网络激活函数一般采用sigmoid。

BP神经网络隐藏层神经元个数由设计者决定，有经验公式K=1+[M*(N+2)]^0.5，MN分别为输入层、输出层节点数目。

实现过程参考：https://blog.csdn.net/zhaomengszu/article/details/77834845

https://blog.csdn.net/weixin_42555080/article/details/94293064

Matlab实现代码举例：

%******************************%
%======原始数据输入========
p=[2845 2833 4488;2833 4488 4554;4488 4554 2928;4554 2928 3497;2928 3497 2261;...
3497 2261 6921;2261 6921 1391;6921 1391 3580;1391 3580 4451;3580 4451 2636;...
4451 2636 3471;2636 3471 3854;3471 3854 3556;3854 3556 2659;3556 2659 4335;...
2659 4335 2882;4335 2882 4084;4335 2882 1999;2882 1999 2889;1999 2889 2175;...
2889 2175 2510;2175 2510 3409;2510 3409 3729;3409 3729 3489;3729 3489 3172;...
3489 3172 4568;3172 4568 4015;]';  

%===========期望输出=======
t=[4554 2928 3497 2261 6921 1391 3580 4451 2636 3471 3854 3556 2659 ...
4335 2882 4084 1999 2889 2175 2510 3409 3729 3489 3172 4568 4015 ...
3666]; 

ptest=[2845 2833 4488;2833 4488 4554;4488 4554 2928;4554 2928 3497;2928 3497 2261;...
3497 2261 6921;2261 6921 1391;6921 1391 3580;1391 3580 4451;3580 4451 2636;...
4451 2636 3471;2636 3471 3854;3471 3854 3556;3854 3556 2659;3556 2659 4335;...
2659 4335 2882;4335 2882 4084;4335 2882 1999;2882 1999 2889;1999 2889 2175;...
2889 2175 2510;2175 2510 3409;2510 3409 3729;3409 3729 3489;3729 3489 3172;...
3489 3172 4568;3172 4568 4015;4568 4015 3666]'; 
 

[pn,minp,maxp,tn,mint,maxt]=premnmx(p,t);  %将数据归一化 

NodeNum1 =20; % 隐层第一层节点数 
NodeNum2=40;   % 隐层第二层节点数 

TypeNum = 1;   % 输出维数  
TF1 = 'tansig';
TF2 = 'tansig'; 
TF3 = 'tansig';
net=newff(minmax(pn),[NodeNum1,NodeNum2,TypeNum],{TF1 TF2 TF3},'traingdx');
%网络创建traingdm 
net.trainParam.show=50; 
net.trainParam.epochs=50000; %训练次数设置 
net.trainParam.goal=1e-5; %训练所要达到的精度
net.trainParam.lr=0.01;   %学习速率      
net=train(net,pn,tn); 

p2n=tramnmx(ptest,minp,maxp);%测试数据的归一化
an=sim(net,p2n);

[a]=postmnmx(an,mint,maxt)   %数据的反归一化 ，即最终想得到的预测结果

V=net.iw{1,1};%输入层权值
theta1=net.b{1}%输入层阈值
W=net.lw{2,1};%输出层权值
theta2=net.b{2};%输出层阈值

plot(1:length(t),t,'o',1:length(t)+1,a,'+'); 
title('o表示预测值--- *表示实际值')
grid on
m=length(a);    %向量a的长度
t1=[t,a(m)];
error=t1-a;     %误差向量
figure
plot(1:length(error),error,'-.') 
title('误差变化图') 
grid on

结果：

python代码举例：

import numpy as np
import scipy.special
class neuralNetwork:
    def __init__(self, inputnodes, hiddennodes, outputnodes, learning_rate):
        self.inodes = inputnodes
        self.hnodes = hiddennodes
        self.onodes = outputnodes
        self.lr = learning_rate
        self.wih = (np.random.rand(self.hnodes ,self.inodes)-0.5)
        self.who = (np.random.rand(self.onodes ,self.hnodes)-0.5)
        self.activation_function =lambda x: scipy.special.expit(x)
    def train(self,inputs_list , targets_list):
        inputs = np.array(inputs_list,ndmin=2).T
        targets =np.array(targets_list,ndmin=2).T
        hidden_inputs = np.dot(self.wih, inputs)
        hidden_outputs =self.activation_function(hidden_inputs)
        final_inputs = np.dot(self.who, hidden_outputs)
        final_outputs =self.activation_function(final_inputs)
        output_errors = targets - final_outputs
        errors_hidden = np.dot(self.who.T , output_errors)
        self.who +=self.lr * np.dot( output_errors * final_outputs * (1-final_outputs ) , np.transpose(hidden_outputs) )
        self.wih +=self.lr * np.dot( errors_hidden * hidden_outputs * (1-hidden_outputs ) , np.transpose(inputs) )
    def query(self ,inputs_list):
        inputs = np.array(inputs_list ,ndmin=2).T
        hidden_inputs = np.dot(self.wih, inputs)
        hidden_outputs =self.activation_function(hidden_inputs)
hidden_outputs = final_inputs
        final_inputs = np.dot(self.who, hidden_outputs)
        final_outputs =self.activation_function(final_inputs)
        return final_outputs
n = neuralNetwork(783,100,10,0.1)
train_data_file =open("C:/Users/Administrator/Desktop/data/kk.txt")
train_data_list = train_data_file.readlines()
train_data_file.close()
for i in range(200):
    j = np.random.randint(len(train_data_list))
    all_value = train_data_list[j].split(',')
    inputs = (np.asfarray(all_value[1:])/255*0.99)+0.01
    targets = np.zeros(10)+0.01
    targets[int(all_value[0])]=0.99
    n.train(inputs,targets)
test_data_file =open("C:/Users/Administrator/Desktop/data/tt.txt")
test_data_list = test_data_file.readlines()
test_data_file.close()
scored = []
for record in test_data_list:
    test_value = record.split(',')
    inputs = (np.asfarray(test_value[1:]) /255 *0.99) +0.01
    outputs = n.query(inputs)
    label = np.argmax(outputs)
    if label ==int(test_value[0]):
        scored.append(1)
    else:
        scored.append(0)
    scored_array =np.asfarray(scored)
print('准确率：',scored_array.sum()/scored_array.size)

四、自动编码器（Auto Encoder）

自动编码器是神经网络的一种，自动编码器（AE）由编码器和解码器组成，编码器实现对输入的映射到隐藏层，解码器将隐藏层的表示解码为输出端的重构结果，假设输入为x，则编码器h=f(x)，解码器s=g(h)=g(f(x))，其中f和g表示某种映射关系，通过训练希望x和s的差异尽可能小。自编码器属于无监督学习，输入和输出维数一样，隐藏层维数较小，相当于一个降维过程，和PCA很像，不同之处在于自编码器可以学习到非线性特征。自编码器的主义用途为降维、去噪和图像生成。

编码器有不同形式的变形，主要有以下几类：

1、欠完备自编码器：香草自编码器；多层自编码器；卷积自编码器（CAE）。

2、正则自编码器：稀疏自编码器；去噪自编码器（DAE）；收缩自编码器（CAE）。

3、变分自编码器（VAE）。

参考资料：https://zhuanlan.zhihu.com/p/84533223

https://blog.csdn.net/weixin_41697507/article/details/88212472

https://blog.csdn.net/qq_27825451/article/details/84968890

五、受限玻尔兹曼机（RBM）

玻尔兹曼机是一种基于能量的神经网络模型，神经元结构包括显层和隐层，传统的玻尔兹曼机中各个神经元间相互连接，即全连接，神经元是布尔型的，只能取0、1，由于全连接计算复杂度很高，难以解决现实问题。受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机生成神经网络，随机”是指网络中的神经元是随机神经元，输出状态只有两种（未激活和激活），状态的具体取值根据概率统计法则来决定，受限玻尔兹曼机和玻尔兹曼机的区别在于，RBM层内无连接，只有层间有连接。RBM是一种双层神经网络，是一种用于降维、分类、回归、协同过滤、特征学习和主题建模的算法，RBM是一个生成模型，也是一个无监督模型。RBM常用对比散度（CD）进行训练。

RBN能量函数表示为：

$E(v, h)=-a^{T} v-b^{T} h-h^{T} W v$

定义RBM的状态为给定v,h的联合概率密度分布为：

$P(v, h)=\frac{1}{Z} e^{-E(v, h)}$

其中Z为归一化因子：

$Z=\sum_{v, h} e^{-E(v, h)}$

RBM可见层到隐藏层、隐藏层到可见层的激活函数都是sigmoid函数。我们期望得到概率函数P的最大值，P越大代表预测概率分布和输入数据概率分布就越接近，将P用损失函数表示，即RBM的训练可理解为求损失函数的最小值，通过不断迭代对权重和偏置进行更新，直到损失函数最小。RBM一般采用对数损失函数：

$L(W, a, b)=-\sum_{i=1}^{m} \ln \left(P\left(V^{(i)}\right)\right)$

由于采用梯度下降算法（即通过求损失函数对权值和偏置的导数来更新参数）对RBM模型进行优化计算复杂度非常大，一般采用CD算法。其参数更新如下：

参考资料：https://baijiahao.baidu.com/s?id=1599798281463567369&wfr=spider&for=pc

https://www.baidu.com/link?url=3BVJU-HhbXTKkRew8JcWtu_t9jnfIDveyKzX8g3Lg55hv2mvyFwr4apXGRh77kjKTFqokleOFl4jeDf-YgFs1FigBlR0nJeD1xe-H90_r_m&wd=&eqid=df1c233b0007089d000000065e65ed5e

https://blog.csdn.net/weixin_42398658/article/details/84279293

https://blog.csdn.net/itplus/article/details/19168937

六、深度置信网络（DBN）

DBN由若干个RBM堆叠而成，上一层的输出作为下一层的输入，由低到高逐层进行训练，然后再进行微调。由于RBM可通过CD快速训练，于是这个框架绕过直接从整体上对DBN高度复杂的训练，而是将DBN的训练简化为对多个RBM的训练，从而简化问题。而且通过这种方式训练后，可以再通过传统的全局学习算法（如BP算法）对网络进行微调，从而使模型收敛到局部最优点，通过这种方式可高效训练出一个深层网络出来。

DBN模型的训练步骤：第一步，分别单独无监督地训练每一层 RBM 网络,确保特征向量映射到不同特征空间时,都尽可能多地保留特征信息；第二步，在 DBN 的最后一层设置 BP 网络,接收 RBM 的输出特征向量作为它的输入特征向量,有监督地训练实体关系分类器。而且每一层 RBM 网络只能确保自身层内的权值对该层特征向量映射达到最优,并不是对整个 DBN 的特征向量映射达到最优，所以反向传播网络还将错误信息自顶向下传播至每一层 RBM，微调整个 DBN 网络。RBM 网络训练模型的过程可以看作对一个深层 BP 网络权值参数的初始化，使DBN 克服了 BP 网络因随机初始化权值参数而容易陷入局部最优和训练时间长的缺点.。上述训练模型中第一步在深度学习的术语叫做预训练，第二步叫做微调。最上面有监督学习的那一层，根据具体的应用领域可以换成任何分类器模型，而不一定是BP网络。

python实现代码：

#加载深度置信相关库
import urllib.request
response=urllib.request.urlopen('http://deeplearning.net/tutorial/code/utils.py')
content=response.read().decode('utf-8')
target=open('utils.py','w')
target.write(content)
target.close()
import math
import tensorflow as tf
import numpy as np
from PIL import Image
from utils import tile_raster_images

class RBM(object):
    def __init__(self, input_size, output_size):
        # Defining the hyperparameters
        self._input_size = input_size  # Size of input
        self._output_size = output_size  # Size of output
        self.epochs = 5  # Amount of training iterations
        self.learning_rate = 1.0  # The step used in gradient descent
        self.batchsize = 100  # The size of how much data will be used for training per sub iteration

        # Initializing weights and biases as matrices full of zeroes
        self.w = np.zeros([input_size, output_size], np.float32)  # Creates and initializes the weights with 0
        self.hb = np.zeros([output_size], np.float32)  # Creates and initializes the hidden biases with 0
        self.vb = np.zeros([input_size], np.float32)  # Creates and initializes the visible biases with 0

    # Fits the result from the weighted visible layer plus the bias into a sigmoid curve
    def prob_h_given_v(self, visible, w, hb):
        # Sigmoid
        return tf.nn.sigmoid(tf.matmul(visible, w) + hb)

    # Fits the result from the weighted hidden layer plus the bias into a sigmoid curve
    def prob_v_given_h(self, hidden, w, vb):
        return tf.nn.sigmoid(tf.matmul(hidden, tf.transpose(w)) + vb)

    # Generate the sample probability
    def sample_prob(self, probs):
        return tf.nn.relu(tf.sign(probs - tf.random_uniform(tf.shape(probs))))

    # Training method for the model
    def train(self, X):
        # Create the placeholders for our parameters
        _w = tf.placeholder("float", [self._input_size, self._output_size])
        _hb = tf.placeholder("float", [self._output_size])
        _vb = tf.placeholder("float", [self._input_size])

        prv_w = np.zeros([self._input_size, self._output_size],
                         np.float32)  # Creates and initializes the weights with 0
        prv_hb = np.zeros([self._output_size], np.float32)  # Creates and initializes the hidden biases with 0
        prv_vb = np.zeros([self._input_size], np.float32)  # Creates and initializes the visible biases with 0

        cur_w = np.zeros([self._input_size, self._output_size], np.float32)
        cur_hb = np.zeros([self._output_size], np.float32)
        cur_vb = np.zeros([self._input_size], np.float32)
        v0 = tf.placeholder("float", [None, self._input_size])

        # Initialize with sample probabilities
        h0 = self.sample_prob(self.prob_h_given_v(v0, _w, _hb))
        v1 = self.sample_prob(self.prob_v_given_h(h0, _w, _vb))
        h1 = self.prob_h_given_v(v1, _w, _hb)

        # Create the Gradients
        positive_grad = tf.matmul(tf.transpose(v0), h0)
        negative_grad = tf.matmul(tf.transpose(v1), h1)

        # Update learning rates for the layers
        update_w = _w + self.learning_rate * (positive_grad - negative_grad) / tf.to_float(tf.shape(v0)[0])
        update_vb = _vb + self.learning_rate * tf.reduce_mean(v0 - v1, 0)
        update_hb = _hb + self.learning_rate * tf.reduce_mean(h0 - h1, 0)

        # Find the error rate
        err = tf.reduce_mean(tf.square(v0 - v1))

        # Training loop
        with tf.Session() as sess:
            sess.run(tf.global_variables_initializer())
            # For each epoch
            for epoch in range(self.epochs):
                # For each step/batch
                for start, end in zip(range(0, len(X), self.batchsize), range(self.batchsize, len(X), self.batchsize)):
                    batch = X[start:end]
                    # Update the rates
                    cur_w = sess.run(update_w, feed_dict={v0: batch, _w: prv_w, _hb: prv_hb, _vb: prv_vb})
                    cur_hb = sess.run(update_hb, feed_dict={v0: batch, _w: prv_w, _hb: prv_hb, _vb: prv_vb})
                    cur_vb = sess.run(update_vb, feed_dict={v0: batch, _w: prv_w, _hb: prv_hb, _vb: prv_vb})
                    prv_w = cur_w
                    prv_hb = cur_hb
                    prv_vb = cur_vb
                error = sess.run(err, feed_dict={v0: X, _w: cur_w, _vb: cur_vb, _hb: cur_hb})
                print('Epoch: %d' % epoch, 'reconstruction error: %f' % error)
            self.w = prv_w
            self.hb = prv_hb
            self.vb = prv_vb

    # Create expected output for our DBN
    def rbm_outpt(self, X):
        input_X = tf.constant(X)
        _w = tf.constant(self.w)
        _hb = tf.constant(self.hb)
        out = tf.nn.sigmoid(tf.matmul(input_X, _w) + _hb)
        with tf.Session() as sess:
            sess.run(tf.global_variables_initializer())
            return sess.run(out)

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
trX, trY, teX, teY = mnist.train.images, mnist.train.labels, mnist.test.images,mnist.test.labels

RBM_hidden_sizes = [500, 200 , 50 ] #create 4 layers of RBM with size 785-500-200-50

#Since we are training, set input as training data
inpX = trX

#Create list to hold our RBMs
rbm_list = []

#Size of inputs is the number of inputs in the training set
input_size = inpX.shape[1]

#For each RBM we want to generate
for i, size in enumerate(RBM_hidden_sizes):
    print('RBM: ',i,' ',input_size,'->', size)
    rbm_list.append(RBM(input_size, size))
    input_size = size

#For each RBM in our list
for rbm in rbm_list:
    print('New RBM:')
    #Train a new one
    rbm.train(inpX) 
    #Return the output layer
    inpX = rbm.rbm_outpt(inpX)

import numpy as np
import math
import tensorflow as tf


class NN(object):

    def __init__(self, sizes, X, Y):
        # Initialize hyperparameters
        self._sizes = sizes
        self._X = X
        self._Y = Y
        self.w_list = []
        self.b_list = []
        self._learning_rate = 1.0
        self._momentum = 0.0
        self._epoches = 10
        self._batchsize = 100
        input_size = X.shape[1]

        # initialization loop
        for size in self._sizes + [Y.shape[1]]:
            # Define upper limit for the uniform distribution range
            max_range = 4 * math.sqrt(6. / (input_size + size))

            # Initialize weights through a random uniform distribution
            self.w_list.append(
                np.random.uniform(-max_range, max_range, [input_size, size]).astype(np.float32))

            # Initialize bias as zeroes
            self.b_list.append(np.zeros([size], np.float32))
            input_size = size

    # load data from rbm
    def load_from_rbms(self, dbn_sizes, rbm_list):
        # Check if expected sizes are correct
        assert len(dbn_sizes) == len(self._sizes)

        for i in range(len(self._sizes)):
            # Check if for each RBN the expected sizes are correct
            assert dbn_sizes[i] == self._sizes[i]

        # If everything is correct, bring over the weights and biases
        for i in range(len(self._sizes)):
            self.w_list[i] = rbm_list[i].w
            self.b_list[i] = rbm_list[i].hb

    # Training method
    def train(self):
        # Create placeholders for input, weights, biases, output
        _a = [None] * (len(self._sizes) + 2)
        _w = [None] * (len(self._sizes) + 1)
        _b = [None] * (len(self._sizes) + 1)
        _a[0] = tf.placeholder("float", [None, self._X.shape[1]])
        y = tf.placeholder("float", [None, self._Y.shape[1]])

        # Define variables and activation functoin
        for i in range(len(self._sizes) + 1):
            _w[i] = tf.Variable(self.w_list[i])
            _b[i] = tf.Variable(self.b_list[i])
        for i in range(1, len(self._sizes) + 2):
            _a[i] = tf.nn.sigmoid(tf.matmul(_a[i - 1], _w[i - 1]) + _b[i - 1])

        # Define the cost function
        cost = tf.reduce_mean(tf.square(_a[-1] - y))

        # Define the training operation (Momentum Optimizer minimizing the Cost function)
        train_op = tf.train.MomentumOptimizer(
            self._learning_rate, self._momentum).minimize(cost)

        # Prediction operation
        predict_op = tf.argmax(_a[-1], 1)

        # Training Loop
        with tf.Session() as sess:
            # Initialize Variables
            sess.run(tf.global_variables_initializer())

            # For each epoch
            for i in range(self._epoches):

                # For each step
                for start, end in zip(
                        range(0, len(self._X), self._batchsize), range(self._batchsize, len(self._X), self._batchsize)):
                    # Run the training operation on the input data
                    sess.run(train_op, feed_dict={
                        _a[0]: self._X[start:end], y: self._Y[start:end]})

                for j in range(len(self._sizes) + 1):
                    # Retrieve weights and biases
                    self.w_list[j] = sess.run(_w[j])
                    self.b_list[j] = sess.run(_b[j])

                print("Accuracy rating for epoch " + str(i) + ": " + str(np.mean(np.argmax(self._Y, axis=1) == sess.run(predict_op, feed_dict={_a[0]: self._X, y: self._Y}))))
                

nNet = NN(RBM_hidden_sizes, trX, trY)
nNet.load_from_rbms(RBM_hidden_sizes,rbm_list)
nNet.train()

参考资料：https://www.baidu.com/link?url=k01MHdP-9nN-tR2aFp-VFXJ-4bAWRCCX5jWzcEc8iI4eUtxeNrzPhV-tBdfh8tZx2A-GdhG7wVLvnknxMOaRkK&wd=&eqid=b87b19bc0006cf74000000035e675439

https://www.cnblogs.com/pythonlearing/p/9979161.html

六、卷积神经网络（CNN）

卷积神经网络由输入层、隐藏层和输出层组成，隐藏层又包括卷积层、激励层、池化层、全连层。卷积神经网络采用局部连接+权值共享，降低神经元间权重个数的同时不会使其学习能力降低。代表性CNN模型有：LeNet、AlexNet、VGGNet、GoogleNet、ResNet、DenseNet等。

输入层：为输入的数据做预处理，如归一化等；

卷积层：每一层卷积层都是由若干个卷积核组成，每个卷积核的权重值都是通过反向传播算法最佳化得到的。卷积运算的目的是要对输入的图像数据做特征提取，每一个卷积核提取一种特征，所以卷积核也被称为特征提取器（filter）。第一层卷积层可能只是提取一些低级的特征，后面层的卷积层能够从前层的低级特征中迭代提取出更复杂的特征。因此控制卷积层的层数也显得尤为重要。卷积核的大小、步长和填充方式决定了卷积计算后输出特征图的大小。

激励层：激励层把卷积层的计算结果做非线性的映射，增加了它的非线性分割能力。且常采用的激励函数是ReLU(The Rectified Linear Unit,修正线性单元)，它的特点是收敛快，求梯度简单。常用激励函数：sigmoid、tanh、ReLu（速度快）、Leaky ReLu、ELU、Maxout。

池化层：池化层往往夹杂在连续的卷积层之间，用于压缩数据和参数的量，降低网络的复杂度，减少过拟合情况的发生。常用两种下采样包括最大池化和平均池化。一般卷积层间引入最大池化，卷积网络最后一层用平均池化。

全连层：在输出层的前面会有全连接层，把所有局部特征结合变成全局特征，把卷积输出的二维特征图转化成一个一维的向量，并将输出的值送给分类器。在全连接层的特征数会特别多，计算量也相当的大。全连层起到分类的作用。

输出层：输出层将全连接层的结果进行分类输出。

参考资料：https://my.oschina.net/u/876354/blog/1620906

LeNet：https://my.oschina.net/u/876354/blog/1632862#comments

AlexNet：https://my.oschina.net/u/876354/blog/1633143

VGGNet：https://my.oschina.net/u/876354/blog/1634322

GoogLeNet：https://my.oschina.net/u/876354/blog/1637819

常用激活函数：https://my.oschina.net/u/876354/blog/1624376

七、RBF神经网络

RBF是一种三层神经网络，由输入层、隐含层、输出层组成，其中，隐含层的作用是把向量从低维度的p映射到高维度的h，这样低维度线性不可分的情况到高维度就可以变得线性可分了，主要就是核函数的思想。从输入空间到隐层空间的变换是非线性的，从隐层到输出层空间的变换是线性的，加快了学习速度，并可以避免局部最小值问题。径向基神经网络的激活函数为径向基函数，常用的为高斯径向基函数。RBF神经网络具有局部映射特性。

RBF网络的基本思想是：用RBF作为隐单元的“基”构成隐含层空间，这样就可以将输入向量直接映射到隐空间。当RBF的中心点确定以后，这种映射关系也就确定了。而隐含层空间到输出空间的映射是线性的，即网络的输出是隐单元输出的线性加权和。此处的权即为网络可调参数。

激活函数： $R\left(x_{p}-c_{i}\right)=\exp \left(-\frac{1}{2 \sigma^{2}}\left\|x_{p}-c_{i}\right\|^{2}\right)$

输出： $y_{j}=\sum_{i=1}^{h} w_{i j} \exp \left(-\frac{1}{2 \sigma^{2}}\left\|x_{p}-c_{i}\right\|^{2}\right) j=1,2, \cdots, n$

d为期望输出，则基函数的方差为： $\sigma=\frac{1}{P} \sum_{j}^{m}\left\|d_{j}-y_{j} c_{i}\right\|^{2}$

方法一：自组织学习

学习过程分为无监督和有监督两个部分，无监督过程求解隐含层基函数的中心与方差，有监督过程求解隐含层到输出层的权值。

随机选取h个训练样本作为中心，做k-means聚类直到聚类中心不再变化，得到最终的基函数中心。

则方差为： $\sigma_{i}=\frac{c_{\max }}{\sqrt{2 h}} \quad i=1,2, \cdots, h$ ， $c_{max}$ 为所有中心间的最大距离。

最小二乘法计算权值，对损失函数求导等于0：得 $w=\exp \left(\frac{h}{c_{\max }^{2}}\left\|x_{p}-c_{i}\right\|^{2}\right) \quad p=1,2, \cdots, P ; i=1,2, \cdots, h$

方法二：有监督学习

采用监督学习方法对三种参数进行训练。随机初始化基函数的中心、方差、隐含层到输出层的权值，通过梯度下降对参数进行更新。代价函数为网络输出与期望输出的均方差。

matlab代码：

%拟合函数
clc;
clear;
x=rand(2,400);
x=(x-0.5)*1.5*2;
x1=x(1,:);
x2=x(2,:);
F=20+x1.^2-10*cos(2*pi*x1)+x2.^2-10*cos(2*pi*x2);
net=newrb(x,F);

[i,j]=meshgrid(-1.5:0.1:1.5);
t1=i(:)';
t2=j(:)';
tx=[t1;t2];
ty=sim(net,tx);

[x1,x2]=meshgrid(-1.5:0.1:1.5);
F=20+x1.^2-10*cos(2*pi*x1)+x2.^2-10*cos(2*pi*x2);
subplot(1,3,1)
mesh(x1,x2,F);
zlim([0,60]);
title('函数图像');

subplot(1,3,2)
v=reshape(ty,size(i));
mesh(i,j,v);
zlim([0,60]);
title('拟合结果');

subplot(1,3,3)
mesh(x1,x2,F-v);
zlim([0,60]);
title('误差图像');
set(gcf,'position',[300,250,900,400]);

python：参考https://blog.csdn.net/m0_37602827/article/details/103099972?depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-3&utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-3

#自组织学习选取RBF中心
import tensorflow as tf
import numpy as np
from sklearn.cluster import KMeans
 
class RBF:
    def __init__(self,learning_rate=0.002,step_num=10001,hidden_size=10):
        self.learning_rate=learning_rate
        self.step_num=step_num
        self.hidden_size=hidden_size
    
    def getC_S(self,x,class_num):
        estimator=KMeans(n_clusters=class_num,max_iter=10000) 
        estimator.fit(x) 
        c=estimator.cluster_centers_
        n=len(c)
        s=0;
        for i in range(n):
            j=i+1
            while j0 and epoch%500==0:
                    mse=sess.run(loss,feed_dict={x_:x,y_:y})
                    print(epoch,mse)
            self.w,self.b=sess.run([w,b],feed_dict={x_:x,y_:y})
        
    def kernel2(self,x,c,s): 
        x1=np.tile(x,[1,self.hidden_size]) 
        x2=np.reshape(x1,[-1,self.hidden_size,self.feature])
        dist=np.sum((x2-c)**2,2)
        return np.exp(-dist/(2*s**2))
    
    def predict(self,x):
        z=self.kernel2(x,self.c,self.s)
        pre=np.matmul(z,self.w)+self.b
        return pre

from sklearn.datasets import load_iris
iris=load_iris()
x=iris.data
y=iris.target
y=y.reshape(-1,1)
model=RBF()
model.train(x,y)

pre=model.predict(x)
for i,v in enumerate(pre):
    if v<1:
        pre[i]=0
    elif v>=1 and v<1.5:
        pre[i]=1
    else:
        pre[i]=2
acc=np.sum(pre==y)/len(pre)
print(acc)

#有监督学习选取中心
import numpy as np
import tensorflow as tf
 
class RBF:

    def __init__(self,learning_rate=0.002,step_num=10001,hidden_size=10):
        self.learning_rate=learning_rate
        self.step_num=step_num
        self.hidden_size=hidden_size
   
    def kernel(self,x,c,s): 
        x1=tf.tile(x,[1,self.hidden_size]) 
        x2=tf.reshape(x1,[-1,self.hidden_size,self.feature])
        dist=tf.reduce_sum((x2-c)**2,2)
        return tf.exp(-dist/(2*s**2))
    
    
    def train(self,x,y):
        self.feature=np.shape(x)[1] 
        x_=tf.placeholder(tf.float32,[None,self.feature]) 
        y_=tf.placeholder(tf.float32,[None,1]) 
        
        
        c=tf.Variable(tf.random_normal([self.hidden_size,self.feature]))
        s=tf.Variable(tf.random_normal([self.hidden_size]))
        z=self.kernel(x_,c,s)
    
       
        w=tf.Variable(tf.random_normal([self.hidden_size,1]))
        b=tf.Variable(tf.zeros([1]))
        yf=tf.matmul(z,w)+b
        
        loss=tf.reduce_mean(tf.square(y_-yf))
        optimizer=tf.train.AdamOptimizer(self.learning_rate) 
        train=optimizer.minimize(loss) 
        init=tf.global_variables_initializer() 

        with tf.Session() as sess:
            sess.run(init)
            for epoch in range(self.step_num):
                sess.run(train,feed_dict={x_:x,y_:y})
                if epoch>0 and epoch%500==0:
                    mse=sess.run(loss,feed_dict={x_:x,y_:y})
                    print(epoch,mse)
            self.c,self.s,self.w,self.b=sess.run([c,s,w,b],feed_dict={x_:x,y_:y})
        
    def kernel2(self,x,c,s): 
        x1=np.tile(x,[1,self.hidden_size]) 
        x2=np.reshape(x1,[-1,self.hidden_size,self.feature])
        dist=np.sum((x2-c)**2,2)
        return np.exp(-dist/(2*s**2))
    
    def predict(self,x):
        z=self.kernel2(x,self.c,self.s)
        pre=np.matmul(z,self.w)+self.b
        return pre

#保存模型
from sklearn.externals import joblib
joblib.dump(model,'rbf_train.m')
clf=joblib.load('rbf_train.m')
clf.predict(x)

八、循环神经网络（RNN）

循环神经网络是一种用于处理序列数据的神经网络，网络会对前面的信息进行记忆并用于当前的输出计算中，隐藏层之间的节点是有连接的，隐藏层的输入不仅包括输入层的输入还包括上一时刻隐藏层的输出。RNN主要用于NLP、语音识别、及其

其中输入序列，隐藏层矢量，输出序列，输入到隐藏层的连接由权重U初始化，隐藏到隐藏的循环连接由权重矩阵W参数化，隐藏到输出的连接由权重矩阵U初始化，假设激活函数使用双曲正切函数，输出用softmax进行概率标准化，则更新方程如下：

$a_t=Ux_t+Wh_{t-1}+b\\ h_t=tanh(a_t))\\ o_t=Vh_t+c\\ \hat{y}=softmax(o_t)$

import numpy as np
X=[1,2]
state=[0.0,0.0]
w_cell_state=np.asarray([[0.1,0.2],[0.3,0.4]])
w_cell_input=np.asarray([0.5,0.6])
b_cell=np.asarray([0.1,-0.1])
w_output=np.asarray([[1.0],[2.0]])
b_output=0.1
for i in range(len(X)):
    before_activation=np.dot(state,w_cell_state)+X[i]*w_cell_input+b_cell
    state=np.tanh(before_activation)
    final_output=np.dot(state,w_output)+b_output
    print("before_activation:",before_activation)
    print("state:",state)
    print("output:",final_output)

参考：https://my.oschina.net/u/876354/blog/1621839

https://www.jb51.net/article/135642.htm

https://zhuanlan.zhihu.com/p/38184788

参数更新方法BPTT推导参考：

https://blog.csdn.net/Torero_lch/article/details/82631946?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-7&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-7

RNN的训练方法BPTT

http://www.mamicode.com/info-detail-1547845.html

九、LSTM（长短期记忆网络）

随着间隔的不断增大，RNN会出现梯度消失或梯度爆炸现象，这就是RNN的长期依赖问题。LSTM是一种特殊的RNN类型，可以学习长期依赖信息。LSTM的结构一般包括遗忘门、输入门和输出门三种结构以及细胞状态，其结构如下：

遗忘门：以一定的概率控制是否遗忘上一层的隐藏细胞状态，代表遗忘上一层隐藏细胞状态的概率。

$f_t=\sigma\left(W_{f} h_{t-1}+U_{f} x_t+b_{f}\right)$

输入门：输入门负责处理当前序列位置的输入，从图中可以看出它由两部分组成，第一部分使用了sigmoid激活函数，第二部分使用了tanh激活函数。

$i_t=\sigma\left(W_{i} h_{t-1}+U_{i} x_t+b_{i}\right)$

$\tilde{C}_t=tanh\left(W_{i} h_{t-1}+U_{i} x_t+b_{c}\right)$

细胞状态：更新细胞状态，由 $C_{t-1}$ 更新为。细胞状态更新是通过遗忘门和输入门共同完成的。

$C_t=C_{t-1} \odot f_t+i_t\odot \tilde{C_t}$ ，其中 $\odot$ 为哈达玛积

输出门：

$o_t=\sigma\left(W_{o} h_{t-1}+U_{o} x_t+b_{o}\right)$

$h_t=o_t\odot tanh(C_t)$

则当前序列索引预测输出为： $\hat{y}_t=\sigma\left(Vh_t+c\right)$

参考：https://my.oschina.net/u/876354/blog/1621839

十、GRU网络（门控循环单元）

GRU是LSTM的一个变体，它保持了LSTM的效果（即能解决RNN中长依赖问题），但结构更加简单，GRU模型中只有两个门：更新门和重置门。其网络结构如下：为重置门，为更新门。重置门控制前一状态有多少信息被写入到当前的候选集 $\tilde{h}_t$ 上，重置门越小，前一状态的信息被写入的就越少；更新门用于控制前一时刻的状态信息被带入到当前状态中的程度，更新门的值越大说明前一时刻的状态信息带入越多。

网络的前向传播：

$\begin{aligned} &\begin{array}{l} r_{t}=\sigma\left(W_{r} \cdot\left[h_{t-1}, x_{t}\right]\right) \\ z_{t}=\sigma\left(W_{z} \cdot\left[h_{t-1}, x_{t}\right]\right) \end{array}\\ &\tilde{h}_{t}=\tanh \left(W_{\tilde{h}} \cdot\left[r_{t} * h_{t-1}, x_{t}\right]\right)\\ &h_{t}=\left(1-z_{t}\right) * h_{t-1}+z_{t} * \tilde{h}_{t}\\ &y_{t}=\sigma\left(W_{o} \cdot h_{t}\right) \end{aligned}$

其中[ ]表示两个向量相连，*表示矩阵的乘积。

GRU 参数更少因此更容易收敛，但是数据集很大的情况下，LSTM表达性能更好。

参考：https://blog.csdn.net/fu6543210/article/details/90741622

十一、神经网络中常见的防止过拟合（overfitting）方法

在训练神经网络时，我们常常有训练集、测试集和验证集三种数据集。有时候训练出来的神经网络在训练集上表现很好（准确率很高），但在测试集上的准确率比较差，因为在训练模型时对一些参数的设置要求过高，而新的样本数据无法达到如此高的要求，导致模型在测试集上的效果很差。这种现象被称为过拟合，也就是过度学习了训练集上的特征，导致泛化能力较差。常见的防止过拟合有以下几种：

1、早期停止（early stoping）

对模型进行训练的过程即是对模型的参数进行学习更新的过程，这个参数学习的过程往往会用到一些迭代方法，如梯度下降学习算法。早期停止便是一种迭代次数截断的方法来防止过拟合的方法，即在模型对训练数据集迭代收敛之前停止迭代来防止过拟合。

早期停止方法的具体做法是，在每一个Epoch结束时（一个Epoch集为对所有的训练数据的一轮遍历）计算validation data的accuracy，当accuracy不再提高时，就停止训练。因为accurary都不再提高了，在继续训练也是无益的，只会提高训练的时间。

那么该做法的一个重点便是怎样才认为validation accurary不再提高了呢？并不是说validation accuracy一降下来便认为不再提高了，因为可能经过这个Epoch后，accuracy降低了，但是随后的Epoch又让accuracy又上去了，所以不能根据一两次的连续降低就判断不再提高。

一般的做法是，在训练的过程中，记录到目前为止最好的validation accuracy，当连续10次Epoch（或者更多次）没达到最佳accuracy时，则可以认为accuracy不再提高了。此时便可以停止迭代了（早期停止）。这种策略也称为“No-improvement-in-n”，n即Epoch的次数，可以根据实际情况取，如10、20、30……

2、数据增强（data augmentation）

在数据挖掘领域中，有时候往往拥有更多的数据胜过一个好的模型。因为我们在使用训练数据训练模型，通过这个模型对将来的数据进行拟合，而在这之间又一个假设便是，训练数据与将来的数据是独立同分布的。即使用当前的训练数据来对将来的数据进行估计与模拟，而更多的数据往往估计与模拟更准确。而实际中我们拥有的数据有限，可通过人为地创造一些数据，比如对图像进行翻转、裁剪等产生新的数据，数据集扩增可采用以下方法：

a、从数据源头采集更多数据；

b、复制原有数据并加上随机噪声

c、重采样

d、根据当前数据集估计数据分布参数，使用该分布产生更多数据等

3、正则化

为了避免过拟合问题，一个常用的方法就是正则化，正则化也称权重衰减（weight decay）。一般而言模型的复杂度只由权重决定，所以一般只对w进行规范化，不对b进行规范化。神经网络中常用的正则化方法有L1正则化和L2正则化两种，计算公式为：

$R(w)=\|w\|_{1}=\sum_{i}\left|w_{i}\right|$ $R(w)=\|w\|_{2}^{2}=\sum_{i}\left|w_{i}^{2}\right|$

正则化的思想为，在损失函数后添加L1或L2正则项，例如L2规范化后的交叉墒为：

$C=-\frac{1}{n} \sum_{i}\left[y_{i} \ln y_{i}^{'}+\left(1-y_{j}\right) \ln \left(1-y_{i}^{'}\right)\right]+\frac{\lambda}{2 n} \sum_{i} w_i^{2}$

无论是哪一种正则化方式，基本的思想都是希望通过限制权重的大小，使得模型不能任意拟合训练数据中的随机噪声，正则化的效果为让网络倾向于学习小一点的权重。这两种正则化都惩罚大的权重，但L1正则化会让参数变得稀疏，而L2正则化不会。所谓参数变得更加稀疏是指会有更多的参数变成0，这样可以达到类似特征选取的功能。

4、Dropout

Dropout是一种相当激进的技术，和之前的正则化技术不同，它不改变网络本身，而是会随机地删除网络中的一般隐藏的神经元，并且让输入层和输出层的神经元保持不变。

我们每次使用梯度下降时，只使用随机的一般神经元进行更新权值和偏置，因此我们的神经网络时再一半隐藏神经元被丢弃的情况下学习的。而当我们运行整个网络时，是两倍的神经元会被激活。因此，我们将从隐藏神经元的权重减半。

这种技术的直观理解为：当我们Dropout不同的神经元集合时，有点像我们在训练不同的神经网络。而不同的神经网络会以不同的方式过拟合，所以Dropout就类似于不同的神经网络以投票的方式降低过拟合。

对于不同的技术，其实都可以理解为：我们在训练网络的健壮性。无论是L1、L2规范化倾向于学习小的权重，还是Dropout强制学习在神经元子集中更加健壮的特征，都是让网络对丢失个体连接的场景更加健壮。

十二、深度学习中常用的激活函数

激活函数可以引入非线性因素，加入非线性激励函数后，神经网络就有可能学习到平滑的曲线来分割平面，而不是用复杂的线性组合逼近平滑曲线来分割平面，使神经网络的表示能力更强了，能够更好的拟合目标函数。激活函数分为“饱和激活函数”和“非饱和激活函数”，sigmoid和tanh是常见的“饱和激活函数”，relu及其变体为“非饱和激活函数”，“非饱和激活函数”能解决梯度消失问题，增加收敛速度。

1、sigmoid函数：函数经过sigmoid后输出值的范围为（0~1）。输出不以0为中心，当输入均为正值时，对w求局部梯度都为正，导致在反向传播过程中w要么都往正方向更新，要么都往负方向更新，导致收敛速度缓慢，同时指数的计算速度很慢。

$f(x)=\sigma(x)=\frac{1}{1+e^{-x}}, f^{\prime}(x)=f(x)(1-f(x))$

2、tanh函数：tanh函数对sigmoid的输出值进行了一个扩展，输出值的范围为（-1，1），但仍然没有解决梯度弥散的问题。tanh(x)=2sigmoid(2x)-1。

$f(x)=\tanh (x)=\frac{e^{x}-e^{-x}}{e^{x}+e^{-x}}, f^{\prime}(x)=1-f(x)^{2}$

3、relu函数：输入小于0的部分输出均为0，大于等于0的部分输出等于输入值，收敛速度较快，解决了正区域梯度弥散的问题，负区域的梯度弥散问题未解决。

$f(x)=\left\{\begin{array}{ll} 0 & \text { for } x<0 \\ x & \text { for } x \geqslant 0 \end{array}, f^{\prime}(x)=\left\{\begin{array}{ll} 0 & \text { for } x<0 \\ 1 & \text { for } x \geqslant 0 \end{array}\right.\right.$

4、noisy relus：在max中加了一个高斯分布的噪声。

$f(x)=\max (0, x+Y), Y \in N(0, \sigma(x))$

5、leaky relus：在relu函数基础上保留了一部分负值，让x为负时乘以a（a取0-1），对负值得信号不是一味地拒绝，而是缩小。

$f(x)=\left\{\begin{array}{c} x(x>0) \\ a x(\text { otherwise }) \end{array} \rightarrow f(x)=\max (x, a x)\right.$

6、elus：在x小于0时做了更复杂的变换。

$f(x)=\left\{\begin{array}{c} x(x \geq 0) \\ a\left(e^{x}-1\right)(\text { otherwise }) \end{array}\right.$

7、softmax函数：softmax的输出结果只有两种（0、1，或-1、1，或0、x）值，如[0 0 1 0 0 ]；通常用于分类，当输入属于某一类的概率大于其它类的概率，则该类的对应值就逼近1，其余类的值逼近0。

$\operatorname{softmax}(x)_{i}=\frac{e^{x_{i}}}{\sum_{j} e^{x_{j}}}$

参考：https://www.cnblogs.com/XDU-Lakers/p/10557496.html

你可能感兴趣的:(神经网络)

使用 Spring AI 调用本地模型实现 drebander AI 编程 spring java springAI
在本篇博客中，我们将学习如何使用SpringAI框架调用本地的PyTorch模型，并通过SpringBoot提供一个预测接口。SpringAI是一个用于将人工智能应用集成到Spring生态系统中的框架，它支持多种AI模型和数据源的集成，帮助开发者将AI模型无缝地集成到Java应用中。1.准备PyTorch模型首先，我们需要训练并保存一个PyTorch模型。这里我们使用一个简单的神经网络模型作为示例
AI需要的基础数学知识大囚长机器学习大模型人工智能
AI（人工智能）涉及多个数学领域，以下是主要的基础数学知识：1.线性代数矩阵与向量：用于表示数据和模型参数。矩阵乘法：用于神经网络的前向传播。特征值与特征向量：用于降维和主成分分析（PCA）。奇异值分解（SVD）：用于数据压缩和降维。2.微积分导数与偏导数：用于优化算法（如梯度下降）。链式法则：用于反向传播算法。积分：在概率和统计中有应用。3.概率与统计概率分布：如高斯分布、伯努利分布等。贝叶斯定
云游戏一二事大囚长运维人生游戏世界游戏
云游戏让CDN边缘计算加速发展，边缘计算节点越来越类似于神经网络的终端节点，AI人类大脑正在加速形成。云游戏就是元宇宙的前站和先锋。云游戏解决了哪些痛点：1.终端成本高玩家购买高端主机设备来适应游戏不断提升的硬件要求，极大程度地加重了玩家成本2.游戏包越来越大，下载安装成本高游戏画面越来越精细的同时也带来了不断膨胀的游戏包体，给游戏存储与推广都带来了更大的压力和成本3.游戏无法在多种终端间自由切换
使用神经网络做二分类预测 weixin_33816300 人工智能 python matlab
不想整理代码了。先给个结果图：train0loss:1838.0616train100loss:1441.5283train200loss:1299.4546train300loss:934.36536train400loss:506.06702train500loss:322.9782train600loss:271.5825train700loss:360.091train800loss:23
Neural Architecture Search (NAS) 原理和应用 weixin_58349913 python
NeuralArchitectureSearch(NAS)原理和应用NeuralArchitectureSearch(NAS)是一种自动化设计神经网络架构的技术。它通过搜索空间中的不同架构配置来找到最优或接近最优的神经网络结构，从而减少人工设计网络结构的工作量。NAS的目标是通过自动化的方式获得比手工设计更高效、准确的模型架构，特别适用于对网络架构要求较高的任务。1.NAS的基本原理NAS的核心思
模型压缩与优化技术——神经架构搜索（Neural Architecture Search, NAS） DuHz 轻量化模型机器学习计算机视觉人工智能神经网络深度学习数据挖掘语音识别
模型压缩与优化技术中的神经架构搜索（NeuralArchitectureSearch,NAS）技术1.引言在深度学习领域，神经网络的架构设计对模型的性能至关重要。传统的手动设计网络架构的过程费时费力，且通常依赖于经验和直觉。为了提升效率与效果，神经架构搜索（NeuralArchitectureSearch,NAS）作为一种自动化的方法，能够通过算法寻找和优化最佳的神经网络架构。NAS可以在图像识别
【揭秘】图像算法工程师岗位如何进入？认识祂人工智能算法图像算法工程师
“图像算法工程师，主要专注于开发图像处理和计算机视觉算法，广泛应用于各行业。本文，我们来揭秘一下他们的日常工作，以及如何成为这一领域的专业人才。”01图像算法工程师的日常工作算法设计与开发图像算法工程师的核心任务是设计和开发算法，以解决特定的图像处理或计算机视觉问题。常见的任务包括：图像分类：使用卷积神经网络（CNN）对图像进行分类，常见算法如ResNet、VGG。目标检测：在图像中定位并标注物体
Python 编译Edge-TTS（edge_tts）转MP3工具浩读语音朗读 edge-tts python edge 自然语言处理前端
Python编译Edge-TTS利用PIPEdge-tts库来实现Azure神经网络自然语音转MP3，这应该是微软给老百姓们一个共享前沿科技大餐。（edge_tts）找了网上的很多源代，现在利用现有公开的代码混编译一个个人的学习工具。代码仅供学习研究。fromtkinterimport*fromtkinter.filedialogimport*fromtkinter.messageboximpor
深度学习｜表示学习｜卷积神经网络｜局部链接是什么？｜06 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：局部连接（LocalConnectivity），是卷积神经网络（CNN）中的一个关键特性。什么是局部连接（LocalConnectivity）？局部连接指的是：在卷积操作中，每个神经元（或输出单元）只与输入数据的一个局部区域相关联，而不是与整个输入数据相连。换句话说：全连接网络（FullyConnectedLayer）中，每个神经元会与上一层所有的神经元相连。卷积网络（Convoluti
机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测墨枣机器学习算法神经网络分类人工智能
机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测本项目链接：https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc1.算法简介和应用1.1算法简介BP（BackPropagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经
python 随机数随机种子 AI算法网奇 python宝典 python 开发语言后端
目录神经网络推理随机种子gpu新版：神经网络推理随机种子gpu：神经网络推理随机种子含npu：numpy.full创建相同矩阵python生成n个随机整数python随机数种子，每次获取相同的随机数随机在区间M内取不重复的N个随机数取一个范围内均匀不重复的随机数神经网络推理随机种子gpu新版：defset_random_seed(seed):"""Setrandomseeds."""random.
Transformer架构原理详解：多头注意力（MultiHead Attention） AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
Transformer,多头注意力,Multi-HeadAttention,机器翻译,自然语言处理,深度学习1.背景介绍近年来，深度学习在自然语言处理（NLP）领域取得了显著进展。传统的循环神经网络（RNN）在处理长序列数据时存在效率低下和梯度消失等问题。为了解决这些问题，谷歌于2017年提出了Transformer架构，并将其应用于机器翻译任务，取得了突破性的成果。Transformer的核心创
人类大脑与大规模神经网络的对比及未来展望东方佑量子变法神经网络人工智能深度学习
引言随着人工智能（AI）技术的迅猛发展，研究人员不断尝试构建更加复杂和强大的模型，以期实现与人类大脑相媲美的智能水平。本文将探讨当前大规模神经网络（LLM,LargeLanguageModels）的发展现状，并基于现有数据对未来进行预测。特别地，我们将分析达到人类大脑突触连接规模所需的时间框架、可能面临的挑战以及使用转义词表技术所带来的优势。人类大脑的基本结构人类大脑是一个极其复杂的系统，包含大约
深度学习模型开发文档 Ares代码行者深度学习
深度学习模型开发文档1.简介2.深度学习模型开发流程3.数据准备3.1数据加载3.2数据可视化4.构建卷积神经网络(CNN)5.模型训练5.1定义损失函数和优化器5.2训练过程6.模型评估与优化6.1模型评估6.2超参数调优7.模型部署8.总结参考资料1.简介深度学习是人工智能的一个分支，利用多层神经网络从数据中提取特征并进行学习。它被广泛应用于图像识别、自然语言处理、语音识别等领域。本文将以构建
联邦学习中客户端发送的梯度是vector而不是tensor wzx_Eleven 联邦学习机器学习网络安全人工智能
在联邦学习中，当本地使用神经网络或深度学习模型时，训练的梯度通常是与模型参数（权重和偏置）相对应的梯度数据。具体来说，梯度的类型和形状取决于模型的结构（例如，卷积神经网络、全连接网络等），以及模型的层数、每层的神经元数量等因素。1.梯度类型：梯度是一个张量：在神经网络中，梯度通常是一个张量（tensor），每一层的梯度张量的形状和该层的权重形状相匹配。具体来说，梯度是损失函数对每个参数的偏导数，表
conv2former模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能 python 神经网络 conda
模型背景在Conv2Former模型提出之前，视觉识别领域的研究主要集中在两个方向：传统卷积神经网络（ConvNets）新兴的视觉Transformer（ViTs）ConvNets通过堆叠基本模块和采用金字塔结构取得了显著进展，但往往忽略了全局上下文信息的显式建模。ViTs则通过自注意力机制有效捕捉全局依赖关系，在多个视觉任务中展现出优异性能。然而，ViTs在处理高分辨率图像时面临计算成本过高的问
Python中实现多层感知机（MLP）的深度学习模型 Echo_Wish Python 笔记从零开始学Python人工智能 python 深度学习开发语言
深度学习已经成为机器学习领域的一个热门话题，而多层感知机（MLP）是最基础的深度学习模型之一。在这篇教程中，我将向你展示如何使用Python来实现一个简单的MLP模型。什么是多层感知机（MLP）？多层感知机（MLP）是一种前馈神经网络，它包含一个输入层、一个或多个隐藏层以及一个输出层。每个层都由一系列的神经元组成，神经元之间通过权重连接。MLP能够学习输入数据的非线性特征，因此在复杂问题的建模中非
AI Agent：深度解析与未来展望码事漫谈 c++人工智能
一、AIAgent的前世：从概念到萌芽（一）早期探索AIAgent的概念可以追溯到20世纪50年代，早期的AI研究主要集中在简单的规则系统上，这些系统的行为是确定性的，输出由输入决定。随着时间的推移，AI逐渐能够处理不确定性，1990年代机器学习的兴起为AIAgent的发展奠定了基础，神经网络技术的突破为深度学习的发展提供了可能。（二）技术突破2017年后，大语言模型（LLM）的出现推动了AIAg
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
【人工智能】Python常用库-Keras：高阶深度学习 API IT古董深度学习人工智能 Python 人工智能 python 深度学习
Keras：高阶深度学习APIKeras是一个高效、用户友好的深度学习框架，作为TensorFlow的高级API，支持快速构建和训练深度学习模型。它以模块化、简单和灵活著称，适合研究和生产环境。Keras的发音为[ˈkerəs]，类似于“凯拉斯”或“克拉斯”。这个名字来源于希腊语κέρας(kéras)，意思是“角”或“角质物”。这个词与深度学习的灵感来源——大脑的神经网络结构有一定联系。Kera
DCGAN - 深度卷积生成对抗网络：基于卷积神经网络的GAN 池央生成对抗网络 cnn 深度学习
深度卷积生成对抗网络（DCGAN，DeepConvolutionalGenerativeAdversarialNetwork）是生成对抗网络（GAN）的一种扩展，它通过使用卷积神经网络（CNN）来实现生成器和判别器的构建。与标准的GAN相比，DCGAN通过引入卷积层来改善图像生成质量，使得生成器能够生成更清晰、更高分辨率的图像。DCGAN提出了一种通过卷积结构来提高图像生成效果的策略，并在多个领域
深度学习从入门到精通：全面指南 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《深度学习从入门到精通：全面指南》文章目录《深度学习从入门到精通：全面指南》文章关键词文章摘要引言第一部分：深度学习基础入门第1章：深度学习概述1.1深度学习的基本概念1.2深度学习的发展历程1.3深度学习的基本原理神经网络前向传播反向传播第2章：深度学习框架入门2.1TensorFlow入门TensorFlow环境搭建TensorFlow基本数据结构2.2PyTorch入门PyTorch环境搭建
【深度学习】Pytorch：在 ResNet 中加入注意力机制 T0uken 深度学习 pytorch 人工智能
在这篇教程中，我们将介绍如何在ResNet网络中加入注意力机制模块。我们将通过对标准ResNet50进行改进，向网络中添加两个自定义的注意力模块，并展示如何实现这一过程。为什么要加入注意力机制注意力机制可以帮助神经网络专注于图像中重要的特征区域，从而提高模型的性能。在卷积神经网络中，加入注意力机制能够有效增强特征提取能力，减少冗余信息的干扰，尤其在处理复杂图像时，能够提升网络的表现。在本教程中，我
2025美赛数学建模-备战2025数学建模美赛——神经网络预测模型详解 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模算法 2025年数学建模美赛 2025年 2025年美赛神经网络人工智能
（全部都是公开资料，不代写论文，请勿盲目订阅）2025年数学建模美赛期间，会发布思路和代码，赛前半价，赛前会发布往年美赛的经典案例，赛题会结合最新款的chatgpto1pro分析，会根据赛题难度，选择合适的题目着重分析，没有代写论文服务，只会发布思路和代码，因为赛制要求，不会回复私信。内容可能达不到大家预期，请不要盲目订阅。已开通200美元/月的chatgptpro会员，会充分利用chatgpto
卷积调制空间自注意力SPATIALatt模型详解及代码复现清风AI 深度学习人工智能 python 神经网络 conda
背景与意义SPATIALaTT模型的提出源于对自注意力机制和卷积神经网络（CNN）的深入研究。在计算机视觉领域，CNN长期占据主导地位，而自注意力机制的引入为视觉任务带来了新的思路。SPATIALaTT模型的意义在于融合了这两种强大的特征提取方法，充分发挥了它们的优势。这种融合不仅提高了模型的性能，还为设计更高效的视觉模型提供了新的思路，推动了计算机视觉技术的发展。通过结合自注意力机制和卷积神经网
深入理解GPT底层原理--从n-gram到RNN到LSTM/GRU到Transformer/GPT的进化网络安全研发随想 rnn gpt lstm
从简单的RNN到复杂的LSTM/GRU,再到引入注意力机制,研究者们一直在努力解决序列建模的核心问题。每一步的进展都为下一步的突破奠定了基础,最终孕育出了革命性的Transformer架构和GPT大模型。1.从n-gram到循环神经网络(RNN)的诞生1.1N-gram模型在深度学习兴起之前,处理序列数据主要依靠统计方法,如n-gram模型。N-gram是一种基于统计的语言模型,它的核心思想是:一
深度学习理论基础（七）Transformer编码器和解码器小仇学长深度学习深度学习 transformer 人工智能编码器解码器
学习目录：深度学习理论基础（一）Python及Torch基础篇深度学习理论基础（二）深度神经网络DNN深度学习理论基础（三）封装数据集及手写数字识别深度学习理论基础（四）Parser命令行参数模块深度学习理论基础（五）卷积神经网络CNN深度学习理论基础（六）Transformer多头自注意力机制深度学习理论基础（七）Transformer编码器和解码器本文目录学习目录：前述：Transformer
深度学习中超参数 fengbingchun Deep Learning hyperparameter
深度学习中的超参数(hyperparameters)是决定网络结构的变量(例如隐藏层数量)和决定网络训练方式的变量(例如学习率)。超参数的选择会显著影响训练模型所需的时间，也会影响模型的性能。超参数是在训练开始之前设置的，而不是从数据中学习的参数。超参数是模型训练期间无法学习的参数，需要事先设置。在深度学习中，模型由模型参数(如神经网络的权重和偏置)定义或表示。然而，训练模型的过程涉及选择最佳超参
深度学习学习笔记（第30周） qq_51339898 深度学习人工智能
一、摘要本周报的目的在于汇报第30周的学习成果，本周主要聚焦于基于深度学习的图像分割领域的常用模型U-net。 U-net是最常用、最简单的一种分割模型，在2015年被提出。UNet网络是一种用于图像分割的卷积神经网络，其特点是采用了U型网络结构，因此称为UNet。UNet算法的关键创新是在解码器中引入了跳跃连接（SkipConnections），即将编码器中的特征图与解码器中对应的特征图进行连接
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro