pengdali

实战LeNet-5 AlexNet ResNet 实践 Cifar-10问题

一、Cifar-10的说明

cifar10是一个32*32 的图像10分类问题，一共有60000张图片，我们拿50000张做训练数据，另外拿2000张做测试数据。

为了学习不同网络，这里统一拿这个用作实验材料，关于下载cifar10，或更多说明可以查看官网CIFAR-10

二、LeNet5模型

如图所示这个模型就是2个卷积、池化，再连3个全连接
第一个卷积层6个大小为5＊5卷积核，第二卷积层为16个5＊5卷积核，其他的都比较简单

def build_model_lenet5():
    model = PowerCNNMode('cifar10_lenet5', is_debug=True)
    model.set_input_placeholder([None, IMAGE_SIZE, IMAGE_SIZE, 3], [None, 10])
    model.set_is_train()
    model.set_dropout()
    mode_config = [{'t': 'conv2d', 'x': 5, 'y': 5, 'n': 6, 's': 1, 'a': tf.nn.relu},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 5, 'y': 5, 'n': 16, 's': 1, 'a': tf.nn.relu},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'flatten'},
                   {'t': 'dense', 'u': 120, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'dense', 'u': 84, 'a': tf.nn.relu},
                   {'t': 'dense', 'u': 10, 'a': tf.nn.softmax},
                   ]

    model.inference(mode_config)
    model.set_loss()
    model.set_adamoptimizer(1e-4)
    model.set_accuracy()
    return model

我训练了100轮，可以达到66%

三、AlexNet模型

ps:这个模型及后面的resnet原始模型都是处理imagenet那种大数据库的，cifar10图片尺寸相对比较小，所以这里都做适当的简化
这个介绍下这个模型的几个特点：
1、激活函数全部都使用ReLU（Rectified Linear Unit）

如图它关闭了右边,从而会使得很多的隐层输出为0,即网络变得稀疏,起到了类似L1的正则化作用，可以在一定程度上缓解过拟合。本质上是分段线性模型，前向计算非常简单,无需指数之类操作，Tanh和Logistic激活函数在两端的时候导数容易趋近于零,多级连乘后梯度更加约等于0，相比下它更不容易发生梯度发散问题
2、局部响应归一化LRN（Local Response Normalization）
原理是仿造生物学上活跃的神经元对相邻神经元的抑制现象（侧抑制）

i表示第i个核在位置（x,y）运用激活函数ReLU后的输出，n是同一位置上临近的kernal map的数目，N是kernal的总数。参数K,n,alpha，belta都是超参数，我这里是这么设置的

tf.nn.lrn(in_data, depth_radius=4, bias=1.0, alpha=0.001 / 9.0, beta=0.75, name=name)

3、防止过拟合使用dropout

dropout是以配置的概率将隐层神经元的输出设置为零。以这种方式“dropped out”的神经元既不参与前向传播，也不参与反向传播。所以每次提出一个输入，该神经网络就尝试一个不同的结构，但是所有这些结构之间共享权重。因为神经元不能依赖于其他特定神经元而存在，所以这种技术降低了神经元复杂的互适应关系.
ps：其他的特性比如双GPU、对数据做预处理这里没有实践

4、实验模型代码

def build_model_alexnet():
    model = PowerCNNMode('cifar10_alexnet', is_debug=True)
    model.set_input_placeholder([None, IMAGE_SIZE, IMAGE_SIZE, 3], [None, 10])
    model.set_is_train()
    model.set_dropout()
    mode_config = [{'t': 'conv2d', 'x': 3, 'y': 3, 'n': 32, 's': 1, 'a': tf.nn.relu},
                   {'t': 'lrn'},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 64, 's': 1, 'a': tf.nn.relu},
                   {'t': 'lrn'},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 64, 's': 1, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 128, 's': 1, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 256, 's': 1, 'a': tf.nn.relu},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'flatten'},
                   {'t': 'dense', 'u': 1024, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'dense', 'u': 1024, 'a': tf.nn.relu},
                   {'t': 'dense', 'u': 10, 'a': tf.nn.softmax},
                   ]

    model.inference(mode_config)
    model.set_loss()
    model.set_adamoptimizer(1e-4)
    model.set_accuracy()
    return model

训练100轮，效果果然提升了

四、ResNet模型

这个只展示个34层的图，最大的有152层

这个模型比之前又改进了不少，在imagenet等其他大赛中大放异彩

1、残差块

随着网络的逐步加深，梯度经过一层层的卷积层会逐渐衰减，这个现象也叫梯度弥散
残差神经网络由于存在shorcut connections，网络间的数据流通更为顺畅。ResNet作者认为深度残差网络不太可能由于梯度消失而形成欠拟合，因为这在batch normalized network中就很难出现。残差网络结构的解决方案是，增加卷积层输出求和的捷径连接。
这是我的残差块：

    def res_block(self, in_data, param):
        out_filter = param['n']
        id = param['id']
        name = 'res_block_' + str(id)
        in_filter = in_data.shape.as_list()[-1]
        self.debug(name + ' in shape', in_data.shape.as_list())
        with tf.variable_scope(name):
            if in_filter != out_filter:             #输出是否需要变小
                x = self.conv2d(in_data, {'x':3,'y':3,'n':out_filter,'s':2,'b':False,'id':id})
                orig_x = self.conv2d(in_data, {'x':3,'y':3,'n':out_filter,'s':2,'b':False,'id':id})
            else:
                x = self.conv2d(in_data, {'x': 3, 'y': 3, 'n': out_filter, 's': 1, 'b': False, 'id': id})
                orig_x = tf.identity(in_data, 'orig_x')
            x = self._batch_norm(x, self._is_train, 'bn1')
            x = self._relu(x, self._relu_leakiness)
            x = self.conv2d(x, {'t': 'conv2d', 'x': 3, 'y': 3, 'n': out_filter, 's': 1, 'id': id})
            x = self._batch_norm(x, self._is_train, 'bn2')
            x += orig_x
            x = self._relu(x, self._relu_leakiness)
        self.debug(name + ' out shape', x.get_shape().as_list())
        return x

2、数据归一化（Batch Normalization）
在Inception V2中提出，这个还是为了防止梯度弥散。它的目的就是要让数据具有0均值和单位方差。实际操纵中是用一个Batch的均值和方差作为对整个数据集均值和方差的估计。整个BN的算
法如下

    def _batch_norm(self, in_data, train_phase, name='bn'):
        in_shape = in_data.shape.as_list()
        w_shape = [in_shape[-1]]
        self.debug(name, 'in shape %s  w_shape %s' % (in_shape, w_shape))
        with tf.variable_scope(name):
            beta = self._variable_on_cpu('beta', tf.constant(0., shape=w_shape))
            gamma = self._variable_on_cpu('gamma', tf.constant(1., shape=w_shape))
            axises = np.arange(len(in_data.shape) - 1).tolist()          #卷积 [0,1,2] 全链接 [0]
            batch_mean, batch_var = tf.nn.moments(in_data, axises, name='moments')          #全部样本的均值与方差
            ema = tf.train.ExponentialMovingAverage(decay=0.9)          #移动平均窗口
            def mean_var_with_update():             #训练使用移动平均及移动方差
                ema_apply_op = ema.apply([batch_mean ,batch_var])
                with tf.control_dependencies([ema_apply_op]):
                    return tf.identity(batch_mean) ,tf.identity(batch_var)
            mean, var = tf.cond(train_phase, mean_var_with_update,
                                lambda: (ema.average(batch_mean), ema.average(batch_var)))
            normed = tf.nn.batch_normalization(in_data, mean, var, beta, gamma, 1e-3)
            return normed

3、全局平均池化（global average pooling）
主要是用来解决全连接的问题,其主要是是将最后一层的特征图进行整张图的一个均值池化,形成一个特征点,将这些特征点组成最后的特征向量进行softmax中进行计算
举个例子
假如,最后的一层的数据是10个6*6的特征图,global average pooling是将每一张特征图计算所有像素点的均值,输出一个数据值,这样10 个特征图就会输出10个数据点,将这些数据点组成一个1*10的向量的话,就成为一个特征向量,就可以送入到softmax的分类中计算了
特征图

代码比较简单

    def global_avg_pool(self, in_data, param):
        assert in_data.get_shape().ndims == 4
        name = 'global_pool_' + str(param['id'])
        self.debug(name + ' in shape', in_data.shape)
        x = tf.reduce_mean(in_data, [1, 2])
        self.debug(name + ' out shape', x.shape)
        return x

4、实验模型代码

def build_model_resnet():
    model = PowerCNNMode('cifar10_resnet', is_debug=True)
    model.set_input_placeholder([None, IMAGE_SIZE, IMAGE_SIZE, 3], [None, 10])
    model.set_is_train()
    model.set_dropout()
    mode_config = [{'t': 'conv2d', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'dropout'},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 2},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 1},
                   {'t': 'dropout'},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 2},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'dropout'},
                   {'t': 'global_avg_pool'},
                   {'t': 'dense', 'u': 10, 'a': tf.nn.softmax},
                   ]
    model.inference(mode_config)
    model.set_loss()
    model.set_adamoptimizer(1e-4)
    model.set_accuracy()
    return model

五、代码框架

为了方便的实验各种模型，随意实验调整各种不同配置，我实现了一个简单框架方便使用
1、模型部分
PowerCNNMode.py

import tensorflow as tf
import numpy as np

class PowerCNNMode:
    def __init__(self, mode_name, is_debug=True):
        self.config_key_map = {
                'conv2d' : self.conv2d,
                'max_pool' : self.max_pool,
                'dense' : self.dense,
                'flatten' : self.flatten,
                'dropout' : self.dropout,
                'lrn' : self.lrn,
                'global_avg_pool': self.global_avg_pool,
                'res_block' : self.res_block,
                }
        self._mode_name = mode_name
        self._is_debug = is_debug

        #private
        self.x = None
        self.y_ = None
        self._dropout = None
        self._is_train = None
        self._layer_data = None            #模型评分结果
        self._loss = None            #损失函数
        self._train_op = None            #反向优化
        self._accuracy = None            #检查函数
        self._relu_leakiness = 0.1          #leakiness relu 参数

    #输入数据占位
    def set_input_placeholder(self, x_shape, y_shape):
        self._layer_data = self.x = tf.placeholder(tf.float32, x_shape, name = 'input_data')
        self.debug('input data shape ' ,self.x.shape.as_list())
        self.y_ = tf.placeholder(tf.float32 ,y_shape ,name = 'y_data')
        self.debug('input label shape ' ,self.y_.shape.as_list())
        return self.x, self.y_

    # 输入数据
    def set_input_data(self, in_data, in_label):
        self._layer_data = self.x = in_data
        self.debug('input data shape ', self.x.shape.as_list())
        self.y_ = in_label
        self.debug('input label shape ', self.y_.shape.as_list())

    #dropout参数
    def set_dropout(self):
        self._dropout = tf.placeholder(tf.float32, name='input_dropout')
        return self._dropout

    #is_train参数
    def set_is_train(self):
        self._is_train = tf.placeholder(tf.bool, name='input_is_train')
        return self._is_train

    #设置模型
    def inference(self, config):
        for k,v in enumerate(config):
            v['id'] = k + 1
            fun = self.config_key_map[v['t']]
            self._layer_data = fun(self._layer_data, v)
        return self._layer_data

    #卷集层
    # id 编号
    # x 卷积盒宽
    # y 卷积盒高
    # n 卷积盒个数
    # s 卷积步长
    # a 激活函数 默认 None 无
    # p 填充方式 默认 same
    # b 是否有偏置 默认 有
    def conv2d(self, in_data, param):
        name = 'conv2d_' + str(param['id'])
        w_shape = [param['x'], param['y'], in_data.shape.as_list()[-1], param['n']]
        step = param['s']
        activation = param['a'] if param.has_key('a') else None
        p = param['p'] if param.has_key('p') else 'SAME'
        is_add_bias = param['b'] if param.has_key('b') else True
        self.debug(name ,'in_shape %s  w_shape: %s' % (in_data.shape.as_list(), w_shape))

        with tf.variable_scope(name):
            n = np.sqrt(2. / (param['x'] * param['y'] * param['n']))
            w = self._variable_on_cpu(name+'_w', tf.truncated_normal(w_shape ,stddev = n))
            b = self._variable_on_cpu(name+'_b', tf.constant(0. ,shape=[w_shape[3]]))

            x = tf.nn.conv2d(in_data, w, strides=[1, step, step, 1], padding=p, name=name)
            if is_add_bias:
                x = tf.nn.bias_add(x, b)
            if activation != None:
                x = activation(x)

            self.debug(name + ' out shape', x.shape.as_list())
            return  x

    #定义池化层
    def max_pool(self, in_data, param):
        ksize = param['k']
        step = param['s']
        name = 'max_pool_' + str(param['id'])
        self.debug(name + ' in shape', in_data.shape.as_list())

        with tf.variable_scope(name):
            x = tf.nn.max_pool(in_data ,ksize=[1 ,ksize ,ksize ,1] ,strides=[1 ,step ,step ,1] ,padding='SAME' ,name=name)
            self.debug(name + ' out shape', x.shape.as_list())
            return  x

    #抹平参数
    def flatten(self, in_data, param):
        name = 'flatten_' + str(param['id'])
        k = in_data.shape.as_list()
        self.debug(name + ' in shape' ,k)

        with tf.variable_scope(name):
            x = tf.reshape(in_data, [-1 ,np.prod(k[1:])], name=name)
            self.debug(name + ' out shape', x.shape.as_list())
            return x

    #全连接层
    def dense(self, in_data, param):
        units = param['u']
        activation = param['a'] if param.has_key('a') else None
        name = 'dense_' + str(param['id'])
        input_units = in_data.shape.as_list()
        is_add_bias = param['b'] if param.has_key('p') else True
        self.debug(name + ' in shape' ,input_units)

        with tf.variable_scope(name):
            n = 1./units
            w = self._variable_on_cpu(name+'_w', tf.truncated_normal([input_units[1] ,units] ,stddev = n))
            b = self._variable_on_cpu(name+'_b', tf.constant(0., shape=[units]))
            x = tf.matmul(in_data ,w ,name=name)
            if is_add_bias:
                x = tf.nn.bias_add(x, b)
            if activation != None:
                x = activation(x)
            self.debug(name + ' out shape', x.shape.as_list())
            return x

    #dropout层
    def dropout(self, in_data, param):
        name = 'dropout_' + str(param['id'])
        k = in_data.shape.as_list()
        self.debug(name + ' in shape', k)

        with tf.variable_scope(name):
            x = tf.nn.dropout(in_data, self._dropout, name=name)
            self.debug(name + ' out shape', x.shape.as_list())
            return x

    #局部响应归一化处理
    def lrn(self, in_data, param):
        name = 'norm_' + str(param['id'])
        self.debug(name + ' in shape', in_data.shape.as_list())
        with tf.variable_scope(name):
            x = tf.nn.lrn(in_data, depth_radius=4, bias=1.0, alpha=0.001 / 9.0, beta=0.75, name=name)
            self.debug(name + ' out shape', x.shape.as_list())
            return x

    #全局池化
    def global_avg_pool(self, in_data, param):
        assert in_data.get_shape().ndims == 4
        name = 'global_pool_' + str(param['id'])
        self.debug(name + ' in shape', in_data.shape)
        x = tf.reduce_mean(in_data, [1, 2])
        self.debug(name + ' out shape', x.shape)
        return x

    #损失函数
    def set_loss(self, name='loss'):
        self.debug(name + ' in shape', self._layer_data.shape.as_list())
        with tf.variable_scope(name):
            self._loss =  tf.reduce_mean(-tf.reduce_sum(self.y_ * tf.log(self._layer_data), reduction_indices=[1]))
            return self._loss

    #训练优化器
    def set_adamoptimizer(self, learning_rate=1e-3, name='adamoptimizer'):
        self.debug('optimizer' ,name)
        with tf.variable_scope(name):
            self._train_op = tf.train.AdamOptimizer(learning_rate, name=name).minimize(self._loss)
            return self._train_op

    #检查函数
    def set_accuracy(self, name='accuracy'):
        self.debug(name + ' in shape', self._layer_data.shape.as_list())
        with tf.variable_scope(name):
            correct_prediction = tf.equal(tf.argmax(self._layer_data, 1), tf.argmax(self.y_, 1)) 
            self._accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32) ,name = name) * 100

    #----------resnet模型---------#
    #res标准块
    # id 编号
    # n 输出卷积数
    def res_block(self, in_data, param):
        out_filter = param['n']
        id = param['id']
        name = 'res_block_' + str(id)
        in_filter = in_data.shape.as_list()[-1]
        self.debug(name + ' in shape', in_data.shape.as_list())
        with tf.variable_scope(name):
            if in_filter != out_filter:             #输出是否需要变小
                x = self.conv2d(in_data, {'x':3,'y':3,'n':out_filter,'s':2,'b':False,'id':id})
                orig_x = self.conv2d(in_data, {'x':3,'y':3,'n':out_filter,'s':2,'b':False,'id':id})
            else:
                x = self.conv2d(in_data, {'x': 3, 'y': 3, 'n': out_filter, 's': 1, 'b': False, 'id': id})
                orig_x = tf.identity(in_data, 'orig_x')
            x = self._batch_norm(x, self._is_train, 'bn1')
            x = self._relu(x, self._relu_leakiness)
            x = self.conv2d(x, {'t': 'conv2d', 'x': 3, 'y': 3, 'n': out_filter, 's': 1, 'id': id})
            x = self._batch_norm(x, self._is_train, 'bn2')
            x += orig_x
            x = self._relu(x, self._relu_leakiness)
        self.debug(name + ' out shape', x.get_shape().as_list())
        return x

    #bn层
    def _batch_norm(self, in_data, train_phase, name='bn'):
        in_shape = in_data.shape.as_list()
        w_shape = [in_shape[-1]]
        self.debug(name, 'in shape %s  w_shape %s' % (in_shape, w_shape))
        with tf.variable_scope(name):
            beta = self._variable_on_cpu('beta', tf.constant(0., shape=w_shape))
            gamma = self._variable_on_cpu('gamma', tf.constant(1., shape=w_shape))
            axises = np.arange(len(in_data.shape) - 1).tolist()          #卷积 [0,1,2] 全链接 [0]
            batch_mean, batch_var = tf.nn.moments(in_data, axises, name='moments')          #全部样本的均值与方差
            ema = tf.train.ExponentialMovingAverage(decay=0.9)          #移动平均窗口
            def mean_var_with_update():             #训练使用移动平均及移动方差
                ema_apply_op = ema.apply([batch_mean ,batch_var])
                with tf.control_dependencies([ema_apply_op]):
                    return tf.identity(batch_mean) ,tf.identity(batch_var)
            mean, var = tf.cond(train_phase, mean_var_with_update,
                                lambda: (ema.average(batch_mean), ema.average(batch_var)))
            normed = tf.nn.batch_normalization(in_data, mean, var, beta, gamma, 1e-3)
            return normed

    def _relu(self, x, leakiness=0.0, name='leaky_relu'):
        self.debug(name + ' in shape', x.shape)
        """Relu, with optional leaky support."""
        return tf.where(tf.less(x, 0.0), leakiness * x, x, name=name)

    def _variable_on_cpu(self, name, initializer, trainable=True):
        with tf.device('/cpu:0'):
            var = tf.Variable(initializer, name=name, trainable=trainable)
        return var

    def _get_variable_on_cpu(self, name, shape, initializer, trainable=True):
        with tf.device('/cpu:0'):
            var = tf.get_variable(name, shape, initializer=initializer, dtype=tf.float32, trainable=trainable)
        return var

    #调试信息打印
    def debug(self, name, message=''):
        if self._is_debug:
            print ('%s : %s' % (name, message))

    def get_mode_name(self):
        return self._mode_name

    def get_input_data(self):
        return self.x

    def get_input_labels(self):
        return self.y_

    def get_input_dropout(self):
        return self._dropout

    def get_input_is_train(self):
        return self._is_train

    def get_loss(self):
        return self._loss

    def get_train(self):
        return self._train_op

    def get_accuracy(self):
        return self._accuracy

    def get_pred(self):
        return self._layer_data

2、训练与验证部分
这个部分主要是训练和保存一下最佳验证结果的权值
PowerCNNTrain.py

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import time
from datetime import datetime
import os

class PowerCNNTrain:
    def __init__(self, model, train_data, train_labels, valid_data, valid_labels, is_dropout=False, is_restore=False, is_debug=True):
        self._model = model      #模型
        self._train_data = train_data
        self._train_labels = train_labels
        self._valid_data = valid_data
        self._valid_labels = valid_labels
        self._is_restore = is_restore           #是否使用上次存储参数
        self._is_debug = is_debug           #是否调试

        #---模型接口---
        self._in_data = model.get_input_data()        #输入入口
        self._in_labels = model.get_input_labels()
        self._in_dropout = model.get_input_dropout() if is_dropout else None
        self._in_is_train = model.get_input_is_train()
        self._loss = model.get_loss()             #损失函数
        self._accuracy = model.get_accuracy()         #检查函数
        self._train_op = model.get_train()                #反向优化

        #private
        self._pre_validation = tf.Variable(0., trainable = False)     #之前的精度
        self._global_step = tf.Variable(0, trainable=False)     #总步数


    def train(self, epochs, batch_size, debug_step=10, acc_step=1, dropout=None, is_train=None):
        with tf.Session() as sess:
            if not self.restore(sess):                        #是否还原
                sess.run(tf.initialize_all_variables())          #执行初始化变量

            data_size = self._train_data.shape[0]
            batch_num = int(np.ceil(data_size/float(batch_size)))
            accuracy_plot = []              #收集验证数据

            for i in range(epochs):
                for j in range(batch_num):
                    step_num = i * batch_num + j
                    start_time = time.time()
                    start, end = j * batch_size, min((j+1) * batch_size, data_size)         #得到每批数据边界

                    fd = {self._in_data: self._train_data[start:end], self._in_labels: self._train_labels[start:end]}
                    if dropout != None and self._in_dropout != None:
                        fd[self._in_dropout] = dropout
                    if self._in_is_train != None:
                        fd[self._in_is_train] = True

                    z = sess.run(self._train_op, feed_dict=fd)
                    loss_value = sess.run(self._loss, feed_dict=fd)         #训练

                    #assert not np.isnan(loss_value), 'Model diverged with loss = NaN'
                    duration = time.time() - start_time         #训练时间
                    if step_num % debug_step == 0:         #训练性能
                        examples_per_sec = batch_size / duration
                        sec_per_batch = float(duration)
                        format_str = ('%s: step %d, loss = %.2f (%.1f examples/sec; %.3f ''sec/batch)')
                        self.debug('train',format_str % (datetime.now().strftime("%y-%m-%d %H:%M:%S"), step_num, loss_value,
                                            examples_per_sec, sec_per_batch))

                sess.run(tf.assign(self._global_step ,tf.add(self._global_step , 1)))
                if i % acc_step == 0 :
                    fd = {self._in_data: self._valid_data, self._in_labels: self._valid_labels}
                    if dropout != None and self._in_dropout != None:
                        fd[self._in_dropout] = 1
                    if self._in_is_train != None:
                        fd[self._in_is_train] = False
                    valid_loss, valid_accuracy = sess.run([self._loss, self._accuracy], feed_dict=fd)

                    accuracy_plot.append(valid_accuracy)
                    self.debug('batch_num: %d' % i ,'loss: %f  total: %f' % (valid_loss,valid_accuracy))
                    self.check_and_save(sess, valid_accuracy)


            if self._is_debug != 0 and len(accuracy_plot) > 1:
                plt.plot(accuracy_plot)
                plt.show()

    #检查准确率是否有所提高
    def check_and_save(self, sess, validation):
        if sess.run(self._pre_validation) < validation:
            sess.run(tf.assign(self._pre_validation ,validation))
            self.save(sess)

    #保存当前会话
    def save(self, sess):
        save_dir = self._model.get_mode_name() + '_cp'
        if not os.path.exists(save_dir):
            os.makedirs(save_dir)
        step = self._global_step.eval()
        self.debug('save', '%s  step : %d' % (save_dir , step))
        saver = tf.train.Saver()    # 用于保存变量
        #saver.save(sess, os.path.join(save_dir,'best_validation'), step)
        saver.save(sess, os.path.join(save_dir,'best_validation'))          #保存最佳验证结果

    #恢复之前的数据
    def restore(self, sess):
        if not self._is_restore:
            return False
        #得到检查点文件
        re_path = self._model.get_mode_name() + '_cp'
        ckpt = tf.train.get_checkpoint_state(re_path)
        if ckpt and ckpt.model_checkpoint_path:
            self.debug('restore', ckpt.model_checkpoint_path)
            saver = tf.train.Saver()
            saver.restore(sess, ckpt.model_checkpoint_path) # 还原所有的变量
            self.debug('restore','validation: %f  step: %d' % (self._pre_validation.eval(),self._global_step.eval()))
            return True
        return False

    #----------调试部分-------------#
    #调试信息打印
    def debug(self ,name ,message):
        if self._is_debug:
            print ('%s : %s' % (name, message))

3、最后是构建各种模型

import tensorflow as tf
from PowerCNNMode import PowerCNNMode
from PowerCNNTrain import PowerCNNTrain
#from PowerCNNEval import PowerCNNEval
from tensorflow.python.framework import ops
import numpy as np
from keras.utils import np_utils
from scipy.misc import imsave

IMAGE_SIZE = 32

# 解压缩，返回解压后的字典
def unpickle(file):
    import cPickle
    fo = open(file, 'rb')
    dict = cPickle.load(fo)
    fo.close()
    return dict

def main_resnet():
    #images, labels = build_input_cifar10('./data/cifar-10-batches-bin',128,'train')
    #print(images.get_shape())

    for i in range(1,6):
        file = 'data/cifar-10-batches-py/data_batch_%d' % i
        dict = unpickle(file)
        img = np.reshape(dict['data'], [-1, 3, 32, 32])      #10000, 3, 32, 32
        img = img.transpose(0, 2, 3, 1)

        if i==1:        #显示前10张图片
            for j in range(10):
                picName = 'cifar10_img/%d_%d.jpg' % (j , dict['labels'][j])
                imsave(picName, img[j])

        if not locals().has_key('images'):
            images = img
            labels = np_utils.to_categorical(dict['labels'])
        else:
            images = np.concatenate([images,img])
            labels = np.concatenate([labels,np_utils.to_categorical(dict['labels'])])



    dict = unpickle('data/cifar-10-batches-py/test_batch')
    test_images = np.reshape(dict['data'], [-1, 3, 32, 32])  # 10000, 3, 32, 32
    test_images = test_images.transpose(0, 2, 3, 1)
    test_labels = np_utils.to_categorical(dict['labels'])
    model = build_model_resnet()

    tr = PowerCNNTrain(model, images, labels,
                       test_images[:2000], test_labels[:2000],
                    is_dropout=True, is_restore=False, is_debug=True)
    tr.train(epochs=100, batch_size=128, debug_step=200, acc_step=1, dropout=0.75)

def build_model_lenet5():
    model = PowerCNNMode('cifar10_lenet5', is_debug=True)
    model.set_input_placeholder([None, IMAGE_SIZE, IMAGE_SIZE, 3], [None, 10])
    model.set_is_train()
    model.set_dropout()
    mode_config = [{'t': 'conv2d', 'x': 5, 'y': 5, 'n': 6, 's': 1, 'a': tf.nn.relu},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 5, 'y': 5, 'n': 16, 's': 1, 'a': tf.nn.relu},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'flatten'},
                   {'t': 'dense', 'u': 120, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'dense', 'u': 84, 'a': tf.nn.relu},
                   {'t': 'dense', 'u': 10, 'a': tf.nn.softmax},
                   ]

    model.inference(mode_config)
    model.set_loss()
    model.set_adamoptimizer(1e-4)
    model.set_accuracy()
    return model

def build_model_alexnet():
    model = PowerCNNMode('cifar10_alexnet', is_debug=True)
    model.set_input_placeholder([None, IMAGE_SIZE, IMAGE_SIZE, 3], [None, 10])
    model.set_is_train()
    model.set_dropout()
    mode_config = [{'t': 'conv2d', 'x': 3, 'y': 3, 'n': 32, 's': 1, 'a': tf.nn.relu},
                   {'t': 'lrn'},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 64, 's': 1, 'a': tf.nn.relu},
                   {'t': 'lrn'},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 64, 's': 1, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 128, 's': 1, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'conv2d', 'x': 3, 'y': 3, 'n': 256, 's': 1, 'a': tf.nn.relu},
                   {'t': 'max_pool', 'k': 2, 's': 2},
                   {'t': 'flatten'},
                   {'t': 'dense', 'u': 1024, 'a': tf.nn.relu},
                   {'t': 'dropout'},
                   {'t': 'dense', 'u': 1024, 'a': tf.nn.relu},
                   {'t': 'dense', 'u': 10, 'a': tf.nn.softmax},
                   ]

    model.inference(mode_config)
    model.set_loss()
    model.set_adamoptimizer(1e-4)
    model.set_accuracy()
    return model

def build_model_resnet():
    model = PowerCNNMode('cifar10_resnet', is_debug=True)
    model.set_input_placeholder([None, IMAGE_SIZE, IMAGE_SIZE, 3], [None, 10])
    model.set_is_train()
    model.set_dropout()
    mode_config = [{'t': 'conv2d', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 16, 's': 1},
                   {'t': 'dropout'},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 2},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 32, 's': 1},
                   {'t': 'dropout'},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 2},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'res_block', 'x': 3, 'y': 3, 'n': 64, 's': 1},
                   {'t': 'dropout'},
                   {'t': 'global_avg_pool'},
                   {'t': 'dense', 'u': 10, 'a': tf.nn.softmax},
                   ]
    model.inference(mode_config)
    model.set_loss()
    model.set_adamoptimizer(1e-4)
    model.set_accuracy()
    return model

if __name__ == '__main__':
    ops.reset_default_graph()
    main_resnet()

NVIDIA下一代Hopper架构曝光，采用5nm工艺晶体管超1400亿 Java小海. 架构人工智能后端程序人生 java
据媒体报道，NVIDIA下一代主要面向高性能计算、人工智能等Hopper架构，将会采用5nm工艺制程，晶体管多达1400亿个，面积核心达到了900平方毫米，是有史以来最大的GPU。作为参考，NVIDIA自家旗舰Ampere架构的A100为542亿个晶体管（每平方毫米约为6560万个晶体管），AMD阵营中采用Aldebaran架构的InstinctMI200系列为582亿个晶体管（每平方米约为736
NVIDIA Hopper解说白总Server redis 数据库缓存 rust mongodb 大数据数据仓库
NVIDIAHopper架构是NVIDIA推出的面向高性能计算（HPC）和人工智能（AI）的最新一代GPU架构。它代表了NVIDIA在加速计算领域的最新进展，旨在为AI训练和推理、HPC应用提供前所未有的性能提升。NVIDIAHopper架构和基于该架构的GPU产品H100的详细信息：NVIDIAHopper架构技术特点：第四代TensorCore：Hopper架构引入了第四代TensorCore
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了大模型零基础教程语言模型人工智能自然语言处理大模型
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
1.8 GPT-4：开创人工智能的新纪元少林码僧 AI大模型应用实战专栏人工智能
GPT-4：开创人工智能的新纪元自从OpenAI推出GPT-4以来，人工智能领域经历了显著的突破。作为“生成预训练转换器”家族中的最新成员，GPT-4不仅在功能上进行了提升，更在语言处理能力、理解深度以及适应性方面带来了全新的变革。本篇文章将深入探讨GPT-4的特点、创新以及它如何定义未来人工智能技术的发展。GPT-4的技术亮点1.规模与深度的进一步提升GPT-4的规模比前代模型更大，训练数据量和
第83期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
PyTorch机器学习与深度学习技术方法 Teacher.chenchong 机器学习 python 开发语言
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。Python基础知识串讲1、Python环境搭建（Python软件下载、安装与版本选择；PyCharm下载、安装；Python之HelloW
基于生成式人工智能的网联自动驾驶：通感融合决策技术罗伯特之技术屋行业信息处理技术与政策研究专栏人工智能自动驾驶机器学习
【摘要】探讨了生成式人工智能在网联自动驾驶技术中的潜在价值。现有研究主要侧重于传统感知决策和车联网技术，但却忽视了生成式人工智能在推动自动驾驶方面的重要作用。首先讨论了生成式人工智能技术如何提高自动驾驶决策、训练、感知和导航等模块的性能，接着探讨了其在融合了语义通信、通感一体和新型空口技术的下一代车联网中的角色，然后提出了基于人工智能代理的网联自动驾驶模型，最后强调生成式人工智能是实现车辆高级别自
人工智能英语学习笔记「已注销」
基础篇单词mythologyn.ancientmythsingeneral;ideasthatmanypeoplethinkaretruebutthatdonotexistorarefalse神话Examples:AsatyrishalfmanandhalfgoatinGreekandRomanmythology.在希腊和罗马神话中，森林之神是半人半羊的样子。Thishasbeenwellillu
从小白到高手：人工智能学习中的挑战与突破博雅智信人工智能深度学习机器学习 python 大语言模型
引言：人工智能学习之路充满挑战学习过程中常见的问题与困境环境安装与配置问题简单报错反复调试，时间浪费大学习进度慢，难以找到合适的方向网上资料过多，选择困难导师催进度，任务压力大不敢多问：与同事、师兄师姐的尴尬理论与实践脱节，缺乏实战经验专注力不足，容易被干扰找一个师傅带着的好处高效解决问题，避免走弯路个性化学习路线与系统化知识框架实战经验的传授与导师的成长指导1.引言：人工智能学习之路充满挑战人工
文秘要学计算机吗,高考志愿：计算机专业和文秘专业哪个适合女生？ weixin_39707851 文秘要学计算机吗
原标题：高考志愿：计算机专业和文秘专业哪个适合女生？肯定是文秘专业更加适合女生吧，这对绝大部分女生来说是适用的。其实目前对高中毕业之后读大专的话，能够选择的热门专业不多。目前这个文秘类的专业，像这种速度方向的专业的话，还算是比较热门的。对于绝大部分大专生而言，尤其是女生而言是比较适合报考这种文秘类的专业的。因为目前来说像文秘类这种专业，社会上的需求比较大的。虽然目前有出现这种人工智能方面的软件，减
计算机专业毕业可以做文秘吗,高考志愿：计算机专业和文秘专业哪个适合女生？... ShuYini 计算机专业毕业可以做文秘吗
原标题：高考志愿：计算机专业和文秘专业哪个适合女生？肯定是文秘专业更加适合女生吧，这对绝大部分女生来说是适用的。其实目前对高中毕业之后读大专的话，能够选择的热门专业不多。目前这个文秘类的专业，像这种速度方向的专业的话，还算是比较热门的。对于绝大部分大专生而言，尤其是女生而言是比较适合报考这种文秘类的专业的。因为目前来说像文秘类这种专业，社会上的需求比较大的。虽然目前有出现这种人工智能方面的软件，减
华为 Ascend 平台 YOLOv5 目标检测推理教程 Lunar* 目标检测华为 YOLO 目标检测
1.背景介绍随着人工智能技术的快速发展，目标检测在智能安防、自动驾驶、工业检测等领域中扮演了重要角色。YOLOv5是一种高效的目标检测模型，凭借其速度和精度的平衡广受欢迎。华为Ascend推理框架（ACL）是AscendCANN软件栈的核心组件，专为AscendAI加速硬件（如Atlas300I）设计，可实现高性能的深度学习推理。在本文中，我们将介绍如何基于华为AscendACL推理框架对YOLO
Python学习路线 Python_JC python
Python是一门易学易用的编程语言，广泛应用于数据处理、Web开发、人工智能、自动化运维、游戏开发等领域。本篇文章将介绍Python的学习路线以及一些值得参考的书籍。Python学习路线Python的学习路线主要包括以下几个方面：掌握Python基础知识：了解变量、数据类型、表达式、流程控制、函数、模块等基础概念。学习Python面向对象编程：学习类、对象、继承、多态等面向对象编程的概念和技术。
【2025最新计算机毕业设计】基于SSM的旅游与自然保护平台【提供源码+答辩PPT+文档+项目部署】万码堂源码计算机毕设精品实战案例实战项目源码课程设计 vue.js 前端计算机毕业设计毕设项目 spring boot
作者简介：✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等。业务范围：免费功能设计、开题报告、任务书
【源码+文档】基于SpringBoot+Vue旅游网站系统【提供源码+答辩PPT+参考文档+项目部署】万码堂源码实战项目源码计算机毕设精品实战案例 spring boot vue.js 旅游
作者简介：✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等。业务范围：免费功能设计、开题报告、任务书
人工智能领域单词：英文解释周杰伦_Jay 人工智能深度学习神经网络中文分词全文检索
目录1、前言2、单词组1：15个3、单词组2：15个4、单词组3：15个5、单词组4：15个6、单词组5：15个1、前言亲爱的家人们，创作很不容易，若对您有帮助的话，请点赞收藏加关注哦，您的关注是我持续创作的动力，谢谢大家！有问题请私信或联系邮箱：[email protected]、单词组1：15个1、人工智能(ArtificialIntelligence,AI):atechnologythatsi
华为CANN架构与Ascend C算子开发 z1931195 华为
CANN架构CANN（ComputeArchitectureforNeuralNetworks）是华为专为应对人工智能场景而推出的一种新型异构计算架构。在当前快速发展的AI技术背景下，CANN致力于提供一种高效且灵活的解决方案，以支持多种AI框架的应用。其设计不仅仅关注于上层应用的兼容性，同时也服务于底层AI处理器的优化和编程需求，发挥了承上启下的关键作用，成为华为昇腾AI处理器计算效率提升的核心
探索极致AI性能：昇腾NPU与PyTorch的完美融合 —— Ascend Extension for PyTorch 尤琦珺Bess
探索极致AI性能：昇腾NPU与PyTorch的完美融合——AscendExtensionforPyTorch去发现同类优质开源项目:https://gitcode.com/项目简介在人工智能领域，高效灵活的框架与强大的硬件加速器是实现先进算法的关键组合。AscendExtensionforPyTorch插件，即torch_npu，正是这样一个解决方案，它无缝对接PyTorch框架，将华为昇腾AI处
《盘古大模型——鸿蒙NEXT的智慧引擎》人工智能深度学习
在当今科技飞速发展的时代，华为HarmonyOSNEXT的发布无疑是操作系统领域的一颗重磅炸弹，其将人工智能与操作系统深度融合，开启了智能新时代。而盘古大模型在其中发挥着至关重要的核心作用。赋予小艺智能助手超强能力在鸿蒙NEXT中，盘古大模型赋予了小艺智能助手更强的记忆、推理和规划能力，使其能够支持23类常用记忆类型，掌握万亿token的知识量。基于盘古大模型，小艺可以实现诸如将带有表格的图片转化
《AI 造梦：解锁虚拟场景与角色逼真丰富密码》人工智能深度学习
在科技飞速发展的当下，生成式人工智能正以前所未有的态势席卷各个领域，尤其在构建虚拟世界方面，展现出令人惊叹的潜力。从沉浸式游戏世界到逼真的影视特效场景，从栩栩如生的虚拟偶像到互动性极强的虚拟角色，生成式人工智能正在改写我们对虚拟场景和角色的认知。今天，就让我们深入探寻如何利用这一前沿技术，创造出更加逼真且丰富的虚拟场景与角色。生成式AI技术基石生成式对抗网络（GANs）和变分自编码器（VAEs）是
《鸿蒙微内核与人工智能算法协同，开启智能系统新时代》人工智能深度学习
在当今科技飞速发展的时代，鸿蒙系统以其独特的微内核架构和对人工智能算法的深度融合，正引领着操作系统智能化的新潮流。本文将深入探讨鸿蒙系统的微内核架构是如何与人工智能算法高效协同，从而提升系统性能和智能化水平的。鸿蒙系统微内核架构的优势鸿蒙系统采用微内核架构，将核心功能模块化，只保留最基本的进程管理、内存管理和通信机制等功能在内核中，而文件系统、网络协议等则作为独立的模块放在用户空间运行。这种架构使
《量子AI：突破量子比特稳定性与容错性的关键瓶颈》人工智能深度学习机器学习
在量子计算的发展进程中，量子比特的稳定性和容错性问题一直是阻碍其走向广泛应用的关键障碍。量子AI作为前沿技术，正积极探索各种途径来攻克这些难题。量子纠错：守护量子比特的精准防线量子纠错是解决量子比特稳定性和容错性问题的核心技术之一。其原理是通过在量子比特之间建立量子纠错码，来检测和纠正量子比特在计算过程中发生的错误。比如谷歌量子人工智能实验室采用的“表面码”技术，通过构建物理量子比特的网格来编码逻
第78期 | GPTSecurity周报 aigcgpts
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.ChatNVD：借
智算中心建设热潮涌动 AI服务器赋能加速数据中心
在数字化浪潮汹涌的今天，人工智能新技术新发展日新月异。智算作为数字经济时代的新生产力，正逐步成为推动经济社会高质量发展的新引擎。智算中心：算力时代的“新基建”近年来，随着人工智能技术的迅猛发展和广泛应用，智能算力需求持续爆发，推动了智算中心的快速发展。2022年，随着国家“东数西算”工程启动，我国算力地图正式开始，形成八大枢纽、十大算力中心集群。据中国电信研究院发布的《智算产业发展研究报告（202
让创意在幻觉中肆虐: 认识Illusion Diffusion AI 程序员
人工智能新境界在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品。敬请关注IllusionDiffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造出迷人的视错觉和超现实意境。AI算法的魔力所在IllusionDiffusion的核心是借助先进的AI模型,包括StableDiffusion和ControlNet,来解读用户输入的文本提示,并生成相应的
10 个免费的 AI 图片生成工具分享程序员
原文：https://openaigptguide.com/ai-picture-generator/在人工智能（AI）图像生成技术的推动下，各类AI图片生成网站如雨后春笋般涌现，为我们的日常生活提供了丰富多彩的视觉体验。AI图片生成技术原理人工智能（AI）图片生成技术原理是通过计算机程序使用深度学习算法从大量的数据中学习特征，并根据特征创建新的图片。该技术可以模拟人类的绘画过程，学习输入图像的潜
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息