风尘浪子

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN

前言

上一章为大家介绍过深度学习的基础和多层感知机 MLP 的应用，本章开始将深入讲解卷积神经网络的实用场景。
卷积神经网络 CNN（Convolutional Neural Networks，ConvNet）是一种特殊的深度学习神经网络，近年来在物体识别、图像重绘、视频分析等多个层面得到了广泛的应用。
本文将以VGG16预训练模型为例子，从人脸识别、预训练模型、图片风格迁移、滤波分析、热力图等多过领域介绍 CNN 的应用。

一、卷积神经网络的原理

二、构建第一个 CNN 对MNIST 数字进行分类

三、利用 CNN 进行人脸识别

四、使用 VGG16 框架预训练模型

五、CNN 中间激活层输出图

六、CNN 滤波器的可视化输出

七、CNN 热力图

一、卷积神经网络的原理

卷积神经网络 CNN 是由多个块组成，每个块都具有两种层：卷积层 Conv 和池化层 Pooling，卷积层 Conv 通过卷积核（也称滤波器）进行卷积运算后，由激活函数输出到池化层，再通过池化运算，如此迭代多次后，由最后的一个块通过输出层全连接进行数据输出，完成卷积神经网络的整个过程（如下图）。
可能听起来可能有点复杂，其实可以把 “卷积层 ——> 激活层 ——> 池化层” 作为一个重复块看待，经过多层重复后再由全连接输出，下面将从卷积层和池化层两个方面分别介绍 CNN 流程。

1.1 卷积层

1.1.1 滤波器（卷积核）

假设在卷积层中，有一个 1*6*6 的图形作为输入数据，这里把它称为输入特征图，它经过一个 3*3 的滤波器（也被称为卷积核）进行卷积运算，即从 input 左上角 3*3 的受野区开始计算其张量积，每完成一次计算向右移动，步幅为1，完成此计算后，就会得出一个 1*4*4 的输出特征图（如下图）。

卷积核的形状必须大于等于 2 * 2 ，一般为 3*3 或者 5*5，其步幅可以自定义，一般为 1。如果卷积核步幅为 3，那么一个输入特征图为1*6*6经过步幅为3的3*3卷积核后，输出特征图就会变为 1*2*2, 如此类推。

1.1.2 偏置值

正如正常等式 f(x)=w*x+h 一样，卷积运算也有偏置值，偏置值的运算就是为每个值都加上此张量，如果下图

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第4张图片

1.1.3 填充

经过卷积核运算后，输出特征图会比输入特征图维度少2，也就是一个1*3*3 的输入特征图与一个步幅为1的3*3卷积核运算后，会得出一个 1*1*1 的输出特征图。然而，这时候如果需要得出一个1*3*3 的输出特征图，只需要把 padding 参数设置为 same，系统就会自动把输入称征图变形状为 1*5*5，用 0 来填充再进行运行。

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第5张图片

1.1.4 三维数据卷积运算

上图所介绍的都是二维数据的卷积运算，如果遇到图像处理时，例如 RGB 图片，往往还需要处理一个数据就是通道 channel，一般 RGB 图片的 channel 数为 3（红、绿、蓝），而 monochrome 图片的 channel 数为 1，根据格式不同略有差别。因此卷积核有三维数据的运算，当输入特征图为三维数据时，其卷积核也会变为三维，并将每个维度的结果相加得出输出特征输出图。

我们可以把这个三维的输入特征图看成是一幅 n 个 channel 的图片输入操作，如果图片为 n 个 channel 大小为 width*height 的输入特征图，卷积核的形状是 n*3*3，最后输出特征图将是 1*owitdh * oheight 。

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第7张图片

此时，若用到 w 个卷积核，然后再加入 w 个偏置值，那 n 个 channel 大小为 height * width 的输入特征图将会输出 w 层大小为 oheight * owidth 的输出特征图

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第8张图片

1.1.5 TensorFlow 中的卷积类 ConvNet

在 TensorFlow 1.x 中需要添加一个卷积层，可使用 tf.nn.conv2d 函数

1 def conv2d_v2(input,  filters,   strides,  padding,
2               data_format="NHWC", dilations=None,
3               name=None):

input: 类型为 `float32`, `float64`,`int32`, `uint8`, `int16`, `int8`, `int64`, `bfloat16`, `uint16`, `half`, `uint32`, `uint64`其中一种的张量，形状为 [batch, in_height, in_width, depth]，代表输入的批量数据
filters: 类型为 float32、float64、halt 的张量，输入类型与 input 相同，代表卷积核格式，例如 [1,3,3,1]
strides：int 类型列表，长度为4，用于控制卷积核的移动步幅，与上述参数相同，也是四维的，[1,1,1,1]，其中第一个1和最后一个1是固定值，中间的两个数代表在x轴和y轴的移动步长。
padding：str 类型 [ SAME','VALID'] 之一，用于选择填充的算法，SAME 是填充边界，VALID 是当不足以移动时直接舍弃。
data_formate：str类型 [‘NHWC’、'NCHW' ] 之一，默认值为 NHWC，指定输入和输出数据的格式。NHWC 时数据格式为 [batch, in_height, in_width, in_channels]，NCHW时数据格式为 [batch,in_channels，in_heihgt，in_width]
dilations：int类型列表，格式必须为 [1, rate_height, rate_width, 1]，指定填充边界时的步幅。当边界无需填充时，其默认值为 None，当需要填充边界时，其默认值为 [1,1,1,1]
name: str 类型，名称

在 TensorFlow 2.x 中可以直接使用 Conv2D 类，其常用参数与 TensorFlow 1.x 类似，注意数据输入格式略有不同。

1 class Conv2D(Conv):
2   def __init__(self,filters,kernel_size,strides=(1, 1),padding='valid',
3           data_format=None,dilation_rate=(1, 1),groups=1,activation=None,
4           use_bias=True,kernel_initializer='glorot_uniform',bias_initializer='zeros',
5           kernel_regularizer=None,bias_regularizer=None,activity_regularizer=None,
6           kernel_constraint=None, bias_constraint=None,
7           **kwargs):

filters：int 类型，代表卷积核的数量
kernel_size：int 类型列表，形状 [int,int]，代表卷积核的形状
strides：int 类型列表，默认值为（1 , 1 ）与 tf.nn.conv2d 不同，其形状为 [int , int ] 二维数组，用于控制卷积核的移动步幅。
padding："valid" 或 "same" (大小写敏感)，用于选择填充的算法，same 是填充边界，valid 是当不足以移动时直接舍弃。
data_formate：str类型 [ channels_last , channels_first ] 之一，默认值为 channels_last，指定输入和输出数据的格式。channels_first 时数据格式为 [batch, channels, height, width]，channels_last 时数据格式为 [batch，heihgt，width, in_channels]
dilations：int类型列表，格式必须为 [ rate_height, rate_width ]，默认值为 [1 , 1 ],指定填充边界时的步幅。
group: int 类型，默认为1，指定输入数据中，沿 channel 轴分割的组的数量
activation: str 类型，默认为 None,要使用的激活函数。如果你不指定，则不使用激活函数 (即线性激活： a(x) = x)。
use_bias: bool 类型，默认为 True，指该层是否使用偏置向量。
kernel_initializer: str 类型，默认为 glorot_uniflorm， kernel 权值矩阵的初始化器 (详见 keras.initializers)。
bias_initializer: str 类型，默认为 zeros ，偏置向量的初始化器 (详见 keras.initializers) 。
kernel_regularizer: str 类型，默认为 None，运用到 kernel 权值矩阵的正则化函数 (详见 keras.regularizers)。
bias_regularizer: 运用到偏置向量的正则化函数 (详见 keras.regularizers)。
activity_regularizer: 运用到层输出（它的激活值）的正则化函数 (详见 keras.regularizers)。
kernel_constraint: 运用到 kernel 权值矩阵的约束函数 (详见 keras.constraints)。
bias_constraint: 运用到偏置向量的约束函数 (详见 keras.constraints)。

1.2 最大池化层

池化层分为最大池化层 MaxPool 与均值池化层 AvgPool，其实就是缩小width和height的运算，比如按步幅 2 进行 2*2 MaxPool，相当于在 2*2 的区域中获取最大值运算，取出最大的值。其池化大小往往也步幅相同，即 2 * 2 的池化步幅为2 ，3 * 3 的池化步幅为3，如此类推。

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第9张图片

在 TensorFlow 1.x 中需要添加最大池化层，可使用 tf.nn.max_pool 函数

1 def max_pool(value, ksize, strides, padding,
2        data_format="NHWC", name=None, input=None):

input: 类型为 `float32` 的 4维张量，形状为 [batch, in_height, in_width, depth]，代表输入的批量数据
ksize: 类型为 int 的整数列表，代表池化区域的格式，例如 [1 , 2 , 2 , 1]
strides：int 类型列表，长度为4，用于控制池化的移动步数，与上述参数相同，也是四维的，例如[1,1,1,1]，其中第一个1和最后一个1是固定值，中间的两个数代表在x轴和y轴的移动步长。
padding：str 类型 [ SAME','VALID'] 之一，用于选择填充的算法，SAME 是填充边界，VALID 是当不足以移动时直接舍弃。
data_formate：str类型 [‘NHWC’、'NCHW' ] 之一，默认值为 NHWC，指定输入和输出数据的格式。NHWC 时数据格式为 [batch, in_height, in_width, in_channels]，NCHW时数据格式为 [batch,in_channels，in_heihgt，in_width]
name: str 类型，名称

在 TensorFlow 2.x 中可通过 MaxPooling2D 类生成最大池化层

1 class MaxPooling2D(Pooling2D):
2   def __init__(self, pool_size=(2, 2), strides=None,
3          padding='valid', data_format=None,  **kwargs):

pool_size：int 类型的整数列表，长为2，默认为（2，2），代表池化层在两个方向（竖直，水平）采样范围。
strides：int 类型列表，步长为2的整数列表，默认为 None，用于控制池化的移动步数。当使用 None 时，默认与pool_size 相同。
padding："valid" 或 "same" (大小写敏感)，用于选择填充的算法，same 是填充边界，valid 是当不足以移动时直接舍弃。
data_format：字符串，“channels_first”或“channels_last”之一，代表图像的通道维的位置。默认值为 channels_last，指定输入和输出数据的格式。channels_first 时数据格式为 [batch, channels, height, width]，channels_last 时数据格式为 [batch，heihgt，width, channels]

1.3 卷积神经网络 CNN 的优势

对比起多层感知机，卷积神经网络有其天生的优势。由于多层感知机使用的是全转接层，因此当输入图形数据例如 RGB 图形为三维形状时，需要先对图像进行变形。例如常用的 MNIST 28*28*1 的数字，输入前会先将其转化为 784 的数据形式。如此一来相当于把所有的神经元看作同一维度处理，这样会把原有的三维数据间所隐藏的关联标志，相距像素等重要信息丢弃。
而从上面的例子可以看到，使用卷积神经网络会以三维数据的形式接收输入数据，同时以三维的形式输出到下一层。因此使用 CNN 可以最大程度保存图形原来的特征，这也是近年来 CNN 被广泛应用于图像、视频、人脸识别等领域的原因。

二、构建第一个 CNN 对MNIST 数字进行分类

以最简单的 MNIST 数字集为例字，介绍最基础的 CNN 应用。输入 28*28*1 MNIST 数据集，经过 32 个 5*5 的卷积核，池化层形状为 2*2，使用ReLU输出后，数据形状变为 14*14*32。经过64个 5*5 卷积核，池化层形状为 2*2，使用ReLU输出后数据形式变为 7*7*64。然后通过 Flatten 把数据拉直，经过三层的全转接，使用 Adam 模型把输出数从1024、256、50下降到10，最后输出层使用 softmax 激活函数输出。

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第10张图片

完成训练后，测试数据准确率基本保持在 96% 以上

 1 def getmodel():
 2     # 生成模型
 3     model=models.Sequential()
 4     # 32个卷积核形状为 5*5，激活函数为 relu
 5     model.add(layers.Conv2D(filters=32,padding='same',kernel_size=(5,5),activation='relu'))
 6     # 池化层，大小2*2
 7     model.add(layers.MaxPool2D(2,2))
 8     # 64个卷积核形状为 5*5，激活函数为 relu
 9     model.add(layers.Conv2D(filters=64,padding='same',kernel_size=(5,5),activation='relu'))
10     # 池化层，大小2*2
11     model.add(layers.MaxPool2D(2,2))
12     # 拉直数据
13     model.add(layers.Flatten())
14     # 多层 MLP dropout 为 0.5
15     model.add(layers.Dense(1024,activation='relu'))
16     model.add(layers.Dropout(rate=0.5))
17     model.add(layers.Dense(256,activation='relu'))
18     model.add(layers.Dropout(rate=0.5))
19     model.add(layers.Dense(50,activation='relu'))
20     model.add(layers.Dropout(rate=0.5))
21     # 输出层激活函数为 softmax
22     model.add(layers.Dense(10,activation='softmax'))
23     return model
24 
25 def run(X,y,model,epoch=10):
26     # 输入数据转换
27     X,_train=convert(X,y)
28     # 生成训练模型，学习率为0.003
29     model.compile(optimizer=optimizers.Adam(0.003),
30                   loss=losses.sparse_categorical_crossentropy,
31                   metrics=['accuracy'])
32     # 日志输出
33     callbacks= keras.callbacks.TensorBoard(log_dir='logs')
34     model.fit(X,y,batch_size=500,epochs=epoch,callbacks=callbacks)
35     return model
36 
37 def convert(X,y):
38     # 数据格式转换
39     X=X.reshape(-1,28,28,1)
40     X=tf.convert_to_tensor(X,tf.float32)
41     y=tf.convert_to_tensor(y,tf.float32)
42     return X,y
43 
44 if __name__=='__main__':
45     # 获取数据集
46     (X_train,y_train),(X_test,y_test)=keras.datasets.mnist.load_data()
47     # 生成模型
48     model=getmodel()
49     # 数据测试
50     run(X_train,y_train,model)
51     print('------------------------test-----------------------')
52     run(X_test,y_test,model,1)

运行结果

tensorboard 损失函数与正确率变化

三、利用 CNN 进行人脸识别

如今人脸识别是近来最为普及的应用，下面就以此为例介绍 CNN 在人面识别领域的实现方式。这个例子只是基于对 CNN 使用的介绍，实际市场上已经有多个成熟的人脸识别框架可供用户选择。
相信大家也感受到在很多手机 APP 中都有着人脸识别登录的功能，在视频录制时都会要求用户进行张口/闭眼/转头等一系列动作，其目的就是进可能地把用户各个脸面特征收纳到云端，然后利用 cv2 把视频按照帧进行分解，最后对分解的图片进行学习。
下面假设录制好的视频被放到 input 文件夹中，通过 cv2 函数即可把视频分解为 jpg 文件，图片按 50*70的大小统一放到 pic 文件夹内。

 1 def read(videopath,output):
 2     # 读入视频文件
 3     vc=cv2.VideoCapture(videopath)
 4     # 打开文件
 5     isOpen=vc.isOpened()
 6     n=0
 7     while(isOpen):
 8         # 读取数据帧
 9         rval,frame=vc.read()
10         if rval:
11             img=Image.fromarray(frame)
12             # 图片剪切
13             img=img.crop((0,100,500,800))
14             # 图片保存为 50*70 大小
15             out=img.resize((50,70),Image.ANTIALIAS)
16             path=output+str(n)+'.jpg'
17             out.save(path)
18             n=n+1
19 
20         else:
21             break
22     print('success')
23 
24 if __name__=='__main__':
25     path='E://Python_Projects/ANN/venv'
26     read(path+'/input/1.mp4',path+'/pic/train/Leslie')

视频转化为图片后，把图片训练数据和测试数据分别放到 train 和 test 文件夹中，不同人物头像放到不同子文件夹。一般用户注册时视频录制一般不会超过 5 秒，所以转化后的图片数量有限，此时可通过 ImageDataGenerator 类得到增强数据集进行训练，通过 ImageDataGenerator 类可以从变换角度，平移等随机转换的方式来增加训练样本，从而得到更好的泛化能力。
切记使用 ImageDataGenerator 时，增强数据只适用于训练数据集，不用于测试数据集，否则将影响准确率。

 1 @keras_export('keras.preprocessing.image.ImageDataGenerator')
 2 class ImageDataGenerator(image.ImageDataGenerator):
 3   def __init__(self, featurewise_center=False， samplewise_center=False,
 4                featurewise_std_normalization=False,samplewise_std_normalization=False,
 5                zca_whitening=False, zca_epsilon=1e-6,rotation_range=0,
 6                width_shift_range=0., height_shift_range=0.,
 7                brightness_range=None, shear_range=0.,
 8                zoom_range=0.,channel_shift_range=0.,
 9                fill_mode='nearest',cval=0., horizontal_flip=False,
10                vertical_flip=False, rescale=None,preprocessing_function=None,
11                data_format=None, validation_split=0.0,dtype=None):
12 
13   def flow_from_directory(self, directory,target_size=(256, 256),
14                color_mode='rgb',classes=None,class_mode='categorical',
15                batch_size=32,shuffle=True, seed=None,
16                save_to_dir=None,save_prefix='', save_format='png',
17                follow_links=False, subset=None,interpolation='nearest'):

__init__构造函数参数说明

featurewise_center：bool 类型，默认为 False ，是否使输入数据集去中心化（均值为0）, 按feature执行
samplewise_center：bool 类型，默认为 False ，是否使输入数据的每个样本均值为0
featurewise_std_normalization：bool 类型，默认为 False ，是否输入除以数据集的标准差以完成标准化, 按feature执行
samplewise_std_normalization：bool 类型，默认为 False ，将输入的每个样本除以其自身的标准差
zca_whitening：bool 类型，默认为 False ，对输入数据施加 ZCA 白化
zca_epsilon: float 类型，默认1e-6，ZCA 使用的 eposilon
rotation_range：int 类型，默认为 0，图片旋转角度
width_shift_rang：float 类型，默认为 0.，图片平移的比例
height_shift_rang: float 类型，默认为 0., 图片垂直移动的比例
brightness_range：
shear_range：float 类型，默认为 0.，剪切强度（逆时针方向的剪切变换角度）
zoom_range：float 类型或形如 [lower,upper] 的列表，默认为 0.，随机缩放的幅度，若为浮点数，则相当于[lower,upper] = [1 - zoom_range, 1+zoom_range]
channel_shift_range：浮点数，随机通道偏移的幅度
horizontal_flip：bool 类型，默认为 False ，是否水平翻转
fill_mode：str 类型，[‘constant’，‘nearest’，‘reflect’, ‘wrap’ ] 之一，默认为 ’nearest' ，当进行变换时超出边界的点将根据本参数给定的方法进行处理
cval：浮点数或整数，当fill_mode=constant时，指定要向超出边界的点填充的值
rescale：默认为None，对图片缩放处理的比例
vertical_flip：布尔值，进行随机竖直翻转
rescale: 重放缩因子,默认为None. 如果为None或0则不进行放缩,否则会将该数值乘到数据上(在应用其他变换之前)
preprocessing_function: 将被应用于每个输入的函数。该函数将在图片缩放和数据提升之后运行。该函数接受一个参数，为一张图片（秩为3的numpy array），并且输出一个具有相同shape的numpy array
data_format：字符串，“channel_first”或“channel_last”之一，代表图像的通道维的位置。该参数是Keras 1.x中的image_dim_ordering，“channel_last”对应原本的“tf”，“channel_first”对应原本的“th”。以128x128的RGB图像为例，“channel_first”应将数据组织为（3,128,128），而“channel_last”应将数据组织为（128,128,3）。该参数的默认值是~/.keras/keras.json中设置的值，若从未设置过，则为“channel_last”

flow_from_directory 方法参数说明

directory: str 类型，目标文件夹路径,对于每一个类,该文件夹都要包含一个子文件夹.子文件夹中任何JPG、PNG、BNP、PPM的图片都会被生成器使用.详情请查看此脚本
target_size: int 数组 [ weight，width ]，图片转换的像素比例，默认为 [ 256, 256 ]
color_mode: str 类型，颜色模式,为 [ "grayscale","rgb" ] 之一,默认为"rgb".代表这些图片是否会被转换为单通道或三通道的图片.
classes: str 类型可选参数,为子文件夹的列表,如['dogs','cats']默认为None. 若未提供,则该类别列表将从directory下的子文件夹名称/结构自动推断。每一个子文件夹都会被认为是一个新的类。(类别的顺序将按照字母表顺序映射到标签值)。通过属性class_indices可获得文件夹名与类的序号的对应字典。
class_mode: str 类型 [ "categorical", "binary", "sparse",None] 之一. 默认为"categorical. 该参数决定了返回的标签数组的形式, "categorical"会返回2D的one-hot编码标签,"binary"返回1D的二值标签."sparse"返回1D的整数标签,如果为None则不返回任何标签, 生成器将仅仅生成batch数据, 这种情况在使用model.predict_generator()和model.evaluate_generator()等函数时会用到.
batch_size: int 类型，batch数据的大小,默认32
shuffle: bool 类型，是否打乱数据,默认为True
seed: 可选参数,打乱数据和进行变换时的随机数种子
save_to_dir: None或 str，该参数能让你将提升后的图片保存起来，用以可视化
save_prefix：str，保存提升后图片时使用的前缀, 仅当设置了save_to_dir时生效
save_format："png"或"jpeg"之一，指定保存图片的数据格式,默认"jpeg"
flollow_links: bool 类型，是否访问子文件夹中的软链

建立 model 卷积核形状为 5 *5，数量由 32 个转化为 64 个转化为 128 个。使用 Adam 优化器，由于是图片数据损失函数使用 binary_crossentropy。通过 Flatten 拉直数据后，通过五层 MLP 使用 sigmoid激活函数输出，dropout 为 50%。
通过训练后，测试数据的准确率平均可达90%以上，准确率高主要是因为人脸识别的登录 / 支付等应用通常都是通过直视镜头的方式进行判断的，所以角度比较固定，对其特征的要求不太高。
然而如果需要进一步对动态图片进行复杂的辨认，那简单 CNN 模型的准确率很可能会急速下滑。

 1 def getModel():
 2     model=keras.models.Sequential()
 3     # 32个卷积核形状为 5*5，激活函数为 relu
 4     model.add(layers.Conv2D(filters=32,kernel_size=(5,5),activation='relu'))
 5     # 池化层，大小2*2
 6     model.add(layers.MaxPool2D())
 7     # 64个卷积核形状为 5*5，激活函数为 relu
 8     model.add(layers.Conv2D(filters=64,kernel_size=(5,5),activation='relu'))
 9     # 池化层，大小2*2
10     model.add(layers.MaxPool2D())
11     # 128个卷积核形状为 5*5，激活函数为 relu
12     model.add(layers.Conv2D(filters=128,kernel_size=(5,5),activation='relu'))
13     # 池化层，大小2*2
14     model.add(layers.MaxPool2D())
15     # 多层 MLP dropout 为 0.5
16     model.add(layers.Flatten())
17     model.add(layers.Dense(8192,activation='relu'))
18     model.add(layers.Dropout(rate=0.5))
19     model.add(layers.Dense(1024,activation='relu'))
20     model.add(layers.Dropout(rate=0.5))
21     model.add(layers.Dense(128,activation='relu'))
22     model.add(layers.Dropout(rate=0.5))
23     model.add(layers.Dense(60,activation='relu'))
24     model.add(layers.Dense(10,activation='sigmoid'))
25     return model
26 
27 def run(generator, model, steps_per_epoch=10,epochs=10):
28     # 生成训练模型，学习率为0.003
29     model.compile(optimizer=optimizers.Adam(0.001),
30                       loss=losses.binary_crossentropy,
31                       metrics=['accuracy'])
32     # 分批训练
33     model.fit(generator,steps_per_epoch=steps_per_epoch,epochs=epochs)
34 
35 if __name__=='__main__':
36     # 视频转换后的文件路径
37     path='E://Python_Projects/ANN/venv/pic/'
38     # 增强的训练数据
39     trainDataGenerator=ImageDataGenerator(rescale=1./255,rotation_range=50,
40                         width_shift_range=0.3,height_shift_range=0.3,
41                         shear_range=0.3,zoom_range=0.3,horizontal_flip=True)
42     train_data=trainDataGenerator.flow_from_directory(path+'train',
43                         target_size=(70,50),batch_size=20)
44     # 测试数据
45     testDataGenerator=ImageDataGenerator(rescale=1./255)
46     test_data=testDataGenerator.flow_from_directory(path+'test',
47                         target_size=(70,50),batch_size=50)
48     # 数据训练与测试
49     model = getModel()
50     run(train_data,model,steps_per_epoch=50)
51     print('-------------------------test------------------------')
52     run(test_data,model,epochs=1)

运行结果

损失函数

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第14张图片

以上所介绍的例子，都属于小型的 CNN 模型，每次创建 model 时都需要手动建立多个 layer ，随着计算的复杂程度越来越高，需要建立的 layer 也会越来越多，这其实是一件令人烦心的事。
事实上，当遇上大型的数据集时更多情况下会使用预训练模型来解决，下面将为大家介绍。

四、使用 VGG16 框架预训练模型

4.1 预训练模型

小型的 CNN 模型可以通过训练数据去精准化模型的权重，然而对于一些大型的数据集这可能需要耗费大量的资源，为了可以使模型发挥更高效的作用，于是业内产生预训练模型这个概念。实际上这是把大量的数据集在网络上完成训练，并把模型保存，通过云端模式，进行模型共享。只要原始数据集足够大，那么经过训练后的模型就可以有效地作为通用模型。
Keras 中早已经包含 VGG16、VGG19、Inception V3、ResNet 50 、AlexNet 等多个模型架构。

完成预训练的模型可以通过 save_model 函数进行保存

1 @keras_export('keras.models.save_model')
2 def save_model(model, filepath, overwrite=True,
3                include_optimizer=True, save_format=None,
4                signatures=None, options=None,
5                save_traces=True):

model: 需要保存的模型对象
filepath: str 类型，需要保存的路径
overwrite: bool 类型，是否覆盖原文件
include_optimizer：bool 类型，是否包含 optimizer 优化器数据
save_format：[ ' tf ' , ' h5 ' ] 二者选一，保存方式，tf 用于 tensorflow 2.x，h5 用于 tensorflow 1.x
singatures：使用 SavedModel 保存的签名细节。当save_formate 为 ' tf ' 时可用。请参阅' signatures '参数“ tf.saved_model。
options：tf.saved_model.SaveOptions 对象，仅适用于SavedModel格式，该对象指定保存到 SavedModel 的选项。
save_traces：bool 类型，默认值为 True，仅适用于SavedModel 格式，SavedModel将存储每个层的函数轨迹。禁用此功能将减少序列化时间和减少文件大小，但它要求所有自定义层/模型实现一个 ' get_config() ' 方法。

需要加载时可以通过 load_model 函数进行获取

1 def load_model(filepath, custom_objects=None,
2      　　　　　　compile=True, options=None):

filepath: str 类型，model 保存的路径
custom_objects：自定义类或函数在反序列化时所映射名称。
compile: bool 类型，是否在加载之后编译模型。
options：可选的 tf.saved_model，加载 save_model 时从 SavedModel 所保存的 options 。

4.2 VGG 16 模型介绍

VGG 16 是成熟的预训练模型之一，它是由 Karen Simonyan 和 Andrew Zisserman 在 2014 年开发的框架，它包含了16 层，如下图。当中包含了多层的卷积、池化层，完成CNN训练后拉直，最后通过3层全连接输出。默认情况下，VGG 16 训练集中包含了1300,000 张图片，验证集中包含了 50,000 张图片，输出 1000 类的物品，因此VGG 16 在卷积层保存了大量已通过训练的向量特征，如果需要添加自定义类别时可以通过自定义的全连接层进行类别的概率分配。
前面曾经介绍过，全连接层会把所有数据看作同一维度处理，这样会把原有图像的三维数据中所包含的关联标志，相距像素，位置等重要信息丢弃。而 VGG 模型的思路正是通过 CNN 的优势，通过足够多的训练集，在卷积层收集大量图片的位置、像素等向量特征，初始化模型时把训练过的特征直接加载。用户可以使用默认的全连接层，也可通过自定义的全连接层，根据物品的出现的概率进行类别分配。

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第15张图片

VGG16 函数

1 @keras_export('keras.applications.vgg16.VGG16', 'keras.applications.VGG16')
2 def VGG16( include_top=True, weights='imagenet',
3     input_tensor=None, input_shape=None,
4     pooling=None, classes=1000,
5     classifier_activation='softmax'):

include_top：bool 类型，默认为 True，指定模型最后是否包含三层全连接分类器。如果使用自定义的全连接层时，可以设置为 False
weights：str 类型，[ ' None' , 'imagenet ' ] 二选一，默认为 imagenet ,指定初始化时加载模型的权重。None 表示随机初始化。
input_tensor：输入到网络中的 keras 张量格式。
input_shape：输入到网络中的图像张量的形状。这个参数完全是可选的，如果不传入这个参数，那么网络能够处理任意形状的输入。
pooling：str 类型，[ ' None ' , ' avg ' , ' max ' ] 三选一，avg 代表使用平均池化，max 代表使用最在池化，' None ' 代表输出将为四维张量的输出
classes：int 类型，表示输出的分类，默认1000类，只在 include_top 为 True, 而且未指定 weights 为参数时有效
classifier_activation: str 类型，激活函数，默认使用 softmax

4.3 使用 VGG16 进行特征提取

下面以 kaggle 竞赛的 DogVSCat 为例介绍一下 VGG16 的使用方式。先从 kaggle 官网 DogVsCat | Kaggle 下载图片资源，当中包括了 train 图片 2000 张，validation 图片 1000 张，test 图片 1000 张。
建立 VGG 16 模型，把 include_top 设置为False 以使用自定义全连接，把 input_shape 输入张量设置 (256，256，3)。
为了在训练时不影响卷积层，必须先把 VGG16 的 trainable 设置为 False。
利用 ImageDataGenerator 增加训练数据集，对卷积层输出数据使用 Flatten 拉直，经过二层全连接，使用 Adam 优化器 sigmoid 激活函数输出。
测试数据集准确率可达到 93% 以上

 1 def getModel():
 2     # 获取 VGG16 模型，把 include_top 设置为 False，使用自定义全连接
 3     conv_base=applications.VGG16(weights='imagenet',include_top=False,
 4                                  input_shape=(256,256,3))
 5     # 把 trainable 属性设计为 False，冻结卷积层权重
 6     conv_base.trainable=False
 7     # 新建模型，使用 VGG16 的卷积层，拉直后，自定义二层全连接层
 8     model=models.Sequential()
 9     model.add(conv_base)
10     model.add(layers.Flatten())
11     model.add(layers.Dense(256,activation='relu'))
12     model.add(layers.Dense(1,activation='sigmoid'))
13     # 显示模型层特征
14     model.summary()
15     return model
16 
17 def test():
18     # 猫狗图路径
19     path='E://Python_Projects/data_test/DogVSCatLit/'
20     # 训练数据集使用增强数据
21     train=ImageDataGenerator(rescale=1./255,rotation_range=20,
22                     width_shift_range=0.2,height_shift_range=0.2,
23                     shear_range=0.2,zoom_range=0.2,
24                     horizontal_flip=True,fill_mode='nearest')
25     # 验证数据集和测试数据使用原数据
26     test=ImageDataGenerator(rescale=1./255)
27     # 图片统一转换成 256*256，每批 50个
28     trainData=train.flow_from_directory(path+'train',target_size=(256,256),
29                     batch_size=50,class_mode='binary')
30     validationData=test.flow_from_directory(path+'validation',target_size=(256,256),
31                     batch_size=50,class_mode='binary')
32     testData=test.flow_from_directory(path+'test',target_size=(256,256),
33                     batch_size=50,class_mode='binary')
34     # 获取模型
35     model=getModel()
36     # 使用 adam 优化器，binary_crossentropy 二进制交叉熵损失函数
37     model.compile(optimizer=optimizers.Adam(3e-4),
38                   loss=losses.binary_crossentropy,
39                   metrics=['acc'])
40     # 日志记录
41     callback=callbacks.TensorBoard(log_dir='logs/091902')
42     # 训练数据 2000 个，每批 50 个，所以 steps_per_epoch 训练批次为 40
43     # 验证数据 1000 个，每批 50 个，所以 validation_steps 训练批次为 20
44     # 重复训练 30 次
45     model.fit(trainData,steps_per_epoch=40,epochs=30,
46               validation_data=validationData,validation_steps=20,
47               callbacks=callback)
48     print('---------------------------------test---------------------------------------')
49     # 测试结果
50     model.fit(testData,steps_per_epoch=20)
51 
52 if __name__=='__main__':
53     test()

模型层次图

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第16张图片

运行结果

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第17张图片

tensorboard

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第18张图片

4.4 微调 VGG16 模型

前一节的例子训练时会将 VGG16 卷积层的模型完全冻结，是为了避免在数据训练期间，错误信息对已有的模型造成影响。而事实上应用更广泛的是对模型的最顶的卷积层进行微调，使模型更匹配新输入的数据。但注意微调一般只针对最顶层的抽象模型，而不适合用于底层，因为这样做对模型影响过大从而造成误判。
下面的例子就是对顶层的卷积层 [ 'block5_conv1'，'block5_conv2'，'block5_conv3' ，‘block5_pool’] 进行解冻，加入微调训练，输出后拉直进入三层全连接层，防止过拟合加入 dropout 层，丢失率设置为 0.3，运行后测试数据的准确率上升到 95%以上。

 1 def getModel():
 2     # 获取 VGG16 模型，把 include_top 设置为 False，使用自定义全连接, 平均值池化
 3     conv_base=applications.VGG16(weights='imagenet',include_top=False,
 4                                  input_shape=(256,256,3))
 5     # 把 trainable 属性设计为 False，冻结卷积层权重
 6     conv_base.trainable=True
 7     # 把顶层卷积层进行解冻
 8     layer_names=['block5_conv1','block5_conv2','block5_conv3','block5_pool']
 9     for layer in conv_base.layers:
10         if layer.name in layer_names:
11             layer.trainable = True
12         else:
13             layer.trainable=False
14 
15     # 新建模型，使用 VGG16 的卷积层，拉直后，自定义三层全连接层
16     model=models.Sequential()
17     model.add(conv_base)
18     model.add(layers.Flatten())
19     model.add(layers.Dense(256,activation='relu'))
20     model.add(layers.Dropout(0.3))
21     model.add(layers.Dense(1,activation='sigmoid'))
22     # 显示模型层特征
23     model.summary()
24     return model
25 
26 def test():
27     # 猫狗图路径
28     path='E://Python_Projects/data_test/DogVSCatLit/'
29     # 训练数据集使用增强数据
30     train=ImageDataGenerator(rescale=1./255,rotation_range=20,
31                     width_shift_range=0.2,height_shift_range=0.2,
32                     shear_range=0.2,zoom_range=0.2,
33                     horizontal_flip=True,fill_mode='nearest')
34     # 验证数据集和测试数据使用原数据
35     test=ImageDataGenerator(rescale=1./255)
36     # 图片统一转换成 256*256，每批 50个
37     trainData=train.flow_from_directory(path+'train',target_size=(256,256),
38                     batch_size=50,class_mode='binary')
39     validationData=test.flow_from_directory(path+'validation',target_size=(256,256),
40                     batch_size=50,class_mode='binary')
41     testData=test.flow_from_directory(path+'test',target_size=(256,256),
42                     batch_size=50,class_mode='binary')
43     # 获取模型
44     model=getModel()
45     # 使用 adam 优化器，binary_crossentropy 二进制交叉熵损失函数
46     model.compile(optimizer=optimizers.Adam(3e-4),
47                   loss=losses.binary_crossentropy,
48                   metrics=['acc'])
49     # 日志记录
50     callback=callbacks.TensorBoard(log_dir='logs/091903')
51     # 训练数据 2000 个，每批 50 个，所以 steps_per_epoch 训练批次为 40
52     # 验证数据 1000 个，每批 50 个，所以 validation_steps 训练批次为 20
53     # 重复训练 30 次
54     model.fit(trainData,steps_per_epoch=40,epochs=30,
55               validation_data=validationData,validation_steps=20,
56               callbacks=callback)
57     print('---------------------------------test---------------------------------------')
58     # 测试结果
59     model.fit(testData,steps_per_epoch=20)
60 
61 if __name__=='__main__':
62     test()

运行结果

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第19张图片

五、CNN 中间激活层输出图

下面的例子尝试对各层输出图进行可视化，你会发现一个很有趣的现象，在底层的通道都是比较形象地反应图片的特征，越往顶层，其特征越抽象，甚至有些输出是空白的，这证明在顶层里越来越多特征经过滤波器后的输出是空白，这表示输入图像中找不到这些滤波器的特征。
原始图

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第20张图片

首先读取图片，把图片升维成（1,224,224,3)，对其除以 255.0 进行标准化。建立VGG16，根据名称获取层输出，对图片进行运算后获取层输出。
最后随机显示每层的 25 张 channel 的输出图。

 1 def getImg():
 2     # 测试图片
 3     path = 'E://Python_Projects/data_test/DogVSCatLit/train/dogs/dog.444.jpg'
 4     img=image.load_img(path,target_size=(224,224,3))
 5     # 转换成数组
 6     img=image.img_to_array(img)
 7     # 升维成（1,224,224,3)
 8     img=np.expand_dims(img,axis=0)
 9     # RGB最大值为255，输入前进行标准化
10     img/=255.
11     return img
12 
13 def getLayerOutput(layername):
14     # 使用 VGG16 模型
15     vgg16=applications.VGG16(weights='imagenet')
16     # 获取层
17     layer=vgg16.get_layer(layername)
18     # 获取层输出
19     layerout=layer.output
20     # 以 vgg16 建立 model，获取输出层
21     model=models.Model(inputs=vgg16.input,outputs=layerout)
22     # 输入图片运算后返回层输出
23     outputs=model.predict(getImg())
24     return outputs
25 
26 def display(layername):
27     # 获取 axes
28     fig, axes = plt.subplots(5, 5, figsize=(50, 50))
29     # 获取层输出
30     outputs=getLayerOutput(layername)
31     for ax in axes.ravel():
32         # 随机抽取 25 个 channel 进行显示
33         high=len(outputs[0,0,0])
34         index=np.random.randint(low=0,high=high)
35         ax.imshow(outputs[0,:,:,index])
36     plt.show()
37 
38 if __name__=='__main__':
39     display('block5_pool')

尝试对 block1_pool，block2_pool，block3_pool，block4_pool，block5_pool 层执行获取输出图，根据运行结果可以看到，越往顶层，其输出图越抽象。而空白的输出图则代表在输入图片中找不到该滤波器的特征。
运行结果

block1_pool	block2_pool
block3_pool	block4_pool
block5_pool

六、CNN 滤波器的可视化输出

要观察 CNN 滤波器最简单的方法就是使用梯度上升来实现，首先以某一层的输出值作为损失函数，使用 backend.gradients 函数绑定输出值对输入值的梯度，注意gradients 默认返回一个列表，取第一个元素即可。然后输入随机图片，利用梯度上升的原理，重复调用 backend.function 函数进行累加，让滤波器的输出响应值实现最大化，此时观察让滤波器有最大输出值的图案。

 1 def getfilter(layername,filterindex):
 2     # tensorflow2.x 以上版本需要手动关闭 eager execution
 3     tf.compat.v1.disable_eager_execution()
 4     # 使用 VGG16 模型
 5     vgg16=applications.vgg16.VGG16(include_top=False)
 6     # 根据层名称获取层
 7     layer=vgg16.get_layer(layername)
 8     # 以该层的某个过滤器输出作为 loss
 9     loss = K.mean(layer.output[:, :, :, filterindex])
10     # 建立 loss与 vgg16 输入特征的梯度
11     # 注意 gradients 返回一个列表，因此只取其第一个元素
12     grads=K.gradients(loss,vgg16.input)[0]
13     # grads 的更新系数，将梯度除以 L2 范数来标准化，加上 1e-4 保证分母非 0
14     grads/=(K.sqrt(K.mean(K.square(grads)))+1e-5)
15     # 绑定输入参数 VGG16 input 值与输出参数 loss，grads
16     func=K.function([vgg16.input],[loss,grads])
17     # 随机生成输入图片
18     image=np.random.random((1,50,50,3))
19     # 根据梯度上升法重复运行 50 次，将滤波器的输出值实现最大化
20     for i in range(50):
21         loss,grads=func(image)
22         image+=grads*0.9
23     return image
24 
25 #把数据转化为 RGB 格式
26 def display(x):
27     x-=x.mean()
28     x/=(x.std()+1e-5)
29     x*=0.1
30     x+=0.5
31     x=np.clip(x,0,1)
32     x*=255
33     x=np.clip(x, 0, 255).astype('uint8')
34     return x
35 
36 if __name__=='__main__':
37     # 5行5格
38     fig,axes=plt.subplots(5,5,figsize=(50,50))
39     filterindex=0
40     for ax in axes.ravel():
41         #过滤器从0开始显示前25个
42         data=getfilter('block1_conv2',filterindex)
43         #因为 display 输出为 （1，50，50，3），输出只用第一个
44         a = display(data[0])
45         filterindex+=1
46         ax.imshow(a)
47     plt.show()

分别显示 block1_conv2，block2_conv2，block3_conv2，block4_conv2，block5_conv2 的过滤器
运行结果

block1_conv2	block2_conv2
block3_conv2	block4_conv2
block5_conv2

每一组滤波器包含一层同类型的特征，block1 可能只包含简单的颜色，轮廓等特征，block2 开始出现纹理特征，block3 开始演变成复杂的图案，随着层的逐步加深，滤波器会变得越来越复杂。

七、CNN 热力图

经过前两个章节的例子可以看到 CNN 的滤波器是逐层复杂化的，每个滤波器都包含了一个特征，越高层的滤波器特征越为得复杂。而图片经过滤波器后的输出图代表这个图片中是否存在着该特征，随着高层滤波器的特征越来越复杂化，经过高层的滤波器输出后，很多输出特征图都变成空白，这是因为在图片中找不到该特征。
结合上述内容，这一节可尝试使用类似的方法，查看图片是根据哪些特征去判断输出值的。

 1 def getImg():
 2     # 读取用于测试的图片
 3     path='C://Users/Leslie/Desktop/CNN/01.jpg'
 4     img=image.load_img(path,target_size=(224,224,3))
 5     # 转换成数组
 6     img=image.img_to_array(img)
 7     # 升维成（1,224,224,3)
 8     img=np.expand_dims(img,axis=0)
 9     return img
10 
11 def getResult():
12     # 执行计算
13     result=vgg16.predict(getImg())
14     # 查看所占比例最高的前5个图片类型
15     print(decode_predictions(result,top=5))
16     # 打印出最高可能性类型的索引
17     arg=np.argmax(result)
18     print(arg)
19 
20 if __name__=='__main__':
21     getResult()

运行结果如下，斑马的可能性最大，占比 88%，属于第 340 类

[[('n02391049', 'zebra', 0.886605), ('n01704323', 'triceratops', 0.09896327), ('n02422699', 'impala', 0.0035573354), ('n02423022', 'gazelle', 0.0028548033), ('n02422106', 'hartebeest', 0.002379738)]]
340

然后根据运算后的索引 340，以 vgg16.output [ : , 340 ] 输出值为 loss，第5层 block5_conv3 为参数求梯度。然后输入测试图片，把测试图片的 block5_conv3 输出值乘以梯度得出热力图。再把热力图以降维去负求均值的方式转化为图片进行显示，最后把热力图与原图进行合并。

 1 def excute():
 2     # tensorflow2.x 以上版本需要手动关闭 eager execution
 3     disable_eager_execution()
 4     # 实例化 VGG16
 5     vgg16 = applications.vgg16.VGG16(weights='imagenet')
 6     # 以 VGG16 最大输出值作为 loss，斑马的索引 340
 7     loss=vgg16.output[:,340]
 8     # 以 block5_conv3 层输出值作为参数
 9     layeroutput=vgg16.get_layer('block5_conv3').output
10     # 求两者的梯度，K.gradients 默认返回数组，取第一个元素即可
11     gradient=K.gradients(loss,layeroutput)[0]
12     func=K.function(vgg16.input,[gradient,layeroutput,loss])
13     grad,layeroutput,loss=func(getImg())
14     # 把输入值乘以梯度值得出热力图
15     for i in range(512):
16         layeroutput[0,:,:,i]*=grad[0,:,:,i]
17     # 把热力图转化为二维数据显示
18     heat=convert(layeroutput[0])
19     plt.matshow(heat)
20     plt.show()
21     return heat
22 
23 def applyheat(heat):
24     # 读入原图
25     path = 'C://Users/Leslie/Desktop/CNN/01.jpg'
26     image=cv2.imread(path)
27     # 把热力图大小转换成原图大小
28     heat=cv2.resize(heat,(image.shape[1],image.shape[0]))
29     # 把热力图转换成 RGB 格式 
30     heat=np.uint8(255*heat)
31     # 热力图与原图合并
32     heat=cv2.applyColorMap(heat,cv2.COLORMAP_JET)
33     image=heat*0.5+image
34     # 保存合并后的图
35     cv2.imwrite('C://Users/Leslie/Desktop/CNN/03.jpg',image)
36 
37 #对热力图进行处理，先降维，再去负，求占比，把数值控制在 0~1 之间
38 def convert(x):
39     # 对最后一个维度进行降维
40     x=np.mean(x,axis=-1)
41     # 去除负值
42     x=np.maximum(x,0)
43     # 求比
44     x/=np.max(x)
45     return x
46 
47 if __name__=='__main__':
48     heat=excute()
49     applyheat(heat)

热力图

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第27张图片

合并原图后，可见斑纹，轮廓对辨别斑马类型的影响比较大。

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN_第28张图片

本章总结

本文主要介绍 CNN 卷积神经网络的基本原理和基础概念，卷积层与池化层的作用，并以常用的 VGG16 为例子，介绍常用模型的使用方式。把中间激活层输出图，滤波器，热力图等进行可视化分析，让大家进一步了解 CNN 的结构特征。文章内容受偶像 Keras 之父 Francois 博客和 Antonio 论文的启发很深。
后面的文章里将会进一步讲解 DeepDream，风格迁移，音频 / 视频处理等高级 CNN 的应用，敬请留意。
希望本篇文章对相关的开发人员有所帮助，由于时间仓促，错漏之处敬请点评。

对 .Python 开发有兴趣的朋友欢迎加入QQ群：790518786 共同探讨！
对 JAVA 开发有兴趣的朋友欢迎加入QQ群：174850571 共同探讨！
对 .NET 开发有兴趣的朋友欢迎加入QQ群：162338858 共同探讨！

AI人功智能相关文章

Python 机器学习实战 —— 监督学习（上）

Python 机器学习实战 —— 监督学习（下）

Python 机器学习实战 —— 无监督学习（上）

Python 机器学习实战 —— 无监督学习（下）

Tensorflow 2.0 深度学习实战——介绍损失函数、优化器、激活函数、多层感知机的实现原理

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN

NLP 自然语言处理实战

你可能感兴趣的:(AI,人工智能,cnn,tensorflow,深度学习,人工智能)

如何使用JSON输出解析器解析语言模型的输出 vaidfl json 语言模型 easyui python
在现代AI应用中，让语言模型返回结构化的数据是一个重要的能力，特别是在需要进一步处理或集成的时候。本文将深入探讨如何利用JsonOutputParser来解析语言模型的JSON输出。技术背景介绍随着语言模型的普及，许多应用场景需要从自然语言处理任务中获取结构化的输出。针对这一需求，输出解析器应运而生，它能够帮助我们定义JSON模式，通过提示语言模型生成符合该模式的输出，并将其解析为JSON格式。核
使用LangChain加载College Confidential数据 scaFHIO langchain python
#使用LangChain加载CollegeConfidential数据##技术背景介绍CollegeConfidential是一个提供有关3800+所大学和学院信息的平台。它被广泛使用于教育咨询和申请指导领域。为了方便开发者从CollegeConfidential获取数据，我们可以使用LangChain的`CollegeConfidentialLoader`模块进行加载和处理。##核心原理解析La
使用LocalAI进行文本嵌入的实战指南 bavDHAUO python
技术背景介绍文本嵌入是一种将文本片段转换为高维向量的技术，可以用于自然语言处理任务中的相似性计算、信息检索等应用。LocalAI提供了一种本地化的嵌入解决方案，允许开发者在本地环境中运行和测试嵌入模型。通过在本地部署LocalAI服务，您可以避免依赖外部API，享受更快的响应速度和更好的数据隐私。核心原理解析LocalAIEmbedding类主要负责与本地运行的LocalAI服务通信，进行文本嵌入
Ubuntu和Windows系统之Mamba_ssm安装 Netceor Python ubuntu windows linux
Mamba的论文：https://arxiv.org/abs/2312.00752Mamba的github：https://github.com/state-spaces/mamba一、Ubuntu安装直接新建一个环境是最好的，不然很容易产生各种冲突#创建环境和相关包condacreate-nmambapython=3.10.13condaactivatemambacondainstallcuda
`docker commit`和`docker tag` NLstudy33 docker java 容器
1.`dockercommit``dockercommit`是一个Docker命令，用于将一个正在运行的容器（Container）的状态提交为一个新的镜像（Image）。这类似于在版本控制系统中提交更改。作用•当你对一个容器进行了修改（例如安装了软件、修改了配置文件等），你可以使用`dockercommit`将这些更改保存为一个新的镜像。•这样，你可以基于这个新镜像创建更多的容器，而不需要重复相同
通用AI Agent的进化图谱：架构革新与安全可控的双重突破——以Manus为范本的启示我也秃了人工智能架构安全
通用AIAgent的进化路径：架构创新与安全管控的双重突破引言近年来，AI智能体正经历前所未有的变革。2025年3月，中国团队Monica推出的全球首款通用AIAgent——Manus，以“全链路自主执行”为核心，通过多签名系统架构和渐进式任务执行引擎，实现了从“生成建议”到“自主闭环交付任务”的范式跃迁。具体而言，Manus通过规划（Planner）-执行（Executor）-验证（Verifi
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
掌握ChatGPT写代码的秘诀：开发者的完整指南酷酷的崽798 机器学习 chatgpt
文章目录前言：如何利用ChatGPT来写代码：一个深度指南1.ChatGPT的基本功能概述2.利用ChatGPT辅助代码编写的好处3.ChatGPT支持的编程语言4.如何向ChatGPT提问以获取最佳结果5.实际应用案例6.ChatGPT的局限性及其解决方法7.关于隐私和安全性的注意事项8.未来展望结论前言：如何利用ChatGPT来写代码：一个深度指南近年来，人工智能技术取得了飞跃性的进展，尤其是
5（五）Jmeter监控服务器性能夜晚打字声工具 jmeter 服务器运维
下载安装插件需要安装插件：ServerAgent-2.2.1（链接：https://pan.baidu.com/s/1Tr63aKbzLuldBoRB5IR7Dg提取码：nyfk）JMeterPlugins-Standard-1.4.0（链接：https://pan.baidu.com/s/13af9OS4JDagg4RFhqxVVbg提取码：51ev）JMeterPlugins-Extras-1
k8s学习笔记（3）--- kubernetes核心技术概念梦谜 k8s基础知识 k8基本核心概念
kubernetes核心技术概念1.容器（Container）2.API对象3.集群（Cluster）4.Master5.Node6.Pod7.复制控制器（ReplicationController，RC）8.副本集（ReplicaSet，RS）9.部署(Deployment)10.服务（Service）11.任务（Job）12.定时任务（CronJob）13.后台支撑服务集（DaemonSet）
从 0 到万粉的 AI 公众号博主教程 hikktn 从0到万粉的AI公众号博主教程公众号
《从0到万粉的AI公众号博主教程》专栏简介作为一名深耕品牌领域二十余载的资深专家，我深刻感受到当下商业环境的剧变。去年，我开始探索AI技术在内容创作中的应用，短短4个月内，我的公众号突破万粉，这让我意识到AI时代带来的巨大机遇。在与众多职场人士交流的过程中，我发现很多人都面临着相似的困境：想要利用AI进行个人品牌升级，但不知如何入门？拥有专业积累，但难以转化为个人IP？尝试做自媒体，但始终无法突破
如何用Function Calling解锁OpenAI的「真实世界」交互能力？（附Node.js 实战） hongkid AI编程
一、FunctionCalling：大模型的「手脚延伸器」1.1核心定义FunctionCalling是OpenAI在2023年6月13日推出的革命性功能（对应模型版本gpt-3.5-turbo-0613和gpt-4-0613），允许开发者通过自然语言指令触发预定义函数，实现大模型与现实世界系统的交互。如同给语言模型安装「手脚」，使其不仅能思考，还能执行具体操作。openai官方说明：https:
动态规划算法--找零方式大王算法数据结构和算法实战宝典算法动态规划 c++
一、问题介绍给定数组arr，arr中所有的值都为正数且不重复。每个值代表一种面值的货币，每种面值的货币可以使用任意张，再给定一个整数aim，代表要找的钱数，求所有的找零方法有多少种。二、算法思路枚举法，列出使用某张钞票n次的所有可能。1、暴力递归intprocess1(intn,intarr[],intindex,intrest){if(index==n)returnrest==0?1:0;int
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
AI学习资料|3月最新版可下载 2501_91122183 人工智能学习
AI学习资料：https://pan.quark.cn/s/d7452a3222d8都说AI是2025年新的风口，都想成为站在风口上的猪，可如何学习AI却成了拦住大多数人的第一道门槛。其实，学习AI很简单，你缺的只是一个信息差！这段时间，清华北大出品AI教学资料，火遍全网，从基础知识到实操应用，各种应用场景和进阶玩法讲解。即便是零基础新人也能轻松上手，从入门到精通。资料我已经帮大家整理好了，放在最
AI学习手册合集｜零基础入门宝典 2501_91234994 pdf
DeepSsek资料包：https://pan.quark.cn/s/2672e0be6178现在AI持续火热，越来越多的人开始使用AI辅助工作，大大提高了生产效率。甚至很多自由职业者，通过学习DeepSeek，在互联网淘金日入过万，登上热搜。普通人如何高效入门AI?清华团队亲自下场教学！自从第一弹AI学习手册《DeepSeek入门到精通》火了后，清华大学接连发布多版AI进阶资料，即便零基础也能轻
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
openai-agents 中custom example agent ZHOU_CAMP oi_agents 人工智能
代码pipshowopenai-agentsName:openai-agentsVersion:0.0.4Summary:OpenAIAgentsSDKHome-page:https://github.com/openai/openai-agents-pythonAuthor:Author-email:OpenAILicense-Expression:MITLocation:d:\soft\ana
解析大模型归一化：提升训练稳定性和性能的关键技术秋声studio 口语化解析深度学习人工智能大模型归一化
引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。本文将深入探讨大模型归一化的原理、常见方法及其应用场景，并结合实际案例和代码示例进行说明。一、归一化的作用与理论基础归一化的主要目的是为了提高模型的训练稳定性和性能。具体来说，归一化有以下几个关键作用：提高训练稳定性：在神经网
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
云原生周刊丨CIO 洞察：Kubernetes 解锁 AI 新纪元 KubeSphere 云原生云原生 kubernetes 人工智能
开源项目推荐DRANETDRANET是由谷歌开发的K8s网络驱动程序，利用K8s的动态资源分配（DRA）功能，为高吞吐量和低延迟应用提供高性能网络支持。它旨在优化资源管理，确保K8s集群中的网络资源能够按需高效分配。DRANET采用Apache-2.0开源许可，鼓励社区贡献与扩展，是云原生环境下提升网络性能的创新解决方案。LazyjournalLazyjournal是一个用Go语言编写的终端用户界
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践古月居GYH 深度学习人工智能
一、引言：模型泛化能力的核心挑战在深度学习模型开发中，欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计，工业级深度学习项目中有63%的失败案例与这两个问题直接相关。本文将从基础概念到工程实践，系统解析其本质特征、诊断方法及解决方案，并辅以可复现的代码案例。二、核心概念与通熟易懂解释简单而言，欠拟合是指模型不能在训练集上获得足够低的误差。换句换说，就是模型复杂度低，模型在
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号