summer_bugs

小白的神经网络学习

小白的神经网络学习笔记

文章目录

- - 小白的神经网络学习笔记
  - - 一.环境配置
    - 二.感知器（Perceptron）
    - - 单层感知器
      - 多层感知器（MLP，Multilayer Perceptron）
      - Keras实现
    - 三.逻辑回归与交叉熵
    - - 关于sparse_categorical_crossentropy & categorical_crossentropy
      - 关于独热编码（one-hot key）
      - 在Python中的应用
      - Keras实现
    - 四.tf.data模块
    - - Python实例
    - 五.Dropout层
    - 六.函数式API
    - 七.卷积神经网络（CNN）
    - - 原理
      - 架构
      - 图像的预处理
    - 八.标准化
    - - 批标准化（Batch Normalization）
      - 批标准化实现过程
      - 批标准化的预测过程
    - 九.TF的变量与自动微分运算
    - - 梯度带tf.GradientTape
      - 自定义梯度下降
    - 十.预训练网络
    - - 概念
      - Keras内置预训练网络
      - 微调
      - Python实现
    - 十一.模型的保存
    - - 保存整个模型
      - 如何仅保存架构
      - 仅保存权重
      - 在训练期间保存检查点
      - 自定义训练中保存检查点
      - Python代码实现

一.环境配置

Python3.6 + tensorflow2.0 + keras + numpy + matplotlib + pandas + jupyter notebook

二.感知器（Perceptron）

单层感知器

定义：二分类线性分类模型，其输入为实例的特征向量，输出为实例的类别，为1或-1

简单说，就是在平面坐标轴画一条直线，把点分为两类
单层感知器的局限性：因为处理函数是线性的，所以不管中间怎么处理，输出都是线性的，最后的结果能表示的范围也很小，由于它只有一层功能神经元，所以学习能力有限

单层感知机不能表示异或逻辑

多层感知器（MLP，Multilayer Perceptron）

多层感知器（MLP）也叫人工神经网络（ANN，Artificial Neural Network）前馈神经网络，除了输入输出层，他中间可以有多个隐藏层，最简单的MLP只含有一个隐藏层，即三层结构
从上图看出，MLP层与层之间是全连接的，MLP最底层是输入层，中间是隐藏层，最后是输出层
特征（feature）：每一个输入的 $x_i$ 都是一个特征（i=1,2,…,n）
权重（weight）：和每一个特征相对应的都有一个权重 $w_i$ （i=1,2,…,n），这也是整个网络需要训练的参数，其实也很好理解（就像判断一个西瓜是否成熟，颜色，声音，花纹等等都是这个西瓜的特征，而与之对应的，颜色，声音，花纹对西瓜是否成熟都有不同的影响权重）
偏置（bias）：可以简单的理解为“截距”
激活函数（activation function）：从单层感知器可知，如果不使用激活函数，那么每一层的输出都是上一层输入的线性函数，无论有多少层神经网络，输出都是输入的线性组合，使用激活函数，能够给神经元引入非线性因素，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以利用到更多的非线性模型

激活函数的特性：

1.连续可导（允许少数点上不可导）的非线性函数，可导的激活函数可以直接利用数值优化的方法来学习网络参数

2.激活函数及其导函数要尽可能简单，有利于提高网络计算效率

3.激活函数的导函数的值域要在一个合适的区间内，不能太大，也不能太小，否则会影响训练的效率和稳定性

常用激活函数：

1.Sigmoid（Logistic）函数： $\delta(x)=\frac{1}{1+e^{-x}}$ ，其导数为： $\delta'(x)=\delta(x)(1-\delta(x))$

可以从图上看到，Sigmoid函数的取值范围为 (0,1)，所以经常将它用在二分类的问题上，对于任何的输入，都能给出（0,1）上的输出

缺点：在进行反向传播时，Sigmoid函数容易出现梯度消失的情况（因为在函数的两端，梯度很小，只有在0附近的梯度才很大），所以在使用Sigmoid的函数的时候，通常要将数据经过归一化处理（将数据分布在0周围）

2.Tanh函数（双曲正切函数）： $tanhx=\frac{sinhx}{coshx}=\frac{e^x-e^{-x}}{e^x+e^{-x}}$ ，其导数为： $tanhx)'=sech^2x=1-tanh^2x$ ，，从图像可看出，函数的取值范围为[-1,1]

tanh在特征相差明显时，效果会很好，在循环过程中会不断扩大特征效果

**缺点：**同样的，也会在反向传播中造成梯度消失

3.relu函数（非线性激活函数）： $f (x) = m a x (0, x)$ ，最为最常用的激活函数，relu的作用就是增加了神经网络各层之间的非线性关系，并且，函数的表达式简单，计算量小，便于求导
MLP一层的输出可以表示为 $f(\sum_{i=1}^nx_i·w_i+b)$ ，其中f(x)为激活函数，一个节点的输出是下一个节点的输入

Keras实现

import tensorflow as tf
from tensorflow import keras 
from tensorflow.keras import layers
import pandas as pd

data=pd.read_csv(path)   # 获取数据

model=keras.Sequential()  # 初始化序列模型
# MLP模型的第一层
# Dense：表示该层是一个全连接层
# 10：表示该层有10个输出
# input_shape：第一层需要给定输入的维度（也就是特征个数），需要注意，输入的是一个元组
# activation：激活函数
model.add(layers.Dense(10,input_shape=(data.shape),activation='relu'))
# 输出层，输出1个维度
model.add(layers.Dense(1))

# 模型编译，选择优化器和损失函数
model.compile(optimizer='adam',loss='mse')

# 模型训练，输入对应的训练数据，并将训练记录保存在history中，还可以添加validation_data参数来添加验证数据
history=model.fit(x,y,epochs=10)

# 模型预测
model.predict(x)

三.逻辑回归与交叉熵

逻辑回归：输出的结果只有两种情况（“是”或“否”），所以逻辑回归不是回归，他是一个分类任务
一般对于逻辑回归，我们通常选用Sigmoid激活函数，原因第二章已经说了
交叉熵：
- 交叉熵刻画的是是技术处（概率）与期望输出（概率）间的距离，它实际上描述的是概率与概率间的距离，也就是说，交叉熵值越小，两个概率分布越接近
- 假设概率分布p为期望输出，概率分布q为实际输出H(p,q)为交叉熵
  
  $H(p,q)=-\sum_xp(x)logq(x)$
  
  在Keras中使用binary_crossentropy损失函数来计算二元交叉熵

import pandas as pd
import numpy as np
import tensorflow as tf
from tensorflow import keras 
from tensorflow.keras import layers

data=pd.read_csv(path)  # 读取数据
x=data[[....]]  # 取出数据和对应的标签
y=data[....]

model=keras.Sequential()
model.add(layers.Dense(10,input_shape=(x.shape),activation='relu'))
model.add(layers.Dense(10,activation='relu'))
model.add(layers.Dense(1,activation='sigmoid'))

model.compile(optimizer='adam',loss='binary_crossentropy')
model.fit()

关于sparse_categorical_crossentropy & categorical_crossentropy

softmax分类
- 神经网络的原始输出不是一个概率值，本质上只是输入了的数值做了复杂的加权和非线性处理之后的一个值而已
- softmax函数可以将这个输出变成概率分布 $f(z)_j=\frac{e^{z_j}}{\sum_{k=1}^Ke^{z_k}},for j=1,2,...,K$
- softmax所有样本概率分量之和为1
在Keras里，对于多分类问题使用categorical_crossentropy & sparse_categorical_crossentropy 来计算交叉熵
- 当使用普通向量时采用sparse_categorical_crossentropy
- 当使用独热编码时采用categorical_crossentropy

关于独热编码（one-hot key）

在机器学习算法中，我们经常会遇到分类特征，例如：人的性别有男女，国家有中国，美国，法国…这些特征值不是连续的，而是离散的，无序的，通常我们需要对其进行特征数字化
什么是特征数字呢？例子如下：
- 性别特征：[‘男’，‘女’]
- 祖国特征：[‘中国’，‘美国’，‘法国’]
- 运动特征：[‘足球’，‘篮球’，‘羽毛球’，‘乒乓球’]
- 假如某个样本，他的特征是[‘男’，‘中国’，‘乒乓球’]，我们可以用[0,0,4]来表示，但是这样的特征处理并不能直接放入机器学习算法中，因为类别间是无序的（运动数据就是任意排序的）
独热编码（one-hot key）
- one-hot码又称为一位有效编码，主要是采用N位状态寄存器来对N个状态进行编码，每个状态都有他独立的寄存器位，并且在任意时候只有一位有效
- one-hot码是分类变量作为二进制向量的表示，这首先要将分类值映射到整个数值，然后每个整数值被表示为二进制向量，除了整数的索引之外，其他都是0，它被标记为1
- 以上面的例子为例，性别特征[‘男’，‘女’]按照N位状态寄存器来对N个状态进行编码的原理，处理后的结果是：
  
  男 -> 10
  
  女 -> 01
  
  祖国特征：[‘中国’，‘美国’，‘法国’]
  
  中国 -> 100
  
  美国 -> 010
  
  法国 -> 001
  
  运动特征：[‘足球’，‘篮球’，‘羽毛球’，‘乒乓球’]
  
  足球 -> 1000
  
  篮球 -> 0100
  
  羽毛球 -> 0010
  
  乒乓球 -> 0001
  
  所以，当一个样本为[‘男’，‘中国’，‘乒乓球’]的时候，完整的特征数字化结果为：
  
  [1，0，1，0，0，0，0，0，1]

在Python中的应用

from sklearn import preprocessing

enc=preprocessing.OneHotEncoder()
enc.fit([[0,0,3],[1,1,0],[0,2,1],[1,0,2]])  # 这里一共4个数据，3种特征

array=enc.transform([[0,1,3]]).toarray()  # 这里使用一个新数据测试

output:[[1 0 | 0 1 0 | 0 0 0 1]]

为什么使用one-hot编码来处理离散特征
- 在回归，分类，聚类等机器学习算法中，特征之间距离的计算或相似度的计算非常重要，而我们常用的距离或相似度的计算都是在欧式空间的相似度计算，计算余弦相似性，就是基于欧式空间
- 而使用one-hot编码，将离散特征的取值扩展到了欧式空间，离散特征的某个取值就是对应欧式空间的某个点
- 将离散特征使用one-hot编码，会让特征之间的距离计算更加合理
不需要使用one-hot编码的情况
- 将离散型特征进行one-hot编码的作用，是为了让距离计算更合理，但如果特征是离散的，并不用one-hot编码就可以很合理的计算出距离，那么久没必要进行one-hot编码
- 离散特征进行one-hot编码后，编码后的特征其实每一维度的特征都可以看做是连续的特征，就可以跟对连续型特征的归一化方法一样，对每一维特征进行归一化，比如归一化[-1,1]，或归一化均值为0，方差为1

Keras实现

from tensorflow import keras
import pandas as pd

data=pd.read_csv(path)  # 拿到数据

# 转化为独热编码
train_label_onehot=keras.utils.to_categorical(tain_label)
test_label_onehot=keras.utils.to_categorical(test_label)

# 可以看到，这里用的损失函数是categorical_crossentropy
model.compile(optimizer='adam',loss='categorical_crossentropy')

#训练的时候需要使用独热编码标签
model.fit(train_data,train_label_onehot,eopchs=...)

四.tf.data模块

tf.data.Dataset表示一系列元素，其中每个元素包含一个或多个Tensor对象（例如：在图片管道中，一个元素可能是单个训练样本，具有一对表示图片的数据和标签的张量）
tf.data.Dataset对象是可迭代的（可for，可next(iter(dataset))）
创建方法：
- 直接从Tensor创建Dataset e.g：Dataset.from_tensor_slices(xxxx)
  - numpy也可以，tensorflow会自动将其转换为Tensor
- 通过一个或多个tf.data.Dataset对象来使用变化（例如Dataset.zip）来创建Dataset
- 一个Dataset对象包含多个元素，每个元素的结构都相同，每个元素包含一个或多个tf.Tensor对象，这些对象被称为组件
- Dataset的属性由构成该Dataset的元素的属性映射得到，元素可以是单个张量，张量元组，也可以是张量嵌套的元组
dataset可以使用shuffle方法，map方法

Python实例

import tensorflow as tf
import numpy as np

dataset=tf.data.Dataset.from_tensor_slices([1,2,3,4,5])
for ele in dataset:
    print(ele.numpy())

# 用take(n)方法取前n个    
for ele in dataset.take(4):  # 这里取前4个
	print(ele.numpy())

dataset_array=tf.data.Dataset.from_tensor_slices([[1,2],[3,4],[5,6]])

dataset_array
output:shape(2,)  # 表示其中每个组件的shape

for ele in dataset_array:
    print(ele.numpy())
output:[1,2]
       [3,4]
       [5,6]

# 字典创建
dataset_dict=tf.data.Dataset.from_tensor_slices({'a':[1,2,3,4],'b':[6,7,8,9],'c':[12,13,14,15]})

dataset_dict
output:<TensorSliceDataset shapes: {a: (), b: (), c: ()}, types: {a: tf.int32, b: tf.int32, c: tf.int32}>
            
for ele in dataset_dict:
    for k,v in ele.items():
        print(k,v)
output:
a tf.Tensor(1, shape=(), dtype=int32)
b tf.Tensor(6, shape=(), dtype=int32)
c tf.Tensor(12, shape=(), dtype=int32)
a tf.Tensor(2, shape=(), dtype=int32)
b tf.Tensor(7, shape=(), dtype=int32)
c tf.Tensor(13, shape=(), dtype=int32)
a tf.Tensor(3, shape=(), dtype=int32)
b tf.Tensor(8, shape=(), dtype=int32)
c tf.Tensor(14, shape=(), dtype=int32)
a tf.Tensor(4, shape=(), dtype=int32)
b tf.Tensor(9, shape=(), dtype=int32)
c tf.Tensor(15, shape=(), dtype=int32)

dataset=dataset.shuffle(len(train_data)).repeat().batch(BATCH_SIZE)

dataset=dataset.map(tf.square)

五.Dropout层

为解决过拟合（也就是说，模型在训练数据上表现良好，但是在测试数据上表现差）问题，最好的方法是增加训练数据，但是在训练数据一定的情况下，为防止模型过拟合，一般使用dropout方法
**原理：**通过随机抛弃某层的某些神经元，达到降低过拟合的目的

import tensorflow as tf
from tensorflow import keras

model=keras.Sequential()
model.add(keras.layers.Flatten(input_shape=xxx))
model.add(keras.layers.Dense(128,activation='relu'))
model.add(keras.layers.Dropout(0.5))  # 参数表示丢弃率
...

六.函数式API

灵活的编程方式

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

(train_image,train_label),(test_image,test_label)=keras.datasets.fashion_mnist.load_data()

train_image=train_image/255  # 归一化
test_image=test_image/255

input=keras.Input(shape=train_image.shape[1:])
x=layes.Flatten()(input)   # 将输入图像展平，输入数据就是input
x=layers.Dense(32,activation='relu')(x)
x=layers.Dropout(0.5)(x)
x=layers.Dense(64,activation='relu')(x)
output=layers.Dense(10,activation='softmax')(x)

model=keras.Model(inputs=input,outputs=output)

model.compile(xxxxxxxxx)
model.fit(xxxxxx)

七.卷积神经网络（CNN）

原理

CNN工作是指：给定一张图像，让它经历一系列 [卷积层，非线性层（激活层），池化层(下采样(downshampling)) ]，和全连接层，得到最终输出，该输出最好的描述了图像内容的一个单独分类或者一组分类的概率
什么是卷积：
- 卷积是指将卷积核应用到某个张量的所有点上，通过将卷积核在输入的张量上滑动而生成经过滤波处理的张量
- 卷积完成的是对图像特征的提取，或者说是信息的匹配，当一个包含某些特征的图像经过一个卷积核的时候，一些卷积核被激活，输出特定的信号
- 卷积核会被训练，训练的结果就是：卷积核会对不同种类的图像的不同特征敏感，输出不同的结果，从而达到了图像识别的目的

架构

[卷积层（conv2D） -> 非线性变换层（激活层 relu/sigmoid/tanh）-> 池化层（pooling2D）]

x n -> 全连接层
如果没有这些层，模型很难与复杂模式匹配，因为网络将有过多的信息填充，其他那些层作用就是突出重要信息，降低噪声
卷积层
- 三个参数
  - ksize（kernel size）：卷积核的大小
  - strides：卷积核移动的跨度
  - padding：边缘填充
池化层

常用的池化层有：
- MaxPooling2D：最大池化，选取kernel中最大的元素，用以代表整个kernel中的元素，达到下采样（比方说用2x2的kernel，可以使一张图片缩小一半）
- GlobalAveragePooling2D：全局平均池化，选取kernel中所有元素的均值，用以代表kernel中的元素，该池化方法也可以某种程度上代替Flatten()层，且效果较好

图像的预处理

1.通过路径读取图像
2.解码图像
3.将所有图像变成统一大小
4.转换数据类型
5.归一化操作

def load_preprocess_image(path,label):
    image=tf.io.read_file(path)
    image=tf.image.decode_jpeg(image,channels=3)
    image=tf.image.resize(xxx,xxx)
    image=tf.cast(image,tf.float32)
    image=image/255
    label=tf.reshape(label,[1])
    return image,label

八.标准化

数据标准化让机器学习模型看到的样本彼此间更加相似，有助于模型的学习以及对新数据的泛化
常见形式
- 标准化和归一化
- 将数据减去其平均值使其中心为0，然后将数据除以其标准差使其标准差为1

批标准化（Batch Normalization）

批标准化和普通的数据标准化类似，是将分撒的数据统一的一种做法，也是优化神经网络的一种方法
批标准化不仅将数据输入模型之前对数据做标准化，在网络的每一次变换之后都应考虑数据的标准化
即使在训练过程中均值和房产随时间发生变化，它也可以适应性的将数据标准化
批标准化解决的问题是梯度消失与梯度爆炸
数据预处理做标准化可以加速收敛，同理，在神经网络中使用标准化也可以加速收敛，而且还有很多好处（具有正则化效果，提高泛化能力，允许更高的学习率从而加快收敛）
批标准化有助于梯度传播，因此允许更深的网络，对于有些特别深的网络，只有包含多个Batch Normalization层时才能进行训练
tf.keras.layers.Batchnormalization()层通常在卷积层或密集层连接层后使用

批标准化实现过程

求每一个训练批次数据的均值
求每一个训练批次数据的方差
将数据进行标准化
训练参数 $\gamma,\beta$
输出y，通过 $\gamma$ 与 $\beta$ 的线性变换得到原来的数值，在训练的正向传播中，不会改变当前输出，只记录下 $\gamma$ 与 $\beta$ ，在反向传播的时候，根据求得的 $\gamma$ 与 $\beta$ 通过链式求导方式，求出学习速率至改变权值

批标准化的预测过程

对于预测阶段时所使用的均值和方差其实也是来源于训练集（比如在模型训练时记录每个batch下的均值和方差，待训练完毕后，我们求整个训练样本的均值和方差的期望值，作为我们进行预测时进行BN的均值和方差）
training=True：该层将使用当前批输入的均值和方差对其输入进行标准化
training=False：该层将使用在训练期间学习的移动统计数据的均值和方差来标准化其输入
BN层放在activation层之后效果会更好

九.TF的变量与自动微分运算

梯度带tf.GradientTape

tf.GradientTape(persistent=False,watch_accessed_variables=True)
- persistent：布尔值，用来指定新创建的gradient tape是否是可持续的，默认是False,意味着只能够调用一次gradient()函数
- watch_accessed_variable：布尔值，标明这个gradient tape是不是会自动追踪任何能被训练（trainable）变量，默认是True,如果为False，表示需要手动指定想追踪的那些变量

import tensorflow as tf

w=tf.Variable([[1.0]])  # w是一个二维变量
with tf.GradientTape() as t:
    func=w*w

dw=t.gradient(func,w)
print(dw)

output:<tf.Tensor: id=39, shape=(1, 1), dtype=float32, numpy=array([[2.]], dtype=float32)>
        
# 上述代码的意思是：求w*w在w=1.0处的倒数

注意：

1.求在某点（w）处的导数，w必须为浮点类型

2.GradientTape占用的资源默认情况下dw=t.gradient(func,w)计算完毕就会立即释放，如不需要释放，则需要设置persistent=True
t.gradient(target,sources,output_gradients=None,unconnected_gradients=tf.UnconnectedGradients.NONE)

作用：根据tape上面的上下文来计算某个或者某些tensor的梯度
- target：被微分的Tensor或者Tensor列表，可以理解为经过某个函数之后的值
- sources：Tensors或者Variables列表（当然可以只有一个值），可以理解为函数的某个变量
- output_gradients：a list of gradients,one for each element of target.Defaults to None.（每一个元素的一个梯度列表，默认为空）
- unconnected_graeidnts：a value which can either hold ‘none’ or ‘zero’ and alters the value which will be returned if the target and sources are unconnected. the possible values and effects are detailed in ‘UnconnectedGradients’ and it defaults to ‘none’
- 返回值：一个列表，表示各个变量的梯度值，和source中的变量列表一一对应，表明这个变量的梯度

自定义梯度下降

增加数据维度tf.expand_dims(data,loc)

参数：

data：需要增加维度的数据

loc：在哪个位置增加（e.g，-1：表示在末尾增加）

(train_image,train_label),_=tf.keras.datasets.mnist.load_data()

# 增加数据的维度！！重要！！
train_image=tf.expand_dims(train_image,-1)
train_image=tf.cast(train_image/255,tf.float32)
train_label=tf.cast(train_label,tf.int64)

dataset=tf.data.Dataset.from_tensor_slices((train_image,train_label))
dataset=dataset.shuffle(xxxx).batch(BATCH_SIZE)

----------------------------------------------------------------------
# 普通的模型建立
model=tf.keras.Sequential()
model.add(layers.Conv2D(16,(3,3),inputshape=(xx,xx,xx),activation='relu'))
model.add(layers.Conv2D(32,(3,3),activation='relu'))
model.add(layers.GlobalMaxPool2D())
model.add(layers.Dense(10))

optimizer=keras.optimizer.Adam()
loss_func=keras.losses.SparseCategoricalCrossentropy(from_logits=True)
----------------------------------------------------------------------
# 自定义学习
def loss(model,x,y):
    # 这里直接调用model(x)就相当于model.predict(x)
    y_=model(x)
    return loss_func(y,y_)

def train_step(model,image,label):
    with tf.GradientTape() as t:
        loss_step=loss(model,image,label)
    grads=t.gradient(loss_step,model.trainable_variables)
    optimizer.apply_gradients(zip(grads,model.trainable_variables))
    
def train(epochs):
    for epoch in range(epochs):
        for (batch,(image,label)) in enumerate(dataset):
            train_step(model,image,label)
        print('epoch{} is finished'.format(eopch+1))
        
train(n)  # n是训练轮数

十.预训练网络

概念

预训练网络是一个保存好的，之前已经在大型数据集（大规模图像分类任务）上训练好的卷积神经网络
如果这个原始数据集足够大且足够通用，那么预训练网络学到的特征的空间层次结构可以作为有效的提取视觉世界特征的模型
即使新问题和新任务与原始任务完全不同，学习到的特征在不同问题之间是可移植的，这也是深度学习与浅层学习相比的一个优势，他使得深度学习对于小数据问题十分有效
关于预训练网络代码，见kaggle

Keras内置预训练网络

tf.keras模块包含了很多预训练网络（VGG16,VGG19,ResNet50，Inceptionv3，Xception）等
ImageNet是一个手动标注好类别的图片数据库，目前已有22000个类别

微调

微调：冻结模型库底部的卷积层，共同训练新添加的分类器层和顶部部分的卷积层
- 底部的卷积层提取的特征一般是通用特征（比如说纹理，细小规则等），顶部的卷积层会逐渐随着窗口视野的扩大（包括MaxPooling层的使用）会形成一些抽象的图形，所以，顶部卷积层会更加与特定的抽象任务相关，所以（比如特定的分类，猫狗分类等）
这允许我们“微调”基础模型中的高阶特征，使他们与特定任务更相关
只有分类器训练好了，才能微调卷积基的顶部卷积层（如果没有这样做的话，刚开始的训练误差很大，微调之前这些卷积层学到的表示会被破坏掉）
微调步骤：
- 1.在预训练卷积基上添加自定义层
- 2.冻结卷积基所有层
- 3.训练添加的分类层
- 4.解冻卷积基的一部分层
- 5.联合训练解冻的卷积层和添加的自定义层

Python实现

import tensorflow as tf
from tensorflow import keras 
import numpy as np
from tensorflow.keras import layers

# 加载keras自带的预训练网络VGG16
# weights=imagenet：表示使用VGG16网络对imagenet训练好的权重
# include_top=False：表示不使用VGG16后面的全连接层，仅使用前面的卷积基
conv_base=keras.applications.VGG16(weights='imagenet',include_top=False)
# 不训练已经带有权重的VGG网络
conv_base.trainable=False

model=keras.Sequential()
model.add(conv_base)  # 将VGG16网络添加到我们自定义的网络中
# 由于VGG16网络最后一层是MaxPooling2D层，输出维度为(None,None,None,512)，为了和后面的全连接层连接，需要进行Flatten()操作，前面提到过，用GlobalAveragePooling2D效果更好
model.add(layers.GlobalAveragePooling2D())
model.add(laers.Dense(512,activation='relu'))
model.add(layers.Dense(1,activation='sigmoid'))

# 编译整个模型，并对整个模型进行训练（但是这个训练只训练了分类器层，原来的卷积基并没有被训练）
model.compile(optimizer=keras.optimizers.Adam(lr=0.0005),loss='binary_crossentropy',metrics=['xxx'])
history=model.fit(train_image_ds,steps_per_epoch=train_count//BATCH_SIZE,
                 epoch=xx,validation_data=test_image_ds,
                 validation_steps=test_count//BATCH_SIZE)

# 当模型训练出现过拟合时，解冻卷积层，和分类器一起训练
conv_base.trainable=True
# 这里需要根据过拟合出现的地方进行设置，一般可以通过画图，或者观察训练输出的数据判断是否出现过拟合
fine_tune_at=-x
# 前面的层仍然设置为不可训练，仅训练最后几层
for layer in conv_base.layers[:fine_tune_at]:
    layer.trainable=False
    
# 重新编译模型，这里要格外注意学习率，用极小的学习率下探    
model.compile(optimizer=tf.keras.optimizers.Adam(lr=0.0005/10),loss='binary_crossentropy',metrics=['xxx'])  

initial_epochs=xx
fine_tune_epochs=xx
total_epochs=initial_epochs+fine_tune_epochs

history=model.fit(train_image_ds,steps_per_epoch=train_count//BATCH_SIZE,
                 epochs=total_epochs,initial_epochs=initial_epochs,
                 validation_data=test_image_ds,
                 validation_steps=test_count//BATCH_SIZE)

十一.模型的保存

保存整个模型

整个模型可以保存到一个文件中，其中包含权重值，模型配置乃至优化器配置，这样，可以为模型设置检查点，并稍后从完全相同的状态继续训练，而不用访问原始代码
在Keras中保存完全可以正常使用的模型是很有用的，可以在Tensorflow.js中加载他们，在网络浏览器中训练和运用他们
Keras只用HDF5标准提供基本的保存格式
model.save(path)，这种方法保存的是1.权重值，2.模型配置（框架），3.优化器配置
使用保存的模型：

keras.models.load_model(path)

如何仅保存架构

有时候我们只对模型的架构感兴趣，而无需保存权重值或者优化器，在这种情况下，我们可以仅保存模型的“配置”
json_config=model.to_json()是以json格式保存模型
reinitialized_model=keras.model.model_from_json(json_config)重新加载模型
这种保存方法仅保存了模型的架构，没有经过编译，权重都是随机初始化的

仅保存权重

有时候我们只需要保存模型的状态（其权重值），而对模型的架构不感兴趣，我们可以通过get_weights()获得其权重值，并通过set_weights()设置权重值
weights=model.get_weights()，可以将模型的权重赋值给weights变量
model.save_weights()可以保存模型的权重，保存到电脑的磁盘上
reinitialized_model.load_weights(path)可以用保存的模型架构，加载磁盘上的模型权重
需要注意：

看似模型的架构+模型的权重=整个完整的模型，但其实不是，保存整个完整的模型还包括了模型的优化器配置，但是模型的架构，和权重都没有保存优化器配置，所以二者并不是相等关系

在训练期间保存检查点

在训练期间或训练结束时自动保存检查点，这样一来，可以使用经过训练的模型，而无需重新训练模型，或从上次暂停的地方继续训练，以防训练过程中断
回调函数：tf.keras.callback.ModelCheckpoint(path，monitor,verbose,save_best_only,save_weight_only,mode,period)

参数：
- path：保存模型文件的路径
- monitor：监控，需要监控的数量
- verbose：详细模式，0或1
- save_best_only：如果为True，则不会覆盖根据监控数量的最新最佳模型
- save_weights_only：如果为True，则仅保存模型权重
- mode：{auto，min，max}之一，如果save_best_only=True，则根据监控数量的最大化或最小化来决定覆盖当前保存文件，对于val_acc，这应该是max，对于val_loss，这应该是min，在自动模式下，从监控量的名称自动推断方向
- period：检查点之间的间隔
model.fit(train_image,train_label,epoch=xxx,callbacks=[cp_callback])
model.load_weights(path)

自定义训练中保存检查点

直接看代码

Python代码实现

import tensorflow as tf
from tensorflow import keras 
from tensorflow.keras import layers
import pandas as pd
import numpy as np
import os

# ------------------------------------------------------------------
# 创建模型
(train_image,train_label),(test_image,test_label)=keras.datasets.fashion_mnist.load_data()
train_image=train_image/255
test_image=test_image/255

# 创建数据集
dataset=tf.data.Dataset.from_tensor_slices((train_image,train_label))
dataset=dataset.shuffle(xxxxx).batch(32)

model=keras.Sequential()
model.add(layers.Flatten(input_shape=train_image.shape[1:]))
model.add(layers.Dense(128,activation='relu'))
model.add(layers.Dense(10,activation='softmax'))

model.compile(optimizer='adam',loss='sparse_categorical_crossentropy')
model.fit(train_image,train_label,epochs=5)

保存整个模型

# 保存整个模型
path=r'xxxxx'
model.save(path)
# 加载模型，这里的new_model就和原模型一样，具有相同的结构，权重，优化器配置
new_model=keras.models.load_model(path)
# 用加载的模型评价，verbose：是否显示提示，0：不显示
new_model.evaluate(test_image,test_label,verbose=0)

仅保存架构

# 这里的json_config就是当前模型的架构，是以json的格式保存
json_config=model.to_json()

# 加载架构
reinitialized_model=keras.models.model_from_json(json_config)
reinitialized_model.summary()  # 可以看到和原模型的架构一样
# 如果用现在的模型进行评估，得到的结果将不确定
reinitialized_model.evaluate(test_image,test_label,verbose=0)

# 所以需要重新编译模型
reinitialized_model.compile(optimizer='adam',loss='sparse_categorical_crossentropy')

# 重新训练
reinitialized_model.fit(train_image,train_label,epochs=xxx)

仅保存权重

weights=model.get_weights()

# 用上面的架构加载保存的权重
reinitialized_model.set_weights(weights)

# 然后再次进行评价
reinitialized_model.evaluate(test_image,test_label,verbose=0)
# ps.可以看到，评价结果正常

训练期间保存检查点

path='xxxx'

# 这里仅保存模型的权重
cp_callback=keras.callbacks.ModelCheckpoint(path,save_weights_only=True)

# 创建模型
model=keras.Sequential()
model.add(keras.layers.Flatten(input_shape=train_image.shape[1:]))
model.add(keras.layers.Dense(128,activation='relu'))
model.add(keras.layers.Dense(10,activation='softmax'))

# 编译模型
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy')

# 训练模型
# 需要注意，要填入回调函数的参数，且是以列表的形式
model.fit(train_image,train_label,epoch=xxx,callbacks=[cp_callback])

# 重新构建一个模型model2
model2=keras.Sequential()
model2.add(keras.layers.Flatten(input_shape=train_image.shape[1:]))
model2.add(keras.layers.Dense(128,activation='relu'))
model2.add(keras.layers.Dense(10,activation='softmax'))

# 加载刚才保存的权重
model2.load_weight(path)

# 用新模型评价，可以看到，评价结果正常
model2.evaluate(test_image,test_label,verbose=0)

自定义训练中保存检查点

# 创建模型
model=keras.Sequential()
model.add(layers.Flatten(input_shape=train_image.shape[1:]))
model.add(layers.Dense(128,activation='relu'))
model.add(layers.Dense(10,activation='softmax'))

optimizer=keras.optimizers.Adam()
# 这里的from_logits参数，如果为True就表示输出层经过了激活函数
loss_func=keras.losses.SparseCategoricalCrossentropy(from_logits=True)

def loss(model,x,y):
    y_=model(x)
    return loss_func(y,y_)

train_loss=keras.metrics.Mean('train_loss',dtype=tf.float32)
train_accuracy=keras.metrics.SparseCategoricalAccuracy('train_accuracy')
test_loss=keras.metrics.Mean('test_lss',tf.float32)
test_accuracy=keras.metrics.SparseCategoricalAccuracy('test_accuracy')

def train_step(model,image,label):
    with tf.GradientTape() as t:
        pred=model(image)
        loss_step=loss_func(label,pred)
    grads=t.gradient(loss_step,model.trainable_variables)
    optimizer.apply_gradients(zip(grads,model.trainable_variables))
    train_loss(loss_step)
    train_accuracy(label,pred)
    
cp_dir='xxx'
cp_prefix=os.path.join(cp_dir,'自己指定的文件名！！！！！')

checkpoint=tf.train.Checkpoint(optimizer=optimizer,model=model)

def train():
    for epoch in range(xxx):
        for (batch,(image,label)) in enumerate(dataset):
            train_step(model,image,label)
        print('epoch{},loss is {}'.format(epoch+1,train_loss.result()))
        print('epoch{},accuracy is {}'.format(epoch+1,train_accuracy.result()))
        train_loss.reset_state()
        train_accuracy.reset_state()
        if (eopch +1) %2 ==0:  # 这里的意思是每2个训练epoch保存一次
            checkpoint.save(file_prefix=cp_prefix)
            
# 查看最新的检查点
tf.train.latest_checkpoint(cp_dir)

你可能感兴趣的:(神经网络,机器学习,tensorflow)

推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
【Java】已解决java.sql.SQLRecoverableException异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习流体力学【干货】人工智能交叉前沿技术，人工智能深度学习 python 机器学习
深度学习作为一种新兴的机器学习技术，为流体科学的研究提供了新的思路和方法。通过对大量数据的学习和分析，深度学习模型可以自动提取特征和模式，为流体科学中的复杂问题提供解决方案。然而，深度学习在流体科学中的应用还面临一些挑战，需要进一步研究和探索。未来，深度学习与传统流体力学方法的结合将成为流体科学研究的重要方向，多模态数据的融合、模型的可解释性、实时预测和控制等将是深度学习在流体科学中发展的重点。相
使用GPU进行机器学习训练时，如果GPU-Util计算核心满载工作但是显存占用较少，应该如何优化？十子木机器学习深度学习人工智能
是否需要优化？如果任务运行正常：无需干预（GPU设计本就是优先榨干计算性能）。如果出现卡顿或效率低下：增大batch_size：提升显存占用，减少数据搬运次数（但需避免OOM）。启用混合精度：torch.cuda.amp可减少显存占用并加速计算。检查CPU到GPU的数据流：避免频繁的小数据拷贝（如DataLoader的num_workers设置）。
机器学习中为什么要用混合精度训练十子木机器学习机器学习人工智能
目录FP16与显存占用关系机器学习中一般使用混合精度训练：FP16计算+FP32存储关键变量。FP16与显存占用关系显存（VideoRAM，简称VRAM）是显卡（GPU）专用的内存。FP32（单精度浮点）：传统深度学习默认使用32位浮点数每个参数占用`4字节`例如：1亿参数的模型→约400MB显存FP16（半精度浮点）：每个参数占用`2字节`（直接减半）相同模型→约200MB显存双精度浮点（FP6
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
入门pytorch-联邦学习四代机您发多少 pytorch 人工智能 python
本文联邦学习的代码引用于https://github.com/shaoxiongji/federated-learning本篇文章相当于带大家读一遍联邦学习的代码，同时加深了大家对联邦学习和Pytorch框架的理解。这里想简单介绍一下联邦学习。联邦学习说白了，就是假如有NNN个数据拥有者F1,...,FN{F_1,...,F_N}F1,...,FN，他们希望使用这些数据来训练机器学习模型，但是又各
SoK: A Critical Evaluation of Efficient Website Fingerprinting Defenses
2023攻击和防御模型防御评估准确度、精确度和召回率：使用准确率来评估攻击模型在多类别封闭世界设置中的性能，但在二进制开放世界设置中使用精确率和召回率防御策略：（1）增加虚拟流量、（2）增加流量延迟、（3）将流量从一个流移到另一个流固定速率发送流量F，随机抽样以添加填充R，修改流量以产生与目标流量样本或模式的碰撞C，将流量分成多个流S，使用对抗性扰动来欺骗机器学习模型AF：（1）（2）BuFLO,
KANN 是一个独立的轻量级 C 语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括 LSTM 和 GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归等
一、软件介绍文末提供程序和源码下载KANN是一个独立的轻量级C语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括LSTM和GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归、共享权重和多个输入/输出/成本的拓扑复杂神经网络。与TensorFlow等主流深度学习框架相比，KANN的可扩展性较低，但它的灵活性接近，代码库要小得多，并且仅依赖于标准C库。与
Python知识点：如何使用Nvidia Jetson与Python进行边缘计算杰哥在此 Python系列 python 边缘计算开发语言面试编程
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用NvidiaJetson与Python进行边缘计算NvidiaJetson平台是专为边缘计算设计的一系列AI计算机，它们能够处理和分析来自物联网(IoT)设备和边缘节点的数据。这些设备小巧、节能且功能强大，非常适合用于执行机器学习、计算机视觉和自然语言处理等任务。Python
AttnRNN：参数更少，却断档碾压LSTM/GRU的新RNN wq舞s 人工智能 python 深度学习 deep learning ai 科技 pytorch
研究者与发布者为:CSDNwq舞s，知乎wqwsgithubwqws突破性进展！新型注意力RNN（AttnRNN）在长序列任务中全面超越传统RNN模型在深度学习领域，循环神经网络（RNN）及其变体GRU和LSTM长期以来一直是处理序列数据的首选架构。然而，它们在长序列任务中始终存在信息遗忘和梯度消失等问题。今天，我很高兴地宣布一种全新的RNN架构——AttnRNN，它在多个长序列基准测试中全面超越
C语言教学大变革！DeepSeek如何改变高职院校编程课堂？武汉唯众智创 c语言开发语言程序设计 Deepseek
一、引言在当今数字化转型的浪潮中，程序设计与分析能力已成为高职教育中不可或缺的核心竞争力。作为编程语言的基础，C语言不仅训练学生的计算思维，还培养其算法实现能力。然而，当前高职院校的C语言教学面临诸多挑战，如实践环节薄弱、学生创新能力不足等。DeepSeek等新一代智能编码支持系统的出现，为这一现状带来了转机。该系统融合了深度神经网络与语义解析技术，能够智能生成代码、优化缺陷检测、解构程序逻辑，并
脑机新手指南（十五）speechBCI 项目新手入门指南（上）：项目概述、代码结构与环境搭建 Brduino脑机接口技术答疑脑机新手指南 python 脑机接口新手入门
一、引言在脑机接口（BCI）领域，语音相关的研究正不断取得突破。speechBCI项目为语音脑机接口的研究提供了一个优秀的开源代码库。该项目与前沿的学术研究、丰富的数据集以及具有挑战性的机器学习竞赛紧密相连。本指南将分上下两篇，详细引导新手深入了解和使用speechBCI项目。二、项目概述speechBCI项目不仅仅是一个代码集合，它背后有着深厚的学术背景和实际应用价值。它与一篇发表在[Natur
Python程序设计第6章：函数和函数式编程若北辰 Python程序设计 python 开发语言
Python程序设计Python是全球范围内最受欢迎的编程语言之一，学好Python将对个人职业生涯产生很大的助力，Python在机器学习、深度学习、数据挖掘等领域应用极为广泛。在数据科学家/数据分析师、人工智能工程师、网络安全工程师、软件工程师/全栈工程师、自动化测试工程师等岗位，年入50万，很普遍，学好Python，高薪就业不是问题，因此推出Python程序设计系列文章：Python程序设计第
什么是神经网络和机器学习？【云驻共创】一键难忘人工智能机器学习深度学习神经网络网络
什么是神经网络和机器学习？一.背景在当今数字化浪潮中，神经网络和机器学习已成为科技领域的中流砥柱。它们作为人工智能的支柱，推动了自动化、智能化和数据驱动决策的进步。然而，对于初学者和专业人士来说，理解神经网络和机器学习的本质是至关重要的。在本文中，我们将深入探讨这两个概念的内涵、工作原理以及彼此之间的联系。二.神经网络和机器学习简介神经网络和机器学习都是人工智能领域中的重要概念，它们通常用于解决各
python学智能算法（十五）|机器学习朴素贝叶斯方法进阶-CountVectorizer多文本处理西猫雷婶人工智能机器学习 python学习笔记机器学习 python 人工智能深度学习 scikit-learn
【1】引言前序学习进程中，已经学习CountVectorizer文本处理的简单技巧，先相关文章链接为：python学智能算法（十四）|机器学习朴素贝叶斯方法进阶-CountVectorizer文本处理简单测试-CSDN博客此次继续深入，研究多文本的综合处理。【2】代码测试首先相对于单文本测试，直接将文本改成多行文本：#引入必要的模块fromsklearn.feature_extraction.te
python学智能算法（十六）|机器学习支持向量机简单示例西猫雷婶 python学习笔记人工智能机器学习机器学习 python 支持向量机人工智能深度学习
【1】引言前序学习了逻辑回归等算法，相关文章链接包括且不限于：python学智能算法（十）|机器学习逻辑回归（Logistic回归）_逻辑回归算法python-CSDN博客python学智能算法（十一）|机器学习逻辑回归深入（Logistic回归）_np.random.logistic()-CSDN博客今天在此基础上更进一步，学习支持向量机，为实现较好地理解，先解读一个简单算例。【2】代码解读【2
人工智能-基础篇-2-什么是机器学习？（ML，监督学习，半监督学习，零监督学习，强化学习，深度学习，机器学习步骤等） weisian151 人工智能人工智能机器学习学习
1、什么是机器学习？机器学习（MachineLearning,ML）是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析等数学理论。其核心目标是让计算机通过分析数据，自动学习规律并构建模型，从而对未知数据进行预测或决策，而无需依赖显式的程序指令。基本思想：通过数据驱动的方式，使系统能够从经验（数据）中改进性能，形成对数据模式的抽象化表达。基本概念：模型：模型是对现实世界现
2025 年最强 RPA 软件盘点天竺鼠不该去劝架人工智能
RPA（机器人流程自动化）软件成为了企业提升效率、降低成本的重要工具。以下是2025年一些顶尖的RPA软件盘点。国外RPA软件UiPath地位：全球RPA市场的领军者。功能特性：全能型平台，覆盖流程发现、自动化设计到机器人管理全生命周期。拥有易用的低代码设计器，便于快速上手；强大的AI集成，可实现机器学习和文档理解；能与ERP、CRM等系统无缝集成。适用场景：适用于金融、零售、制造业等需要处理复杂
《机器学习数学基础》补充资料：什么是随机变量 CS创新实验室机器学习数学基础机器学习人工智能数学概率
卓永鸿提供本文介绍什么是随机变量及为什么要发展此种概念。我们先来看这个问题：一个边长为aaa的正三角形，CCC为其外接圆，外接圆半径为RRR。若在圆内随机作一弦，则弦长lll大于aaa的概率为何？法1：随机半径法先拉出一条圆半径，然后随机在半径上取一点，再画出通过此点并垂直半径的弦。易知当弦心距小于R/2R/2R/2时，弦长lll大于aaa，故概率为1/21/21/2。法2：随机端点法在圆周上随机
贝叶斯网络与深度学习的结合：图像识别和分类 AI天才研究院 AI人工智能与大数据计算 AI大模型企业级应用开发实战自然语言处理人工智能语言模型编程实践开发语言架构设计
本文我将为您撰写一篇关于"贝叶斯网络与深度学习的结合：图像识别和分类"的技术博客文章。这篇文章将深入探讨贝叶斯网络和深度学习在图像识别和分类领域的结合应用。我会遵循您提供的要求和结构模板,确保文章内容全面、深入且易于理解。让我们开始吧。贝叶斯网络与深度学习的结合：图像识别和分类关键词：贝叶斯网络、深度学习、图像识别、图像分类、概率推理、卷积神经网络、不确定性建模文章目录贝叶斯网络与深度学习的结合：
在浏览器中使用TensorFlow.js 魏铁锤chui tensorflow javascript 人工智能
TensorFlow.js简介介绍光学字符识别(OCR)是指能够从图像或文档中捕获文本元素，并将其转换为机器可读的文本格式的技术。如果您想了解更多关于这个主题的内容，本文是一个很好的介绍。TensorFlow.js是一个库，用于使用JavaScript开发和训练机器学习模型，并将其部署在浏览器中或Node.js上。您可以使用现有模型、转换PythonTensorFlow模型、使用迁移学习用您自己的
c++基于BP神经网络的手写数字识别鱼弦机器学习设计类系统开发语言人工智能
鱼弦：CSDN内容合伙人、CSDN新星导师、全栈领域创作新星创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）基于BP（Backpropagation）神经网络的手写数字识别是一种常见的机器学习应用。下面我将为您提供原理的详细解释、使用场景的解释以及一些相关的文献材料链接。原理详细解释
pytorch底层原理学习--Libtorch
libtorchlibtorch是PyTorch的C++实现版本，可以认为所有的pytorch底层都是由c++实现，而pytorch的所有C++实现就叫libtorch，也就是我们在pytorch官网getstart页面下载的c++pytorch版本。我们用python写的pytorch神经网络代码都会通过pybind11将python转换为libtorch的C++代码。[官方文档](PyTorc
基于uniapp微信小程+SpringBoot+Vue的流浪动物救助领养系统设计和实现(源码+论文+部署讲解等)
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
【Python】Hydra 用法详解行码棋 #Python python 开发语言
Hydra官方文档Hydra（Python配置管理工具）1.引言在机器学习、深度学习和软件开发中，管理复杂的配置是一个常见的挑战。Hydra是一个强大的Python库，允许开发者轻松地管理和组织配置文件，支持动态参数覆盖、多层次配置和可组合配置等特性。2.安装HydraHydra可以通过pip直接安装：pipinstallhydra-core安装完成后，你可以使用hydra进行配置管理。3.基础用
用户实体行为分析与数据异常访问联防方案 KKKlucifer 时序数据库
一、用户实体行为分析（UEBA）技术概述1.1定义与概念用户实体行为分析（UEBA）是一种高级网络安全方法，它利用机器学习和行为分析技术，对用户、设备、应用程序等实体在网络环境中的行为进行深入分析，以检测出异常行为和潜在的安全威胁。UEBA的核心在于通过建立行为基线，识别出偏离正常行为模式的活动，从而发现那些传统安全工具难以检测到的高级、隐藏和内部威胁。1.2工作原理UEBA系统通过收集来自多个数
java opencv 数字识别算法_[机器学习]基于OpenCV实现最简单的数字识别后期小雨 java opencv 数字识别算法
本文将基于OpenCV实现简单的数字识别。这里以游戏AngryBirds为例，通过以下几个主要步骤对其中右上角的分数部分进行自动识别。1.学习分类器根据训练样本，选取模型训练产生数字分类器。这里的样本可以是通用的数字样本库(如NIST等)，也可以是针对应用场景而制作的专门训练样本。前者优在泛化性，后者强在准确率，当然常用做法是将这两者结合，即在通用数字库基础上做修改。另外这里由于模式并不复杂，计算
Keras环境复现代码（三） yanyiche_ keras 深度学习人工智能
DQN雅达利Breakout强化学习实验要求明确实验目的：学习和实现深度Q学习（DQN），这是一种结合了Q学习和深度神经网络的强化学习算法，用于解决复杂的决策问题。清楚实验原理：1、深度Q学习（DeepQ-Network）将卷积神经网络与Q学习结合，解决高维视觉输入的强化学习问题：2、经验回放：将状态转换存储到缓冲区，打破数据相关性，稳定训练。3、目标网络：定期更新目标Q值计算网络，减少训练中的目
Python 爬虫实战：从图片网站抓取图片并进行特征提取（2025 最新版） Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 github chrome 数据库
一、引言在当今的数字时代，图像数据在各个领域中扮演着至关重要的角色。无论是计算机视觉、机器学习，还是数据分析，图像数据的获取和处理都是基础。然而，获取大量高质量的图像数据并非易事。幸运的是，互联网上充斥着丰富的图像资源，只需借助合适的工具和技术，我们就能高效地从中获取所需的图像数据。本文将详细介绍如何使用Python构建一个完整的爬虫系统，从图片网站抓取图像，并对其进行特征提取。我们将涵盖从网页分
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">