踏破万里无云

【神经网络与深度学习-TensorFlow实践】-中国大学MOOC课程（十三）（人工神经网络（2）））

13 人工神经网络（2）
- 13.1 小批量梯度下降法
- - 13.1.1 批量梯度下降法
  - 13.1.2 随机梯度下降法（Stochastic Gradient Decent，SGD）
  - 13.1.3 小批量梯度下降（Mini-Batch Gradient Decent，MBGD）
- 13.2 梯度下降法的优化
- - 13.2.1 影响小批量下降法的主要因素
  - - 13.2.1.1 小批量样本的选择
    - 13.2.1.2 小批量样本的数量（mini-batch size）（批量大小）
    - 13.2.1.3 学习率
- 13.3 keras和tf.keras
- - 13.3.1 keras
- 13.4 Sequential模型
- - 13.4.1 建立Sequential模型
  - 13.4.2 添加层
  - 13.4.3 查看摘要
  - 13.4.4 对于多分类任务-三层神经网络
  - 13.4.5 配置训练方法
  - - 13.4.5.1 model.compile()的损失函数loss
    - 13.4.5.2 model.compile()的优化器optimizer
    - 13.4.5.3 model.compile()的评测指标metrics
    - 13.4.5.4 iris鸢尾花数据中的配置
    - 13.4.5.5 手写数字识别中的配置Mnist
  - 13.4.6 训练模型
  - 13.4.7 评估模型
  - 13.4.8 使用模型
- 13.5 实例： Sequential模型实现手写数字识别
- - 13.5.1 设计神经网络结构
  - 13.5.2 代码的实现
- 13.6 实例：模型的保存和加载
- - 13.6.1 保存模型参数
  - - 13.6.1.1 HDF5格式
    - 13.6.1.2 SavedModel格式
    - 13.6.1.3 overwrite参数
  - 13.6.2 加载模型参数
  - 13.6.2 实例：使用Sequential模型实现手写数字识别进行保存和加载模型参数
  - 13.6.2.1 完整演示代码
  - 13.6.2 实例：保存整个模型
  - - 13.6.2.1 保存格式
    - 13.6.2.2 加载模型
    - 13.6.2.3 使用演示

13 人工神经网络（2）

多层神经网络-非线性分类问题
多层神经网络的损失函数不是凸函数，很难计算解析解
通常采用梯度下降法，得到数据解，梯度下降法可以用来求解函数极值问题

批量梯度下降
随机梯度下降
小批量梯度下降

13.1 小批量梯度下降法

13.1.1 批量梯度下降法

之前的算法采用的都是批量梯度下降法
每一步迭代的时候都会用到所有的样本，计算量大的惊人
即使使用向量计算，仍十分耗费时间

13.1.2 随机梯度下降法（Stochastic Gradient Decent，SGD）

每次迭代只选择一个样本训练模型，使网络的输出尽可能逼近这个样本的标签值，当训练误差足够小时，结束本次训练，在输入下一个新的样本，显然使用前面样本训练的网络参数不一定能够使得后面的新样本误差最小，所以这个新样本需要再重新训练网络，重复这个过程，直到所有的样本都训练一遍之后。
这个过程称为一轮：使用所有样本训练一遍
反复训练多轮，直到网络对所有样本的误差足够小。
参数更新非常频繁，训练次数非常多，无法快速收敛
不易于实现并行计算
所以现在说的随机梯度下降通常是指小批量梯度下降算法

13.1.3 小批量梯度下降（Mini-Batch Gradient Decent，MBGD）

也成为小批量随机梯度下降（Mini-Batch SGD）
把数据分为多个小批量，每次迭代使用一个小批量来训练模型
每个小批量中的所有样本共同决定了本次迭代中梯度的方向
一轮：使用所有小批量训练一遍
需要训练多轮，使网络对所有样本的误差足够小
每次迭代的训练样本数固定，与整个训练集的样本数量无关
训练大规模数据集
是**抽样（Samping）**的思想

从数据集中随机抽取出来一部分样本，它们的特征可以在一定程度上代表完整数据集的特征
应该是独立同分布：小批量样本能够代表整个样本集的特征。但是实际中，是很难做到这一点的。
随机抽取：小批量样本的特征和整体样本的特征存在差异

小批量梯度下降

小批量样本计算出的梯度和使用全部样本计算出的标准梯度之间存在偏差。
总体向最优化的方向前进
提高模型的泛化能力

13.2 梯度下降法的优化

多层神经网络使用梯度下降法，无法保证一定可达到最小值点

13.2.1 影响小批量下降法的主要因素

小批量样本的选择
批量大小
学习率
梯度

13.2.1.1 小批量样本的选择

在每轮训练之前，打乱样本顺序
因为数据集的连续样本之前有高度的相关性

13.2.1.2 小批量样本的数量（mini-batch size）（批量大小）

批量中的样本数量越多，梯度方向越准确，迭代次数越少
批量梯度下降法：小批量样本=整个数据集
批量中的样本数量越少，随机性越大，迭代次数越多
随机梯度下降法：小批量样本数=1
充分利用处理器资源，进行并行计算
批量大小使用2的幂数：32，64，128，256

13.2.1.3 学习率

之前都是设置为固定的学习率

学习率设置过小，收敛速度慢；
学习率设置过大，震荡，无法收敛

**动态调整学习率：**在训练过程中，动态的调整学习率
. 对于凸函数，可以采用学习率衰减（Learning Rate Decay）/学习率退火（Learning Rate Annealing）

开始训练时，设置较大学习率，加快收敛速度
迭代过程中，学习率随着迭代次数逐渐减小，避免震荡

调节学习率–非凸函数

周期性的增大学习率
自适应的调整学习率
自适应调整每个参数的学习率

自适应学习率算法
梯度估计
动量项的作用
牛顿加速梯度算法（Nesterov Accelerated Gradient，NAG）

13.3 keras和tf.keras

13.3.1 keras

右Python编写的开源人工神经网络库

采用面向对象的方法编写，提供了大量的封装好的模块，使得搭建神经网络模型就好像搭建积木一样简答快捷，容易上手
keras支持神经网络和深度学习领域的主流算法，并且具有很好的可扩展性
支持多操作系统下的多GPU并行计算
作为深度学习库的前端，快速构建和训练深度学习模型
要注意的是，keras只是一个前端工具，是介于计算引擎和程序员之间的接口，不能离开后端计算引擎独立的工作，keras默认的后端是tensorflow，也可以指定其他的如CNTK、Theano
因此使用keras时，可以使用两种方法：第一种方法是把keras作为一个独立的开发工具进行安装，tensorflow作为它的后端；第二种方法是将它作为tensorflow的高级API来使用，在tensorflow1.4版本之后，keras已经成为tensorflow的官方API
Tensorflow具备keras的简单性
Keras具备Tensorflow的强大性，能够在任何规模，一切平台上实现人工智能的应用
一般时第二种方式

13.4 Sequential模型

tf.keras

TensorFlow的高级API
快速搭建和训练神经网络模型
主要数据结构时模型（model）

Sequential模型

其是Keras中的一种神经网络框架，可以被认为是一个容器，其中封装了神经网络的结构
只有一组输入和一组输出
各层之间按照先后顺序堆叠，前面一层的输出就是后面一层的输入，通过不同层的堆叠构建出神经网络

13.4.1 建立Sequential模型

model=tf.keras.Sequential()

>>> import tensorflow as tf
>>> model = tf.keras.Sequential()
>>> model
<tensorflow.python.keras.engine.sequential.Sequential object at 0x00000210D1ABFCC8>

13.4.2 添加层

model.add(tf.keras.layers...)

tf.keras.layers.Dense( # Dense表示全连接层
	inputs # 输入该网络层的数据，表示这个层中神经元的个数
	activation # 激活函数，以字符串的形式给出，如‘relu’、‘softmax’、‘sigmoid’、‘tanh’
	input_shape # 输入数据的形状，全连接神经网络的第一层接受来自输入层的数据，必须要指定形状，后面的层接受前面一层的输出，不用再指明输入数据的情况
	)

13.4.3 查看摘要

在定义神经网络之后，可以使用它的summary()方法来查看网络的结构和参数信息

model.summary()

13.4.4 对于多分类任务-三层神经网络

下面我们就是用Sequential模型来构建这个网络

>>> import tensorflow as tf
>>> 
>>> model = tf.keras.Sequential()
>>> model.add(tf.keras.layers.Dense(8,activation="relu",input_shape=(4,))) # 添加第一层
隐含层，其中有8个神经元，采用relu函数作为激活函数，输入数据的形状为4
>>> model.add(tf.keras.layers.Dense(4,activation="relu")) # 添加第二层隐含层，relu激活
函数，采用上层输出作为输出，不用说明输入
>>> model.add(tf.keras.layers.Dense(3,activation="softmax")) # 添加输出层
>>> 
>>> model.summary()
Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
dense (Dense)                (None, 8)                 40
_________________________________________________________________
dense_1 (Dense)              (None, 4)                 36
_________________________________________________________________
dense_2 (Dense)              (None, 3)                 15
=================================================================
Total params: 91
Trainable params: 91
Non-trainable params: 0
_________________________________________________________________

也可以采用下面形式，直接将其作为参数，建议大家使用第一种方式

model = tf.keras.Sequential([
    tf.keras.layers.Dense(8,activation="relu",input_shape=(4,)),
    tf.keras.layers.Dense(4,activation="relu"),
    tf.keras.layers.Dense(3,activation="softmax")])

13.4.5 配置训练方法

model.compile(loss,optimizer,metrics)

loss：是损失函数
optimizer：是优化器
metrics：是模型训练时希望输出的评测指标

13.4.5.1 model.compile()的损失函数loss

损失函数：这是tf.keras中常用的损失函数，可以以字符串方式给出，也可以是函数形式

第二行的第一个用于独热编码方式的标签值，交叉熵损失函数中有一个参数from_logits是神经网络在输出前已经使用softmax函数将预测结果变换为概率分布，所有的输出之和为1，前面介绍的多分类网络都是这样做的；也有没有的网络在输出前没有经过softmax变化，是原始的输出，那么需要将这个参数的值设置为true
第二行的第二个用于自然顺序码的标签值
第三行是逻辑回归时使用的交叉熵损失函数，与激活函数sigmoid搭配使用，实现二分类任务
这些损失函数都是tf.keras中losses中的子类，因此也可以采用下面的方式

13.4.5.2 model.compile()的优化器optimizer

可以使用前面的字符串形式，也可以使用后面的函数形式
使用后面的函数形式，可以配置参数
在tensorflow1.x中，使用tf.train.optimizer
在tensorflow2.x中，使用tf.keras.optimizer广泛使用

13.4.5.3 model.compile()的评测指标metrics

这里可以使用keras模型性能评估函数
自定义性能评估函数

13.4.5.4 iris鸢尾花数据中的配置

这是鸢尾花分类中的语句

model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),
			loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
			metrics=[tf.keras.metrics.SparseCategoricalAccuracy()])

优化器采用小批量下降法，这里使用函数形式应用，设置学习率为0.1
鸢尾花数据集中，鸢尾花的类别采用自然顺序码表示，神经网络的输出经过softmax函数变换后得到的向量模式，因此损失函数采用稀疏交叉熵损失函数，参数from_logits设置为False，iris标签值数值，预测值是独热编码
准确率函数稀疏交叉熵准确率，注意要使用中括号括起来，在这里，可以使用多个评价函数
如果我们已经把鸢尾花的标签值由数值形式改为了独热编码形式，那么就要改为相应的如下形式

model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),
			loss=tf.keras.losses.CategoricalCrossentropy(from_logits=False),
			metrics=[tf.keras.metrics.CategoricalAccuracy()])

13.4.5.5 手写数字识别中的配置Mnist

其中的参数全部采用字符串形式

model.compile(optimizer='adam',
			loss='sparse_categorical_crossentropy',
			metrics=['sparse_categorical_accuracy'])

13.4.6 训练模型

model.fit(训练集的输入特征，训练集的标签，
		batch_size = 批量大小，
		epochs = 迭代次数，
		shuffle = 是否每轮训练之前打乱数据，默认为true
		validation_data = (测试集的输入特征，测试集的标签),这个参数和下面那个参数是二选一的，如果同时给出，data将覆盖比例
		validation_split = 从训练集划分多少比例给测试集,取值为0~1
		validation_freq = 测试频率,每隔多少论训练，输出一次评测指标
		verbose = 日志显示形式，0：不再标准输出流输出；1：输出进度条记录；2：每个epoch输出一次记录
		)

在程序运行中，是先执行划分数据集，然后再打乱，因此如果数据是有序的，在执行中，应该首先打乱数据集，
下面给出fit方法的输出默认值

model.fit(x=None,y=None,batch_size=32,epochs=1,shuffle=True,validation_data=None,validation_split=0.0,validation_freq=1,verbose=1)

下面给出手写数字识别的fit代码

history = model.fit(X_train,y_train,batch_size=32,epochs=5,validation_split=0.2)

history.history # 可以使用这查看列表储存的信息

13.4.7 评估模型

model.evaluate(test_set_x,test_set_y,batch_size,verbose)

第一个返回值是损失，第二个返回值是在model.compile()方法中指定的性能指标

13.4.8 使用模型

训练好模型之后，就可以使用它来进行分类了，通过模型的predict方法来实现

model.predict(x,batch_size,verbose)

x：数据的属性值
batch_size：当输入批量数据时，模型就会根据batch_size的大小来分批量的运行数据，这样比每次运行一个样本更快，也防止了同时多个数据超过内存的情况，

13.5 实例： Sequential模型实现手写数字识别

Sequential模型

只有一组输入和一组输出
各个层按照先后顺序堆叠

实现分为六个步骤

建立模型

model = tf.keras.Sequential()
model.add()

查看摘要

model.summary()

配置训练方法

model.compile()

训练模型

model.fit()

评估模型

model.evaluate()

使用模型

model.predict()

在这节课中，我们就是用Sequential模型实现手写数据数据集MNIST

13.5.1 设计神经网络结构

MNIST数据集中的每个手写图片都是28*28的，用图片作为神经网络的输入时，通常把它拉成一个一维张量送入神经网络，因此输入层中有184个节点
我们使用有一个隐含层的全连接网络来实现手写数字识别，这些数字从0到9分为10类，输出层中有十个神经元，分别是当前图片属于每个数字的概率
这是一个多分类任务，因此输出层采用softmax函数作为激活函数
隐含层我们设计128个神经元，使用relu函数作为激活函数
在MNIST数据集中，标签是作为0到9的数字，可以直接使用数值标签计算稀疏交叉熵损失函数，而无需把他们转换为独热编码的形式。损失函数：SparseCategoricalCrossentropy
在输入层和隐含层之间共784*128+128=100480参数
在隐含层和输出层之间共128*10+10=1290参数
一共101770个数字

13.5.2 代码的实现

# 1 导入库
import tensorflow as tf
print("TensorFlow version: ", tf.__version__)

import numpy as np
import matplotlib.pyplot as plt

# 在使用GPU版本的Tensorflow训练模型时，有时候会遇到显存分配的错误
# InternalError: Bias GEMM launch failed
# 这是在调用GPU运行程序时，GPU的显存空间不足引起的，为了避免这个错误，可以对GPU的使用模式进行设置
gpus = tf.config.experimental.list_physical_devices('GPU')# 这是列出当前系统中的所有GPU，放在列表gpus中
# 使用第一块gpu，所以是gpus[0]，把它设置为memory_growth模式，允许内存增长也就是说在程序运行过程中，根据需要为TensoFlow进程分配显存
# 如果系统中有多个GPU，可以使用循环语句把它们都设置成为true模式
tf.config.experimental.set_memory_growth(gpus[0], True)

# 2 加载数据
mnist = tf.keras.datasets.mnist
(train_x,train_y),(test_x,test_y) = mnist.load_data()
# (60000,28,28),(60000,),(10000,28,28),(10000,)    
# numpy.ndarray,numpy.ndarray,numpy.ndarray,numpy.ndarray

# 3 数据预处理,这里也可以省去，在之后为进行维度变换
# X_train = train_x.reshape((60000,28*28)) # (60000,784)
# X_test = test_x.reshape((10000,28*28)) # (10000,784)

# 对属性进行归一化,使它的取值在0~1之间，同时转换为tensorflow张量,类型为tf.int16
X_train,X_test = tf.cast(train_x/255.0,tf.float32),tf.cast(test_x/255.0,tf.float32)
y_train,y_test = tf.cast(train_y,tf.int16),tf.cast(test_y,tf.int16)


# 4 建立模型
model = tf.keras.Sequential()
# 首先添加一个Flatten，说明输入层的形状，其不进行计算，只是完成形状转换，
# 把输入的属性拉直，变成一维数组，这样在数据预处理阶段，不用改变数据的形状，隐含层中也不用说明输入数据，各层结构更加清晰
model.add(tf.keras.layers.Flatten(input_shape=(28,28))) 
model.add(tf.keras.layers.Dense(128,activation="relu")) # 添加隐含层
model.add(tf.keras.layers.Dense(10,activation="softmax")) # 添加输出层
# model.summary()函数查看网络结构和信息

# 5 配置模型的训练方法
model.compile(optimizer = 'adam', # 优化器使用adam，这里不用设置其中的参数，因为keras中已经使用公开的参数作为默认值，大多数情况下，都可以得到好的结果
            loss = 'sparse_categorical_crossentropy', # 损失函数使用稀疏交叉熵损失函数
            metrics = ['sparse_categorical_accuracy']) # 标签值：0~9；预测值：概率分布，类似于独热编码；所以使用稀疏分类准确率函数

# 6 训练模型

# 从中划分出20%作为测试数据
model.fit(X_train,y_train,batch_size = 64,epochs=5,validation_split=0.2)

# 7 评估模型
# 在这里，使用mnist本身的测试集评估模型

model.evaluate(X_test,y_test,verbose=2)

# 8 使用模型
np.argmax(model.predict([[X_test[0]]]))# 两层中括号
# 随机抽取4个样本
for i in range(4):
    num = np.random.randint(1,10000)

    plt.subplot(1,4,i+1)
    plt.axis("off")
    plt.imshow(test_x[num],cmap='gray')
    y_pred = np.argmax(model.predict([[X_test[num]]]))
    plt.title("y="+str(test_y[num])+"\ny_pred"+str(y_pred))
plt.show()

输出结果为：

rain on 48000 samples, validate on 12000 samples
Epoch 1/5
2021-12-19 21:01:08.858052: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library cublas64_100.dll
48000/48000 [==============================] - 3s 53us/sample - loss: 0.3291 - sparse_categorical_accuracy: 0.9077 - val_loss: 0.1822 - val_sparse_categorical_accuracy: 0.9500
Epoch 2/5
48000/48000 [==============================] - 2s 38us/sample - loss: 0.1520 - sparse_categorical_accuracy: 0.9557 - val_loss: 0.1402 - val_sparse_categorical_accuracy: 0.9592
Epoch 3/5
48000/48000 [==============================] - 2s 39us/sample - loss: 0.1061 - sparse_categorical_accuracy: 0.9693 - val_loss: 0.1183 - val_sparse_categorical_accuracy: 0.9656
Epoch 4/5
48000/48000 [==============================] - 2s 39us/sample - loss: 0.0805 - sparse_categorical_accuracy: 0.9766 - val_loss: 0.0995 - val_sparse_categorical_accuracy: 0.9709
Epoch 5/5
48000/48000 [==============================] - 2s 39us/sample - loss: 0.0643 - sparse_categorical_accuracy: 0.9812 - val_loss: 0.0950 - val_sparse_categorical_accuracy: 0.9711

13.6 实例：模型的保存和加载

13.6.1 保存模型参数

model.save_weights(filepath,
					overwrite = true,
					save_format = None)

可以保存为HDF5格式
或者TensorFlow的SavedModel格式

13.6.1.1 HDF5格式

文件名后缀

**.h5
**.keras
save_format = None时被保存为HDF5格式

分层数据格式（Hierarchical Data Format）是一种二进制的文件格式，可以看作是一个包含group和dataset的容器

group可以看作是一个文件夹，文件夹下存放子文件夹，子文件夹下存放数据
dataset是具体的数据，类似于numpy中的多维数组
使用HDF5来存放数据，效率很高，非常适合存储大量的数据，因此常用来保存多维数据和图像

13.6.1.2 SavedModel格式

如果在文件中没有指明后缀，那么模型参数就被保存为TensorFlow的SavedModel格式
为了更加清晰，保存为这种格式的时候，会把save_format=“tf”
SavedModel是Tensorflow特有的一种序列文化格式，采用这种格式时，信息不是被保存在一个文件中，而是需要多个文件
model.save_weights("mnist_weights",save_format="tf")
这条语句会出现4个文件，其中checkpoint文件是检查文件，保存模型的相关信息；data文件用来保存所有的可训练变量，也就是模型参数的值；.index文件用来保存变量关键字和值之间对应关系。

13.6.1.3 overwrite参数

表示当指定写入的文件已经存在时，是否直接覆盖原来的数据，默认为true
如果将这个参数设置为false，那么就会出现提示，文件已经存在，是否进行覆盖

13.6.2 加载模型参数

model.load_weight(filepath)

如果加载报错，就看这个keras调用model.load_weights()函数报错:AttributeError: ‘str‘ object has no attribute ‘decode‘

13.6.2 实例：使用Sequential模型实现手写数字识别进行保存和加载模型参数

运行13.5.2的代码之后，可以在最后加上一句

model.save_weight("mnist_weights.h5")

然后会出现一个新的文件，在当前目录下
当然也可以保存在指定位置
然后使用它

# 6 调用已经训练好的参数文件
model.load_weights("mnist_weights.h5")

model.evaluate(X_test,y_test,verbose=2)

13.6.2.1 完整演示代码

# 1 导入库
import tensorflow as tf
print("TensorFlow version: ", tf.__version__)

import numpy as np
import matplotlib.pyplot as plt

# 在使用GPU版本的Tensorflow训练模型时，有时候会遇到显存分配的错误
# InternalError: Bias GEMM launch failed
# 这是在调用GPU运行程序时，GPU的显存空间不足引起的，为了避免这个错误，可以对GPU的使用模式进行设置
gpus = tf.config.experimental.list_physical_devices('GPU')# 这是列出当前系统中的所有GPU，放在列表gpus中
# 使用第一块gpu，所以是gpus[0]，把它设置为memory_growth模式，允许内存增长也就是说在程序运行过程中，根据需要为TensoFlow进程分配显存
# 如果系统中有多个GPU，可以使用循环语句把它们都设置成为true模式
tf.config.experimental.set_memory_growth(gpus[0], True)

# 2 加载数据
mnist = tf.keras.datasets.mnist
(train_x,train_y),(test_x,test_y) = mnist.load_data()
# (60000,28,28),(60000,),(10000,28,28),(10000,)    
# numpy.ndarray,numpy.ndarray,numpy.ndarray,numpy.ndarray

# 3 数据预处理,这里也可以省去，在之后为进行维度变换
# X_train = train_x.reshape((60000,28*28)) # (60000,784)
# X_test = test_x.reshape((10000,28*28)) # (10000,784)

# 对属性进行归一化,使它的取值在0~1之间，同时转换为tensorflow张量,类型为tf.int16
X_train,X_test = tf.cast(train_x/255.0,tf.float32),tf.cast(test_x/255.0,tf.float32)
y_train,y_test = tf.cast(train_y,tf.int16),tf.cast(test_y,tf.int16)


# 4 建立模型
model = tf.keras.Sequential()
# 首先添加一个Flatten，说明输入层的形状，其不进行计算，只是完成形状转换，
# 把输入的属性拉直，变成一维数组，这样在数据预处理阶段，不用改变数据的形状，隐含层中也不用说明输入数据，各层结构更加清晰
model.add(tf.keras.layers.Flatten(input_shape=(28,28))) 
model.add(tf.keras.layers.Dense(128,activation="relu")) # 添加隐含层
model.add(tf.keras.layers.Dense(10,activation="softmax")) # 添加输出层
# model.summary()函数查看网络结构和信息

# 5 配置模型的训练方法
model.compile(optimizer = 'adam', # 优化器使用adam，这里不用设置其中的参数，因为keras中已经使用公开的参数作为默认值，大多数情况下，都可以得到好的结果
            loss = 'sparse_categorical_crossentropy', # 损失函数使用稀疏交叉熵损失函数
            metrics = ['sparse_categorical_accuracy']) # 标签值：0~9；预测值：概率分布，类似于独热编码；所以使用稀疏分类准确率函数

# 6 调用已经训练好的参数文件
model.load_weights("mnist_weights.h5")

model.evaluate(X_test,y_test,verbose=2)

# 8 使用模型
np.argmax(model.predict([[X_test[0]]]))# 两层中括号
# 随机抽取4个样本
for i in range(4):
    num = np.random.randint(1,10000)

    plt.subplot(1,4,i+1)
    plt.axis("off")
    plt.imshow(test_x[num],cmap='gray')
    y_pred = np.argmax(model.predict([[X_test[num]]]))
    plt.title("y="+str(test_y[num])+"\ny_pred"+str(y_pred))
plt.show()

save_weight()方法仅保存了神经网络的模型参数
使用load_weight方法之前，需要首先定义一个完全相同的神经网络模型，否则就会出现模型没有定义的提示。
也就是说model.load_weights()仅仅是替代了model.fit()，不用重新替代模型

13.6.2 实例：保存整个模型

model.save(filepath,
			overwrite=True,
			include_optimizer=True,
			save_format=None
			)

include_optimizer = True：是否保存优化器当前的状态，默认为true，有时时间过长，我们可能需要终止训练，那么就需要保存当前状态，下次运行时就可以从这个断点开始。
可以保存神经网络的结构
模型参数
配置信息（优化器、损失函数等）
优化器状态

13.6.2.1 保存格式

使用方法几乎和保存参数相同

13.6.2.2 加载模型

需要使用它时，使用下面语句

tf.keras.models.load_model()

13.6.2.3 使用演示

只需要在刚才训练的代码后面增加一条model.save("mnist_model_all.h5")
加载演示

# 1 导入库
import tensorflow as tf
print("TensorFlow version: ", tf.__version__)

import numpy as np
import matplotlib.pyplot as plt

# 在使用GPU版本的Tensorflow训练模型时，有时候会遇到显存分配的错误
# InternalError: Bias GEMM launch failed
# 这是在调用GPU运行程序时，GPU的显存空间不足引起的，为了避免这个错误，可以对GPU的使用模式进行设置
gpus = tf.config.experimental.list_physical_devices('GPU')# 这是列出当前系统中的所有GPU，放在列表gpus中
# 使用第一块gpu，所以是gpus[0]，把它设置为memory_growth模式，允许内存增长也就是说在程序运行过程中，根据需要为TensoFlow进程分配显存
# 如果系统中有多个GPU，可以使用循环语句把它们都设置成为true模式
tf.config.experimental.set_memory_growth(gpus[0], True)

# 2 加载数据
mnist = tf.keras.datasets.mnist
(train_x,train_y),(test_x,test_y) = mnist.load_data()
# (60000,28,28),(60000,),(10000,28,28),(10000,)    
# numpy.ndarray,numpy.ndarray,numpy.ndarray,numpy.ndarray

# 3 数据预处理,这里也可以省去，在之后为进行维度变换
# X_train = train_x.reshape((60000,28*28)) # (60000,784)
# X_test = test_x.reshape((10000,28*28)) # (10000,784)

# 对属性进行归一化,使它的取值在0~1之间，同时转换为tensorflow张量,类型为tf.int16
X_train,X_test = tf.cast(train_x/255.0,tf.float32),tf.cast(test_x/255.0,tf.float32)
y_train,y_test = tf.cast(train_y,tf.int16),tf.cast(test_y,tf.int16)

# 6 调用已经训练好的参数文件
model = tf.keras.models.load_model("mnist_model_all.h5")

model.evaluate(X_test,y_test,verbose=2)

# 8 使用模型
np.argmax(model.predict([[X_test[0]]]))# 两层中括号
# 随机抽取4个样本
for i in range(4):
    num = np.random.randint(1,10000)

    plt.subplot(1,4,i+1)
    plt.axis("off")
    plt.imshow(test_x[num],cmap='gray')
    y_pred = np.argmax(model.predict([[X_test[num]]]))
    plt.title("y="+str(test_y[num])+"\ny_pred"+str(y_pred))
plt.show()

即可

你可能感兴趣的:(深度学习,深度学习,tensorflow,神经网络)

tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导 CrazyWolf_081c
tensorflowsigmoid_cross_entropy_with_logits函数解释及公式推导tensorflow官方文档解释参考pytorch--BCELosspytorch--BCELoss解释参考定义在tensorflow/python/ops/nn_impl.py.功能：计算在给定logits和label之间的sigmoidcrossentropy。测量离散分类任务中的概率误差，
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
通俗易懂循环神经网络（RNN）指南
本文用直观类比、图表和代码，带你轻松理解RNN及其变体（LSTM、GRU、双向RNN）的原理和应用。什么是循环神经网络循环神经网络（RecurrentNeuralNetwork,RNN）是一类专门用于处理序列数据的神经网络。与前馈神经网络不同，RNN具有“记忆”能力，能够利用过去的信息来帮助当前的决策。这使得RNN特别适合处理像语言、语音、时间序列这样具有时序特性的数据。类比：你在阅读一句话时，会
DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
【人工智能之深度学习】1. 深度学习基石：神经元模型与感知机的数学本质（附代码实现与收敛性证明） AI_DL_CODE 人工智能之深度学习人工智能深度学习神经元模型感知机赫布法则深度学习基础线性可分
摘要：作为深度学习的基础单元，神经元模型与感知机承载着从生物智能到人工神经网络的桥梁作用。本文从生物神经元的工作机制出发，系统剖析数学建模过程：详解赫布法则的权重更新原理（Δwi=η·xi·y），推导McCulloch-Pitts神经元模型的数学表达（y=Θ(∑wixi−b)），重点证明感知机在linear可分情况下的收敛性——通过Novikoff定理严格推导迭代次数上界，揭示间隔γ对收敛速度的影
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
深入解析Hadoop RPC：技术细节与推广应用码字的字节 hadoop布道师 Hadoop RPC
HadoopRPC框架概述在分布式系统的核心架构中，远程过程调用（RPC）机制如同神经网络般连接着各个计算节点。Hadoop作为大数据处理的基石，其自主研发的RPC框架不仅支撑着内部组件的协同运作，更以独特的工程哲学诠释了分布式通信的本质。透明性：隐形的通信桥梁HadoopRPC最显著的特征是其对通信细节的完美封装。当NameNode接收DataNode的心跳检测，或ResourceManager
【Python 语法】Python 神经网络项目常用语法一杯水果茶！人生苦短我用 Python python
基础1.导入模块和包2.修改系统路径(sys.path.append)3.命令行参数解析(argparse模块)4.assert确保正确性5.main()脚本入口点6.辅助函数生成器函数`cycle(dl)`一、常用函数1.`.cuda()`/`.cpu()`和`torch.device`2.`torch.zeros`、`torch.randn`、`torch.arrange`、`torch.po
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
2023-08-03 yM_aad9
神经是一种社会资源！只要能和别的神经互动就行了！社会性的驯化离不开神经网络人与人之间的合作只能依赖感性理性心理生理事理物理跟蠢人谈情说爱免不了虚情假意它们最爱空头支票如果兑现不了那一定是别人欺骗了它！而不是自欺欺人的本能自欺欺人最容易受人欺骗最要命的是还持有了资料官有什么可怕？可怕的是贼呀！官可能互相约束贼只能互相伤害如果没有互相？那只有相护了！傻子坏人坏事见得少不知道什么叫坏处孬子好人好事见得少
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
AI产品经理面试宝典第42天：学习方法与产品流程解析 TGITCIC AI产品经理一线大厂面试题产品经理 AI面试大模型面试 AI产品经理面试大模型产品经理面试 AI产品大模型产品
具体问答：学习产品及AI知识的方法问：请谈谈您是如何学习产品及AI知识的，以及您认为哪些资源对您帮助最大答：我的学习体系包含三个维度：分层知识架构、实践验证闭环、资源筛选机制。在知识获取阶段，采用「理论-案例-工具」三级学习法：通过《人工智能：一种现代的方法》构建AI基础框架，用TensorFlow官方文档掌握工程实现，结合《启示录》《俞军产品方法论》理解产品逻辑。实践环节采用「项目反哺」模式，例
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
人工神经网络的拓扑结构,神经网络的神经元结构快乐的小蓝猫神经网络深度学习人工智能 rnn
bp神经网络BP（BackPropagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。BP神经
Deepoc大模型重构核工业智能基座：混合增强架构与安全增强决策技术 Deepoch 人工智能创业创新科技自动化学习
面向复杂系统的高可靠AI赋能体系构建Deepoc大模型通过多维度技术突破，显著提升核工业知识处理与决策可靠性。经核能行业验证，其生成内容可验证性提升68%，关键参数失真率99.999%）。动态可信度评估系统：基于贝叶斯神经网络实时量化模型不确定性，为关键决策提供置信度评分（如堆芯功率控制置信区间±0.05%）。二、核心突破：物理增强型智能算法创新机理与数据双驱动建模神经微分方程求解器：将中子输运方
对标ChatGPT，「文心一言」今日亮相！AI人机时代来临，未来在何方？ AI医学
本文由「AI医学er」提供医海无涯，AI同舟。关注我们，助力高效科研。3月15日，OpenAI公布了其大型语言模型的最新版本——GPT-4。3月16日，百度文心一言人工智能聊天机器人正式上线。一个时代开始了。OpenAI在官网表示，GPT-4是一个能接受图像和文本输入，并输出文本的多模态模型，是OpenAI在扩展深度学习方面的最新成果。此前的ChatGPT，只能通过向其输入文字提问才能生成文字回答
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
学习人工智能开发的详细指南 Ws＿学习人工智能 python
一、引言人工智能（AI）开发是一个充满挑战与机遇的领域，它融合了数学、计算机科学、统计学、认知科学等多个学科的知识。随着大数据、云计算和深度学习技术的快速发展，AI已经成为推动社会进步和产业升级的关键力量。本文将为初学者提供一份详细的学习指南，帮助大家逐步掌握AI开发的核心技能。二、基础知识准备数学基础：线性代数：理解向量、矩阵、线性变换等基本概念，掌握矩阵运算和特征值分解等技巧。概率论与统计学：
AI人工智能领域知识图谱在文本分类中的应用技巧 AI天才研究院 AI大模型企业级应用开发实战人工智能知识图谱分类 ai
AI人工智能领域知识图谱在文本分类中的应用技巧关键词：知识图谱、文本分类、图神经网络、实体关系抽取、深度学习、自然语言处理、特征融合摘要：本文深入探讨了知识图谱在文本分类任务中的应用技巧。我们将从知识图谱的基本概念出发，详细分析如何将结构化知识融入传统文本分类流程，介绍最新的图神经网络方法，并通过实际案例展示知识增强型文本分类系统的构建过程。文章特别关注知识表示学习与文本特征的融合策略，以及在不同
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出