白码王子小张

基于windows10+Anaconda3+Python搭建配置TensorFlow、Keras、Jupyter Notebook库，下载Kaggle狗猫数据集完成原始数据直接训练和数据增强后训练

一、引言

（一）Overfit（过拟合）含义

1.简单理解就是训练样本的得到的输出和期望输出基本一致，但是测试样本输出和测试样本的期望输出相差却很大。

2.为了得到一致假设而使假设变得过度复杂称为过拟合。想像某种学习算法产生了一个过拟合的分类器，这个分类器能够百分之百的正确分类样本数据（即再拿样本中的文档来给它，它绝对不会分错），但也就为了能够对样本完全正确的分类，使得它的构造如此精细复杂，规则如此严格，以至于任何与样本数据稍有不同的文档它全都认为不属于这个类别！

如果数据本身呈现二次型，故用一条二次曲线拟合会更好。但普通的PLS程序只提供线性方程供拟合之用。这就产生拟合不足即“欠拟合”现象，从而在预报时要造成偏差。如果我们用人工神经网络拟合，则因为三层人工神经网络拟合能力极强，有能力拟合任何函数。如果拟合彻底，就会连实验数据点分布不均匀，实验数据的误差等等“噪声”都按最小二乘判据拟合进数学模型。这当然也会造成预报的偏差。这就是“过拟合”的一个实例了

（二）数据增强

1、什么是数据增强

数据增强主要用来防止过拟合，用于dataset较小的时候。

之前对神经网络有过了解的人都知道，虽然一个两层网络在理论上可以拟合所有的分布，但是并不容易学习得到。因此在实际中，我们通常会增加神经网络的深度和广度，从而让神经网络的学习能力增强，便于拟合训练数据的分布情况。在卷积神经网络中，有人实验得到，深度比广度更重要。

然而随着神经网络的加深，需要学习的参数也会随之增加，这样就会更容易导致过拟合，当数据集较小的时候，过多的参数会拟合数据集的所有特点，而非数据之间的共性。那什么是过拟合呢，之前的博客有提到，指的就是神经网络可以高度拟合训练数据的分布情况，但是对于测试数据来说准确率很低，缺乏泛化能力。

因此在这种情况下，为了防止过拟合现象，数据增强应运而生。当然除了数据增强，还有正则项/dropout等方式可以防止过拟合。

2、常见的数据增强方法

随机旋转：随机旋转一般情况下是对输入图像随机旋转[0,360)。
随机裁剪：随机裁剪是对输入图像随机切割掉一部分。
色彩抖动：色彩抖动指的是在颜色空间如RGB中，每个通道随机抖动一定的程度。在实际的使用中，该方法不常用，在很多场景下反而会使实验结果变差。
高斯噪声：是指在图像中随机加入少量的噪声。该方法对防止过拟合比较有效，这会让神经网络不能拟合输入图像的所有特征。
水平翻转
竖直翻转

随机裁剪/随机旋转/水平反转/竖直反转都是为了增加图像的多样性。并且在某些算法中，如faster RCNN中，自带了图像的翻转。

在实验中我们发现，一个小数据集通过数据增强方法后，loss和accuracy反而都增加了。这可能对于初学者来说比较困惑，因为同样的网络结构可以拟合一个较大的数据集，却不能拟合一个小的数据集。有人给出了解释说，因为经过了数据增强后，dataset更容易学习了，所以虽然迭代次数一致，但是大的数据集更容易学习到收敛，小的数据集学的要慢一些。如果增加迭代次数，两者都将达到一个很高的拟合程度。还有人说，这是因为加入了正则项的原因，导致小的数据集不能过拟合了。

在训练时，我们还发现，当batchsize不变时，经过了数据增强后的数据集容易造成更大的波动。这主要是因为，如果数据增强是把1张图片变成5张，batchsize都为5，那么在validation的时候，小数据集每个batchsize的5张图片都不同，因此全部错误的概率很低，但是经过了数据增强后的数据集，有很大可能5张图片来自于同一张或同两张原始图片，因此可能要对都对，要错都错，这也就是为什么会波动很大的原因。因此，或许我们可以对经过数据增强后的数据集训练的batchsize也增大同样的倍数。

二、相关数据下载及TensorFlow、Keras、Jupyter Notebook库的搭建

（一）搭建配置TensorFlow、Keras、Jupyter Notebook

1、打开Anaconda Prompt，安装tensorflow库

conda  --version  //检查Anaconda是否成功安装（如果成功会显示版本号）
conda create -n tensorflow pip python=3.6 //创建名为tensorflow的conda环境 注意:这里需要将Python版本改成自己的版本号
activate tensorflow  //激活TensorFlow

激活成功显示如下：

安装TensorFlow的纯CPU版本

pip install --ignore-installed --upgrade tensorflow

可能会报错：E:\MyDownloads\Anaconda3\Anaconda3\envs\tensorflow\Scripts\pip-script.py”, line 6, in from pip._internal.cli.main import mainModuleNotFoundError: No module named ‘pip._internal.cli.main’
解决方法：

easy_install pip

如果出现以下问题：

那就参考一下这位朋友的解决方法吧:https://blog.csdn.net/qq_30722795/article/details/103231442
安装好之后退出tensorflow环境

deactivate

查看tensorflow的环境是否已经被成功添加

conda info --envs

2、安装keras库

pip install keras

3、打开Anaconda Navigator安装jupyter notebook
第一次打开需要install，因为我是下载好的，所以这里是可以直接launch的，这里install的时候最好用手机热点下载。

如果下载的时候弹错error窗口的话，需要为 Anaconda 配置国内镜像源。

如果给 Anaconda 配置了环境变量，可以直接在 cmd 窗口中执行；如果没有配置环境变量，则在 Anaconda Prompt 中执行，我这里没有配置环境变量，在Anaconda Prompt 中执行如下命令，为 Anaconda 配置清华大学镜像源。

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

然后下载应该就没有什么问题了。

（二）Kaggle狗猫数据集下载

猫狗数据集下载链接：https://pan.baidu.com/share/init?surl=l1AnBgkAAEhh0vI5_loWKw
提取码：2xq4

三、猫狗数据集原始数据直接训练和数据增强后训练

（一）创建三个子集的新数据集

1、打开jupyter，创建python3，导入keras，查看版本信息

import keras
keras.__version__

2、下载猫狗数据集并解压缩后，我们将创建一个包含三个子集的新数据集:一个包含每个类1000个样本的训练集，一个包含每个类500个样本的验证集，最后一个包含每个类500个样本的测试集,通过如下代码可以实现该步骤：

import os, shutil
# The path to the directory where the original
# dataset was uncompressed
original_dataset_dir = 'C:\\Users\\asus\\Desktop\\人工智能与机器学习\\卷积神经网络图像分类\\train'

# The directory where we will
# store our smaller dataset
base_dir = 'C:\\Users\\asus\\Desktop\\人工智能与机器学习\\卷积神经网络图像分类\\cat_and_dog_small'
os.mkdir(base_dir)

# Directories for our training,
# validation and test splits
train_dir = os.path.join(base_dir, 'train')
os.mkdir(train_dir)
validation_dir = os.path.join(base_dir, 'validation')
os.mkdir(validation_dir)
test_dir = os.path.join(base_dir, 'test')
os.mkdir(test_dir)

# Directory with our training cat pictures
train_cats_dir = os.path.join(train_dir, 'cats')
os.mkdir(train_cats_dir)

# Directory with our training dog pictures
train_dogs_dir = os.path.join(train_dir, 'dogs')
os.mkdir(train_dogs_dir)

# Directory with our validation cat pictures
validation_cats_dir = os.path.join(validation_dir, 'cats')
os.mkdir(validation_cats_dir)

# Directory with our validation dog pictures
validation_dogs_dir = os.path.join(validation_dir, 'dogs')
os.mkdir(validation_dogs_dir)

# Directory with our validation cat pictures
test_cats_dir = os.path.join(test_dir, 'cats')
os.mkdir(test_cats_dir)

# Directory with our validation dog pictures
test_dogs_dir = os.path.join(test_dir, 'dogs')
os.mkdir(test_dogs_dir)

# Copy first 1000 cat images to train_cats_dir
fnames = ['cat.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_cats_dir, fname)
    shutil.copyfile(src, dst)

# Copy next 500 cat images to validation_cats_dir
fnames = ['cat.{}.jpg'.format(i) for i in range(1000, 1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_cats_dir, fname)
    shutil.copyfile(src, dst)
    
# Copy next 500 cat images to test_cats_dir
fnames = ['cat.{}.jpg'.format(i) for i in range(1500, 2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_cats_dir, fname)
    shutil.copyfile(src, dst)
    
# Copy first 1000 dog images to train_dogs_dir
fnames = ['dog.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_dogs_dir, fname)
    shutil.copyfile(src, dst)
    
# Copy next 500 dog images to validation_dogs_dir
fnames = ['dog.{}.jpg'.format(i) for i in range(1000, 1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_dogs_dir, fname)
    shutil.copyfile(src, dst)
    
# Copy next 500 dog images to test_dogs_dir
fnames = ['dog.{}.jpg'.format(i) for i in range(1500, 2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_dogs_dir, fname)
    shutil.copyfile(src, dst)

3、打印新数据集的尺寸

print('total training cat images:', len(os.listdir(train_cats_dir)))
print('total training dog images:', len(os.listdir(train_dogs_dir)))
print('total validation cat images:', len(os.listdir(validation_cats_dir)))
print('total validation dog images:', len(os.listdir(validation_dogs_dir)))
print('total test cat images:', len(os.listdir(test_cats_dir)))
print('total test dog images:', len(os.listdir(test_dogs_dir)))

这里确实有2000张训练图像，1000张验证图像和1000张测试图像。在每一次分割中，来自每个类的样本数量都是相同的:这是一个平衡的二元分类问题，这意味着分类的准确性将是衡量成功的一个合适的标准。

（二）构建小型卷积网络

在前面的示例中，我们已经为MNIST构建了一个小型卷积网，所以您应该熟悉它们。我们将重用相同的通用结构:我们的卷积网将是一个交替的Conv2D(激活relu)和MaxPooling2D层的堆栈。
然而，由于我们处理的是更大的图像和更复杂的问题，因此我们将使我们的网络相应地更大:它将有一个更多的Conv2D + MaxPooling2D阶段。这样既可以扩大网络的容量，又可以进一步缩小特征图的大小，这样当我们到达平坦层时，特征图就不会太大。在这里，由于我们从大小为150x150的输入开始(有点随意的选择)，我们在Flatten层之前得到大小为7x7的feature map。

注意：feature map的深度在网络中逐渐增加(从32到128)，而feature map的大小在减少(从148x148到7x7)。这是你会在几乎所有convnets中看到的模式。由于我们解决的是一个二元分类问题，我们用一个单一单元(一个大小为1的稠密层)和一个s型激活来结束网络。这个单元将对网络正在查看一个类或另一个类的概率进行编码。

1、构建小型卷积网络

from keras import layers
from keras import models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu',
                        input_shape=(150, 150, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

2、让我们来看看要素地图的尺寸是如何随每个连续图层而变化的

model.summary()

3、让我们来看看特征地图的尺寸是如何随着每一个连续的层：为我们编译步骤，我们将一如既往地使用RMSprop优化器。由于我们用一个单一的乙状结肠单元结束我们的网络，我们将使用二进制交叉熵作为我们的损失（作为提醒，查看第4章第5节中的表格，了解在各种情况下使用什么损失函数）

from keras import optimizers
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-4),
              metrics=['acc'])

（三）数据预处理

正如我们现在所知道的，在将数据输入到我们的网络之前，应该将数据格式化为经过适当预处理的浮点张量。目前，我们的数据以JPEG文件的形式保存在硬盘上，因此将其导入网络的步骤大致如下:

读取图片文件。
解码JPEG内容到RBG像素网格。
把它们转换成浮点张量。
将像素值(从0到255)缩放到[0,1]区间(如您所知，神经网络更喜欢处理小的输入值)。

这看起来可能有点令人畏惧，但是谢天谢地，Keras有一些实用程序来自动处理这些步骤。Keras有一个包含图像处理辅助工具的模块，位于Keras
.preprocessing.image。特别是，它包含类ImageDataGenerator，它允许快速设置Python生成器，这些生成器可以自动地将磁盘上的图像文件转换为一批预处理的张量。这就是我们要用的。

1、数据预处理

from keras.preprocessing.image import ImageDataGenerator

# All images will be rescaled by 1./255
train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
        # This is the target directory
        train_dir,
        # All images will be resized to 150x150
        target_size=(150, 150),
        batch_size=20,
        # Since we use binary_crossentropy loss, we need binary labels
        class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=20,
        class_mode='binary')

2、查看输出

for data_batch, labels_batch in train_generator:
    print('data batch shape:', data_batch.shape)
    print('labels batch shape:', labels_batch.shape)
    break

我们可以看其中一个生成器的输出:它生成一批150x150的RGB图像(shape(20, 150, 150, 3))和二进制标签(shape(20，))。20是每批样品的数量(批次尺寸)。请注意，生成器会无限期地生成这些批:它只是在目标文件夹中出现的图像上无休止地循环。由于这个原因，我们需要在某一点中断迭代循环。

3、使用生成器使我们的模型适合于数据

history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,
      epochs=30,
      validation_data=validation_generator,
      validation_steps=50)

这里使用fit_generator方法来完成此操作，对于我们这样的数据生成器，它相当于fit方法。它期望Python生成器作为第一个参数，它将无限期地生成成批的输入和目标，就像我们的示例一样。因为数据是不断生成的，所以在宣告一个纪元结束之前，生成器需要知道示例从生成器中抽取多少样本。这就是steps_per_epoch参数的作用:在从生成器中绘制完steps_per_epoch批处理之后，即在运行完steps_per_epoch梯度下降步骤之后，拟合过程将转到下一个epoch。在我们的例子中，批次是20个样本大，所以在我们看到2000个样本的目标之前将需要100个批次。

在使用fit_generator时，可以传递validation_data参数，就像fit方法一样。重要的是，允许这个参数本身是一个数据生成器，但是它也可以是Numpy数组的元组。如果您传递一个生成器作为validation_data，那么这个生成器将会不断生成成批的验证数据，因此您还应该指定validation_steps参数，它告诉流程从验证生成器提取多少批来进行评估。
4、保存模型

model.save('C:\\Users\\asus\\Desktop\\人工智能与机器学习\\卷积神经网络图像分类\\cats_and_dog_small_1.h5')

5、在训练和验证数据上绘制模型的损失和准确性

import matplotlib.pyplot as plt

acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(len(acc))

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.legend()

plt.figure()

plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.legend()

plt.show()

这些图具有过拟合的特点。我们的训练精度随着时间线性增长，直到接近100%，而我们的验证精度停留在70-72%。我们的验证损失在5个epoch后达到最小，然后停止，而训练损失继续线性下降，直到接近0。
因为我们只有相对较少的训练样本(2000)，过度拟合将是我们首要关心的问题。你已经知道了一些技术，可以帮助减轻过度拟合，如dropout和重量衰减(L2正则化)。现在我们将介绍一种新的方法，专门针对计算机视觉，在深度学习模型处理图像时几乎普遍使用:数据增强。

（四）数据增强

过度拟合是由于可供学习的样本太少，使我们无法训练一个模型来泛化到新的数据。给定无限的数据，我们的模型将暴露于手头数据分布的每一个可能方面:我们永远不会过度拟合。数据增强采用的方法是从现有的训练样本中生成更多的训练数据，方法是通过一系列随机变换来“增强”样本，从而产生看上去可信的图像。我们的目标是在训练时，我们的模型不会两次看到完全相同的图像。这有助于将模型暴露于数据的更多方面，并更好地泛化。

在Keras中，这可以通过配置一系列随机转换来完成，这些转换将对ImageDataGenerator实例所读取的图像执行。让我们以一个例子开始:
1、图像数据生成器增强数据

datagen = ImageDataGenerator(
      rotation_range=40,
      width_shift_range=0.2,
      height_shift_range=0.2,
      shear_range=0.2,
      zoom_range=0.2,
      horizontal_flip=True,
      fill_mode='nearest')

这些只是可用的选项中的一部分(更多信息，请参阅Keras文档)。以上参数含义如下:

rotation_range是一个角度值(0-180)，在这个范围内可以随机旋转图片。
width_shift和height_shift是范围(作为总宽度或高度的一部分)，在其中可以随机地垂直或水平地转换图片。
shear_range用于随机应用剪切转换。
zoom_range用于在图片内部随机缩放。
horizontal_flip是用于水平随机翻转一半的图像——当没有假设水平不对称时(例如真实世界的图片)。
fill_mode是用于填充新创建像素的策略，它可以在旋转或宽度/高度移动之后出现。

2、查看增强后的图像

# This is module with image preprocessing utilities
from keras.preprocessing import image

fnames = [os.path.join(train_cats_dir, fname) for fname in os.listdir(train_cats_dir)]

# We pick one image to "augment"
img_path = fnames[3]

# Read the image and resize it
img = image.load_img(img_path, target_size=(150, 150))

# Convert it to a Numpy array with shape (150, 150, 3)
x = image.img_to_array(img)

# Reshape it to (1, 150, 150, 3)
x = x.reshape((1,) + x.shape)

# The .flow() command below generates batches of randomly transformed images.
# It will loop indefinitely, so we need to `break` the loop at some point!
i = 0
for batch in datagen.flow(x, batch_size=1):
    plt.figure(i)
    imgplot = plt.imshow(image.array_to_img(batch[0]))
    i += 1
    if i % 4 == 0:
        break

plt.show()

如果我们使用这种数据增加配置训练一个新的网络，我们的网络将永远不会看到两次相同的输入。然而，它看到的输入仍然是高度相关的，因为它们来自少量的原始图像——我们不能产生新的信息，我们只能混合现有的信息。因此，这可能还不足以完全消除过度拟合。

3、为了进一步对抗过拟合，我们还将在我们的模型中增加一个Dropout层，就在密集连接分类器之前：

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu',
                        input_shape=(150, 150, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dropout(0.5))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-4),
              metrics=['acc'])

4、用数据增强和退出来训练我们的网络:

train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,)

# Note that the validation data should not be augmented!
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
        # This is the target directory
        train_dir,
        # All images will be resized to 150x150
        target_size=(150, 150),
        batch_size=32,
        # Since we use binary_crossentropy loss, we need binary labels
        class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=32,
        class_mode='binary')

history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,
      epochs=100,
      validation_data=validation_generator,
      validation_steps=50)

5、保存模型在convnet可视化部分使用

model.save('C:\\Users\\asus\\Desktop\\人工智能与机器学习\\卷积神经网络图像分类\\cat_and_dog_small_2.h5')

6、画出结果

acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(len(acc))

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.legend()

plt.figure()

plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.legend()

plt.show()

由于数据的增加和遗漏，我们不再过度拟合:训练曲线相当紧密地跟踪验证曲线。我们现在能够达到82%的精度，相对于非正则化模型有15%的改进。
通过进一步利用正则化技术和调整网络参数(比如每个卷积层的滤波器数量，或者网络中的层数)，我们可能能够获得更好的精度，可能达到86-87%。

四、优化提高猫狗图像分类模型精度

在我们构造卷积网络时，一开始先是好几层卷积层和Max Pooling层，然后会调用Flatten()把他们输出的多维向量压扁后，传入到普通层

（一）构建卷积网络

1、构建网络

from keras import layers
from keras import models
from keras import optimizers
model = models.Sequential()
#输入图片大小是150*150 3表示图片像素用(R,G,B)表示
model.add(layers.Conv2D(32, (3,3), activation='relu', input_shape=(150 , 150, 3)))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64, (3,3), activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(128, (3,3), activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(128, (3,3), activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer=optimizers.RMSprop(lr=1e-4),
             metrics=['acc'])
model.summary()

（二）构建VGG16网络

现在要借用的的VGG16网络，其结构与上面差不多，只不过它的Conv2D和MaxPooling层要比我们上面做的多得多而已。在我们借用别人训练好的网络时，往往要去掉Flatten()后面的网络层，因为那些网络层与别人构造网络时的具体应用场景相关，他们的应用场景与我们肯定不同，我们要借用的是Flatten上面那些由卷积层和Max Pooling层输出的结果，这些结果蕴含着对训练图片本质的认知，这才是我们想要的，去掉Flatten后面的神经层，换上我们自己的神经层，这个行为就叫特征抽取，具体流程如下图：

1、初始化一个VGG16网络实例

from keras.applications import VGG16
conv_base = VGG16(weights = 'imagenet', include_top = False, input_shape=(150, 150, 3))
conv_base.summary()

weight参数告诉程序将网络的卷积层和max pooling层对应的参数传递过来，并将它们初始化成对应的网络层次
include_top表示是否也要把Flatten()后面的网络层也下载过来，VGG16对应的这层网络用来将图片划分到1000个不同类别中，由于我们只用来区分猫狗两个类别，因此我们去掉它这一层
input_shape告诉网络，我们输入图片的大小是150*150像素，每个像素由[R, G, B]三个值表示

2、首次运行时候，会自动从对应网站下载h5格式文件

上面下载很慢，而且还有可能在中途挂掉，因此建议将网址复制到手机上面，然后通过手机下载，一下就下载好了，手机下载好之后，上传到电脑，然后放到当前jupyter目录下，最后，将上面代码修改为如下：

from keras.applications import VGG16
conv_base = VGG16(weights = 'vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5', include_top = False, input_shape=(150, 150, 3))
conv_base.summary()

运行结果：

VGG16的网络结构与我们前面做的网络差不多，只不过它的层次要比我们多不少。最后的(None, 4, 4,
512)表示它将输出44的矩阵，而这些矩阵有512层，或者你也可以看成它将输出一个44的矩阵，而矩阵每个元素是包含512个值的向量

（三）将猫狗数据集传递给神经网络

1、将步骤三产生的新建的猫狗数据集传递给神经网络，让它把图片的隐含信息给抽取出来

import os 
import numpy as np
from keras.preprocessing.image import ImageDataGenerator
base_dir = 'E:\\dogs-vs-cats1'
train_dir = os.path.join(base_dir, 'train')
validation_dir = os.path.join(base_dir, 'validation')
test_dir = os.path.join(base_dir, 'test')
datagen = ImageDataGenerator(rescale = 1. / 255)
batch_size = 20
def extract_features(directory, sample_count):
    features = np.zeros(shape = (sample_count, 4, 4, 512))
    labels = np.zeros(shape = (sample_count))
    generator = datagen.flow_from_directory(directory, target_size = (150, 150), 
                                            batch_size = batch_size,
                                            class_mode = 'binary')
    i = 0
    for inputs_batch, labels_batch in generator:
        #把图片输入VGG16卷积层，让它把图片信息抽取出来
        features_batch = conv_base.predict(inputs_batch)
        #feature_batch 是 4*4*512结构
        features[i * batch_size : (i + 1)*batch_size] = features_batch
        labels[i * batch_size : (i+1)*batch_size] = labels_batch
        i += 1
        if i * batch_size >= sample_count :
            #for in 在generator上的循环是无止境的，因此我们必须主动break掉
            break
        return features , labels
#extract_features 返回数据格式为(samples, 4, 4, 512)
train_features, train_labels = extract_features(train_dir, 2000)
validation_features, validation_labels = extract_features(validation_dir, 1000)
test_features, test_labels = extract_features(test_dir, 1000)

2、把抽取的特征输入到我们自己的神经层中进行分类

train_features = np.reshape(train_features, (2000, 4 * 4 * 512))
validation_features = np.reshape(validation_features, (1000, 4 * 4 * 512))
test_features = np.reshape(test_features, (1000, 4 * 4* 512))
from keras import models
from keras import layers
from keras import optimizers
#构造我们自己的网络层对输出数据进行分类
model = models.Sequential()
model.add(layers.Dense(256, activation='relu', input_dim = 4 * 4 * 512))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(1, activation = 'sigmoid'))
model.compile(optimizer=optimizers.RMSprop(lr = 2e-5), loss = 'binary_crossentropy', metrics = ['acc'])
history = model.fit(train_features, train_labels, epochs = 30, batch_size = 20, 
                    validation_data = (validation_features, validation_labels))

3、画出训练结果和校验结果

import matplotlib.pyplot as plt
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1, len(acc) + 1)
plt.plot(epochs, acc, 'bo', label = 'Train_acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation acc')
plt.title('Trainning and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'bo', label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()

（四）参数调优

从上面可以看出，经过一百多万张图片训练的网络，其识别效果就要比我们用4000张图片训练的网络要好很多，网络对图片的校验正确率达到了99%以上，同时对训练数据和校验数据的损失估计完全是一模一样的。

上面的方法叫特征提取，还有一种方法叫参数调优。特征提取时，我们把图片输入VGG16的卷积层，让他直接帮我们把图片中的特征提取出来，我们并没有通过自己的图片去训练更改VGG16的卷积层，参数调优的做法在于，我们会有限度的通过自己的数据去训练VGG16提供的卷积层，于是让其能从我们的图片中学习到相关信息。我们从VGG16模型中获取了它六层卷积层，我们在调优时，让这六层卷积层中的最高2层也去学习我们的图片，于是最高两层的链路权重参数会根据我们的图片性质而更改，基本情况如下：

1、参数调优步骤

（1).将我们自己的网络层添加到VGG16的卷积层之上。
（2). 固定VGG16的卷积层保持不变。
（3).用数据训练我们自己添加的网络层
（4).将VGG16的卷积层最高两层放开
（5). 用数据同时训练放开的那两层卷积层和我们自己添加的网络层
2、参数调优代码

model = models.Sequential()
#将VGG16的卷积层直接添加到我们的网络
model.add(conv_base)
#添加我们自己的网络层
model.add(layers.Flatten())
model.add(layers.Dense(256, activation = 'relu'))
model.add(layers.Dense(1, activation = 'sigmoid'))
model.summary()

上图可以看出，VGG16的卷积层已经有一千多万个参数了！用个人电脑单个CPU是不可能对这个模型进行训练的！但我们可以训练它的其中一部分。
3、把它最高三层与我们自己的网络层结合在一起训练，同时冻结最低四层

conv_base.trainable = True
set_trainable = False
#一旦读取到'block5_conv1'时，意味着来到卷积网络的最高三层
#可以使用conv_base.summary()来查看卷积层的信息
for layer in conv_base.layers:
    if layer.name == 'block5_conv1':
        set_trainable = True
    if set_trainable:
        #当trainable == True 意味着该网络层可以更改，要不然该网络层会被冻结，不能修改
        layer.trainable = True
    else:
        layer.trainable = False

4、数据传入网络，训练给定的卷积层和我们自己的网络层

#把图片数据读取进来
test_datagen = ImageDataGenerator(rescale = 1. / 255)
train_generator = test_datagen.flow_from_directory(train_dir, target_size = (150, 150), batch_size = 20,
                                                   class_mode = 'binary')
validation_generator = test_datagen.flow_from_directory(validation_dir, target_size = (150,150),
                                                       batch_size = 20,
                                                       class_mode = 'binary')
model.compile(loss = 'binary_crossentropy', optimizer = optimizers.RMSprop(2e-5),
             metrics = ['acc'])

history = model.fit_generator(train_generator, steps_per_epoch = 100, epochs = 30, 
                              validation_data = validation_generator,
                              validation_steps = 50)

开始训练：

这里训练的时间会偏长，请耐心等待…

以上就是狗猫数据集完成原始数据直接训练和数据增强后训练全部内容了，如有错误请帮忙指正，谢谢大家~

你可能感兴趣的:(人工智能与机器学习)

2024年技术总结与2025年最有潜力的技术发展方向 Allen-Steven python相关应用深度学习
2024年是技术领域高速发展的一年。从人工智能到量子计算，从物联网到区块链，各项技术都取得了显著突破。本文将回顾2024年的关键技术成果，并展望2025年的技术发展趋势，附加一些具有代表性的开源项目例子，供大家参考。2024年技术总结1.人工智能与机器学习2024年，生成式人工智能（GenerativeAI）技术继续扩展应用范围。从文本生成到图像、音频、视频生成，这些技术被广泛应用于教育、娱乐、医
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
人工智能与机器学习原理精解【18】叶绿先锋基础数学与应用数学人工智能机器学习
文章目录决策树基础决策树的定义决策树的计算决策树的例子决策树的例题决策树算法一、决策树的算法过程二、决策树的性质Julia中实现框架使用`DecisionTree.jl`使用`MLJ.jl`Julia包的教程一、了解Julia包生态系统二、安装Julia包1.打开JuliaREPL2.使用Pkg包管理器三、使用Julia包四、查找和了解Julia包1.Julia官方文档2.JuliaHub3.Gi
人工智能与机器学习原理精解【1】叶绿先锋基础数学与应用数学神经网络人工智能深度学习
文章目录Rosenblatt感知器感知器基础收敛算法算法概述算法步骤关键点说明总结C++实现要点代码参考文献Rosenblatt感知器感知器基础感知器，也可翻译为感知机，是一种人工神经网络。它可以被视为一种最简单形式的前馈式人工神经网络，是一种二元线性分类器。Rosenblatt感知器建立在一个非线性神经元上，但是它只能完成线性分类硬限幅与超平面局部诱导域v=∑i=1mwixi+b从上面公式看来，
人工智能与机器学习原理精解【16】叶绿先锋基础数学与应用数学人工智能机器学习
文章目录因果推理概率空间模型一、定义二、性质三、构建步骤四、示例五、应用联合分布概述联合分布函数和概率密度函数之间的主要关系离散型联合分布连续型联合分布联合分布函数一、定义二、性质三、计算四、例子五、例题Reichenbach的共同原因原则定义与背景主要内容数学原理概述应用与推断应用领域注意事项Reichenbach共同原因原则（赖兴巴赫共同原因原理）的实例1.自然科学领域实例一：地震与海啸的相关
人工智能与机器学习原理精解【17】叶绿先锋基础数学与应用数学人工智能机器学习概率论
文章目录贝叶斯贝叶斯定理的公式推导一、条件概率的定义二、联合概率的分解三、贝叶斯定理的推导四、全概率公式的应用五、总结全概率公式推导一、全概率公式的定义二、全概率公式的推导三、全概率公式的应用贝叶斯定理的原理一、基本原理二、核心概念三、数学表达式四、原理应用五、原理特点朴素贝叶斯定理一、贝叶斯定理基础二、朴素贝叶斯的原理三、朴素贝叶斯的特点朴素贝叶斯公式一、贝叶斯定理二、特征独立性假设三、朴素贝叶
未来行业走向：探索变革与机遇安西宁
引言随着科技的迅猛发展和社会的不断变迁，未来的行业走向将会面临新的挑战和机遇。本文将对未来行业的几个关键领域进行分析，并探讨相关变革所带来的影响和可能的机遇。一、人工智能与机器学习人工智能（AI）和机器学习（ML）将成为未来行业发展的关键驱动力。AI技术的广泛应用将改变许多行业的工作方式和商业模式。例如，在医疗领域，AI可以帮助医生进行更准确的诊断和治疗方案选择；在交通领域，自动驾驶技术的发展将彻
政安晨：【完全零基础】认知人工智能（一）【超级简单】的【机器学习神经网络】 —— 预测机政安晨政安晨的机器学习笔记政安晨的人工智能笔记人工智能神经网络深度学习机器学习原理超级简单零基础
开个头很多小伙伴们很想亲近人工智能与机器学习领域，然而这个领域里的核心理论、算法、工具给人感觉都太过“高冷”，让很多小伙伴们望而却步，导致一直无法入门。如何捅破这层窗户纸？让高冷的不再高冷，让神秘的不再神秘！不要怕它，伙计们，咱们以这个小系列文章零基础入门。（这个系列的文章仅需要您稍微听说过一点点编程语言即可，比如Python）如果是对IT这个产业了解不深的小伙伴，可以先快速浏览一下我的这两篇文章
探索嵌入式系统的未来发展趋势迷璃学妹人工智能
嵌入式系统是一种专门设计用于特定应用领域的计算机系统，它通常被嵌入到更大的设备中，以执行特定的任务。随着科技的不断发展，嵌入式系统的未来发展趋势将受到多方面的影响，包括技术进步、市场需求和应用场景的拓展等。以下将从多个角度对嵌入式系统未来的发展趋势进行分点论述。1.人工智能与机器学习的融合随着人工智能和机器学习技术的快速发展，嵌入式系统将更多地融合这些先进技术。未来的嵌入式系统将具备更强大的智能和
大数据思考：面对海量数据时，选择哪种模式才是更适合自己的？ Akamai中国云计算大数据云计算 Akamai Linode 数据仓库
如果您从事科技行业或者您不在这个行业，也许您已经听说过很多关于AI的信息。我所说的不仅仅是多年来我们都喜欢的科幻小说中“天网正在接管地球”式的人工智能，而是人工智能和机器学习已经逐渐成为我们日常生活中的实际应用.大数据是人工智能与机器学习的生命线和支柱。庞大的数据，或者说海量数据，一直驱动着当今的人工智能与机器学习的发展。虽然我们总是希望数据量越大越好，但近年来组织已经开始从追求大数据转向选择小而
ChatGPT学习大纲冷暖从容 ChatGPT chatgpt 学习人工智能
引言在2023年2月份左右开始使用ChatGPT时，就被它强大的理解能力和应答效果所折服，这期间一直在断断续续的学习和使用，也没形成一个完整的学习过程，最近刚好有空，就寻思着好好再学习总结一下，故写出了ChatGPT学习系列的文章，供与大家学习交流。第1周-ChatGPT基础知识ChatGPT简介了解ChatGPT的基本功能和应用场景。人工智能与机器学习基础学习AI和机器学习的基本概念，为理解
人工智能与机器学习——开启智能时代的里程碑洁洁！人工智能机器学习
写在前面前言人工智能与机器学习的概述监督学习、无监督学习和强化学习的基本原理监督学习：无监督学习：强化学习：机器学习的算法和方法常见的机器学习算法和方法线性回归：决策树：支持向量机：神经网络：人工智能与机器学习的应用领域人工智能与机器学习的未来发展结论：图书推荐主要内容作者简介推荐语前言人工智能是指使计算机系统表现出类似于人类智能的能力。其目标是实现机器具备感知、理解、学习、推理和决策等智能行为。
【网络安全|信息泄露】谷歌容器云曝“严重风险”：上千 Kubernetes 集群可能暴露，涉某上市公司网安老伯 web安全 kubernetes 安全网络安全 xss 开发语言 googlecloud
有消息称：谷歌刚刚修复了一个影响重要云服务的漏洞。此前研究人员发现，多家组织（包括一家上市公司）的系统容易受到该漏洞影响。该问题影响了谷歌Kubernetes引擎（GKE），这是一种用于部署、扩展和管理应用程序“容器化”的系统。GKE是谷歌针对Kubernetes开源项目的商用服务，广泛用于医疗保健、教育、零售和金融服务，以及数据处理和人工智能与机器学习操作。云安全厂商OrcaSecurity的研
人工智能与机器学习在工业质量检测中的融合发展 matlabgoodboy 人工智能机器学习
人工智能与机器学习在工业质量检测中的融合发展随着科技的进步，人工智能和机器学习已经成为引领工业质量检测变革的重要力量。它们在工业领域的应用，不仅提高了检测的准确性和效率，也为企业带来了前所未有的发展机遇。一、机器学习在工业质量检测中的优势机器学习技术可以通过训练模型，让机器自动识别和检测产品的缺陷和异常，大大提高了检测的效率和准确性。相比传统的人工检测方式，机器学习能够处理大量数据，快速准确地定位
2023年全球软件质量&效能大会（QECon深圳站）：核心内容与学习收获（附大会核心PPT下载）百家峰会软件质量效能 QECon 程序人生软件开发 QECon
随着科技的快速发展，软件行业面临着越来越多的挑战和机遇。为了更好地应对这些挑战，不断提升软件的质量和效能，大会将汇聚全球的软件开发者、架构师和项目经理，共同探讨和分享关于软件质量保证、测试、性能优化、用户体验设计、人工智能与机器学习、安全与隐私保护等方面的最佳实践和技术趋势。通过本次大会，深入了解行业动态和前沿技术，从中汲取灵感和知识。一、大会核心内容1、软件质量保证和测试：这一板块将重点关注软件
2023年全球软件开发大会（QCon北京站2023）9月：核心内容与学习收获（附大会核心PPT下载）百家峰会程序人生软件开发 QCon 软件开发大会 QCon 软件人生
随着科技的飞速发展，全球软件开发大会（QCon）作为行业领先的技术盛会，为世界各地的专业人士提供了交流与学习的平台。本次大会汇集了全球的软件开发者、架构师、项目经理等，共同探讨软件开发的最新趋势、技术与实践。本文将深入解析大会的核心内容，并探讨从中可以学到的东西。一、核心内容1、人工智能与机器学习在本次大会上，人工智能与机器学习成为核心议题之一。专家们深入探讨了如何运用机器学习技术优化软件开发流程
人机对话：程序设计，学哪种语言好？明月看潮生码农视角少年软件工程师少年工程师编程语言职业发展前景未来
人机对话：程序设计，学哪种语言好？程序设计，学哪种语言好？学习目的：职业发展：个人兴趣：go语言怎么样？优点：缺点：要开发手机APP，还需要学习哪些技术？编程语言：前端开发技术：后端开发技术：移动网络技术：本地存储与数据管理：性能优化：安全开发实践：测试技术：那是学的范围广一些好呢，还是专门钻研一种技术呢？就目前来说，哪种技术更好价值？人工智能与机器学习：前端Web全栈技术：移动开发：区块链技术：
基于Java的人工智能与机器学习初探 naer_chongya 人工智能 java 机器学习
随着人工智能和机器学习的快速发展，Java作为一种流行的编程语言，被广泛应用于许多AI和机器学习应用程序的开发中。本文将介绍Java在AI和机器学习开发中的基本概念和技术。Java在AI和机器学习中的应用Java可以广泛应用于人工智能和机器学习应用程序的开发中，包括数据预处理、特征选择、模型训练和评估等。Java还具备跨平台的能力，能够在各种操作系统上运行，这使得Java成为机器学习和AI领域的重
图像识别的技术前沿：人工智能与机器学习的融合 matlabgoodboy 人工智能机器学习
图像识别的技术前沿在于人工智能（AI）与机器学习（ML）的融合。这种融合使得图像识别系统能够从大量数据中自动学习并识别出各种模式，从而在复杂和动态的环境中实现更高的准确性和鲁棒性。机器学习在图像识别中发挥着越来越重要的作用。传统的图像识别方法通常依赖于手工制作的特征提取和特征匹配，而机器学习则通过训练神经网络自动学习图像中的特征，并做出准确的分类或识别。深度学习，特别是卷积神经网络（CNN），已经
搜索与人工智能码海串游人工智能
前言第一：通过博弈树搜索和启发式搜索的例子了解基于搜索的通用问题求解方法第二：了解人工智能发展的历程和社会影响第三：了解机器学习的基本思想和典型应用第四：了解人工智能应用开发的基本模式内容1.博弈树与剪纸、零和博弈，极大极小策略博弈树与搜索，α与β剪枝以及著名的计算机博弈的例子2.启发式搜索启发式函数，启发式搜索过程，3.人工智能与机器学习人工智能发展历程，专家系统，机器学习，神经网络与深度学习。
图像识别的技术前沿：人工智能与机器学习的融合 matlabgoodboy 人工智能机器学习
图像识别的技术前沿在于人工智能（AI）与机器学习（ML）的融合。这种融合使得图像识别系统能够从大量数据中自动学习并识别出各种模式，从而在复杂和动态的环境中实现更高的准确性和鲁棒性。机器学习在图像识别中发挥着越来越重要的作用。传统的图像识别方法通常依赖于手工制作的特征提取和特征匹配，而机器学习则通过训练神经网络自动学习图像中的特征，并做出准确的分类或识别。深度学习，特别是卷积神经网络（CNN），已经
斯坦福AI百年报告2017：人工智能与机器学习全景式概览智能交通技术人工智能游戏大数据机器学习深度学习
“AIIndex”（AI指数）近日重磅发布，这是斯坦福大学AI百年研究（AI100）的一个项目，旨在追踪人工智能的活动和进展。该报告列出了2017年人工智能在计算机视觉、自然语言理解等方向上的最新进展，分学术、产业多个角度盘点人工智能进度。报告还综合学术论文数量、招生数量和VC投资数量，得出AI发展活力指数，数据显示，最新一波AI浪潮在2015年活力最高，自那以后其实活力开始有小幅减弱。报告全文：
AI和人工智能与机器学习全景报告人工智能学派人工智能
今天分享的是AI系列深度研究报告：《AI和人工智能与机器学习全景报告》。（报告出品方：appen）报告共计：30页获取数据获取仍是AI应用构建团队的主要瓶颈。原因各不相同。例如，特定用例的数据可能不足，新的机器学习技术需要更多的数据，或者并未建立轻松高效获取所需数据的适当流程。受访者对AI生命周期数据管理的看法有着强烈的共识，即企业领导者了解AI生命周期数据管理的价值(90%同意)，AI生命周期数
SQL on Hadoop在快手大数据平台的实践与优化 | 分享实录 weixin_34292959 大数据面试后端
快手大数据架构工程师钟靓本文是根据快手大数据架构工程师钟靓于5月18-19日在A2M人工智能与机器学习创新峰会《SQLonHadoop在快手大数据平台的实践与优化》演讲中的分享内容整理而成。内容简介：本文主要从SQLonHadoop介绍、快手SQLonHadoop平台概述、SQLonHadoop在快手的使用经验和改进分析、快手SQLonHadoop的未来计划四方面介绍了SQLonHadoop架构。
Python实现游戏人工智能与机器学习心梓知识人工智能 python 游戏
一、前言人工智能（AI）与机器学习（ML）已逐渐渗透到游戏开发领域，游戏玩法、画面效果、物理模拟等都得到了极大的提升。本文将介绍Python在游戏人工智能与机器学习方面的应用，主要涉及以下几个方面：游戏AI基础知识游戏AI示例：独立行动游戏（IndependentActionGame，IAG）监督学习与无监督学习遗传算法强化学习深度学习二、游戏AI基础知识游戏AI分为两类：基于规则的游戏AI和机器
1000+常用Python库 TimeBomb2021 python库 python
目录Python常用库文件处理图像处理游戏和多媒体大数据与科学计算人工智能与机器学习系统与命令行数据库网络Web框架安全构建封装代码调试Python常用库Chardet字符编码探测器，可以自动检测文本、网页、xml的编码。colorama主要用来给文本添加各种颜色，并且非常简单易用。Prettytable主要用于在终端或浏览器端构建格式化的输出。difflib，[Python]标准库，计算文本差异
架构师必知必会系列：人工智能与机器学习架构禅与计算机程序设计艺术 AI大模型应用实战架构师必知必会系列大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍人工智能（ArtificialIntelligence，AI）、机器学习（MachineLearning，ML）、深度学习（DeepLearning，DL）和计算机视觉（ComputerVision，CV），经历了从新兴到昙花一现的发展过程，目前已成为人类社会发展的不可或缺的一部分。随着科技的不断进步，人工智能在各个领域都已经取得重大突破，将迎来深刻的变革。
第三章:人工智能深度学习教程-人工智能与机器学习与深度学习之间的区别 geeks老师人工智能深度学习人工智能深度学习机器学习图搜索算法生成对抗网络视觉检测自动驾驶
人工智能基本上是通过一组规则（算法）将人类智能融入机器的机制。人工智能是两个词的组合：“人工”是指由人类或非自然物体制造的东西，“智能”是指相应地理解或思考的能力。另一个定义可能是“人工智能基本上是训练机器（计算机）模仿人脑及其思维能力的研究”。人工智能侧重于3个主要方面（技能）：学习、推理和自我纠正，以获得尽可能最大的效率。机器学习：机器学习基本上是一种研究/过程，它使系统（计算机）能够通过其拥
人工智能与机器学习 Kali与编程～未来科技人工智能机器学习
人工智能和机器学习是目前科技领域最热门的话题之一，它们正在改变着我们的生活和工作方式。本文将从多个角度探讨人工智能和机器学习的应用和发展，以期为读者提供更全面的了解。一、人工智能和机器学习的定义人工智能（ArtificialIntelligence，简称AI）是模拟人类智能的机器系统，这种机器系统可以在某些任务上比人类表现得更好。人工智能的应用领域非常广泛，例如自然语言处理、计算机视觉、智能机器人
人工智能与机器学习---梯度下降法鄧丫丫机器学习
一、梯度下降法1、概述梯度下降（gradientdescent）在机器学习中应用十分的广泛，不论是在线性回归还是Logistic回归中，它的主要目的是通过迭代找到目标函数的最小值，或者收敛到最小值。2、原理梯度下降算法的基本原理就是通过多次迭代，求得与精度值匹配的最后结果：二、牛顿法1、牛顿法的概述牛顿法是机器学习中用的比较多的一种优化算法。牛顿法的基本思想是利用迭代点处的一阶导数(梯度)和二阶导
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts