Pierce_KK

关于Keras 的 ImageDataGenerator 和 Data Augmentation

今天的分享是关于如何使用 keras 的 ImageDataGenerator类来进行数据增强处理（data augmentation）。

通过这篇博客你会了解：

什么是数据增强？

为什么我们要使用数据增强？

数据增强的几种常用类型。

什么情况下可以使用，什么情况下不能使用？

1 什么是数据增强

如果你使用过 keras ，那么首先请你来看一下面的这个问题：

以下的选项当中，哪一个是增强处理（data augmentation）这项操作所做的？

添加更多的训练数据（training data）
替换原始的训练数据
二者都有涉及
I don’t know

你默默地选择了哪一项呢？？？

这篇博文的原作者 Adrian Rosebrock 曾经在它的 Twitter 中做过相同的调查，调查的结果如下：

只有 5% 的人选择了 “ 正确 ” 的答案 B ，（这里的正确仅仅是存在于使用 keras 的 ImageDataGenerator class 来进行

数据增强处理的范围内，如果你用的不是keras 的I..D..G..类，那可能 B 项就算不是正确的了，但是在今天的这篇博客

当中，我们仅仅针对 keras 的 ImageDataGenerator 类。）其实它的这个问题并没有表达清楚，如果只是单讲数据增强，

那么前三个选项都是正确的。好了，不要纠结于这个小问题了，它的出现只不过是用于引出我们今天的出题。

到底应当如何来定义 data augment ，要根据你的使用环境来综合考虑。

augment 这个词有 make something ' great ' , or ' increase ' something 的意思，

什么是广义上的数据增强呢？

————它是一种从给定的原始数据当中通过一些图像处理的方法来生成“ 新的 ”训练数据的技巧（techniques），但是要注意的是，生成后的图像要和原图像的 class label 是相同的。

为什么要使用数据增强？

——我们使用数据增强的这个技巧可以增强模型的泛化能力（the generalizability of the model.）

并且 Given that our network is constantly seeing new, slightly modified versions of the input data, the network is able to learn more robust features.

注意：在测试模型的时候我们不针对 test data 使用数据增强，在绝大多数的时候，数据增强的使用是可以增加测试集在

网络模型上的准确度的；但是这也许会在你的训练阶段导致有轻微的在精度上的下降。

针对数据：

下面的两张图是我们随机创建的一些样本点，左侧的数据服从正态分布，

右侧的数据使我们为这个分布添加了一些微小的扰动（jitter），

这种类型的数据增强的应用就能够有效的增加我们网络模型的泛化能力（the generalizability of our networks）。

基于类似于左侧图像的如此标准的数据分布来训练我们的 machine learning model ，也许能够精确的进行建模，

但是这种模型的泛化能力实在是令人堪忧的。况且在真实的世界当中这种如此标注的数据分布是并不多见的，或者说是并不存在的。

为了增强我们分类器的泛化能力，我们人为的为其增加一些大小为e的随机扰动（ randomly jitter ），就有了右侧的分布。

它总体上也是个正态分布，只不过没有左侧的那么标准罢了。

针对图像：

如果换做是将图像作为输入，那么应用数据增强就会生成如下的“ 新图像 ” ，

这种变换只不过是增强方法的一种， we can obtain augmented data from the original images by applying simple geometric transforms, such as random:

Translations
Rotations
Changes in scale
Shearing
Horizontal (and in some cases, vertical) flips

三种常见的数据增强类型

常见的数据增强方式大致可以分为如下的几种：

1. Dataset generation and data expansion via data augmentation (less common)

（通过数据增强来扩展数据集）

2. In-place/on-the-fly data augmentation (most common)

（在训练的时候给模型输入随机变化后的图像，以达到数据增强的目的）

3. Combining dataset generation and in-place augmentation

（两者的结合）

Type #1: Dataset generation and expanding an existing dataset (less common)

第一种类型是使用图像增强方式来扩充我们现有的数据集，但这并不常用，流程如下：

这种形式的数据增强我们一般称其为 dataset generation or dataset expansion.

众所周知，无论是 machine learning 还是 deep learning 都是需要大量的数据集来训练模型的，但是很多时候我们的数据集

当中往往没有这么多的图像，那该怎么办？

我们举一个极端一些的例子，假设我们只有一张图像，那么你就要基于这一张图像apply data augmentation to create an entire dataset of images 。

为了完成这个任务，你需要：

Load the original input image from disk.
Randomly transform the original image via a series of random translations, rotations, etc.
Take the transformed image and write it back out to disk.
Repeat steps 2 and 3 a total of N times.

这样一来，你也能拥有一个数量相对可观的数据集了，这些数据都是基于一张图像，通过各种形式的变换得到的。

当然，你肯定并不是只有一张图，你可能有几十张，上百种，并且想通过这种形式来拓展你的数据集到几千张的数量级。

但是， In those situations, dataset expansion and dataset generation may be worth exploring.

因为这样做虽然增加了训练集的数据量，但是却对模型的泛化能力没有什么帮助，

你的数据虽然很多，但是都是基于少量数据所生成的，在训练的阶段，你可能会发现精度有所提升，

但是在 test 的时候就会原形毕露了，因为 neural network is only as good as the data it was trained on ，

我们不能指望着只用少量的数据来训练网络，然后使其能够识别 “ 他从来没有见过的东西。 ”

如果你现在正在考虑以这种方式来扩充数据集，那么我觉得你应该再向后退一步，并且

将你的时间投入到如何收集数据上，或者是考虑一下 behavioral cloning 这种方法

Type #2: In-place/on-the-fly data augmentation (most common)

在训练的时候给模型输入随机变化后的图像，以达到数据增强的目的，这是我们最常用的数据增强方式，

也是 keras 的 ImageDataGenerator 类所使用的方式，使我们这篇博客的终点所在。

它的流程如下：

使用这种类型的数据增强方法，可以确保我们的网络在训练时接收到新 batch 里的图像都是之前从未 ‘ 看到过 ’ 的新图像，

（ Using this type of data augmentation we want to ensure that our network, when trained, sees new variations of our data at each and every epoch. ）

从上图中我们可以看到，这个过程共分为三步：

Step #1: An input batch of images is presented to the ImageDataGenerator .
Step #2: The ImageDataGenerator transforms each image in the batch by a series of random translations, rotations, etc.
Step #3: The randomly transformed batch is then returned to the calling function.

有两点需要额外的注意：

第一， keras 的 ImageDataGenerator 类并不会 return 原图，他仅仅是return 经过随机变换过后的图像，

第二， We call this “in-place” and “on-the-fly” data augmentation because this augmentation is done at training time (i.e., we are not generating these examples ahead of time/prior to training).

你可能会觉得这与你头脑中所想像的数据增强的方式有些不同，（你可能认为应当是返回原始数据 + 一些图像变换

所生成的 ‘ 综合 ’ 数据，）但这确实是keras 的 ImageDataGenerator 类所做的。

它所执行的是替换（Replace）操作，而不是添加（additive）操作。

下面的这个想法是错误的：

Keras 的 ImageDataGenerator class 类接收一个 batch 的数据来用于网络的训练。并对接收到的 batch 中的每一张图片都使用一些随机的transformations (including random rotation, resizing, shearing, etc.)。它仅仅 return 这些新生成的图像，并组成一个全新的batch 代替原始的batch 来训练网络。

你可能会觉得这与你头脑中所想像的数据增强的方式有些不同，（你可能认为应当是返回原始数据 + 一些图像变换

所生成的 ‘ 综合 ’ 数据，）但这确实是keras 的 ImageDataGenerator 类所做的。

它所执行的是替换（Replace）操作，而不是添加（additive）操作。

或许你会有这样的问题，那原始的训练数据怎么办？为什么我们不使用原始数据呢？

———— 请你回想一下我们使用数据增强的目的，不就是为了让网络在每个 epoch 都使用 “ 新的” “ 没见过 ” 的图像么，

以此来增加模型的泛化能力。

如果我们没个 epoch 都使用相同的图像来训练，这就与我们使用数据增强方法的初中相违背了，所以，我们使用

“replace” the training data 的方法。

（关于 keras 中的 ImageDataGenerator 类的使用方法会在后文当中提到，）

Type #3: Combining dataset generation and in-place augmentation

也就是说你既要填充数据，以扩充你的 dataset 的数量；还要用 replace 的方法来训练。

you may see this type of data augmentation when performing behavioral cloning 。

behavioral cloning 经常可以在自动驾驶领域中见到，这个领域当中数据的采集是extremely time consuming and expensive。

一个常用的解决方法就是 instead use video games and car driving simulators.

Video game graphics have become so life-like that it’s now possible to use them as training data.

Therefore, instead of driving an actual vehicle, you can instead:

Play a video game
Write a program to play a video game
Use the underlying rendering engine of the video game
…all to generate actual data that can be used for training.

Once you have your training data you can go back and apply Type #2 data augmentation
 (i.e., in-place/on-the-fly data augmentation) to the data you gathered via your simulation.

如何使用通过keras 来实现这几种数据增强

你可以从这里下载到源码，https://download.csdn.net/download/pierce_kk/11473611

我们先来看一下压缩文件中的目录，

$ tree --dirsfirst --filelimit 10
.
├── dogs_vs_cats_small
│   ├── cats [1000 entries]
│   └── dogs [1000 entries]
├── generated_dataset
│   ├── cats [100 entries]
│   └── dogs [100 entries]
├── pyimagesearch
│   ├── __init__.py
│   └── resnet.py
├── cat.jpg
├── dog.jpg
├── plot_dogs_vs_cats_no_aug.png
├── plot_dogs_vs_cats_with_aug.png
├── plot_generated_dataset.png
├── train.py
└── generate_images.py

我们有两个数据集， dogs_vs_cats_small 和 generated_dataset，都是有两类物体（猫和狗）。

前者是从 kaggle 的猫狗大战中节选出来的部分数据（原数据每类有 25000 张）。

后者是采用第一类数据增强的方式生成的，它的原始image 是 parent directory 下的 cat.jpg 和 dog.jpg。

pyimagecearch 文件当中包含了 our implementation of the ResNet CNN classifier.

接下来是几张训练结果的截图，

最后是 train 和 generate 的 script 。

train.py 实现的就是一个从数据加载到训练，最后测试并绘制曲线的过程使用的是resnet，

generate.py 实现的是我们上面说的第一种数据增强的方法，也就是给一张 image ，然后利用各种图像处理的方法

生成一大堆的基于它变换后的iamge

如果你不了解什么keras 的 imageDataGeneraton 和 fit_generation 我推荐你读一下这篇博客

（https://blog.csdn.net/learning_tortosie/article/details/85243310）

我们先来看train.py

2-18 行 import 我们需要使用的package

# set the matplotlib backend so figures can be saved in the background
import matplotlib
matplotlib.use("Agg")
 
# import the necessary packages
from pyimagesearch.resnet import ResNet
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
from keras.preprocessing.image import ImageDataGenerator
from keras.optimizers import SGD
from keras.utils import np_utils
from imutils import paths
import matplotlib.pyplot as plt
import numpy as np
import argparse
import cv2
import os

20- 28 行我们定义了一些命令行参数（如果你不太理解命令行参数，可以看一下我的这篇博客）

# construct the argument parser and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-d", "--dataset", required=True,
	help="path to input dataset")
ap.add_argument("-a", "--augment", type=int, default=-1,
	help="whether or not 'on the fly' data augmentation should be used")
ap.add_argument("-p", "--plot", type=str, default="plot.png",
	help="path to output loss/accuracy plot")
args = vars(ap.parse_args())

接下来的 30 - 53 是 initialize hyperparameters and load our image data

标签的种类从image 的名字当中得到，并且将 image resize 到 64 x 64

# initialize the initial learning rate, batch size, and number of
# epochs to train for
INIT_LR = 1e-1
BS = 8
EPOCHS = 50

# grab the list of images in our dataset directory, then initialize
# the list of data (i.e., images) and class images
print("[INFO] loading images...")
imagePaths = list(paths.list_images(args["dataset"]))
data = []
labels = []

# loop over the image paths
for imagePath in imagePaths:
	# extract the class label from the filename, load the image, and
	# resize it to be a fixed 64x64 pixels, ignoring aspect ratio
	label = imagePath.split(os.path.sep)[-2]
	image = cv2.imread(imagePath)
	image = cv2.resize(image, (64, 64))

	# update the data and labels lists, respectively
	data.append(image)
	labels.append(label)

对image 做归一化处理，对 label做 one-hot 处理（如果不太理解什么事one-hot 可以参考一下我的这篇博客）

并划分 training data 和 test data

# convert the data into a NumPy array, then preprocess it by scaling
# all pixel intensities to the range [0, 1]
data = np.array(data, dtype="float") / 255.0

# encode the labels (which are currently strings) as integers and then
# one-hot encode them
le = LabelEncoder()
labels = le.fit_transform(labels)
labels = np_utils.to_categorical(labels, 2)

# partition the data into training and testing splits using 75% of
# the data for training and the remaining 25% for testing
(trainX, testX, trainY, testY) = train_test_split(data, labels,
	test_size=0.25, random_state=42)

处理过的 one-hot 形式的label 大概是下面的这个样子：

# 这代表狗狗狗猫猫狗狗，

array([[0., 1.],
       [0., 1.],
       [0., 1.],
       [1., 0.],
       [1., 0.],
       [0., 1.],
       [0., 1.]], dtype=float32)

OK 我们开始数据生成的部分，首先实例化一个 ImageDataGenerator类，

(i.e., no augmentation will be performed). This is the default operation of this script.

# initialize an our data augmenter as an "empty" image data generator
aug = ImageDataGenerator()

然后第73-84 行是检查通过命令行赋值的参数‘ augment ’ 的具体值，参数 ' augment ' 的默认值为 -1，即不进行数据增强操作

如果我们想要增强，那么就需要改变这个参数的值 ---> (if args["augment"] > 0)

然后，如果确实要进行增强操作，接下来就是为实现增强的一些参数赋值（包括 rotation_range， zoom_range等）

# check to see if we are applying "on the fly" data augmentation, and
# if so, re-instantiate the object
if args["augment"] > 0:
	print("[INFO] performing 'on the fly' data augmentation")
	aug = ImageDataGenerator(
		rotation_range=20,
		zoom_range=0.15,
		width_shift_range=0.2,
		height_shift_range=0.2,
		shear_range=0.15,
		horizontal_flip=True,
		fill_mode="nearest")

86 - 100 compile our model and train .

优化方法是随机梯度下降 SGD ，loss 为binary_crossentropy 评价方式是accuracy ，model 使我们的resnet,

使用 . fit_generator的方法来训练。

# initialize the optimizer and model
print("[INFO] compiling model...")
opt = SGD(lr=INIT_LR, momentum=0.9, decay=INIT_LR / EPOCHS)
model = ResNet.build(64, 64, 3, 2, (2, 3, 4),
	(32, 64, 128, 256), reg=0.0001)
model.compile(loss="binary_crossentropy", optimizer=opt,
	metrics=["accuracy"])
 
# train the network
print("[INFO] training network for {} epochs...".format(EPOCHS))
H = model.fit_generator(
	aug.flow(trainX, trainY, batch_size=BS),
	validation_data=(testX, testY),
	steps_per_epoch=len(trainX) // BS,
	epochs=EPOCHS)

最后（102 - 120）是用test data 来评估模型， print statistics, and generate a training history plot

# evaluate the network
print("[INFO] evaluating network...")
predictions = model.predict(testX, batch_size=BS)
print(classification_report(testY.argmax(axis=1),
	predictions.argmax(axis=1), target_names=le.classes_))
 
# plot the training loss and accuracy
N = np.arange(0, EPOCHS)
plt.style.use("ggplot")
plt.figure()
plt.plot(N, H.history["loss"], label="train_loss")
plt.plot(N, H.history["val_loss"], label="val_loss")
plt.plot(N, H.history["acc"], label="train_acc")
plt.plot(N, H.history["val_acc"], label="val_acc")
plt.title("Training Loss and Accuracy on Dataset")
plt.xlabel("Epoch #")
plt.ylabel("Loss/Accuracy")
plt.legend(loc="lower left")
plt.savefig(args["plot"])

我们的输入图像的路径是通过以命令行参数的形式给定的，所以我们可以在程序执行时来选择具体训练哪些数据。

- - - - - - generate_images.py

Generating a dataset/dataset expansion with data augmentation and Keras

上面的demo 讲述的是如何通过 keras 的 ImageDataGeneration 来在模型训练的时候实现data augment ，

下面我们来看一下 dataset expansion via data augmentation with Keras 也就是第一种方法，基于较少的数据

来扩充你的数据集。

在训练CNN之前，我们首先需要制作我们的 dataset，

下面我们使用 generate_images.py 和这两张猫狗的图像来生成我们的 dataset,

首先，依旧是 import 环节和命令行参数的定义环节

命令行的参数共有三个， input/ output path 和你要生成多少张

# import the necessary packages
from keras.preprocessing.image import ImageDataGenerator
from keras.preprocessing.image import img_to_array
from keras.preprocessing.image import load_img
import numpy as np
import argparse
 
# construct the argument parser and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", required=True,
	help="path to the input image")
ap.add_argument("-o", "--output", required=True,
	help="path to output directory to store augmentation examples")
ap.add_argument("-t", "--total", type=int, default=100,
	help="# of training samples to generate")
args = vars(ap.parse_args())

（line 18 - 35）加载数据，并且实例化一个ImageDataGenerator 类，

在加载数据的部分，我们使用的是 Keras functionality (i.e. we aren’t using OpenCV) ；

This object（ aug ） will facilitate performing random rotations, zooms, shifts, shears, and flips on our input image.

# load the input image, convert it to a NumPy array, and then
# reshape it to have an extra dimension
print("[INFO] loading example image...")
image = load_img(args["image"])
image = img_to_array(image)
image = np.expand_dims(image, axis=0)
 
# construct the image generator for data augmentation then
# initialize the total number of images generated thus far
aug = ImageDataGenerator(
	rotation_range=30,
	zoom_range=0.15,
	width_shift_range=0.2,
	height_shift_range=0.2,
	shear_range=0.15,
	horizontal_flip=True,
	fill_mode="nearest")
total = 0

接下来我们便 construct 我们的 Python generator ，并且run , 直到生成我们预设数量的图像。

# construct the actual Python generator
print("[INFO] generating images...")
imageGen = aug.flow(image, batch_size=1, save_to_dir=args["output"],
	save_prefix="image", save_format="jpg")
 
# loop over examples from our image data augmentation generator
for image in imageGen:
	# increment our counter
	total += 1
 
	# if we have reached the specified number of examples, break
	# from the loop
	if total == args["total"]:
		break

具体的操作过程如下，（这里偷个懒，直接放上原作者的截图）

实验部分

首先是用网络来训练 generated_data 这个数据集，（就是基于一张图变换出来的dataset）

过程和结果如下：

从上面的结果中我们可以看出， accuracy 已经接近了 100% ，

我们看到其出现了严重的过拟合现象，并且可想而知，模型的泛化能力也会很糟糕。

这并不是一个严肃的实验，你就把它当做是个热身吧，

下面的这部分才是今天实验内容的重点所在 ----> in-place data augmentation 。

也就是用变换后的图像替换原图像来进行训练的方法。

Obtaining a baseline (no data augmentation)

1000张cat和1000张dog 的图像来训练网络，不使用数据增强的技巧。

实验过程如下：

我们得到了 0.64 的准确率，但是同时也出现了一个问题，我们看下面的这张图：

网络出现了严重的过拟合：大约在 epoch = 15 的时候，training loss 的曲线还是处于下降的趋势，

但是validation loss 的曲线已经有了上升的趋势；在 epoch = 20的时候就更加明显了。

这是典型的过拟合现象， The solution is to (1) reduce model capacity, and/or (2) perform regularization.

加入数据增强，（使用 keras 的 ImageDataGeneration )

实验的流程如下

准确率由 64% 提升到了 68% ，更为重要的是，我们解决了过拟合问题

By using data augmentation we were able to combat overfitting!

In nearly all situations, unless you have very good reason not to,

you should be performing data augmentation when training your own neural networks.

总结

今天我们分享了一些关于数据增强的知识，包括什么是数据增强，为什么要使用数据增强以及

如何使用数据增强等等，，

我们现在知道了，一共有三种数据增强的方法，以及哪些是有用的，哪些是没什么太大用的；

掌握了如何通过 keras 的 ImageDataGeneration 类来实现数据增强；

并且你要注意到： data augmentation is a form of regularization

This claim of data augmentation as regularization was verified in our experiments when we found that:

Not applying data augmentation at training caused overfitting
While apply data augmentation allowed for smooth training, no overfitting, and higher accuracy/lower loss

好了，今天的分享到此为止，

如果你喜欢计算机视觉或者 deeplearning 这个领域的一些内容，你也可以关注 Adrian Rosebrock 的blog。

或者是持续关注我这个专栏的分享（PS 本人能力和水平有限）

如果你觉得我分享的内容帮助到了你，就请给我点个赞吧，这是对我一种莫大的鼓励；

当然，也欢迎你对我提出宝贵的意见。

我们下次再见 @

你可能感兴趣的:(Adrian)

《星光背后的双A》曾依婷
开头：当夜幕降临，闪烁的霓虹灯点亮了整个城市，一个神秘的音乐组合双A，在音乐世界中崭露头角。这两位神秘的音乐家，宛如来自未知星球一般，名字被众人称为双A。Ava和Adrian，这是他们的真实名字。两位年轻的音乐家各自拥有独特的音乐才华，但他们选择隐藏自己的身份，让音乐成为他们的唯一身份标识。在舞台上，他们不是Ava和Adrian，而是Allegro和Aria。他们的音乐超越了语言的枷锁，每一次表演
为什么越在乎，越容易失去？-聊一聊《女儿们的恋爱》其实我想做条鱼
今天来说一说《女儿们的恋爱》中的任容萱和Adrian这一对，两个人最后的约会结果体现了一个很常见却被大家所忽略的一个客观事实：太想赢就会输，太在乎就会失去。看节目的时候一直觉得两个人很般配，男生典型的帅气港男长相，两个人还算默契，很搭，走到哪里都觉得很亮眼，很像偶像剧。可惜的是，男生的心态搞砸了一切。任容萱说的很对，她跟Adrian很像，两个人都是敏感细腻型的，可以迅速感知到对方的情绪，共情能力很
熬夜、节食、“机”不离身：纵欲，正在慢慢毁掉你！明述
你本以为自己的生活方式很健康，却不知它正在一点一点地消耗你的生命。在《掌控分寸》这本书中提到：达到这一切的方法就是：把握分寸，掌控界限。这一完整的概念将助你逾越任何障碍，让生活的方方面面发生真正的转变。什么是分寸？分寸就是我们在管控自身行为和与他人互动时对界限的掌控。把握分寸从掌控自我开始。放纵熬夜：想睡就睡，不想睡就通宵朋友Adrian是搞游戏开发的，记得在一个新游戏上线的前后N个月，他经常跟我
python识别文字 opencv_Adrian小哥教程：如何使用Tesseract和OpenCV执行OCR和文本识别... weixin_39833469 python识别文字 opencv
近期，AdrianRosebrock发布一篇教程，介绍了如何使用OpenCV、Python和Tesseract执行文本检测和文本识别。从安装软件和环境、项目流程、review代码、实验结果，到展示局限、提出建议，这篇教程可以说十分详细了。机器之心对该教程进行了摘要编译介绍。本教程将介绍如何使用OpenCVOCR。我们将使用OpenCV、Python和Tesseract执行文本检测和文本识别。那么下
第三十八章世上无难事只怕有心人洛邑布衣
文/洛邑布衣说到这位好心的洋设计师，他叫亚德利安.古柏，大约30岁光景，意大利人，在美国旧金山艺术大学AcademyofArtUniversity读设计系的时候，同学们都叫他Adrian.Cuthbert.他的父亲亚德利安.西彼连Adrian.Cuthbert在美国唐人街开了一个缝纫店。这位精明的父亲发现：中国有钱的贵妇或者电影明星黄柳霜之类的名人，特别喜欢穿质量上乘的面料，比如绸缎，传统大衣呢，
今早聊天记录桃子汽水不加冰
我今天决定好好吃药因为我觉得我的抑郁有点发作了我不知道该不该跟Adrian讲我有好多东西想讲但是我突然发现我还没有刚开始和他聊天顺畅我越来越小心翼翼了啊这个大好天气我想变成一只鸟然后撞到飞机上！！！我踏马好想大哭一场啊我昨天重新下回了写东西写到深夜然后今天我刚刚看到上有个连载我在精神病院的生活是个姑娘也得了抑郁症然后我才突然惊觉我好像抑郁又起来了我一直都潜意识里认为自己“很正常”我感觉我现在纯粹的
创业者理念管理博士学校高高高！分享成瘾咋办！-瑞士DBA第五天徐林Grace
图片发自App2019-10-11DBA5头天晚上incubator成立几个点：创始人Adrian刚MBA7月份毕业，荷兰人，买下一个手表品牌100年历史，想成立手表microbrand联盟，可以很便宜买下来，花了8000欧元。我说：很便宜啊，值得！我要看一下质量，说和omega，IWC一样，letussee！我们说好保持联系，探讨中国市场。另一个创始人瑞士的，在做区块链服务，说是家乐福和LVMH
Adrian一生中的一天：作为计算机视觉研究员、开发人员和企业家程序媛一枚~ Python OpenCV 深度学习计算机视觉深度学习人工智能
Adrian一生中的一天：作为计算机视觉研究员、开发人员和企业家1.5:20AM起床2.咖啡因（战略性）3.检查神经网络训练4.电子邮件5.计划“三件大事”（“3BigThings”）6.早餐7.关闭通知8.午餐9.冥想和正念（Meditationandmindfulness）10.下午（12:00PM–5PM）11.晚上（下午5点至8点）12.夜间（晚上8点至10点30分）参考“作为一名计算机视
读完《论语》丹尼思
我一直是一个理工科背景、技术背景极强的人。《论语》，只在中学的时候，在语文老师的威逼利诱下，在高考的指挥棒下，我读过只字片语。从小我就不喜欢语文，更不喜欢文言文。听闻现在的高考，增加了语文部分的分数占比，听到这个消息，我只庆幸没有再晚生几年。十几年之后，我匆匆看了一遍《论语》，没有任何人的威逼利诱。在美国留学期间，我结交了一位朋友圈中为数不多的外国友人，Adrian。有一天他请我去他家做客，于是我
C++解题报告——Rima（字典树+树形DP） C20201018 图论树形DP 图论树形DP 字典树
题目描述Adrian对单词押韵很感兴趣。如果两个单词的最长公共后缀的长度与两个单词中较长那个的长度一样，或者等于较长单词的长度减一，则这两个单词押韵。换句话说，如果A,B的最长公共后缀LCS（A，B）≥max（|A|，|B|）-1，则A和B押韵。有一天，在阅读一套短篇小说时，他决定创造出能够使每两个相邻单词押韵的最长的单词序列，序列中的每个单词只能出现一次。但是Adrian已经厌倦了这个任务，所以
Hive_HQL_复杂SQL_连续发单天数高达一号 Hive
原文地址：1.HiveSQL复杂场景实现(1)——连续发单天数https://blog.csdn.net/Adrian_Wang/article/details/89791948至今在数据分析岗摸爬滚打已有一年，尚且不敢说自己挖掘洞见的本事提升多少。但实打实的与SQL打了一年的交道，接触过各种各样的业务场景，完成过各种千奇百怪的需求，自我感觉在sql编程上也颇有体会。相信接触过SQL的人都明白知道
人工智能顶会 IJCAI22 Accepted Paper List Ricky_Yan 机器学习目标跟踪人工智能计算机视觉
IJCAI22MainTrackAcceptedPapersLongPresentation#21TheLimitsofMoralityinStrategicGamesRuiCao,PavelNaumovScheduledonJuly29that11:15:00#42MotionMixer:MLP-based3DHumanBodyPoseForecastingArijBouazizi,Adrian
树存储结构---二叉树的链式存储结构 PIG_先生数据结构
@Adrian普通二叉树示意图：如图1所示，此为一棵普通的二叉树，若将其采用链式存储，则只需从树的根节点开始，将各个节点及其左右孩子使用链表存储即可。因此，图1对应的链式存储结构如图2所示：由图2可知，采用链式存储二叉树时，其节点结构由3部分构成（如图3所示）：指向左孩子节点的指针（Lchild）；节点存储的数据（data）；指向右孩子节点的指针（Rchild）；完整代码示例：#include#i
渗透测试靶场合集你说的独品
1DVWA(DamVulnerableWebApplication)DVWA是用PHP+Mysql编写的一套用于常规WEB漏洞教学和检测的WEB脆弱性测试程序。包含了SQL注入、XSS、盲注等常见的一些安全漏洞。链接地址：http://www.dvwa.co.uk2mutillidae是一个免费，开源的Web应用程序，提供专门被允许的安全测试和入侵的Web应用程序。它是由Adrian“Ironge
普林斯顿微积分读本修订版 ,Adrian Banner ,P648 ,2016.10 给你好看哈哈哈
将拜读，替换为baidu链接:https://pan.拜读.com/s/1Q3BMxuX4vZWtYaOhd1XNAA提趣码:es4s1.png内容介绍编辑《普林斯顿微积分读本》特点：是任何单变量微积分教科书的好伙伴：洋溢着非正式的、娱乐性的但非强求的对话语境风格；丰富的在线视频；大量精选例题（从简单到复杂）提供了一步一步的推理过程；定理和方法的证明以及相关应用的说明实现理论应用于实践的目标；详细
小学一年级20以内加减法题目自动生成（家长的福利，孩子的魔鬼） PIG_先生搞点事情
@Adrian我是魔鬼，来折磨小学生了，这又你做不完的题，不要哭，先来个1000题，静静心。给祖国的花朵施施肥#include#include#include#includeintmain(void){intcount=100;FILE*quiz_file;FILE*result_file;quiz_file=fopen("D:\\class/exam.txt","w");result_file=
logisim打不开 PIG_先生安装教程
@Adrian双击红色框中的jar包弹出提示，无法进入Logisim我明明装了1.8的jdk，环境变量也配置好了。但是还显示没有jdk环境。解决办法：Alt+R输入cmd打开命令行,然后输入命令：（“1”为“2”所在的文件夹）可以启动成功！！！！“安装包”可以评论问问要！！！
兔子生兔子的问题 PIG_先生 c语言题
@Adrian假设一对兔子的成熟期是一个月，即一个月可长成成兔，那么，如果每对成兔每个月都生一对小兔，一对新生的小兔从第二个月起就开始生兔子，试问从一对兔子开始繁殖，以后每个月会有多少对兔子？I代表成兔，i代表小兔。第一个月：ii1对第二个月：II1对第三个月：IIii2对第四个月：IIIIii3对第五个月：IIIIIIiiii5对....不难看出是斐波那契数列#include#include/*
HDU 4847 Wow! Such Doge! 小鸡炖蘑菇_ 杭电
HDU4847Wow!SuchDoge!ProblemDescriptionChen,Adrian(November7,2013).“DogeIsAnAc-tuallyGoodInternetMeme.Wow.”.Gawker.RetrievedNovember22,2013.DogeisanInternetmemethatbecamepopularin2013.Thememetypicallyc
搬到人少地方却每天被猫监视，干脆让它进来，让它看一辈子！大爱猫咪控
Adrian是一名喜剧演员平时还做点摄影和导演的工作自疫情爆发后便搬到了一个人烟稀少的地方居住没想到却被一双眼睛盯上了从搬到新房子的第一天起Adrian每天醒来就会发现窗外总有一只奶牛猫直勾勾地盯着他看看到猫咪如此可爱Adrian忍不住开窗撸了几下顺便给了他一点吃的一开始，猫咪吃完饭便会离开但渐渐地，猫咪越来越不客气了吃完饭会从窗户进来房间逛几圈但是后面几天猫咪进来后便赖着不走了就这样，虽然搬到了
小哥起床发现一只喵在窗户边盯着他看…这一看，就甩不掉了!!! 英国那些事儿
微信的规则进行了调整希望大家看完故事多点“在看”，喜欢的话也点个分享和赞这样事儿君的推送才能继续出现在你的订阅列表里才能继续跟大家分享每个开怀大笑或拍案惊奇的好故事啦~Adrian是一名英国的喜剧演员，平时也做摄影和导演的工作，在疫情爆发之后，他搬到了一个人烟稀少的地方自我隔离，可能是怕他太寂寞，一个可爱的小精灵从天而降了……从搬进这个房子的第一天开始，Adrian就觉得这里有点问题，自己被监视了
python web框架Django之基础第一篇 weixin_33979203
一、Django安装Django是python编程语言驱动的一个开源模型、视图、控制器（MVC）风格的web应用程序框架，其最初的开发者是Adrian和Simon。开发背景是为了快速建立新闻站点，开源时间是2005年。官方站点：https://www.djangoproject.com官方文档：https://docs.djangoproject.com/en/1.9/目前Django的最新版为1
[部分译+复现]A Guide to Learn OpenCV--Adrian Rosebrock[未完] Laniakea opencv linux ubuntu16.04
PS:本文纯粹自己想学习OpenCV来复现一遍,随意翻译,可能用词大量不准确,如有异议错误欢迎指正需要下载的文件可以在这里找到(免费)作者原文链接:https://www.pyimagesearch.com/2018/07/19/opencv-tutorial-a-guide-to-learn-opencv/OpenCVTutorial:AGuidetoLearnOpenCVThisOpenCVt
命令行交互的一种Java实现 iteye_7025
现在服务器远程控制一般都是web方式实现的，这种方式体现的最明显的是J2EE应用服务器；当然为了操作方便，有些服务器也提供GUI客户端，不过笔者比较喜欢字符终端，我想有很多人同笔者一样，在这里，向大家介绍一个Java实现的命令行程序，这是笔者当时阅读OBE(一个WorkflowEngine)的源代码时的收获，把代码调整了一下，版权就不属于Adrian.Price的了，哈哈！importjava.i
[Trie树] Rima C20200902 Trie树
文章目录题目题解代码题目题目描述Adrian对单词押韵很感兴趣。如果两个单词的最长公共后缀的长度与两个单词中较长那个的长度一样，或者等于较长单词的长度减一，则这两个单词押韵。换句话说，如果A,B的最长公共后缀LCS（A，B）≥max（|A|，|B|）-1，则A和B押韵。有一天，在阅读一套短篇小说时，他决定创造出能够使每两个相邻单词押韵的最长的单词序列，序列中的每个单词只能出现一次。但是Adrian
时间序列预测（一）数据的一些处理方法 weixin_30919571
一、滑动平均公式（窗口为7）：也就是说7个数做一次平均二、指数平均公式：其中因此也就是说离本点越近，考虑的权重也越大。pythoncode：#author:adrian.wuimportnumpyasnpfrommatplotlibimportpyplotaspltimportpandasaspd"""count:count(1)day:d"""path='/Users/adrian.wu/Pyc
Top 100论文导读（一）：纯干货！深度神经网络中的理解，泛化以及迁移学习 weixin_34417814 人工智能数据结构与算法运维
更多深度文章，请关注：https://yq.aliyun.com/cloud作者：AdrianColyer,著名阿克赛尔合伙公司（AccelPartners）的投资合伙人，该公司致力于帮助杰出的企业家创建世界级的高科技企业，在加入Accel之前，Adrian拥有20年技术人员工作经验，如担任Pivota,VMware,SpringSource的CTO。如果你对科技企业感兴趣，可以和他联系。邮箱：a
Top 100论文导读：深度神经网络的理解，泛化以及迁移学习蓝云0958 深度学习
更多深度文章，请关注云计算频道：https://yq.aliyun.com/cloud作者：AdrianColyer,著名阿克赛尔合伙公司（AccelPartners）的投资合伙人，该公司致力于帮助杰出的企业家创建世界级的高科技企业，在加入Accel之前，Adrian拥有20年技术人员工作经验，如担任Pivota,VMware,SpringSource的CTO。如果你对科技企业感兴趣，可以和他联系
每周优质推图-20160728 图图是秋阳
今天分享荷兰摄影师AdrianSommeling的创意摄影作品,。一个26岁才华横溢的摄影师，将自己的儿子当做模特，拍摄了一组关于童年的趣味照片。他说：“儿子是我最大的灵感来源，当我看见他，就仿佛看见了自己的童年，我想通过照片讲故事，”这些照片充分利用了Photoshop和绘画技术，在他的个人主页上，Adrian将照片的拍摄和制作过程也录制成视频，供人分享学习。用照片给我们讲故事,他很喜欢儿童摄影
Sublime Text 3 配置java程序运行环境（可输入） PIG_先生开发技巧
@Adrian1、首先得配置好java环境2、SublimeText3—>Preference—>BrowsePackages，打开User文件夹，新建记事本，复制下面代码并保存命名为java.sublime-build{"cmd":["javac","-encoding","UTF-8","-d",".","$file"],"file_regex":"^(...*?):([0-9]*):?([0
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul