在路上的工程师

使用Keras-yolov3来识别滑动验证码

深度学习目标检测破解滑动验证码

前言

本文主要参考以下文章：

利用深度学习识别滑动验证码缺口位置

利用深度学习 PyTorch 识别滑动验证码缺口

这两篇文章都是同一位大佬所写，第一篇是利用华为云的一个深度学习平台做的(无需做任何编码工作)，第二篇是通过PyTorch来做的，要自己代码实现。我这里主要参考第二篇文章，也直接在这里把作者使用到github项目列出来：

标注工具labelImg

PyTorch-YOLOv3

作者自己的破解项目

因为我在次之前接触过一点Keras，还没有接触过PyTorch，所以倾向于利用Keras来解决此问题，于是我就查找了keras-yolov3的相关资料，主要参考这两篇博客：

Keras-yolov3如何训练自己的数据集

keras-yolov3训练及测试详解

上面那篇博客过于具体过程讲的比较详细，一般按照教程来就可以，下面那篇是我遇到一些问题时找到的，关于这个项目的解析比较详细，可以帮助我们理解这个项目。

这篇博客主要使用这个github项目：

keras-yolov3

正文

`labelImg`

是github上的一个开源的图片标注工具，比较适用于目标检测任务的标注，具体使用方法github上写的比较清楚，主要就是安装一个PyQt5应该就可以用了，运行后有一个图像化界面，可以选择图片使用矩形框进行标注，类似这样：

如果你需要标记的对象有很多种类，可以先在 data/predefined_classes.txt中输入所有的分类，后面在图形界面中标注时直接选择相应的class；因为这里只是为了找出验证码中的小滑块，属于同一类，这里起名为target；先设置好xml文件保存的路径，然后打开验证码图片的文件夹，一张张标注即可。

每标记完成一张图片记得保存，保存后会生成xml文件，文件内容如下：

<annotation>
	<folder>JPEGImagesfolder>
	<filename>0.41614717298921.jpgfilename>
	<path>D:\python_project\yidun\keras-yolo3\VOCdevkit\VOC2007\JPEGImages\0.41614717298921.jpgpath>
	<source>
		<database>Unknowndatabase>
	source>
	<size>
		<width>320width>
		<height>160height>
		<depth>3depth>
	size>
	<segmented>0segmented>
	<object>
		<name>targetname>
		<pose>Unspecifiedpose>
		<truncated>0truncated>
		<difficult>0difficult>
		<bndbox>
			<xmin>190xmin>
			<ymin>21ymin>
			<xmax>230xmax>
			<ymax>63ymax>
		bndbox>
	object>
annotation>

object里面的name是这张图片的分类名称（这里都是target），(xmin, ymin)和(xmax, ymax)是两组坐标，表示你标记的矩形的左上角和右下角。

此外还可以保存成yolo3要求的数据格式：

点击左上角的file->PascalVOC,之后会显示为YOLO；YOLO数据格式，会直接把每张图片标注的标签信息保存到一个txt文件中:

0 0.521000 0.235075 0.362000 0.450249
0 0.213000 0.645522 0.418000 0.519900
0 0.794000 0.665423 0.376000 0.470149

txt中信息说明：

每一行代表标注的一个目标
第一个数代表标注目标的标签，第一目标circle_red，对应数字就是0
后面的四个数代表标注框的中心坐标和标注框的相对宽和高（进行了归一化)

同时会生成一个Annotation/classes.txt实际类别文件classes.txt

关于`yolov3`

yolo3 论文

yolo v1深入理解

yolo v2深入理解

yolo v3深入理解

`Pytorch-yolov3`

`Pytorch`安装

因为本次实践过程一开始准备使用pytorch,在安装的时候遇到点问题，这里记录下。曾尝试使用pip install torch安装，但会报ModuleNotFoundError:no module named 'tools.nnwrap'的错误，这种情况可以打开Pytorch官网,选择你的电脑系统、安装方式、编程语言、显卡版本等会提示你使用相应的安装命令，如图：

把下面的那串命令复制到终端执行就可以了，但是我使用这种方式也有个问题，下载超时；然后我直接打开了那个下载地址,选择了相应的版本直接在浏览器中进行下载，虽然下载速度较慢，但是勉强可以下载。

之后把cd到下载的.whl文件目录，然后执行pip install filename即可。比如我这里是：pip install torch-1.6.0+cpu-cp36-cp36m-win_amd64.whl

因为后来我专注于使用keras实现，所以pytorch的内容暂时没了。

`Keras-yolo3`

下载使用

keras-yolo3的GitHub地址我上面已经给出了，直接将项目拉到本地即可：

git clone https://github.com/qqwweee/keras-yolo3

之后需要下载权重文件yolov3.weights,下载完成后放到keras-yolo3文件夹下;

因为原生的yolov3使用darknet作为主干网络，需要将其配置文件转化为keras适用的h5格式文件：

python convert.py yolov3.cfg yolov3.weights model_data/yolo.h5

执行完以上命令，会在model_data下生成yolo.h5的文件。

这里有一篇关于yolov3.cfg参数说明及调参经验的文章,是我在查询我的模型检测不到目标时可能存在的问题时看到的，当时我在纠结下面这个参数说明：

# Testing(此处下面的两行，测试的时候开启即可)
#batch=1                 # 每batch个样本更新一次参数。
#subdivisions=1          # 如果内存不够大，将batch分割为subdivisions个子batch，每个子batch的大小为batch/subdivisions。

# Training(此处下面的两行，训练的时候开启即可)
batch=64                 # 表示网络积累多少个样本后进行一次正向传播
subdivisions=16          # 将一个batch的图片分sub次完成网络的正向传播

到底需不需要设置batch和subdivisions，这篇文章里讲到keras实际并没有使用这个配置。

这里再额外解释一下，这部操作的具体含义，查看yolo.py可以看到有这样一行配置"model_path": 'model_data/yolo.h5',其实这里生成的yolo.h5文件，本身就是一个训练好的模型，可以直接用来对你的图片进行检测，如果你要检测的目标恰好已经被这个模型包含了，那你就无需再训练了。

因为我这里训练的滑块缺口，模型肯定是不包含的，所以需要自己从头训练，然后按照很多博客中写的，要去修改yolov3.cfg中的三处地方(文章下面有写)，这样就产生了以下几个问题：

1、修改完之后并没有告诉我们需要重新生成h5文件,那有啥用呢？参考原始的train.py代码，有一个加载预训练模型的操作，预训练模型名称为yolo_weights.h5,所以如果需要使用预训练模型，这里要重新生成h5文件：

python convert.py -w yolov3.cfg yolov3.weights model_data/yolo_weights.h5

否则直接运行train.py会报错的；或者你可以选择不加载预训练模型，将create_model方法的参数load_pretrained修改为False即可（这时候就根本无需修改yolov3.cfg文件，我尝试过直接删除该文件都可以正常训练，因为根本没有去使用该文件）

2、博客中要求我们使用文章中给出的train.py去训练，实际上就是对原始的train.py做了修改，设置不加载预训练模型，那为何前面要让我们去改yolov3.cfg文件呢，我感觉这两个操作很矛盾。

准备数据集

新建文件夹
1. 新建一个文件夹VOCdevkit；
2. 在VOCdevkit下新建文件夹VOC2007；
3. 在VOC2007下，建立如下文件夹
Annotations、ImageSets、JPEGImages、SegmentationClass、SegmentationObject

（后面两个与分割有关暂时没用）

其中Annotations存放图片xml文件(包括标注的坐标和类别)

JPEGImages存放图片(训练所需的图片)

而ImageSets下面又有文件夹

Layout、Main、Segmentation

ImageSets->Main目录下，存放train.txt、val.txt、test.txt、trainval.txt（txt文件中只存放图片的名字，不包括后缀名）
标注数据

使用上面提到的labelImg工具，将图片全部放到JPEGImages文件夹，将生成的xml文件放到Annotations（labelImg工具可以直接设置保存的文件夹）

划分数据集

标注好数据之后，需要划分数据集，生成ImageSets/Main目录下的txt文件，

在VOC2007目录下运行以下代码：

import os
import random
 
trainval_percent = 0.2
train_percent = 0.8
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)
 
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
 
ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')
 
for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)
 
ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

运行完成后，会在ImageSets->Main目录下生成这四个文件train.txt、val.txt、test.txt、trainval.txt。

转换数据格式

生成的数据集不能供yolov3直接使用。需要运行voc_annotation.py

需要修改voc_annotation.py

sets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test')]

classes = ["target"]

运行代码：python voc_annotation.py

在keras-yolo3文件夹下得到3个文件:

2007_test.txt, 2007_train.txt, 2007_val.txt

txt文件中包含图片完整的路径信息、坐标信息和类别信息

包括前面的数据集划分，这里的转化，一直都是划分了三个数据集，但是在后面的训练代码中，实际上是对训练集划分为按照9:1划分训练集和验证集，所以感觉这里分的验证集没有什么用

参数/代码修改

1、修改参数文件yolov3.cfg

打开yolov3.cfg,搜索yolo(共3次），按如下提示修改

filters：3*（5+len（classes））（yolo层上一层的filters）

classes: 你要训练的类别数

random：原来是1，显存小的话改为0，显存大的话不用改

！！！注意：filter要设置为具体的数字，我第一次居然就写的3（5+len(classes)）, 导致训练完的模型检测不到目标*

因为我这里只有目标target一类，所以classes=1,filter=18,因为我是用CPU训练的，所以设置的random=0

2、修改model_data下的voc_classes.txt为自己训练的类别：

将voc_classes.txt修改为自己训练的类别，一行一个类别名称。

3、修改train.py的代码

这里我在修改一些参数后运行时，会报错，所以直接用了博客中给出的代码：

"""
Retrain the YOLO model for your own dataset.
"""
import numpy as np
import keras.backend as K
from keras.layers import Input, Lambda
from keras.models import Model
from keras.callbacks import TensorBoard, ModelCheckpoint, EarlyStopping
 
from yolo3.model import preprocess_true_boxes, yolo_body, tiny_yolo_body, yolo_loss
from yolo3.utils import get_random_data
 
 
def _main():
    annotation_path = '2007_train.txt'
    log_dir = 'logs/000/'
    classes_path = 'model_data/voc_classes.txt'
    anchors_path = 'model_data/yolo_anchors.txt'
    class_names = get_classes(classes_path)
    anchors = get_anchors(anchors_path)
    input_shape = (416,416) # multiple of 32, hw
    model = create_model(input_shape, anchors, len(class_names) )
    train(model, annotation_path, input_shape, anchors, len(class_names), log_dir=log_dir)
 
def train(model, annotation_path, input_shape, anchors, num_classes, log_dir='logs/'):
    model.compile(optimizer='adam', loss={
        'yolo_loss': lambda y_true, y_pred: y_pred})
    logging = TensorBoard(log_dir=log_dir)
    checkpoint = ModelCheckpoint(log_dir + "ep{epoch:03d}-loss{loss:.3f}-val_loss{val_loss:.3f}.h5",
        monitor='val_loss', save_weights_only=True, save_best_only=True, period=1)
    batch_size = 10
    val_split = 0.1
    with open(annotation_path) as f:
        lines = f.readlines()
    np.random.shuffle(lines)
    num_val = int(len(lines)*val_split)
    num_train = len(lines) - num_val
    print('Train on {} samples, val on {} samples, with batch size {}.'.format(num_train, num_val, batch_size))
 
    model.fit_generator(data_generator_wrap(lines[:num_train], batch_size, input_shape, anchors, num_classes),
            steps_per_epoch=max(1, num_train//batch_size),
            validation_data=data_generator_wrap(lines[num_train:], batch_size, input_shape, anchors, num_classes),
            validation_steps=max(1, num_val//batch_size),
            epochs=500,
            initial_epoch=0)
    model.save_weights(log_dir + 'trained_weights.h5')
 
def get_classes(classes_path):
    with open(classes_path) as f:
        class_names = f.readlines()
    class_names = [c.strip() for c in class_names]
    return class_names
 
def get_anchors(anchors_path):
    with open(anchors_path) as f:
        anchors = f.readline()
    anchors = [float(x) for x in anchors.split(',')]
    return np.array(anchors).reshape(-1, 2)
 
def create_model(input_shape, anchors, num_classes, load_pretrained=False, freeze_body=False,
            weights_path='model_data/yolo_weights.h5'):
    K.clear_session() # get a new session
    image_input = Input(shape=(None, None, 3))
    h, w = input_shape
    num_anchors = len(anchors)
    y_true = [Input(shape=(h//{0:32, 1:16, 2:8}[l], w//{0:32, 1:16, 2:8}[l], \
        num_anchors//3, num_classes+5)) for l in range(3)]
 
    model_body = yolo_body(image_input, num_anchors//3, num_classes)
    print('Create YOLOv3 model with {} anchors and {} classes.'.format(num_anchors, num_classes))
 
    if load_pretrained:
        model_body.load_weights(weights_path, by_name=True, skip_mismatch=True)
        print('Load weights {}.'.format(weights_path))
        if freeze_body:
            # Do not freeze 3 output layers.
            num = len(model_body.layers)-7
            for i in range(num): model_body.layers[i].trainable = False
            print('Freeze the first {} layers of total {} layers.'.format(num, len(model_body.layers)))
 
    model_loss = Lambda(yolo_loss, output_shape=(1,), name='yolo_loss',
        arguments={'anchors': anchors, 'num_classes': num_classes, 'ignore_thresh': 0.5})(
        [*model_body.output, *y_true])
    model = Model([model_body.input, *y_true], model_loss)
    return model
def data_generator(annotation_lines, batch_size, input_shape, anchors, num_classes):
    n = len(annotation_lines)
    np.random.shuffle(annotation_lines)
    i = 0
    while True:
        image_data = []
        box_data = []
        for b in range(batch_size):
            i %= n
            image, box = get_random_data(annotation_lines[i], input_shape, random=True)
            image_data.append(image)
            box_data.append(box)
            i += 1
        image_data = np.array(image_data)
        box_data = np.array(box_data)
        y_true = preprocess_true_boxes(box_data, input_shape, anchors, num_classes)
        yield [image_data, *y_true], np.zeros(batch_size)
 
def data_generator_wrap(annotation_lines, batch_size, input_shape, anchors, num_classes):
    n = len(annotation_lines)
    if n==0 or batch_size<=0: return None
    return data_generator(annotation_lines, batch_size, input_shape, anchors, num_classes)
 
if __name__ == '__main__':
    _main()

4、修改yolo.py:

class YOLO(object):
    _defaults = {
        "model_path": 'logs/000/trained_weights.h5',
        "anchors_path": 'model_data/yolo_anchors.txt',
        "classes_path": 'model_data/voc_classes.txt',
        "score" : 0.3,
        "iou" : 0.45,
        "model_image_size" : (416, 416),
        "gpu_num" : 1,
    }

其实这里的修改可以等到训练完成后，测试的时候再调整

开始训练

python train.py

代码中epochs=500,batch_size=10可根据情况自行修改，因为这个验证码的目标检测问题比较简单，类别也只有1类，我尝试100轮后loss降到15，但是效果并不明显，batch_size一般也根据显存大小来设置，显存小的话batch_size就设置小一些（模型效果不好时，说不定也会和batch_size有关系，可以调小一些试试，因为太大表示计算机一次性读取的图片过多，可能会处理不过来），当然batch_size设置的越大收敛的会越快；另外按照很多博客写的一般loss降到10左右即可使用。

PS:运行train时，遇到了一个错误：AttributeError: module 'keras.backend' has no attribute 'control_flow_ops',参考这篇博客可以解决：https://blog.csdn.net/weixin_44697140/article/details/105891364

测试

运行python yolo_video.py --image

等这条命令运行完，再输入图片的路径进行预测。

关于yolo_video.py的使用可以看github上面的项目描述。

研究下代码应该可以发现，核心检测方法是yolo.py中的detect_image，yolo_video.py这边实际上是一个外层调用，首先通过命令行传入一些参数，包括图片地址，然后打开图片，传入detect_image,然后对返回的图片进行展示。

不过yolo.py中的_defaults的配置需要注意下，可能会需要你来进行一定的调整：

class YOLO(object):
    _defaults = {
        "model_path": 'logs/000/trained_weights.h5',
        "anchors_path": 'model_data/yolo_anchors.txt',
        "classes_path": 'model_data/voc_classes.txt',
        "score" : 0.3,
        "iou" : 0.45,
        "model_image_size" : (416, 416),
        "gpu_num" : 1,
    }

这里model_path(测试的模型权重路径)、anchors_path(模型anchors数据路径)、classes_path(数据集种类路径)我们训练前已经调整过，这里不需要再做调整。

score代表一个阈值，只有置信度高于此值的目标才会被框出来，iou交并比（Intersection-over-Union，IoU），是产生的候选框（candidate bound）与原标记框（ground truth bound）的交叠率，即它们的交集与并集的比值（可以看看上面我给出的介绍YOLO的文章，里面有提到这一概念）。当检测到Box比较多时，可以适当的调大这两个值，以搜寻最匹配的结果；当无法检测到Box时，可以适当减少这两个值，有的博客中有提到将这两个值设置到0.0几来解决检测不到Box的问题，实际上这种方式并不可取，调到这么低才出现的box置信度很低，也就表示结果其实并不准确，也就是治标不治本，本质还是要去提升模型的准确率。

调参

按照以上操作开始训练之后，可能并不一定就能直接获得理想的模型，之后我们需要来调整一些参数来尝试使模型更优。

先记录下我这边的训练情况：

一开始是在windows机器上运行，但是没有显卡，具体环境如下：

windows+CPU(12G内存)+keras(2.3.1)+tersonflow(1.15.0)

训练图片共244张，其中220用于训练，24用于验证。

跑100轮用了12个小时左右吧，但是识别的时候识别率很低，因为只有少数的图片可以检测到目标，大部分都检测不到，所以明显是模型有问题，但是我多次核查我的所有改动和上面的博客中提到的是否一致，基本确定没有什么错误，此外也查询了许多资料，但是没有得到很有效的解决措施。但是基于一些杂七杂八的信息，得知不同的环境对结果也会有所不同，如有无GPU,tersonflow版本等。于是我换了一个有GPU的环境，打算尝试下，环境如下：

ubuntu+GPU(GeForce GTX 1050 Ti/4G显存)+keras(2.2.4)+tersonflow-gpu(1.13.0)

之后我对input_shape做了调整，不再使用原始的416*416，因为要求长宽都是16的倍数即可，而我的图片长宽正好为320*160，那为啥不直接就用原始尺寸呢，说不定可以得到更精确的结果。因为显存只有4G，继续保持batch_size=8,将epochs扩大了一倍调整为200（本来想的是有显卡训练会很快，但实际发现训练依然很慢，只比CPU版本有一丢丢的提升，平均一轮165秒，200轮也需要9个多小时）

本次训练结束后测试效果依然不理想，真是让人头大，应该所有操作完全按照这两篇博客讲的来进行的，或许是博客中有些步骤并不对或者遗漏了某些操作，经过查资料对keras yolov3的进一步了解，我提出了一些疑问（具体看下载使用这部分内容），所以接下来我进行了一系列的尝试，为了加以区分，加上小标题：

第一次

重新生成编辑yolov3.cfg然后重新生成h5文件，然后使用原始的train.py(加载预训练模型)

1、首先将yolov3.cfg的batch改为64，subdivisions改为16，width=320，height=160，如果keras真的未使用该配置，那做了修改也不会有什么影响，万一使用了，那也就保证了参数正确；然后将random改为1，因为我下面还是在有4G显存的机器上训练，所以可以尝试下改为1；filters和classes肯定还是要改的，不过之前已经改过了；

2、重新生成h5文件:python convert.py -w yolov3.cfg yolov3.weights model_data/yolo_weights.h5(坑也太多了，之前转换没问题，现在转换又开始报编码错误了，原因在cfg文件中加了中文注释，大家注意下……)

3、重新调整train.py,首先换为原始train.py文件，修改：

annotation_path = '2007_train.txt'

input_shape = (320,160)

batch_size = 16(有两处，因为之前设置batch_size=8训练好像没啥压力，所以这次调大点)

开始训练后，额，速度好像倒是挺快，val_loss=nan！！！，貌似哪里不太对，我怀疑因为使用的是预训练模型，但是又擅自改变了input_shape导致的，所以先把input_shape改为(416, 416)，包括cfg文件里的width和height，然后重新生成h5文件，然后再次训练，好像依然不行……难道这里面是不能使用预训练模型的？

这里转念一想，前50轮好像是“预热”，开始训练时有这样的提示：

Load weights model_data/yolo_weights.h5.
Freeze the first 249 layers of total 252 layers

所以大胆猜想了一下，因为只调整了最后两层(这也是为什么训练的这么快)，实际模型可能与我需要的相差甚远，等过了50轮之后再看看，果然50轮之后有了val_loss，但是在训练到100多轮之后，学习率变得极低

Epoch 00104: ReduceLROnPlateau reducing learning rate to 9.999999717180686e-11.
Epoch 105/300
13/13 [==============================] - 152s 12s/step - loss: 88.1543 - val_loss: 88.0351
Epoch 00105: early stopping

损失也降不下去了，导致整个训练提前结束了。没办法拿模型测试了一下，主观上感觉好像比以前稍微强点，对差不多半数的图片都能识别出box，虽然不准确，大小也不对，但是基本是定位在目标范围内。本来想的是看看怎么去优化模型，但是网上几乎查不到什么有用的资料，暂时不知道该怎么去优化。

第二次

考虑到针对keras的相关文章都没有提到对cfg文件除filter,classes、random的修改，所以我打算对自己做的多余的修改进行复原，然后重新生成h5文件，然后使用预训练模型,并把shape也还原为(416, 416)，开始训练发现此次的初始loss相比第一次大很多，并且速度也慢了很多，虽然不确定会有提升，但是这说明做的修改还是会产生影响的？

开始训练后，在初始的50轮预热之后，报错导致训练终止：

Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info

上网查了是由于显存不够，所以调整batch_size=8继续训练。

第51轮，自动Killed……难道还是因为显存不够？

第三次

在第二次调整后训练的过程中，仔细思考了下如何针对第一次的模型进行优化（因为其实对第二次根本不报啥希望），然后想到anchors（锚点），在yolov3中也叫先验框，这个是作者根据VOC数据集利用kmeans聚类得到的一些先验框大小,原始的共有9类：10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326，考虑到我的目标只有一类（滑块缺口），并且大小基本相同，或许应该根据自己的数据集来生成适用的先验框，正好项目中的kmeans.py就具备这样的功能，kmeans.py可以根据你自己的xml数据生成新的anchors(锚点)，只需要更改filename和cluster_number即可：

if __name__ == "__main__":
    cluster_number = 3
    filename = "2007_train.txt"
    kmeans = YOLO_Kmeans(cluster_number, filename)
    kmeans.txt2clusters()

这里我改成只生成3种大小的先验框，完全没必要生成9种，其实我感觉一种也可以，但是发现不同图片的滑块大小确实会不太一样，所以觉得生成3种大小相比一种或许能够有所提高。

生成的anchors如下(这个每次运行结果可能都不太一样)：

K anchors:
 [[39 40]
 [39 38]
 [40 42]]
Accuracy: 95.86%

然后要做的事情：

1、首先跟第一次的所有调整保持一致；

2、cfg文件的anchors改成这三组数值，一共有三处要改，然后重新生成h5文件；

3、修改model_data/yolo_anchors.txt文件内容为这三组数值；

4、train.py 修改input_shape(320, 160),batch_size=16

运行报错

File "/home/qxb/liutengfei/keras-yolo3/yolo3/model.py", line 376, in yolo_loss
anchors[anchor_mask[l]], num_classes, input_shape,calc_loss=True)
IndexError: index 3 is out of bounds for axis 0 with size 3

看了下是因为对anchors进行了修改，但是没有改model.py，也就是模型和配置不匹配，上网查了资料，看到了这篇文章基于keras的YOLOV3改变锚框数量代码操作,特别契合我的需求。

我们这里是将原有的9个anchors（每个尺度3个anchors）改为3个anchors(每个尺度1个anchors)，要进行以下操作：

1、对于cfg文件,不仅要修改anchors，同时要调整num=3（原先为9）,mask分别改为2， 1， 0；random和classes根据自身情况而定。改完后，每个[yolo]上面几行的filters改为x*（5+classes）其中X就是预设的anchor数量，此处我们预设的是1(之前是3，还记得上面是让改的是3*(5+classes))，并且只有一类，所以总共是6；改完记得重新生成h5文件。

2、修改model.py文件
num_layers要保证为3，所以在这个文件内出现的num_layer下面的//3，都给去掉;另外anchor_mask改为如下：

anchor_mask = [[2], [1], [0]] if num_layers==3 else [[3,4,5], [1,2,3]]

此次训练依然提前终止，因为学习率在第120轮左右变得极低，不过此次损失值降到了21左右，相比之前的80多也算有了极大的进步，不过测试结果并不理想，测了几个大概都是这样：

对着测试结果思考了一会，感觉哪里不太对劲，前面还在设置先验框来着，我先验框的大小已经明确给出了，你的检测Box给我一个长方形的是什么鬼，明显不是模型的问题，肯定哪里配置错了，上网一查，果然查到了类似的问题：

问题描述：预测框的中心位置正常，但是预测的框的width和height不正常。

解决方法：使得训练的配置cfg和测试中cfg的输入width, height, anchorbox保持一致！

虽然这里给出的cfg配置文件我的肯定没有问题，并且测试是不需要cfg文件的，但是根据同样的道理，也就是说训练和测试的大小不一致可能会导致这个问题，然后我真的在训练代码中发现了问题：

input_shape = (320, 160) # multiple of 32, hw

这里给出了注释，这是高x宽，我写的320*160实际上宽x高，虽然这里写错了应该会对模型的精度造成一定的影响，只要我检测的时候也这样来配置应该可以正常检测，由于我一开始测试的yolo.py中model_image_size=(320, 160),那我换成(160, 320)或许可以，一试果然可以：

难道说测试代码中的model_image_size实际是宽x高？测了一些图片，感觉准确率其实还可以（准确率在百分之六七十吧，至少比前几次有了质的飞跃），但是我觉得按照正确的shape重新训练一个模型，准确率应该更高，于是改了train.py再次训练。

本次训练同样是提前结束，不过这次损失只降到24，还没有上次降得低，测试了一下，准确率跟上面的差不多，不过测试的话model_image_size还是要设置为(160, 320)才比较准确，所以并不是宽x高？也是高x宽？具体这里也搞不清楚到底什么原因，但是好像只要按照高x宽并且和真实测试图片保持一致就可以，而不用管训练中如何设置的。

因为我之前一共标了305张图片，经过上面的划分，实际训练和验证只使用了244张，我批量测试了一下剩余的61张，差不多有44张算是比较准确的定位了（这个准确我是按照左边界是否准确来判定的，因为左边界不准确后面滑动的距离肯定也会算错，那就无法通过验证）类似这样：

准确率在70%以上，不过感觉还是有点低，因为损失毕竟也没有降到10左右，所以我打算把这61张也放进训练集进行训练，反正后面测试还可以随便再下一些验证码图片。

加上之后训练结果依然是70%左右，虽然损失下降到了20，但是准确率没有实质性的提升；之后我就没有再去尝试提升准确率了，其实还可以不使用预训练模型来尝试训练一下，后面如果做了相关尝试有比较好的效果再来更新……

批量测试以及实际应用

yolo_video中写了一大堆的命令行参数，对于不了解这块的来说反而容易懵，实际上就是去调用yolo中的detect_image,所以我们完全可以自己编写一个脚本，一个循环读取你要测试的图片，使用PIL的Image加载，然后传入detect_image,原始的detect_image方法返回给我们检测后的图片（会把检测的目标图片标注到图片上），所以我们直接保存到一个文件夹中，后面去挨个看一遍就知道大概的效果了。

当然我们在实际应用中，一般需要用到检测到的目标的坐标，这时候我们修改一下detect_image的内部逻辑，把坐标返回出来就OK了。

不过这里要注意一个int32的问题，yolo中是把相关坐标值转换成了int32类型，这里我比较疑惑，难道检测到的目标位置不会是小数吗？另外，因为转换成了int32类型，导致我后面使用的时候出错(json.dumps int32型的数据会报错)，后来发现这个问题后就把yolo中相关的astype('int32')去掉了。

我的gtihub博客地址：https://forchenxi.github.io/

另外，如果对投资理财感兴趣的同学，可以关注我的微信公众号：运气与实力。

你可能感兴趣的:(深度学习,keras,python,深度学习,目标检测,滑动验证码)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
209. 长度最小的子数组（滑动窗口）追光者2020 leetcode 双指针/滑动窗口
题目描述给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其和≥target的长度最小的连续子数组[numsl,numsl+1,…,numsr-1,numsr]，并返回其长度。如果不存在符合条件的子数组，返回0。示例1：输入：target=7,nums=[2,3,1,2,4,3]输出：2解释：子数组[4,3]是该条件下的长度最小的子数组。示例2：输入：target=4,nums
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
209. 长度最小的子数组（中等数组滑动窗口）风雨中de宁静 leetcode 算法排序算法
209.长度最小的子数组给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其和≥target的长度最小的连续子数组[numsl,numsl+1,…,numsr-1,numsr]，并返回其长度。如果不存在符合条件的子数组，返回0。示例1：输入：target=7,nums=[2,3,1,2,4,3]输出：2解释：子数组[4,3]是该条件下的长度最小的子数组。示例2：输入：targe
209. 长度最小的子数组（滑动窗口法）清榎 leetcode刷题 c++leetcode 算法
209.长度最小的子数组题目描述：给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其和≥target的长度最小的连续子数组[numsl,numsl+1,...,numsr-1,numsr]，并返回其长度。如果不存在符合条件的子数组，返回0。解答：法一：直接使用暴力法。两重循环，对每一个元素向后进行寻找，若找到一个子数组≥target，比较其长度和result的大小，如果其长度
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少