涛声依旧叭

深度学习之卷积神经网络识别图片验证码实战案例（十）

案例背景：程序自动化的爬虫而无需人工介入是我们的最终目标。自动化爬虫避免不了自动登录的问题，在爬取XX数据的过程中，遇到登录图形验证码的识别的问题，那我们该如何攻破这种验证码呢？

字符验证码图片如下：

在这个案例中，我会通过案例一步一步攻破这种验证码。

现有能力调研

pytesseract 是一款开源的免费的OCR识别工具，它能识别一些很基础、很简单的验证码，但是面对稍微复杂一点的验证码识别准确率就很低了。
超级鹰等云打码平台，能够识别复杂的验证码，识别准确率较好，但是其是收费的，费用标准大约几百每年。在平台上注册后会送一些免费的使用次数，大家感兴趣的可以尝试一下。

靠人不如靠己！不就是个简单的验证码识别吗？弄他！

验证码分析

我们先分析一下，我们这个验证码相较于市面上常见的验证码，有何区别？

这个验证码主要有2个问题影响识别：

干扰元素较多
字符倾斜，严重的字符展示不全。

如何让机器像人一样准确地识别出图片上的验证码字符呢？下面我们一起用机器学习搞定这个实战案例！开始之前，我们再来回顾一下六步法实战！

1、数据收集

首先，我们要搞定训练数据收集的问题，也就是收集一些验证码图片的数据。数据从何而来呢？在六步法实战中，我们介绍了获取数据的几种常用手段。显然，这个数据集需要我们自己去手动搞定他了！怎么搞？答案就是爬虫！

爬虫分析实现

XX平台获取验证码的接口是动态的，也就是同样的请求会随机返回一张二维码。接口的URL是：http://xxxxx
获取的图片的数据后，我们将数据保存下来。
重复1、2步骤…

20行代码实现爬取图片数据

import requests
import time

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                         "Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81"}

url = "https://xxxxx"


def get_captcha():
    """
    获取验证码并存储
    :return: 
    """
    for i in range(0, 10000):
        time.sleep(2)
        print("sleeping...")
        resp = requests.get(url, headers=headers)
        with open(f"../picture/{i}.png", 'wb') as file:
            file.write(resp.content)


def main():
    get_captcha()


if __name__ == '__main__':
    main()

这里我们通过 resp = requests.get(url, headers=headers) 请求验证码图片并返回数据，然后通过 file.write(resp.content) 保存图片数据。

这里爬了很多个小时，终于把数据准备好了！（不敢爬的太快！爬虫爬得快，监狱进的早）爬完之后的数据长这样子。

2、数据预处理

数据准备好之后，重头戏才刚刚开始。

在数据处理之前，我们先明确一个问题，验证码识别应该属于什么类型的机器学习项目？其实这是一个分类的项目，并且属于监督学习。以机器的视角来看，验证码识别，其实就是对验证码图片上的字符进行分类成A、B、C、7、8、9等等，所以这是监督学习中的分类问题，那为什么是监督学习呢？请你思考一下。

在数据的预处理阶段，我们要做哪些工作？再回顾一下数据预处理的经典5步：

数据可视化阶段在这个案例中可以省略了！

数据清洗对于验证码图片数据而言，叫图片清洗分类更为贴切，其中包括图片的灰度、降噪、裁剪、分类等工作。

2.1、让图片更干净些

我们先看一下效果，如下是经过了验证码背景图清洗前和清洗后的对比：

这里主要使用OpenCV库对图片进行灰度、降噪、二值化，这些都是图片预处理的常用手段。这里我们简单的介绍一下。

OpenCV是一个开源的计算机视觉库。它提供了一系列图像处理和计算机视觉算法，包括图像滤波、目标检测、人脸识别等。

灰度图像

在一张彩色图片中，每个像素点由三个RGB颜色通道（红、绿、蓝）组成，每个通道的颜色值可以是0到255之间的任何值。灰度图像是一种单通道图像，每个像素只有一个灰度值。灰度图像可以看作是将彩色图像的三个颜色通道（红、绿、蓝）合并为一个通道得到的结果，也可以通过将三个通道的值加权平均得到。

在机器学习领域，通常将彩色图像转换为灰度图像进行处理，因为与RGB图像相比，灰度图像具有更简单的结构和更低的计算复杂度。在OpenCV中使用 cv2.cvtColor(img, cv2.COLOR_RGB2GRAY) 方法将RGB三通道图像转换为灰度图像。

降噪

降噪就是用于减少图像中的噪声。图像噪声是由于图像获取和传输过程中的信号干扰、电磁辐射等原因导致的随机扰动。这些噪声会影响图像质量和后续处理结果，因此需要使用降噪技术来减少噪声的影响。在OpenCV中，可以使用`cv2.GaussianBlur()函数实现高斯滤波，从而提高图像的质量和后续处理结果。

二值化

图片二值化是一种重要的图像预处理技术，可以用于去除噪声、提高对比度、简化图像信息、分离目标、降低数据量等目的。在实际应用中，需要根据具体情况选择合适的二值化方法和参数，以达到最佳的效果。在OpenCV中，可以使用 cv2.threshold()函数对图像进行二值化操作。

以下是降噪、灰度和二值化的完整代码，主要流程为：

OpenCV载入待处理图片：img = cv2.imread(image_path, 1)
将RGB三通道图像转为灰度图像 gray_img = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
使用高斯滤波降噪 cv2.GaussianBlur(gray_img, (5, 5), 0)
二值化图片 cv2.threshold(blur, 134, 255, 0, gray_img)
返回处理后的图片

完整代码如下：

def cv2_noise_remove(image_path, k):
    """
    8邻域降噪
    Args:
        image_path: 图片文件命名
        k: 判断阈值

    Returns:
    """

    def calculate_noise_count(img_obj, w, h):
        """
        计算邻域非白色的个数
        Args:
            img_obj: img obj
            w: width
            h: height
        Returns:
            count (int)
        """
        count = 0
        width, height = img_obj.shape
        for _w_ in [w - 1, w, w + 1]:
            for _h_ in [h - 1, h, h + 1]:
                if _w_ > width - 1:
                    continue
                if _h_ > height - 1:
                    continue
                if _w_ == w and _h_ == h:
                    continue
                if img_obj[_w_, _h_] < 230:  # 二值化的图片设置为255
                    count += 1
        return count

    img = cv2.imread(image_path, 1)
    # 灰度
    gray_img = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
    w, h = gray_img.shape
    for _w in range(w):
        for _h in range(h):
            if _w == 0 or _h == 0:
                gray_img[_w, _h] = 255
                continue
            # 计算邻域pixel值小于255的个数
            pixel = gray_img[_w, _h]
            if pixel == 255:
                continue

            if calculate_noise_count(gray_img, _w, _h) < k:
                gray_img[_w, _h] = 255

    # gray_img = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)

    # 先使用一个 5x5 的高斯核除去噪音，然后再使用 Otsu 二值化
    blur = cv2.GaussianBlur(gray_img, (5, 5), 0)
    # ret3, th3 = cv2.threshold(blur, 1, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
    # ret3, th3 = cv2.threshold(blur, 144, 255, 0, gray_img)
    ret3, th3 = cv2.threshold(blur, 134, 255, 0, gray_img)  # 更优秀
    # # 二值化处理
    # ret3, th3 = cv2.threshold(th3, 134, 255, 0, th3)  # 二值化函数

    return th3

2.2、裁剪图片

图片清理干净后，我们需要对图片进行裁剪。裁剪的目的是将图片按照字符进行切分，以便于后续的训练及识别。

切割的方法比较简单，这里我们将验证码图片等比例切分为4份。并保存切割后的图片。主要逻辑为：

等比例裁剪图片 image.copy()[box[1]:box[3], box[0]:box[2]] # 裁剪坐标为[y0:y1, x0:x1]
使用OpenCV保存图片 cv2.imwrite(temp_path, temp_image)

def cv2_split_image_and_save(img_path):
    """
    根据图片路径cv2处理图片并拆分
    :param img_path: 图片download路径
    :return: 拆分后图片路径
    """
    # '/Users/rongtao7/IdeaProjects/yaoCaptchaDiscern/temp/97090039-4859-4bb6-a47e-003654b36881.png'
    image = cv2_noise_remove(img_path, 4)
    save_path = []
    for i in range(ConfigUtil.IMG_CHAR_COUNT):
        box = cv2_img_crop_box(i)
        temp_image = image.copy()[box[1]:box[3], box[0]:box[2]]  # 裁剪坐标为[y0:y1, x0:x1]
        file_name = f"{img_path.split('/temp/')[1].split('.')[0]}{ConfigUtil.TEMP_IMG_NAME_SEPARATOR}{i}.png"
        # print(file_name)
        temp_path = f"{sys.path[0]}/temp/{file_name}.png"
        cv2.imwrite(temp_path, temp_image)
        save_path.append(temp_path)
    return save_path

2.3、图片分类

裁剪好的图片，我们需要将图片分类，相当于给图片打标签，告诉机器这张图片应该属于什么分类，也就是它是什么。那我们一共有哪些分类呢？

由数字和英文字母组成，一共32个分类类别，其中排除掉了 1和I 0和O的易错选项，因为他们容易混淆，人眼都容易弄错，用户的体验也不好。

那我们现在要做的工作就是将所有切割后的图片分类到这32个文件夹中！好家伙！这可是一个庞大的工程啊，看一下我是怎么做的？

。。。。。。省略人工标注过程

前期我做了大量的人工标注工作，简直怀疑人生

那有没有什么工具能帮帮我呢！这让我又想起了 pytesseract 这个开源的OCR识别库，前面我们提到过，针对整个验证码图片它的识别率是极低的，因为它只能处理简单的字符图片识别工作！但是我们的图片经过预处理和切割后，相对也好识别一些了，所以我就想到了让 pytesseract 帮我识别一部分，它识别不了的或者识别错误的，我们再手动标注一部分数据，这样我们图片手动标注的工作也是提效了约 50%

那有的同学就想到了！是不是图片切割好以后，用 pytesseract 识别字符，就可以完成验证码识别工作了？

当然可以！这个我也尝试过了，只不过识别的准确率较低，每个字符图片的准确率大概在 40%左右，但是4张图片结果加到一起后准确率相对就比较低了，一个免费开源的库你还要啥自行车啊！

使用 pytesseract辅助分类的代码如下，主要有2个步骤：（1）通过 ocr方法识别图片（2）通过 collect将图片移动到指定文件夹下

import os
import cv2
from PIL import Image, ImageFilter
import shutil

import pytesseract

"""
OCR图片分类
"""

split_list = os.listdir("./splits")
list_new = os.listdir("./captchas_new")


def ocr(img_path):
    """
    pytesseract ocr识别
    :param img_path: 图片路径
    :return: 识别结果
    """
    image = cv2.imread(img_path, 1)
    if image is None:
        return ""
    test_message = Image.fromarray(image)
    if test_message is None:
        return ""
    target = pytesseract.image_to_string(test_message, lang='eng',
                                         config='--psm 10 --oem 3 -c '
                                                'tessedit_char_whitelist=0123456789QWERTYUIOPLKJHGFDSAZXCVBNM')
    target = target.replace('\n', '').replace('\r', '')
    print(f"图片路径：{img_path},ocr识别结果为：{target}")
    return target


def collect(target, source):
    """
    收集图片
    :param target: 目标路径
    :param source: 源路径
    :return: 
    """
    target = "./captchas_new/" + target + "/"
    if str(target) in list_new:
        shutil.move(source, target)
        print(f"移动文件成功，源文件为:[{source}]")
    else:
        print(f"移动文件失败，{source}文件识别结果为[{target}]")


for path in split_list:
    print(path)
    new_path = "./splits/" + path
    source = ocr(new_path)
    collect(source, new_path)

至此，我们的数据清洗工作就完成了！

2.4、特征工程

在特征工程阶段，我们要对图片的数据特征进行变换。特征变换的手段对于数值特征和分类特征是不同的。

我们这里属于分类特征，那对标签我们使用独热编码进行变换。而图片数据，我们通过特征缩放变换来压缩特征的空间。

在这个环节，我们要将图片转换成机器可以识别的数据，然后就可以把数据集喂给模型了。这里我们将图片转换成 NumPy 数组也叫张量数组，对张量数组进行归一化缩放；将标签转换成One-Hot编码。

什么是张量数组

在深度学习中，模型的输入通常都是张量数组。通过使用张量数组，可以对大量的数据进行高效的处理和计算。

张量数组其实就是一个多维数组。他可以存储和处理大量的数据。例如，图像可以表示为三维数组，其中第一个维度表示图像的高度，第二个维度表示图像的宽度，第三个维度表示图像的颜色通道。文本数据可以表示为二维数组，其中第一个维度表示文本的序列长度，第二个维度表示每个单词的向量表示。

什么是One-Hot编码

One-hot编码是一种常见的数据编码方式，用于将离散的、分类的数据转换为机器学习算法能够使用的数值型数据。在One-hot编码中，每个离散的特征值（也称为类别、标签或因子）被编码为一个长度为特征数量的二进制向量，其中只有一个元素为1，其他元素均为0。这个1所在的位置就代表了该特征值所属的类别。

首先，我们通过OpenCV来读入图片的数据，并使用NumPy将图片转换成张量数组。

import numpy as np
import pandas as pd
import os
import cv2


list = ["2","3","4","5","6","7","8","9","A","B","C","D","E","F","G","H","J","K","L","M","N","P","Q","R","S","T","U","V","W","X","Y","Z"]

X = []
y_label = []
imgsize = [105, 96]

def training_data(label, data_dir):
    for img in os.listdir(data_dir):
        path = os.path.join(data_dir, img)  # 目录+文件名
        img = cv2.imread(path,cv2.IMREAD_COLOR) #读入图片
        img = cv2.resize(img,(imgsize[0],imgsize[1])) #设定图片像素维度
        X.append(np.array(img)) #X特征集
        y_label.append(str(label)) #y标签

for label in list:
    training_data(label, f'./captchas_new/{label}')

这段代码很简单，我们通过 for 循环调用 training_data() 方法，在这个方法中，通过 cv2.imread 读取os路径的图片数据，然后通过 cv2.resize(img,(imgsize[0],imgsize[1]))统一图片的像素维度。收集特征和标签分别到 X = [] 和 y_label = []集合中。

然后通过 NumPy将图片转换为张量数组

X = np.array(X) # 将X从列表转换为张量数组

现在我们要对张量数组再进行特征变换，由于我们的特征都是0~255之间的数值，所以这里选择特征缩放，即归一化缩放。

X = X/255 # 将X张量归一化

然后我们对标签进行编码及特征变换的处理。这里要使用 sklearn 库的LabelEncoder编码工具，然后通过 keras 库的 to_categorical 进行One-hot编码。

from sklearn.preprocessing import LabelEncoder # 导入标签编码工具
from keras.utils import to_categorical # 导入One-hot编码工具

label_encoder = LabelEncoder()
y = label_encoder.fit_transform(y_label) # 标签编码
y = to_categorical(y, 32) # 将标签转换为One-hot编码

好了，现在我们的特征集X和标签集 y 就构建完毕了，在特征工程阶段，我们对特征集X进行了归一化缩放，对标签集y进行了One-hot编码，做这些工作的目的就是为了能够把数据集喂给模型。

2.4、构建特征集和标签集

这里我们要借助 sklearn 库的 model_selection 模块的 train_test_split 拆分工具来拆分数据集。我们将特征集拆分为训练集 X_train 和测试集 X_test，将标签集拆分为训练集 y_train 和测试集 y_test。并且训练集和测试集的比例是8:2

from sklearn.model_selection import train_test_split # 导入拆分工具

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,random_state=1)

3、选择算法

图像的处理，使用深度学习的神经网络算法肯定是更胜一筹，它擅长对复杂特征的提取。

神经网络算法又分为CNN、RNN、DNN等，而卷积神经网络对图像等数据进行特征提取和分类则是比较有优势，所以这里我们选择卷积神经网络CNN算法。

举例：车牌识别

卷积神经网络？

卷积神经网络（CNN）是一种常用的神经网络模型，特别适用于图像、视频和语音等高维度数据的处理和分析。其主要原理是通过卷积操作和池化操作来提取数据的特征，并通过全连接层将这些特征映射到输出层进行分类或回归。

卷积神经网络结构：卷积神经网络由输入层、一个或多个卷积层和输出层的全连接层组成。

输入层：接收输入数据，并将其传递到下一层。什么输入数据？就是特征缩放后的数据。
卷积层：主要负责提取图片的特征。其中的卷积核（上图中红框部分）也叫滤波器，能够自动进行图像特征的提取。
最大池化层：就是将特征映射划分为若干个矩形区域，挑选每个区域中的最大值，也就是最明显的特征作为采样的结果。可以避免过拟合。
多个卷积层和池化层能够实现对图像特征的逐层提取。
展平层，主要负责将网络展平。展平之后通常会接一个普通的全连接层。而最右边的输出层也是全连接层，用 Softmax 进行激活分类输出层，Softmax 函数的主要作用是将神经网络输出的实数值转化为概率分布。

建立CNN算法模型

借助 keras库的layers和models工具我们建立CNN模型

from keras import layers # 导入所有层 
from keras import models # 导入所有模型 
import joblib

# 贯序模型 ，序贯模型也是最简单的模型，就是像盖楼一样，一层一层往上堆叠着搭新的层。
cnn = models.Sequential() 


# 激活函数接收神经元的输入信号，经过非线性变换后输出神经元的激活值。这个激活值通常被用于传递到下一层神经元或输出层中。激活函数可以增加模型的表达能力和拟合能力
cnn.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(96, 105, 3)))# 输入卷积层
cnn.add(layers.MaxPooling2D((2, 2))) # 最大池化层 

cnn.add(layers.Conv2D(64, (3, 3), activation='relu')) # 卷积层 
cnn.add(layers.MaxPooling2D((2, 2))) # 最大池化层 

cnn.add(layers.Conv2D(128, (3, 3), activation='relu')) # 卷积层 
cnn.add(layers.MaxPooling2D((2, 2))) # 最大池化层 

cnn.add(layers.Conv2D(128, (3, 3), activation='relu')) # 卷积层 
cnn.add(layers.MaxPooling2D((2, 2))) # 最大池化层 

cnn.add(layers.Flatten()) # 展平层 

cnn.add(layers.Dense(512, activation='relu')) # 全连接层 

# 32表示种类，激活函数使用Softmax
cnn.add(layers.Dense(32, activation='softmax')) # 分类输出层 


# 设置优化器
cnn.compile(loss='categorical_crossentropy', # 损失函数 
            optimizer='RMSprop',
            metrics=['acc']) # 评估指标

4、训练模型

通过fit 拟合模型，指定训练轮次，训练的同事进行验证

在训练过程中，我们还指定了 validation_split，它可以在训练的同时，自动把训练集部分拆出来，进行验证，在每一个训练轮次中，求出该轮次在训练集和验证集上面的损失和预测准确率。

# 训练网络并把训练过程信息存入history对象
history = cnn.fit(X_train,y_train, #训练数据
                  epochs=50, #训练轮次（梯度下降）
                  validation_split=0.2) #训练的同时进行验证

然后将训练的模型保存到 model.h5文件中

cnn.save(os.path.join(os.path.dirname("./result"), 'model.h5'))

Train on 2089 samples, validate on 523 samples
Epoch 1/50
2089/2089 [==============================] - 86s 41ms/step - loss: 1.3523 - acc: 0.3978 - val_loss: 1.0567 - val_acc: 0.5411
Epoch 2/50
2089/2089 [==============================] - 85s 41ms/step - loss: 1.0167 - acc: 0.5692 - val_loss: 1.0336 - val_acc: 0.5526
Epoch 3/50
2089/2089 [==============================] - 85s 41ms/step - loss: 0.8912 - acc: 0.6343 - val_loss: 0.9183 - val_acc: 0.6310
Epoch 4/50
2089/2089 [==============================] - 84s 40ms/step - loss: 0.8295 - acc: 0.6596 - val_loss: 0.9289 - val_acc: 0.6138
Epoch 5/50
2089/2089 [==============================] - 85s 41ms/step - loss: 0.7228 - acc: 0.7056 - val_loss: 1.0086 - val_acc: 0.5736
... ...

这个输出的信息包括了训练的轮次（梯度下降的次数）、每轮训练的时长、每轮训练过程中的平均损失，以及分类的准确度。这里的每一个轮次，其实就是神经网络对其中的每一个神经元自动调参、通过梯度下降进行最优化的过程。

5、评估和优化模型

优化器和学习速率

在卷积神经网络中，优化器和学习速率是两个常用的超参数，用于调节模型的训练过程和优化效果。

**优化器（Optimizer）**是指模型在训练过程中使用的优化算法，用于更新模型的权重和偏置参数，使得模型的损失函数最小化。前较常用的是 RMSprop 和 Adam

学习速率（Learning Rate）是指模型在每次参数更新时，更新的步长大小。学习速率通常是一个非常重要的超参数，它能够影响模型的训练速度和优化效果。如果学习速率过大，可能会导致模型参数在更新过程中产生过大的波动，使得模型无法收敛；而如果学习速率过小，可能会导致模型训练缓慢，需要更长时间才能收敛。

优化器是用于解决神经网络中的局部最低点的问题。

神经网络也是通过梯度下降来实现参数的最优化，梯度下降是通过求导实现的。神经网络因为函数十分复杂，会出现很多的局部最低点，在每一个局部最低点，导数的值都为 0。没有求导后的正负，梯度下降也就没有任何方向感，所以这时候，优化神经网络的参数也不知道应该往哪里走了。

学习速率（Learning Rate）是指模型在每次参数更新时，更新的步长大小。学习速率通常是一个非常重要的超参数，它能够影响模型的训练速度和优化效果。如果学习速率过大，可能会导致模型参数在更新过程中产生过大的波动，使得模型无法收敛；而如果学习速率过小，可能会导致模型训练缓慢，需要更长时间才能收敛。因此，选择合适的学习速率非常重要，通常需要通过实验和调参来确定最佳的学习速率。

如何设定优化器?==**

cnn.compile(loss='categorical_crossentropy', # 损失函数 行15
            optimizer=Adam(learning_rate=1e-4), # 优化器和学习速率
            metrics=['acc']) # 评估指标

显示训练过程中的损失曲线

在训练模型时，我们将训练的过程信息保存到了history对象中，通过history对象我们可以查看训练集上的损失以及验证集上的准确率。

# 训练网络并把训练过程信息存入history对象
history = cnn.fit(X_train,y_train, #训练数据
                  epochs=50, #训练轮次（梯度下降）
                  validation_split=0.2) #训练的同时进行验证

通过matplotlib画出损失曲线和准确率曲线

def show_history(history): # 显示训练过程中的学习曲线
    loss = history.history['loss'] #训练损失
    val_loss = history.history['val_loss'] #验证损失
    epochs = range(1, len(loss) + 1) #训练轮次
    plt.figure(figsize=(12,4)) # 图片大小
    plt.subplot(1, 2, 1) #子图1
    plt.plot(epochs, loss, 'bo', label='Training loss') #训练损失
    plt.plot(epochs, val_loss, 'b', label='Validation loss') #验证损失
    plt.title('Training and validation loss') #图题
    plt.xlabel('Epochs') #X轴文字
    plt.ylabel('Loss') #Y轴文字
    plt.legend() #图例
    acc = history.history['acc'] #训练准确率
    val_acc = history.history['val_acc'] #验证准确率
    plt.subplot(1, 2, 2) #子图2
    plt.plot(epochs, acc, 'bo', label='Training acc') #训练准确率
    plt.plot(epochs, val_acc, 'b', label='Validation acc') #验证准确率
    plt.title('Training and validation accuracy') #图题
    plt.xlabel('Epochs') #X轴文字
    plt.ylabel('Accuracy') #Y轴文字
    plt.legend() #图例
    plt.show() #绘图
show_history(history) # 调用这个函数

通过 evaluate方法可以评估模型在测试集上的准确率

result = cnn.evaluate(X_test, y_test) #评估测试集上的准确率
print('CNN的测试准确率为',"{0:.2f}%".format(result[1]))

下面是训练集和验证集的损失曲线和准确率曲线。

1）训练5次的结果。下面的损失曲线在验证集上是有一些波动的，效果并不是很好

2）训练24次，模型在测试集上的准确率为 95%

3）训练50次，模型在测试集上的准确率为 96%

这个时候，其实无论训练多少次，都没有多大作用了！我们要考虑优化模型的超参数了！

调整超参数：优化器和学习速率

我们将优化器由 Adam 更换为 RMSprop ，并且我们没有指定学习速率，RMSprop 优化器是一种自适应学习率算法，它可以根据梯度的大小自动调整学习速率。

cnn.compile(loss='categorical_crossentropy', # 损失函数 行15
            # optimizer=Adam(learning_rate=1e-4), # 优化器
            optimizer='RMSprop',
            metrics=['acc']) # 评估指标

训练50次，使用RMSprop优化器，模型在测试集上的准确率为 99%

至此，我们训练的模型已经满足我们的要求了，它对验证码的识别准确率达到了 99%。

6、部署模型

模型已经训练出来了，我们现在要将模型部署到服务器上，然后通过域名对外提供API服务，这里我们选择了Django框架。因为有同事是使用这个框架部署的，可以借鉴一些经验，少踩坑！

Diango： Django是一个基于Python的Web应用程序框架。使用简单，社区很活跃，是python语言中开发Web应用的首选框架。

https://www.djangoproject.com/

具体涉及公司隐私内容，不便展示。

你可能感兴趣的:(机器学习入门与实战,深度学习,cnn,图片验证码识别案例,卷积神经网络,字符验证码识别)

Monorepo与pnpm：前端项目管理的完美搭档秋の本名前端 pnpm 前端框架 mojo
一、什么是pnpmpnpm又称performantnpm，翻译过来就是高性能的npm。1.节省磁盘空间提高安装效率pnpm通过使用硬链接和符号链接（又称软链接）的方式来避免重复安装以及提高安装效率。硬链接：和原文件共用一个磁盘地址，相当于别名的作用，如果更改其中一个内容，另一个也会跟着改变符号链接（软链接）：是一个新的文件，指向原文件路径地址，类似于快捷方式官网原话：当使用npm时，如果你有100
ES6语法详解八月五前端前端 es6
ES的全称是ECMAScript,它是由ECMA国际标准化组织,制定的一项脚本语言的标准化规范。ES6实际上是一个泛指，泛指ES2015及后续的版本。目录1.let关键字和const关键字let关键字const关键字2.解构赋值数组解构赋值对象解构赋值解构赋值用于传参3.字符串新增特性模板字符串字符串实例新增方法4.数值新增特性新增二进制和八进制表示方法Number构造函数本身新增方法和属性安全整
Python 字符串操作 iteye_13776 Python Python C C++C#
Python截取字符串使用变量[头下标:尾下标]，就可以截取相应的字符串，其中下标是从0开始算起，可以是正数或负数，下标可以为空表示取到头或尾。#例1：字符串截取str='12345678'printstr[0:1]>>1#输出str位置0开始到位置1以前的字符printstr[1:6]>>23456#输出str位置1开始到位置6以前的字符num=18str='0000'+str(num)#合并字
web前端期末大作业：婚纱网页主题网站设计——唯一旅拍婚纱公司网站HTML+CSS+JavaScript IT-司马青衫前端课程设计 html
‍静态网站的编写主要是用HTMLDⅣV+CSSJS等来完成页面的排版设计‍，一般的网页作业需要融入以下知识点：div布局、浮动定位、高级css、表格、表单及验证、js轮播图、音频视频Fash的应用、uli、下拉导航栏、鼠标划过效果等知识点，学生网页作业源码，制作水平和原创度都适合学习或交作业用，记得点赞。精彩专栏推荐【作者主页——获取更多优质源码】【web前端期末大作业——毕设项目精品实战案例(1
关联规则算法：揭秘数据中的隐藏关系，从理论到实战秋声studio 机器学习算法详解关联规则算法数据挖掘 Apriori算法 FP-Growth算法大数据优化数据预处理增量式更新
引言在当今数据驱动的时代，如何从海量数据中挖掘出有价值的信息成为了各行各业的核心挑战。关联规则算法作为数据挖掘领域的重要工具，能够帮助我们发现数据中隐藏的关联关系，从而为决策提供支持。无论是电商平台的商品推荐，还是医疗领域的疾病诊断，关联规则算法都展现出了强大的应用潜力。本文将从基础概念出发，逐步深入探讨关联规则算法的核心原理、经典算法及其优化策略。无论你是数据挖掘的初学者，还是希望进一步了解关联
【Go语言圣经1.1】 Pyroyster golang 开发语言后端
目标学习Go的编译方式、包的组织方式以及工具链的统一调用方式概念与定义packageGo语言通过包来组织代码。包类似于其它语言的库librarries或模块modules，每个包通常对应一个目录，目录中的所有.go文件都属于同一个包。特殊的main包:当代码使用packagemain声明时，表示这是一个可独立执行的程序而非一个库。程序的执行入口就是main函数import通过import语句，编译
Spike Neural Network Introduction and Research Directions Debug_Snail SNN Neuralnetwork 人工智能 AIGC
1.SNNs是一类神经网络,其中的神经元通过脉冲(spikes)来传递信息,而不是像传统的人工神经网络中那样使用实数值激活。SNNs更接近生物学上的神经系统,因为生物神经元也是通过电信号脉冲来传递信息的。与传统神经网络相比,SNNs具有以下几个特点:更低的功耗-因为只在发生脉冲时才激活神经元,所以整体功耗会比传统神经网络低很多。这使得SNNs很适合应用在对功耗要求非常严格的场景,如边缘计算。时序编
一文理清：阿里系数据中台-数据治理工具集(傻傻也能分清楚） Debug_Snail Hadoop Big Data 技术工具人工智能 hadoop 数据仓库
阿里云提供的大数据与数据分析产品种类较多，各产品的定位和核心功能有所不同。以下是对DataWorks、MaxCompute、Dataphin、AnalyticDBforMySQL（ADB）、QuickBI、EMR的详细梳理。一、核心产品定位与功能DataWorks定位：一站式大数据开发治理平台，提供数据集成、开发、调度、治理、服务等全链路能力。核心功能：数据集成：支持异构数据源（如数据库、OSS、
哪个AI论文生成助手好用？5 款AI论文工具深度评测 AI论文图鉴人工智能
2025年，AI论文写作工具如雨后春笋般涌现，迅速在学术圈走红。身为一个常被论文写作困扰的“懒人”，我对这些工具的实际表现充满好奇。于是，我亲测了五款当下国内外最热门的AI论文写作助手，从功能、交互、写作水平、写作效率等维度进行全面评测，结果令人惊喜。相信这篇文章能为仍在观望的你带来新的启发与认识。这次测评，我挑选了五款极具代表性的AI工具，以“基于大语言模型的医疗诊断研究”为主题，看它们如何大显
大语言模型(LLM)入门学习路线图_llm教程，从零基础到精通，理论与实践结合的最佳路径！ AGI学习社语言模型学习人工智能 LLM 大模型大数据自然语言处理
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
Webpack打包构建流程码上跑步 webpack 前端 node.js
webpack的打包构建流程为什么需要打包？在前端有非常多的资源，如css、js、vue、vue、图片、字体等。有些资源需要加工处理1.ts->jsts-loader2.css->css-loader+style-loader3.图片->file-loader+url-loader4.html->html-webpack-plugin需要对产物进行优化optimization（webpack优化配
vue脚手架码上跑步 vue.js 前端 javascript
Vue脚手架脚手架是官方提供的标准化开发工具。下载配置//全局安装vue的脚手架npminstall@vue/cli-g//在项目目录下开启一个脚手架vuecreate‘项目名’//进入项目目录，直接运行npmrunserve1.vue.js与vue.runtime.xxx.js的区别：（1).vue.js是完整版的Vue，包含：核心功能+模板解析器。（2）.vue.runtime.xxx.js是
AI-大模型中的流式输出与非流式输出岂不闻 AI 人工智能开发语言 AI编程
1.前言在大模型API开发中，流式与非流式输出对应着两种不同的数据交互，在代码中stream中通过参数true与false来进行设定。2.流式输出与非流式输出的原理2.1.非流式输出-请求一次响应返回完整数据非流式输出，传统的请求-响应模式，发起请求-等待完整内容生成后一次性返回给客户端。完整性：返回经过处理和验证的完整响应。单次传输：采用标准HTTP请求与响应模式，一次传输所有数据。等待时间：用
机器学习实战——音乐流派分类（主页有源码）喵了个AI 机器学习实战机器学习分类人工智能
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.简介音乐流派分类是音乐信息检索（MusicInformationRetrieval,MIR）中的一个重要任务，旨在通过分析音频信号的特征，将音乐自动分类到不同的流派（如古典、摇滚、爵士、流行等）。随着数字音乐平台的普及，音乐流派分类技术被广泛应用于音乐推荐、自动标签生成和音乐库管理
Flutter中使用NetworkImage加载网络图片缓存问题学习实践云水-禅心 flutter 缓存
Flutter中默认的NetworkImage会有缓存机制，如果图片的url不变化，但是url的图片已经发生变化，NetworkImage不会下载新的图片deepseek是这么解决问题的，但是在鸿蒙上禁用缓存无效在Flutter中，NetworkImage默认会使用缓存机制来优化性能。如果你想禁用缓存，可以通过以下几种方式实现：1.使用NetworkImage的headers参数你可以通过设置he
前端实现版本更新自动检测✅ 水煮白菜王前端 Vue JavaScript 前端 vue.js javascript
作者简介：水煮白菜王，一位资深前端劝退师文章专栏：前端专栏，记录一下平时在博客写作中，总结出的一些开发技巧和知识归纳总结✍。感谢支持目录一、背景二、实现原理2.1逻辑2.2一些好处三、具体实现3.1工程化封装3.2关键方法解析脚本哈希获取：对比逻辑：四、全部代码4.1vue34.2vue2五、注意事项与常见问题5.1可能出现的问题5.2浏览器兼容方案一、背景在现代Web应用中，部署前端版本更新后及
2.10 Spring Boot定时任务：@Scheduled与Quartz对比分析 Sendingab spring boot 后端 java
SpringBoot定时任务：@Scheduled与Quartz对比分析一、核心特性对比特性**@Scheduled**Quartz依赖复杂度内置于Spring（零配置）需额外依赖与配置任务持久化不支持（内存存储）支持（数据库持久化）动态任务管理仅静态配置支持运行时增删改查分布式支持需自行实现原生集群支持调度策略固定速率/延迟Cron表达式/日历触发错误处理简单异常捕获完善的重试与错误日志机制性能
CSS入门指南：从零开始学习网页开发——（一）简介 GIS小白吃 css 学习前端
一、什么是CSS？CSS（CascadingStyleSheets，层叠样式表）是一种用于描述网页的外观和布局的样式表语言。它通过定义网页元素的样式（如颜色、字体、边距等）来与HTML内容分离，提升了网页的可维护性和设计的灵活性。CSS的核心目的是增强网页的表现力。早期的网页仅使用HTML来进行内容的展示，但由于HTML只能描述内容的结构，页面设计和内容变得难以管理。于是，CSS作为一种辅助技术应
学习笔记09——并发编程之线程基础码代码的小仙女高级开发必备技能学习笔记 python
线程基础1.1进程与线程的区别，Java中线程的实现（用户线程与内核线程）进程是操作系统分配资源的基本单位，而线程是CPU调度的基本单位。每个进程有独立的内存空间，而同一进程内的线程共享内存.可以从资源分配、切换开销、通信方式和独立性四个方面来比较两者的区别资源分配进程：操作系统分配资源（如内存、文件句柄等）的基本单位，拥有独立的地址空间。线程：隶属于进程，共享进程的资源（如内存、文件等），是CP
学习笔记10——并发编程2线程安全问题与同步机制码代码的小仙女高级开发必备技能 java知识学习笔记
线程安全问题与同步机制线程安全的本质问题线程安全问题源于多线程环境下对共享资源（数据或状态）的非原子性、非可见性、非有序性访问，导致程序行为不符合预期。主要表现如下：竞态条件（RaceCondition）：多个线程对同一资源进行非原子操作，导致结果依赖线程执行顺序。示例：两个线程同时执行count++（非原子操作，实际包含读-改-写三步）。内存可见性问题：线程修改共享变量后，其他线程无法立即看到最
C 语言中的数组详解 812503533 c语言 java 开发语言
在C语言中，数组是一种非常基础且常用的数据结构。数组是存储一组相同类型元素的集合，允许我们以统一的方式访问和操作这些元素。C语言中的数组不仅在编程中使用广泛，而且它的灵活性和效率使得它成为了许多算法实现的基础。本篇文章将深入分析C语言中的一维数组，包括定义、存储方式、操作方式、常见问题等等，所有的数据结构都可以从这几个方面来学习。1.数组的定义与存储方式1.1一维数组的定义数组的定义方式包括数组大
Linux tcpdump -any抓的包转换成标准的pcap 812503533 linux tcpdump 网络协议 tcp/ip
在Linux中使用tcpdump-any抓包并转换为标准pcap文件时出现额外字段，通常与链路层协议头部的差异以及pcap文件格式的兼容性有关。以下是详细原因和解决方案：一、问题原因分析-any选项的局限性tcpdump-any会自动猜测链路层协议类型（如Ethernet、IEEE802.11、PPP等），但可能因环境复杂导致误判。例如：在混合网络（如同时包含有线和无线流量）中，自动检测可能失败。
暮然回首--再看C语言--常量与宏定义 812503533 蓦然回首---再看C语言 c语言
常量与宏定义在C语言中，常量和宏定义是非常重要的概念。它们有助于提高程序的可读性、可维护性，并且能够避免重复代码。常量是指在程序运行期间其值不发生变化的变量，而宏定义是一种预处理指令，用于定义常量或代码片段，在编译阶段进行替换。一、常量常量是指在程序执行过程中其值不可改变的量。在C语言中，我们可以使用const关键字来声明常量。常量分为以下几种类型：常量整数：例如constinta=5;常量浮点数
12.1go语言sync.Map和atomic包 chxii go语言 #go 基础后端 golang
sync.Map在Go语言中，sync.Map是sync包提供的一个并发安全的映射（map）类型。与内置的map类型不同，sync.Map无需在外部加锁即可安全地在多个goroutine中进行读写操作。这使得sync.Map在某些特定场景下，如高并发读写、键值对频繁变动等，具有更好的性能表现。1.特点并发安全：sync.Map内部实现了同步机制，多个goroutine可以同时对其进行读写操作，而无
异地收款被拦截？一文读懂聚合二维码风控解决方案畅联支付大数据支付经验分享笔记
随着移动支付的普及，许多商家使用聚合二维码实现多平台收款。但近期不少用户反馈"人在外地扫自家二维码付款却被风控拦截"，这不仅影响经营效率，还可能引发资金冻结风险。今天我们就来解析这个问题的成因和应对策略。一、为什么会触发风控？1.地理位置异常：支付系统发现收款设备与常用地址存在跨省变动（如北京商家突然在上海收款）2.交易行为突变：短期内出现远超日常交易量的资金流动3.信息不匹配：营业执照注册地与收
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language UnknownBody LLM Daily Multimodal 语言模型人工智能自然语言处理
摘要深度学习的最新进展给地震监测带来了革命性变化，但开发一个能在多个复杂任务中表现出色的基础模型仍然充满挑战，尤其是在处理信号退化或数据稀缺的情况时。本文提出SeisMoLLM，这是首个利用跨模态迁移进行地震监测的基础模型，它无需在地震数据集上进行直接预训练，就能充分发挥大规模预训练大语言模型的强大能力。通过精心设计的波形标记化处理和对预训练GPT-2模型的微调，SeisMoLLM在DiTing和
【批量图片区域识别改名】有没有可以自动批量识别jpg图片上的区域文字，并直接提取文字命名的软件么? 没有我们教你基于WPF和腾讯api的方案做一个如沐春风菜鸡收割机图片OCR识别扫描PDF提取内容 PDF明细提取表格工具实现PDF明细转Excel PDF数据导出Excel 批量PDF内容提取工具批量图片识别区域内容改名批量图片识别多个区域内容导表格
应用场景描述在很多实际工作场景中，我们可能会遇到大量的图片文件，这些图片中包含特定区域的文字信息，比如发票图片上的发票号码、合同图片上的合同编号等。手动识别并为图片命名效率极低且容易出错。使用自动批量识别JPG图片上的区域文字，并直接提取文字为图片命名的软件，可以大大提高工作效率，减少人工操作带来的错误。实现方案：基于WPF和腾讯云OCRAPI步骤1：准备工作注册腾讯云账号：访问腾讯云官网（腾讯云
【春招笔试真题】饿了么2025.03.07-开发岗真题春秋招笔试突围最新互联网春秋招试题合集 java 算法网络
饿了么2025.03.07-开发岗题目1️⃣：统计01串中0和1的个数，通过计算可能的交换方式确定不同字符串数量2️⃣：使用模板匹配技术识别验证码图片中的"#"符号分布模式3️⃣：构建字典树（Trie）优化异或查询，实现高效的数字黑板游戏整体难度这套题目整体难度适中，由简到难逐步递进：第一题是基础的计数问题，需要理解交换操作的特性第二题是模式识别问题，需要实现模板匹配第三题是高级数据结构应用，需要
Spring Boot 与 Spring MVC 有何不同大G哥 spring spring boot mvc 后端 java
SpringBoot和SpringMVC都是Spring框架的一部分，但它们有不同的目标和功能。以下是它们之间的主要区别：1.核心目标SpringBoot：SpringBoot的目标是简化Spring应用的配置和部署。它通过提供默认配置和嵌入式服务器(如Tomcat、Jetty或Undertow)，使开发者能够快速构建和启动Spring应用，而无需配置繁琐的XML或类配置。SpringMVC：Sp
AbMole| 纳米药物递送系统IL@H-PP在乳腺癌和脑转移光热疗法 AbMole AbMole 生物化学生物试剂科研生物实验
近年来，光热疗法（PTT）作为一种非侵入性的癌症治疗手段，因其独特的优势而受到广泛关注。来自四川大学华西药学院药物靶向与药物递送系统重点实验室的范童,胡海丽,徐燕燕等多名研究人员发表了题为《HollowcoppersulfidenanoparticlescarryingISRIBforthesensitizedphotothermaltherapyofbreastcancerandbrainmet
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不