zhifeng687

使用浅层神经网络识别图片中的英文字母

一、实验介绍

1.1 实验内容

本次实验我们正式开始我们的项目：使用神经网络识别图片中的英文字母。

激动人心的时刻到了，我们将运用神经网络的魔力，解决一个无法使用手工编程解决的问题。如果你（自认为）是一个程序员，本次实验结束后，你将变得与其他只会手工编写程序的程序员不同。

1.2 实验知识点

“浅层”与“深度”的区别
泛化性能
随机梯度下降算法
如何对矩阵求导
编写我们的损失层

1.3 实验环境

python 2.7
numpy 1.12.1
scipy 0.19.0

二、实验步骤

2.1 是“浅层”好还是“深度”好？

2.1.1 神经网络的潜能

这里先插入一个问题，我们一开始直接把神经网络的模型结构告诉了大家，但有一个问题似乎被忽视掉了：神经网络是万能的吗？或者说，对于神经网络来说，会不会存在其无法表示的问题？这个问题不是很好回答，但可以告诉大家的一点是，数学上可以证明，满足一定条件的神经网络，可以以任意精度逼近任何函数。这里给出了一个直观的解释为什么神经网络有这样的能力。所以，神经网络确实是非常强大。

2.1.2 为什么“深度”更好

界定多"深"才算深度学习的标准不一，一种较常见的界定方法是，我们将神经网络除输入和输出层之外的层叫做隐层（hidden layer），当隐层的数量大于1时，就可以称之为深度学习。我们第一次实验所放的第一张神经网络结构图，只有一个隐层，可以称之为“浅层神经网络”，本次实验将会实现的神经网络模型就会是类似的结构。
“深度”神经网络要比“浅层”神经网络更好，这里面的原因有很多，其中最重要的一点是，深度神经网络可以利用“层次化”的信息表达减少网络中的参数数量，而且能够提高模型的表达能力，即靠后的网络层可以利用靠前的网络层中提取的较低层次的信息组合成更高层次或者更加抽象的信息。

2.2 准备训练数据

2.2.1 获取训练数据

为了完成我们的项目，我们需要准备足够的训练数据data, 构建一个浅层神经网络模型model, 并且使用梯度下降算法learn去优化我们的模型。
我们先来解决训练数据的问题，我已经事先准备好了一些带有标签(label，代表图片上的字母是什么，0代表A，1代表B,依次类推)的训练图片，你可以直接运行以下命令下载并解压它们：

wget http://labfile.oss.aliyuncs.com/courses/814/data.tar.gz
tar zxvf data.tar.gz

解压之后，我们得到了一个文件夹pic和三个分别名为train、validate、test的txt格式文件，pic文件夹下一共有60000张图片，每张图片的尺寸为17*17，包含一个不等宽的大写英文字母。train.txt文件有40000行，每行的格式为"图片路径标签"，代表一张有标签训练图片，validate.txt和test.txt文件格式与train.txt类似，且都包含10000行。

你可以使用cat命令查看这三个文件中的内容：

cat train.txt

2.2.2 训练、验证和测试 & 泛化性能

train.txt、validate.txt和test.txt将我们的数据划分成了三个部分。进行这样的划分是有原因的，在实际运用深度学习解决分类问题的过程中，我们总是将数据划分为训练集、验证集和测试集。

我们的学习算法learn利用训练集来对模型中的参数进行优化，为了检验这些参数是否足够“好”，可以通过观察训练过程中的损失函数值来判断，但通过损失函数值来判断有一个问题，就是我们的模型可能只是“记住”了所有的训练数据，而不是真正的学会了训练数据中所包含的问题本身的性质。就像是如果我们考试时总是出原题，那笨学生只要把所有题目都记住也一样可以取得高分。

所以为了检验我们的模型是在“学习”而不是在“死记硬背”，我们再使用与训练集不同的验证集对模型进行测试，当模型对验证集的分类准确率也比较高时，就可以认为我们的模型是真正的在“学习”，此时我们称我们的模型拥有较好的泛化性能（generalization）--能够正确的对未曾见过的测试样例做出正确的预测。

然而这里还是有一个问题，别忘了除了模型里的参数，我们还手动设置了超参数，我们的超参数也有可能只能适应一部分数据，所以为了避免这种情况，需要再设置一个与训练集和验证集都不同的测试集，测试在当前超参数的设置下，我们的模型具有良好的泛化性能。

2.2.3 预处理训练数据

对于图片数据，我们首先需要将它们转换成输入向量的形式，并且由于我们是有监督学习，每张图片的标签也必须与对应的图片向量一一对应。
编写数据预处理脚本preprocess.py如下：

# Created by wz on 17-3-23.
# encoding=utf-8
import sys
from scipy import misc
import numpy as np


def main():
    l = len(sys.argv)
    if l < 2:  # 检查参数的数量是否足够
        print'eg: python img2pkl.py list.txt dst.npy\n' \
             'convert image to npy\n'
        return

    src = sys.argv[1]
    dst = sys.argv[2] if l > 2 else 'data.pkl'
    with open(src, 'r') as f:  # 读取图片列表
        list = f.readlines()

    data = []
    labels = []
    for i in list:
        name, label = i.strip('\n').split(' ')  # 将图片列表中的每一行拆分成图片名和图片标签
        print name + ' processed'
        img = misc.imread(name)  # 将图片读取出来，存入一个矩阵
        img /= 255  # 将图片转换为只有0、1值的矩阵
        img.resize((img.size, 1))  # 为了之后的运算方便，我们将图片存储到一个img.size*1的列向量里面
        data.append(img)
        labels.append(int(label))

    print 'write to npy'
    np.save(dst, [data, labels])  # 将训练数据以npy的形式保存到成本地文件
    print 'completed'


if __name__ == '__main__':
    main()

读入图片数据需要scipy模块，使用以下命令安装：

sudo pip install scipy

我们的预处理脚本接收两个参数，第一个参数src对应之前我们提到的train.txt、validate.txt和test.txt，我们从src中读取图片的路径和它的标签。第二个参数dst代表我们将预处理好的图片数据保存到哪里，我们直接使用np.save()函数将数组保存到npy文件。

注意原始图片中只有0和255两种灰度值，我们的代码对图片灰度值除以了255，将图片矩阵转换成了只包含0-1值的矩阵。同时我们将图片矩阵转换成了列向量，注意这里的列向量的尺寸是img.sizex1而不是img.size，即我们其实是使用矩阵的形式表示向量，这样可以方便我们之后的运算。

我们可以使用以下命令将图片转换成npy文件：

python preprocess.py train.txt train.npy
python preprocess.py validate.txt validate.npy
python preprocess.py test.txt test.npy

然后你会发现生成了3个文件

2.3 编写数据层 & 随机梯度下降算法

预处理好了训练数据之后，我们还需要将数据读入我们的神经网络，为了一致性，我们将读入数据的操作放到一个数据层里面。创建layers.py文件，数据层代码如下：

import numpy as np

class Data:
    def __init__(self, name, batch_size):  # 数据所在的文件名name和batch中图片的数量batch_size
        with open(name, 'rb') as f:
            data = np.load(f)
        self.x = data[0]  # 输入x
        self.y = data[1]  # 预期正确输出y
        self.l = len(self.x)
        self.batch_size = batch_size
        self.pos = 0  # pos用来记录数据读取的位置

    def forward(self):
        pos = self.pos  
        bat = self.batch_size
        l = self.l
        if pos + bat >= l:  # 已经是最后一个batch时，返回剩余的数据，并设置pos为开始位置0
            ret = (self.x[pos:l], self.y[pos:l])
            self.pos = 0
            index = range(l)
            np.random.shuffle(index)  # 将训练数据打乱
            self.x = self.x[index]
            self.y = self.y[index]
        else:  # 不是最后一个batch, pos直接加上batch_size
            ret = (self.x[pos:pos + bat], self.y[pos:pos + bat])
            self.pos += self.batch_size

        return ret, self.pos  # 返回的pos为0时代表一个epoch已经结束

    def backward(self, d):  # 数据层无backward操作
        pass

这里先要介绍梯度下降算法的实际运用版本：随机梯度下降算法（stochastic gradient descent）。在实际的深度学习训练过程当中，我们每次计算梯度并更新参数值时，总是一次性计算多个输入数据的梯度，并将这些梯度求平均值，再使用这个平均值对参数进行更新。这样做可以利用并行计算来提高训练速度。我们将一次性一起计算的一组数据称为一个batch。同时，我们称所有训练图片都已参与一遍训练的一个周期称为一个epoch。每个epoch结束时，我们会将训练数据重新打乱，这样可以获得更好的训练效果。我们通常会训练多个epoch。

2.3 编写一次处理一个batch的全连接层 & 对矩阵求导的窍门

在上次实验中，我们实现了一个全连接FullyConnect层，但是那段代码只能处理输出是一个标量的情况，对于输出是多个节点的情况无法处理。而且当一个batch中包含多个训练图片数据时，那段代码更是无法正常工作。

所以我们需要重新编写我们的全连接层，由于batch的引入，这时的全连接层要难了很多：

class FullyConnect:
    def __init__(self, l_x, l_y):  # 两个参数分别为输入层的长度和输出层的长度
        self.weights = np.random.randn(l_y, l_x) / np.sqrt(l_x)  # 使用随机数初始化参数，请暂时忽略这里为什么多了np.sqrt(l_x)
        self.bias = np.random.randn(l_y, 1)  # 使用随机数初始化参数
        self.lr = 0  # 先将学习速率初始化为0，最后统一设置学习速率

    def forward(self, x):
        self.x = x  # 把中间结果保存下来，以备反向传播时使用
        self.y = np.array([np.dot(self.weights, xx) + self.bias for xx in x])  # 计算全连接层的输出
        return self.y  # 将这一层计算的结果向前传递

    def backward(self, d):
        ddw = [np.dot(dd, xx.T) for dd, xx in zip(d, self.x)]  # 根据链式法则，将反向传递回来的导数值乘以x，得到对参数的梯度
        self.dw = np.sum(ddw, axis=0) / self.x.shape[0]
        self.db = np.sum(d, axis=0) / self.x.shape[0]
        self.dx = np.array([np.dot(self.weights.T, dd) for dd in d])

        # 更新参数
        self.weights -= self.lr * self.dw
        self.bias -= self.lr * self.db
        return self.dx  # 反向传播梯度

为了理解上面的代码，我们以一个包含100个训练输入数据的batch为例，分析一下具体执行流程：
我们的l_x为输入单个数据向量的长度，在这里是17*17=289，l_y代表全连接层输出的节点数量，由于大写英文字母有26个，所以这里的l_y=26。
所以，我们的self.weights的尺寸为26*289, self.bias的尺寸为26*1（self.bias也是通过矩阵形式表示的向量）。forward()函数的输入x在这里的尺寸就是100*289*1(batch_size*向量长度*1)。backward()函数的输入d代表从前面的网络层反向传递回来的“部分梯度值”，其尺寸为100*26*1（batch_size*输出层节点数l_y*1）。

forward()函数里的代码比较好理解，由于这里的x包含了多组数据，所以要对每组数据分别进行计算。

backward()函数里的代码就不太好理解了，ddw保存的是对于每组输入数据，损失函数对于参数的梯度。由于这里的参数是一个26*289的矩阵，所以，我们需要求损失函数对矩阵的导数。（对矩阵求导可能大部分本科生都不会。但其实也不难，如果你线性代数功底可以，可以尝试推导矩阵求导公式。）不过这里有一个简便的方法去推断对矩阵求导时应该如何计算：由于这里的参数矩阵本身是26*289的，那损失函数对于它的梯度（即损失函数对参数矩阵求导的结果）的尺寸也一定是26*289的。而这里每组输入数据的尺寸是289*1，每组数据对应的部分梯度尺寸为26*1,要得到一个26*289尺寸的梯度矩阵，就只能是一个26*1尺寸的矩阵乘以一个1*289尺寸的矩阵，需要对输入数据进行转置。所以这里计算的是np.dot(dd,xx.T)。
对一个batch里的数据分别求得梯度之后，按照随机梯度下降算法的要求，我们需要对所有梯度求平均值，得到self.dw, 其尺寸为26*289，刚好与我们的self.weights匹配。

由于全连接层对bias的部分导数为1，所以这里对于bias的梯度self.bias就直接等于从之前的层反向传回来的梯度的平均值。
损失函数对于输入x的梯度值self.dx的求解与self.dw类似。由于输入数据self.x中的一个数据的尺寸为289*1，self.weights的尺寸为26*289, dd的尺寸为26*1, 所以需要对self.weights进行转置。即“289*1=(289*26)*(26*1)”。

最后是使用梯度更新参数，注意这里的self.lr即为前面我们提到过的学习速率alpha，它是一个需要我们手工设定的超参数。

这里的矩阵求导确实不太好处理，容易出错，请你仔细分析每一个变量代表的含义，如果对一个地方不清楚，请回到前面看看相关的概念是如何定义的。

2.4 激活函数层

由于numpy能够同时处理标量和矩阵的情况，所以我们之前写的激活函数sigmoid层可以不用修改直接使用：

class Sigmoid:
    def __init__(self):  # 无参数，不需初始化
        pass

    def sigmoid(self, x):
        return 1 / (1 + np.exp(-x))

    def forward(self, x):
        self.x = x
        self.y = self.sigmoid(x)
        return self.y

    def backward(self, d):
        sig = self.sigmoid(self.x)
        self.dx = d * sig * (1 - sig)
        return self.dx  # 反向传递梯度

sigmoid函数将输出限制在0到1之间，刚好可以作为概率看待。这里我们有26个输入节点，经过sigmoid层计算之后，哪个输出节点的数值最大，就认为图片上最有可能是该节点代表的字母。比如如果输出层第0个节点值最大，就认为图片上的字母是“A”, 如果第25个节点的值最大，就认为图片上的字母是“Z”。

注意一般在计算神经网络的深度时我们一般不把激活层算进去，但这里为了编程方便，也将激活函数视为单独的一层。　　

2.5 损失函数层

之前我们讲解过二次损失函数quadratic loss的定义，这里我们来实现它：

class QuadraticLoss:
    def __init__(self):
        pass

    def forward(self, x, label):
        self.x = x
        self.label = np.zeros_like(x)  # 由于我们的label本身只包含一个数字，我们需要将其转换成和模型输出值尺寸相匹配的向量形式
        for a, b in zip(self.label, label):
            a[b] = 1.0  # 只有正确标签所代表的位置概率为1，其他为0
        self.loss = np.sum(np.square(x - self.label)) / self.x.shape[0] / 2  # 求平均后再除以2是为了表示方便
        return self.loss

    def backward(self):
        self.dx = (self.x - self.label) / self.x.shape[0]  # 2被抵消掉了
        return self.dx

在随机梯度下降算法里，每次前向计算和反向传播都会计算包含多个输入数据的一个batch。所以损失函数值在随后也要除以batch中包含的数据数量,　即self.x.shape[0]，同时这里除以了2,　这个地方的2可以和对二次损失函数求导后多出来的系数2抵消掉。所以，我们的损失函数变成了：

2.6 准确率层

前面我们提到过，为了判断经过训练的模型是否具有良好的泛化性能，需要使用验证集和测试集对模型的效果进行检验。所以我们还需要一个计算准确率的层：

class Accuracy:
    def __init__(self):
        pass

    def forward(self, x, label):  # 只需forward
        self.accuracy = np.sum([np.argmax(xx) == ll for xx, ll in zip(x, label)])  # 对预测正确的实例数求和
        self.accuracy = 1.0 * self.accuracy / x.shape[0]
        return self.accuracy

如果我们的神经网络的输出层中，概率最大的节点的下标与实际的标签label相等，则预测正确。预测正确的数量除以总的数量，就得到了正确率。

2.7　构建神经网络

我们已经写好了所有必须的网络层，并所有网络层都放到一个layers.py文件里。　　

接下来我们要使用这些层构建出一个完整的神经网络，方法很简单，按顺序把它们“堆叠”起来就可以了，就像搭积木一样，创建shallow.py文件：

# encoding=utf-8
from layers import *


def main():
    datalayer1 = Data('train.npy', 1024)  # 用于训练，batch_size设置为1024
    datalayer2 = Data('validate.npy', 10000)  # 用于验证，所以设置batch_size为10000,一次性计算所有的样例
    inner_layers = []
    inner_layers.append(FullyConnect(17 * 17, 26))
    inner_layers.append(Sigmoid())
    losslayer = QuadraticLoss()
    accuracy = Accuracy()

    for layer in inner_layers:
        layer.lr = 1000.0  # 为所有中间层设置学习速率

    epochs = 20
    for i in range(epochs):
        print 'epochs:', i
        losssum = 0
        iters = 0
        while True:
            data, pos = datalayer1.forward()  # 从数据层取出数据
            x, label = data
            for layer in inner_layers:  # 前向计算
                x = layer.forward(x)

            loss = losslayer.forward(x, label)  # 调用损失层forward函数计算损失函数值
            losssum += loss
            iters += 1
            d = losslayer.backward()  # 调用损失层backward函数层计算将要反向传播的梯度

            for layer in inner_layers[::-1]:  # 反向传播
                d = layer.backward(d)

            if pos == 0:  # 一个epoch完成后进行准确率测试
                data, _ = datalayer2.forward()
                x, label = data
                for layer in inner_layers:
                    x = layer.forward(x)
                accu = accuracy.forward(x, label)  # 调用准确率层forward()函数求出准确率
                print 'loss:', losssum / iters
                print 'accuracy:', accu
                break


if __name__ == '__main__':
    main()

由于FullyConnect层和Sigmoid层在网络中的调用方式一模一样，所以把它们存到一个列表里，使用循环的方式调用。同时由于Sigmoid层一般不计入神经网络的深度，所以我们将这个列表命名为inner_layers而不是hidden_layers以免混淆。　　

datalayer1数据层用来输出训练集数据，datalayer2数据层用来输出验证集数据。accuracy层用来在每个epoch结束时计算验证集上的准确率。　　

上面的代码里只有一个隐层，构建的神经网络属于浅层神经网络，所以我们把这段代码存储在shallow.py文件里。

preprocess.py　layers.py　shallow.py三个文件可以使用以下命令获取：

wget http://labfile.oss.aliyuncs.com/courses/814/code.tar.gz
tar zxvf code.tar.gz

2.8 训练神经网络

终于，我们排除万难，准备好了训练数据，构建好了我们的浅层神经网络，也写好了训练算法，终于可以开始训练了！在terminal里输入：

python shallow.py

这里设置学习速率为1000(实际当中很少看到大于1的学习速率，下次实验我们会解释为什么这里的学习速率需要这么大),你可以尝试将学习速率改变成其他的值，观察损失函数值和准确率的变化情况。

我们看到每个epoch结束时，会先输出在训练集上的损失函数值，再输出在验证集上的准确率。　　

20个epoch结束时，准确率大概会在0.9左右(为了节省时间这里只训练了20个epoch,你可以加大epochs的数值，看看最高能到多少，我这里测试大概是在0.93)，这非常令人振奋不是吗！一个原本通过手工编程不可解的图片分类问题，（几乎）被我们解决了，0.9的准确率已经可以应用在一些实际的项目中了（比如这里），而且我们模型中的参数都是自动设定的，我们只是编写了模型和训练算法部分的代码。
而且，我们的代码具有很好的可扩展性，一方面我们可以很方便的向神经网络中添加更多的网络层使之成为真真的“深度神经网络”，另一方面我们也可以很方便的将我们的模型运用到其他图片分类问题当中，我们只编写了一次代码，就有可能能够解决多种问题！

不过，我要告诉你的是，我们的神经网络的性能还没有被完全发掘出来，我们的准确率还可以更高！这次实验的最开始我们提到过，深度神经网络会比浅层神经网络拥有更好的性能，下次实验，我们会尝试使用深度神经网络来提高我们的模型性能，进行真正的深度学习！

三、实验总结

这次实验我们编写了数据预处理脚本、数据输入网络层、能够处理批量数据的FullyConnect层、损失函数层和准确率层，使用这些层构建出了只有一个隐层的浅层神经网络，并使用这个神经网络训练得到了一个效果已经很不错的模型。

在此课程的一开始，我就强调本课程不要求很高的数学水平，但是我相信你在实验的过程中还是逐渐的体会到了（尤其是编写FullyConnect层对矩阵求导数的时候），要想理解深度学习的原理，必须要具备一定的数学基础，数学就像是一把强大的战斧，帮你扫清一个个障碍，使原本不可解的问题变得可解。所以如果你想从事深度学习相关的工作，甚至进行深度学习领域的研究的话，请务必要重视学习相关数学知识。

本次实验，我们学习了：

深度神经网络比浅层神经网络更好
泛化性能是指一个模型能够正确预测未曾见过的样例的能力
随机梯度下降算法在每轮(epoch)训练开始时将所有数据打乱，每次训练一次性计算多个样例的平均值并使用平均值对参数进行更新

四、课后作业

修改上面的代码，在训练过程中打印出FullyConnect层的梯度值，观察这些值的大小。
增大epoch的值，测试我们的神经网络最高能达到多少准确率。

你可能感兴趣的:(使用浅层神经网络识别图片中的英文字母)

uniapp uni-easyinput组件textarea属性去除在支付宝小程序右下角的数字统计独揽月下萤火√ uni-app 小程序前端 javascript 钉钉
问题描述：在使用uniapp的uni-easyinput组件的textarea时，编译到支付宝小程序时，右下角带有数字统计，有些时候是不需要的，找了很多方法，最终解决问题解决：使用show-count属性设为false就可以了，但是要注意，这个属性在uniapp的uni-easyinput组件中是没有的，所以需要修改uni-easyinput组件的源代码。
从零打造工业级智能二维码识别系统：基于PyQt5与ZXingCpp的实战指南蜡笔小新星 PyQt5 qt 开发语言 python 图像处理经验分享 pyqt 扫码读码解码
文章目录第一章：系统全景解析1.1实时识别工作流图解1.2界面布局与功能分区说明1.3代码文件结构树形图第二章：环境搭建与依赖管理2.1必需组件清单2.2虚拟环境配置步骤2.3摄像头硬件检测方法第三章：多线程视频采集3.1VideoThread类设计剖析3.2图像采集核心循环3.3线程安全停止机制3.4信号槽通信实例第四章：图像预处理流水线4.1预处理方法开关实现4.2自适应二值化算法4.3图像格
【OpenCV C++】存图，如何以时间命名，“年月日-时分秒“产生唯一的文件名呢？“年月日-时分秒-毫秒“ 自动检查存储目录，若不存在自动创建存图 R-G-B OpenCV C++C/C++opencv c++人工智能
文章目录1生成文件名（格式:"年月日-时分秒"格式）2生成文件名（格式:"年月日-时分秒-毫秒"）3多模式存图函数4综合调用实例5注意：默认参数只能在头文件中定义，不能在实现中重复默认参数mode==1→“年月日-时分”→YYYYMMDD-HHMM的文件名；例如：20250310-1647mode==2→"年月日-时分秒-毫秒"→YYYYMMDD-HHMMSS-MMM（适用采集存储帧率搞得图片，增
CV：傅里叶变换壹十壹 CV 人工智能计算机视觉 python
图像中的傅里叶变换主要指将图像从空间域转换到频域的过程。通过傅里叶变换，我们可以将图像看作是不同频率正弦波的叠加，这有助于分析图像的周期性特征、纹理和噪声等信息。主要概念频域表示幅值谱（MagnitudeSpectrum）：反映了各个频率成分的能量或强度。低频部分一般对应图像中的整体轮廓和大致结构，高频部分则反映图像的边缘、细节和噪声。相位谱（PhaseSpectrum）：包含了图像的空间位置信息
Linux: windows或者Ubuntu解压分卷压缩、解压zip、z01、z02 壹十壹 Linux linux ubuntu 运维
1windows系统：1.1使用WinRAR下载并安装WinRAR：WinRAR官方网站执行解压操作：找到包含.z01,.z02,…文件的文件夹。在.zip文件（主文件）或.z01文件上右键点击，选择“ExtractHere”（解压到此处）或“Extractto[文件夹名]”。WinRAR将会自动识别并解压所有分卷。2.2使用7-Zip下载并安装7-Zip：7-Zip官方网站执行解压操作：找到包含
Velodyne16线激光雷达点云数据中的线束（ring）是如何分布的壹十壹激光雷达编辑器
将sensor_msgs::PointCloud2转为pcl::PointCloud后的点云数据线束（ring）是从下往上进行递增排序。在下图中线束0为深蓝色，线束1是红色，线束2为淡蓝色，线束3为橘黄色，线束4为绿色，线束6为黄色。（一帧激光雷达点云的强度值在RVIZ中显示的颜色与该帧点云数据中激光雷达强度值的最大值有关）
深度学习：偏差和方差壹十壹深度学习深度学习人工智能 python 机器学习
偏差（Bias）偏差衡量了模型预测值的平均值与真实值之间的差距。换句话说，偏差描述了模型预测的准确度。一个高偏差的模型容易出现欠拟合，即模型无法捕捉数据中的真实关系，因为它对数据的特征做出了错误的假设。特征：高偏差的模型通常是过于简单的模型，无法对数据中的复杂关系进行准确建模。高偏差模型的训练误差和测试误差可能都较高。解决方法：增加模型复杂度：例如增加多项式的阶数、增加神经网络的层数等。使用更多的
POI 的 Excel 读写操作教程 Kale又菜又爱玩 excel java
POI的Excel读写操作教程一、POI简介ApachePOI是一款在Java开发中广受欢迎的开源库，主要用于处理各种MicrosoftOffice文件格式，Excel文件便是其中之一。凭借其功能强大的API，POI不仅支持对Excel文件的读取、写入和修改，还为Java开发者在处理Excel相关业务时提供了极大的便利。二、POI的Excel读写操作案例（一）引入依赖在Maven项目中使用POI时
Netty入门教程 Kale又菜又爱玩 java 开发语言
Netty入门教程Netty是一个高性能、低延迟的网络通信框架，广泛应用于高并发、高吞吐量的网络应用程序中。它提供了简洁易用的API，封装了底层的复杂操作，让开发者能够专注于业务逻辑。本文将从基础概念入手，逐步深入Netty的核心组件、使用方法及高级特性，帮助你在生产环境中得心应手地使用Netty。1.什么是Netty？Netty是一个异步、事件驱动的网络通信框架，极大地简化了TCP和UDP网络编
uniapp水印相机(水印照片，图片加水印) corekeys uniapp uni-app
在实际开发的项目中，我们有时候会遇到相机拍照上传照片的时候需要带有水印的功能。下面整理了我在自己的项目中做的水印相机(完整源码)功能实战分享给大家。水印中内容包含如下(实际包含的内容根据你的实际需求而定，这里只是以我的项目需求为例)：具体日期时间，如：2023-05-2512:00:00星期四地理位置，如：江苏省南京市雨花台区软件大道19号经纬度，如：纬度:32.08405200000000,经度
探讨消息队列系统：AWS SQS vs. Apache Kafka fxrz12 工具 aws apache kafka
在现代软件架构中，消息队列系统扮演着关键角色，帮助系统实现异步通信、负载均衡和解耦。两种广泛使用的消息队列系统是AWSSimpleQueueService(SQS)和ApacheKafka。尽管它们都提供消息传递功能，但在设计理念、功能和使用场景上存在显著差异。本文将详细探讨AWSSQS和ApacheKafka的特点，帮助你在不同场景下做出最佳选择。一、ApacheKafkaApacheKafka
技术干货 | i.MX 8视频开发案例全集 Tronlong创龙工业级核心板嵌入式ARM 软硬件原理图规格资料平台案例 fpga arm nxp 嵌入式
前言：本文主要介绍基于NXPi.MX8MMini处理器的视频开发案例，主要包含：(1)基于GStreamer的USB摄像头视频采集、软件解码、边缘检测、显示案例。(2)基于GStreamer的网络摄像头视频采集、H.264解码、显示案例。(3)基于GigE工业相机的图像采集、显示、保存案例。(4)基于MIPICameraOV4689摄像头演示Linux子系统V4L2的使用案例。(5)H.265视频
解析JSON的这 6 种方案（带示例）浪九天企业级开发效率提升 java spring spring boot spring cloud
目录1.使用Gson详细解释运用场景代码示例2.使用Jackson详细解释运用场景代码示例3.使用JSON.simple详细解释运用场景代码示例4.使用org.json详细解释运用场景代码示例5.使用FastJSON详细解释运用场景代码示例6.使用Moshi详细解释运用场景代码示例在Java中，有多种方案可以用于解析JSON数据，以下为你详细介绍6种常见的方案：1.使用Gson详细解释Gson是G
Digicert SSL 证书 https
Digicert作为世界最早的证书品牌，是全球领先的数字安全解决方案提供商，Digicert在SSL证书领域具有显著的市场份额和影响力。DigicertSSL证书以其高度的安全性和可靠性赢得了全球用户的信赖。众多金融机构、政府机构、电子商务网站等关键领域都选择了DigicertSSL证书来保护其网络通信安全。一、基本功能加密通信：通过使用公钥加密技术，确保用户与网站之间的数据传输是安全的。身份验证
centos7使用yum网络安装
CentOS7Yum网络安装完全指南核心原理分析Yum（YellowdogUpdater,Modified）作为RPM系统的智能化软件包管理工具，通过以下机制实现自动化安装：依赖解析：自动识别软件包的前置依赖关系仓库同步：连接配置的软件仓库（repo）获取元数据事务处理：采用原子化操作保证安装/更新的完整性️全流程安装步骤详解步骤1：连接CentOS7服务器sshusername@server-i
详解工单系统WGCAT - 如何设置主题背景色运维服务器linux程序员
工单系统WGCAT在v1.2.2版本开始支持设置主题背景色如果你在使用老版本，只需要升级到v1.2.2版本就可以使用此功能了登录后，在右上角点击，如下图
Android入门（七） | 常用控件 ·Jormungand Android android java android studio
文章目录TextView控件：文本信息Button控件：按钮EditText控件：输入框ImageView控件：图片ProgressBar控件：进度条AlertDialog控件：提示框ProgressDialog控件：带有进度条的提示框TextView控件：文本信息TextView是Android中较常用的一个控件。主要用于在界面上显示一段文本信息，配置在每个活动的xml文件中。除了之前用到的an
Linux目录删除指南：彻底解决“Is a directory”错误 linux运维服务器
在Linux系统中遇到cannotremove'xxx':Isadirectory错误时，说明你正在尝试删除目录但未正确使用参数。以下是详细解决方案：1.基础命令修正删除空目录rmdir目录名#仅删除空目录删除非空目录rm-r目录名#递归删除（确认目录内容可删）rm-rf目录名#强制递归删除（慎用！）2.权限问题处理查看目录权限ls-ld目录名#输出示例：drwxr-xr-x2useruser40
IP，MAC与ARP 憨堡包^—^ tcp/ip macos 网络协议
一、IPIP（InternetProtocol）地址是互联网协议地址的简称，它是分配给每个连接到互联网的设备的唯一标识符，用于在网络中定位和识别设备。IP地址分为两种主要类型：1.IPv4（InternetProtocolversion4）格式：由4组0到255之间的数字组成，用点号分隔，例如192.168.1.1。范围：IPv4地址总量约为42亿个，但由于互联网设备的快速增长，IPv4地址已经接
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，为开发者提供了强大的工具来构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的音视频处理应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的特性，结合ArkTS的强大功能，实现复杂
Solana中的程序派生地址（PDAs）：是什么，为什么，以及如何？ GTokenTool发币平台区块链
程序派生地址(PDA)在Solana中的应用：什么、为什么和如何？在学习Solana时，你会经常听到关于程序派生地址(PDAs)的讨论。它们就像这样——强大、多功能，而且最重要的是，稍微被误解。如果你是一个开发者，试图理解它们，不用担心。我们将在本文中一起揭开PDAs的面纱。在本文中，我将从基础开始解释PDAs，假设你刚刚开始接触Solana。因此，不需要任何先前的知识——让我们开始吧。什么是PD
利用Java爬虫获取衣联网商品详情：实战指南 Jason-河山 java 爬虫开发语言
在电商领域，获取商品详情是数据分析和市场研究的重要环节。衣联网作为知名的电商平台，提供了丰富的服装商品资源。本文将详细介绍如何利用Java编写爬虫程序，通过商品ID获取衣联网商品详情。一、准备工作（一）环境搭建Java安装：确保已安装Java开发环境，推荐使用JDK11或更高版本。开发工具配置：使用IntelliJIDEA或Eclipse等Java开发工具，创建一个新的Maven项目。依赖库添加：
Linux管理磁盘分区 IT小馋猫 linux 运维服务器
一、规划磁盘中的分区在磁盘设备中创建、删除、更改分区fdisk/列出磁盘分区信息进入分区管理界面命令/fdisk-lfdisk/dev/sdb命令/列出磁盘分区情况创建分区命令/pn命令/删除分区更改分区类型命令/dt命令/保存分区操作不保存退出命令/wqFdisk命令的参数：m：查看各种操作指令的帮助信息p：列出硬盘中的分区情况n：创建分区-t：变更分区的类型d：删除分区w：保存并退出q：不保存
目标检测煤烦恼目标检测人工智能大数据 pytorch
1.概念：目标检测是识别图片中物体并确定其位置的多任务技术，面临目标种类数量多、尺度不均、外部环境干扰等问题。这里的数字为置信度2.数据集：VOC数据集分4大类20小类；COCO数据集含20万图像、80个类别、超50万目标标注，平均每图7.2个目标。3.GroundTruth格式：包含类别和边界框坐标，常见的有YOLO（归一化中心点坐标和宽高）、VOC（左上角和右下角坐标）、COCO（左上角坐标和
Yarn：包管理优化与工作空间的最佳实践
在现代前端开发中，包管理工具是不可或缺的工具之一。Yarn作为一个快速、可靠且安全的包管理工具，相对于npm，提供了一些独特的功能和优化，尤其是在工作空间管理和性能优化方面尤为突出。本文将深入探讨Yarn的专业使用，包括其工作空间的强大功能、性能优化技术以及在大型项目中的最佳实践。Yarn简介Yarn是由Facebook开发的一个JavaScript包管理工具，它旨在解决npm的一些关键问题，如安
ELK Stack 安装教程 - 构建日志存储告警系统运维
介绍“ELK”是三个开源项目的首字母缩写，这三个项目分别是：Elasticsearch、Logstash和Kibana。Elasticsearch是一个搜索和分析引擎。Logstash是服务器端数据处理管道，能够同时从多个来源采集数据，转换数据，然后将数据发送到诸如Elasticsearch等“存储库”中。Kibana则可以让用户在Elasticsearch中使用图形和图表对数据进行可视化。目前最
盲签名算法的原理与C语言实现 c密码学信息安全加密解密
0x01概述盲签名(BlindSignature)是由Chaum,David提出的一种数字签名方式，其中消息的内容在签名之前对签名者是不可见的（盲化）。经过盲签名得到的签名值可以使用原始的非盲消息使用常规数字签名验证的方式进行公开验证。盲签名可以有效的保护隐私，其中签名者和消息作者不同，在电子投票系统和数字现金系统中会被使用。盲签名常常被类比成下面的场景：Alice想让Bob在自己的文件上签名，但
【LLM】从零开始实现 LLaMA3 FOUR_A LLM 人工智能机器学习大模型 llama 算法
分词器在这里，我们不会实现一个BPE分词器（但AndrejKarpathy有一个非常简洁的实现）。BPE（BytePairEncoding，字节对编码）是一种数据压缩算法，也被用于自然语言处理中的分词方法。它通过逐步将常见的字符或子词组合成更长的词元（tokens），从而有效地表示文本中的词汇。在自然语言处理中的BPE分词器的工作原理如下：初始化：首先，将所有词汇表中的单词分解为单个字符或符号。例
Zookeeper学习种豆走天下 zookeeper 学习分布式
Zookeeper是一个开源的分布式协调框架，它主要用于处理分布式系统中的一些常见问题，如同步、配置管理、命名服务和集群管理等。Zookeeper是由Apache提供的，并且广泛应用于各种分布式应用中，特别是在高可用、高可靠性和高性能的系统中。Zookeeper的主要功能分布式协调：Zookeeper提供了协调多个节点（服务器）间行为的机制。例如，分布式锁、选举、配置管理等。命名服务：Zookee
【软件测试】接口自动化测试用例通常包含哪些要素小马哥编程自动化测试用例
接口自动化测试用例通常包含以下要素：用例ID：唯一标识符，便于追踪和管理。用例名称：简要描述测试目的。接口信息：URL：接口地址。请求方法：如GET、POST、PUT、DELETE等。请求参数：Headers：如Content-Type、Authorization等。QueryParameters：GET请求中的查询参数。Body：POST/PUT请求的请求体，通常为JSON或XML。预期结果：状
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置