独行者~

深度学习实战项目：速算题目批改

前言
一、摘要
二、项目框架
三、项目步骤
- 1. 数据处理
- - 1.1 数据收集
  - 1.2 数据打标
  - 1.3 数据预处理
- 2. 模型训练
- - 2.1 目标检测
  - - 2.1.1 模型介绍
    - 2.1.2 模型训练
    - 2.1.3 训练结果
  - 2.2 文本识别
  - - 2.2.1 模型介绍
    - 2.2.2 模型训练
    - 2.2.3 训练结果
- 3. 模型推理
- - 3.1 YOLO模型接口
  - 3.2 CRNN模型接口
- 4. 模型部署
- - 4.1 上传图像
  - - 4.1.1 代码实现
    - 4.1.2 页面效果
  - 4.2 文本检测
  - - 4.2.1 代码实现
    - 4.2.2 效果展示
  - 4.3 文本识别
  - - 4.3.1 代码实现
    - 4.3.2 效果展示
  - 4.4 算式批改
  - - 4.4.1 代码实现
    - 4.4.1 效果展示
  - 4.5 结果反馈
  - - 4.5.1 推理时间
    - 4.5.2 用户答题情况
- 5. 模型压缩
- - 5.1 核心代码
  - 5.2 压缩效果
- 6. 项目优化
- - 6.1 书的部分拱起
  - 6.2 模型泛化能力
  - 6.3 模型压缩
  - 6.4 模型推广
三、项目演示
四、项目总结
五、项目地址
六、参考资料

前言

这个项目是笔者在《深度学习实践与应用》这门课的期末大作业，可以算得上是我的深度学习启蒙项目。当时这个项目花了我很多精力去完成的，最后也取得了不错的结果，收获满满。我第一次看到这个项目时，是有点恐惧的，担心自己无法完成这个项目，但当我真正上手去做这个项目的时候，才发现它没有想象中的那么难，我只需要把项目进行拆解，分解成若干个子任务，然后各个击破就可以了。所以有时候不要畏惧挑战，干就完事了哈哈哈。而做完这个项目之后，不瞒你说贼有成就感，也因为这个项目我对人工智能应用也更加感兴趣，未来我还会继续做更多有意思的项目，敬请期待吧！废话不多说，让我们直接开始吧！
友情提示：全文篇幅有点长，建议阅读时间30分钟，可以先收藏后慢慢食用哈

一、摘要

针对AI+教育行业的应用，以小学速算作业批改为原型，我们运用了OCR(光学字符识别)中经典的目标检测搭配文本识别来实现自动批改任务。首先，我们对数据进行人工标注，分为YOLO和CRNN的标记，分别为equation和题目字符内容；然后是目标检测和文本识别两个任务，分别使用的是训练好的YOLO和CRNN模型，得到了不错的识别效果，最终使用逆波兰式对用户的答案进行批改。其中，我们还对系统进行了优化，对于数据标记，我们利用了的图像处理的方法进行自动数据标注；对于用户上传的低质量图片（模糊/倾斜/含阴影），我们同样利用了一些图像处理的方法进行修正；对于YOLO模型参数过大的，我们使用了模型剪枝方法对其进行压缩。最后，我们的展望是能将模型适用于对存在拱起区域的图片，以及将模型剪枝搭配参数量化方法进一步压缩我们的模型，进一步提升模型的推理速度。

二、项目框架

三、项目步骤

本次项目可以分为以下几步：

数据处理
模型训练
模型推理
模型部署
模型压缩
项目优化

由于本次项目是应用为主，这里我就不会过多介绍具体的算法实现，而会偏向于介绍工程上的实现，包括数据集制作、模型训练心得、模型优化等等。

1. 数据处理

数据处理又可以分为数据收集、数据打标和数据预处理。下面我就来分别介绍下。

1.1 数据收集

有多少人工就有多少智能，深度学习项目成功与否很大程度是跟数据有关，所以一开始的重中之重就是收集数据。这里我们采取分工协作的方式来创建数据集，每个小组写两大本小学速算题目并将照片拍照收集起来，（这个过程蛮有意思，如果你发现某个大学生上课在做小学计算题，请不要嘲笑他哈哈）。最后我们通力合作收集了601张照片。

1.2 数据打标

数据收集好后，为了模型能训练准确识别算式的位置和内容，所以我们需要给图片都进行标注，这里我们用的是labelimg软件来进行数据打标，操作十分简单，只需要拖动鼠标划出矩形框，对于YOLO模型，标记统一设定为“equation”，如下图所示：

对于CRNN模型，标记设定为等式框中的字符串内容：

最后数据标注的结果会生成对应图片的XML文件，XML文件保存着对应图片中算式的位置坐标和标注结果信息。如下图所示：（关于XML文件的具体介绍，我后续会继续完善和补充，先占个位哈哈）

1.3 数据预处理

YOLO模型训练的数据就是整张照片，而CRNN模型训练的数据是一个个算式式子，因此我们利用脚本将YOLO模型训练数据进行处理。具体原理是根据YOLO数据打标获得的XML文件获取每张图片每个等式在图片的具体位置，然后利用CV2库将其裁剪为一个个小图片。核心代码如下：

# 裁剪，只适用标签文件为xml的情况，其他情况可相应地修改代码
for img_file in os.listdir(img_path):    # 遍历图片文件夹
    img_filename = os.path.join(img_path, img_file)  #将 图片路径与图片名进行拼接
    img_cv = cv2.imread(img_filename)  #读取图片

    img_name = (os.path.splitext(img_file)[0])  # 分割出图片名，如“000.png” 图片名为“000”
    xml_name = xml_path + '\\' + '%s.xml'%img_name  #利 用标签路径、图片名、xml后缀拼接出完整的标签路径名

    root = ET.parse(xml_name).getroot() # 利用ET读取xml文件
    for obj in root.iter('object'):  # 遍历所有目标框
        name = obj.find('name').text   # 获取目标框名称，即label名

        xmlbox = obj.find('bndbox')   # 找到框目标
        x0 = xmlbox.find('xmin').text  # 将框目标的四个顶点坐标取出
        y0 = xmlbox.find('ymin').text
        x1 = xmlbox.find('xmax').text
        y1 = xmlbox.find('ymax').text

        obj_img = img_cv[int(y0):int(y1), int(x0):int(x1)]  # cv2裁剪出目标框中的图片
        obj_img_name = obj_img_path + '\\' + '%s_%s'%(img_name, name) + '.jpg'  # 裁剪图片的名字
        
        cv2.imencode('.jpg', obj_img)[1].tofile(obj_img_name)  # 写入
                
print("Finished.")

最后获得CRNN训练数据长这样：

同时也生成对应的txt文件，txt文件里包含图片的名字和图片的算式内容

2. 模型训练

2.1 目标检测

我参考的代码是这个：yolo3-pytorch
（占个坑哈，后面会补上YOLO模型训练的具体过程，敬请期待）

2.1.1 模型介绍

这里我采用的目标检测算法是YOLO算法，由于YOLO算法采用了残差网络这种跳层连接的方式，性能完全比ResNet-152和ResNet-101深层网络更好，无论是准确率还是计算效率都更佳。相比于RCNN系列的目标检测方法，YOLO的识别物体位置精准性较差，召回率低。

2.1.2 模型训练

这里我用的是
(1) 数据集
样本总量共601张，预处理前的图片平均尺寸为(1452.0, 1815.6)，将样本划分为训练集:验证集:测试集=0.81:0.09:0.1
(2) 参数调整
输入图片放缩尺寸至416*416，通道数为3.
冻结阶段：epochs为20、batch_size为8、lr为1e-3。
解冻阶段：epochs为50，batch_size为4、lr为1e-4。
预测概率阈值为0.5（只有预测概率大于0.5的预测框才会保留）

2.1.3 训练结果

2.2 文本识别

我参考的代码是这个：使用pytorch训练自己的文字识别模型
关于文本识别的训练过程蛮有意思的可以分享下哈哈：当时我在使用大佬模型训练过程中一直出现问题，所以我通过B站蹲点联系上了大佬并加上了大佬的微信，大佬也很热情地帮我解决了问题。这告诉我们：办法总是比困难多的（~~B站真的是个学习的地方~~ ）
（再占个坑哈，到时候会补上CRNN模型训练的具体过程，敬请期待）

2.2.1 模型介绍

文本识别我采用的是CRNN模型，文字识别可以认为是对序列的预测方法，所以采用了对序列预测的RNN网络。通过CNN将图片的特征提取出来后采用RNN对序列进行预测，最后通过一个CTC的翻译层得到最终结果。简单来说就是CNN+RNN+CTC的结构。CRNN可以直接从序列标签（例如单词）学习，不需要详细的标注，虽然其对较大形变的手写字体的的识别准确率欠佳，但在速算识别的应用场景下的识别率较为稳定。

2.2.2 模型训练

(1) 数据集
样本总量共3284张，预处理前的图片平均尺寸为(266，65)，将样本划分为训练集:验证集:测试集=0.75:0.2:0.05
(2) 参数调整
输入图片放缩尺寸至262*32，通道数为3.
训练轮数epochs为30、batch_size为256、lr为1e-3。
Val_epoch为1，即每轮都验证一次。

2.2.3 训练结果

3. 模型推理

3.1 YOLO模型接口

我们根据以下两个YOLO接口，将YOLO模型嵌入我们的系统中。

yolo.detect_image(image)
GetBoxedPic(img, boxes)

接口1：yolo.detect_image(image)
目的：该接口用于调用YOLO3模型对图片进行预测并返回相应的预测结果信息。
输入：原图image(PIL的image对象)。
输出：等式检测图、所有等式框的坐标信息和对应的置信度。

其中，等式检测图是在输入的原图上进行了等式框的绘制；等式框的坐标信息将作为后面CRNN文本识别的输入；等式框的置信度将在模型性能分析报告中体现。
如下图所示，该Detecting函数用于实现将等式检测的部分展现至web上，首先，根据st.subheader函数显示副标题(Detected Image)，根据st.write函数提示用户等待信息。然后创建一个yolo对象，并输入用户上传的图像，调用接1(yolo.detect_image)进行等式检测并返回结果信息，与此同时，st.progress函数将会显示识别的进度条，防止用户错认为网站卡顿。

# 进行yolo检测，呈现在web页面上
def Detecting(image):
    st.subheader("Detected Image")
    st.write("Just a second ...")
    yolo = YOLO()
    my_bar = st.progress(0)
    img = image.copy()
    start1 = time.time()
    r_image, boxes, top_conf = yolo.detect_image(image)
    end1 = time.time()
    # print(boxes)
    for percent_complete in range(100):
        my_bar.progress(percent_complete + 1)
    st.image(r_image, use_column_width=True)  # 展现检测结果
    # st.download_button(label="Download image", data=r_image, file_name='large_df.jpg', mime="image/jpg")
    st.subheader("Detection outcome Analysis")
    plt.scatter(np.arange(len(top_conf)), top_conf)
    plt.xlabel('detected rectangle')
    plt.ylabel('score')
    st.pyplot()
    # st.balloons()
    pics = GetBoxesPic(img, boxes)
    return boxes, start1, end1
    # st.image(pic, use_column_width=True)

接口2：GetBoxedPic(img, boxes)
目的：该接口用于存储检测出的所有等式图像，作为CRNN文本识别的输入图像。输入：原图img(PIL的image对象)、等式框坐标信息boxes。
输出：将所有截取的等式框图像保存。

其中，等式框的坐标信息需要转为整型，分别为top, left, bottom, right四个整型，代表等式框的上(y)，左(x)，下(y)，右(x)坐标。在等式检测完毕后，返回(输出)了等式检测图像r_image、等式框坐标信息boxes、等式框检测置信度top_conf。我们使用st.image在web上显示出等式检测图像，并将等式框识别置信度以散点图的形式绘制在web上。除此之外，调用接口2用于存储boxes的信息，代码如下：

def get4pos(box, image):
    top, left, bottom, right = box
    top = max(0, np.floor(top).astype('int32'))
    left = max(0, np.floor(left).astype('int32'))
    bottom = min(image.size[1], np.floor(bottom).astype('int32'))
    right = min(image.size[0], np.floor(right).astype('int32'))
    return top, left, bottom, right

# 返回yolo框出的区域，并将其等式图片存入对应文件夹中
def GetBoxesPic(image, boxes):
    pics = []
    shutil.rmtree('./yolo3/tmp_img')  # 清空操作
    os.mkdir('./yolo3/tmp_img')
    for i in range(len(boxes)):
        top, left, bottom, right = get4pos(boxes[i], image)
        pic = image.crop((left - 15, top, right + 40, bottom))
        pic.save('./yolo3/tmp_img/pic' + str(i).rjust(3, '0') + '.jpg')
        pics.append(pic)
    return pics

3.2 CRNN模型接口

接口1：parse_opt配置函数
接口2：main函数

接口1：parse_opt配置函数
目的：对CRNN模型提供参数以及路径，包括模型权重、预测图片路径、批量大小、结果存放路径等。
输出：返回模型的配置内容的对象。代码如下图所示：

def parse_opt():
    parser = argparse.ArgumentParser(description='detect')
    parser.add_argument('--weights', type=str, default='../crnn_master/weights/CPU.pt', help='权重的路径')
    parser.add_argument('--source', type=str, default='../YOLO/yolo3/tmp_img/', help='要用来推理图片的路径，可以是一张图片，也可以是一个目录')
    parser.add_argument('--batch_size', type=int, default=32, help='批次大小')
    parser.add_argument('--chinese', type=str, default='../crnn_master/data/formula.txt', help='字符集保存路径')
    parser.add_argument('--imgH', type=int, default=32)
    parser.add_argument('--nc', type=int, default=1)
    parser.add_argument('--nh', type=int, default=256)
    opt = parser.parse_args()
    return opt

接口2：main函数
目的：使用CRNN模型对输入的一系列等式图像进行识别。
输入：接口1返回的配置对象。
输出：CRNN的识别结果，即所有等式图像对应的等式字符串。

def main(opt):
    chinese = get_chinese(opt.chinese)
    converter = StrLabelConverter(chinese)
    nclass = len(chinese) + 1

    crnn = CRNN(opt.imgH, opt.nc, nclass, opt.nh)
    crnn.load_state_dict(torch.load(opt.weights))
    log_load_model(opt.weights)

    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    #device = torch.device('cpu')
    log_device(device)
    crnn = crnn.to(device)
    equations = detect_(crnn, opt.source, device, converter)
    return equations

4. 模型部署

本次项目对训练好的YOLO3目标识别模型和CRNN文本检测模型，使用Streamlit轻量级机器学习部署工具呈现至web端，提供给用户良好的速算批改体验。这里简单介绍下Streamlit：它是第一个专门针对机器学习和数据科学团队的应用开发框架，它是开发自定义机器学习工具的最快的方法，它的目标是取代Flask在机器学习项目中的地位，可以帮助机器学习工程师快速开发用户交互工具。（下面是官网首页的介绍）

“Streamlit turns data scripts into shareable web apps in minutes.All in pure Python. No front‑end experience required.”

我们的模型部署主要分为以下五个方面：

上传图像
文本检测
文本识别
算式批改
结果反馈

4.1 上传图像

在使用streamlit工具进行部署的过程中，我们无需像部署Flask应用程序，编写html、css和js代码，只需要调用若干个streamlit库的API就可以实现不错的页面交互效果。

4.1.1 代码实现

首先，我们通过streamlit的set_option函数设置配置项的值，然后通过st.title在web端显示标题，并通过st.file_uploader进行文件的读取，返回至file_up变量，然后使用PIL库中的Image.open函数读取file_up中的图像数据。最后通过st.subheader显示副标题，以及将读取的图片展示在web端。

st.set_option('deprecation.showPyplotGlobalUse', False)
    st.title("Handwriting Recognition")
    st.write("")
    file_up = st.file_uploader("Upload an image", type="jpg")

    if file_up is not None:
        image = Image.open(file_up)
        st.subheader("Uploaded Image")
        st.image(image, use_column_width=True)

4.1.2 页面效果

以上传图像为例，我们实现了如下web交互页面，通过点击“Browse files”就可以上传一个本地文件，以供后续使用。在本项目中，根据用户需求上传的文件是图片文件，文件名以.jpg等后缀结尾。

4.2 文本检测

对于文本位置检测，我使用的是训练好的YOLO3模型。我将上传的图片进行等式位置检测后返回含有标记框的图片。首先，设置一个按钮(Detect)，点击该选项后将依次进行等式检测和文本识别，等式检测的过程在Detecting函数中进行了实现。

4.2.1 代码实现

首先通过st.subheader设置好标题后，便调用Detecting( )函数来实现文本位置的检测，相关代码如下：

 if st.button('Detecting'):
     st.subheader("Recognition")
     # 等式检测
     boxes, start1, end1 = Detecting(image)

接着利用yolo.detect_image(image)函数对图片进行预测并返回相应的预测结果信息，预测结果包括等式检测图、所有等式框的坐标信息以及对应的置信度。其中，等式检测图是在输入的原图上进行了等式框的绘制；等式框的坐标信息将作为后续的CRNN文本识别的输入；等式框的置信度将在模型性能分析报告中体现。相关代码如下：

def Detecting(image):
    st.subheader("Detected Image")
    st.write("Just a second ...")
    yolo = YOLO()
    my_bar = st.progress(0)
    img = image.copy()
    start1 = time.time()
    r_image, boxes, top_conf = yolo.detect_image(image)
    end1 = time.time()
    # print(boxes)
    for percent_complete in range(100):
        my_bar.progress(percent_complete + 1)
    st.image(r_image, use_column_width=True)  # 展现检测结果

最后利用GetBoxedPic(img, boxes)函数来存储检测出的所有等式图像，作为CRNN文本识别的输入图像。其中，等式框的坐标信息需要转为整型，分别为top, left, bottom, right四个整型，代表等式框的上(y)，左(x)，下(y)，右(x)坐标。相关代码如下：

# 返回yolo框出的区域，并将其等式图片存入对应文件夹中
def GetBoxesPic(image, boxes):
    pics = []
    shutil.rmtree('./yolo3/tmp_img')  # 清空操作
    os.mkdir('./yolo3/tmp_img')
    for i in range(len(boxes)):
        top, left, bottom, right = get4pos(boxes[i], image)
        pic = image.crop((left - 15, top, right + 40, bottom))
        pic.save('./yolo3/tmp_img/pic' + str(i).rjust(3, '0') + '.jpg')
        pics.append(pic)
    return pics

4.2.2 效果展示

4.3 文本识别

对于文本识别，我只需要需要调用CRNN的接口对之前文本检测后存储起来的图像进行预测，得到等式的文本信息。

4.3.1 代码实现

调用pasrse_oppt函数、main函数，分别是用于CRNN的模型配置、运行CRNN。

  if st.button('Detecting'):
       st.subheader("Recognition")
       # 等式检测
       boxes, start1, end1 = Detecting(image)
       # 文本识别
       start2 = time.time()
       opt = parse_opt()
       equations = main(opt)
       end2 = time.time()
       painting(equations, img, boxes)

首先是CRNN的模型配置，我是调用pasrse_oppt函数来进行模型的初始化配置，它将会对CRNN的模型权重、预测图片路径、批量大小、结果存放路径等参数进行配置，最后会返回模型的配置内容的对象。

def parse_opt():
    parser = argparse.ArgumentParser(description='detect')
    parser.add_argument('--weights', type=str, default='../crnn_master/weights/CPU.pt', help='权重的路径')
    parser.add_argument('--source', type=str, default='../YOLO/yolo3/tmp_img/', help='要用来推理图片的路径，可以是一张图片，也可以是一个目录')
    parser.add_argument('--batch_size', type=int, default=32, help='批次大小')
    parser.add_argument('--chinese', type=str, default='../crnn_master/data/formula.txt', help='字符集保存路径')
    parser.add_argument('--imgH', type=int, default=32)
    parser.add_argument('--nc', type=int, default=1)
    parser.add_argument('--nh', type=int, default=256)
    opt = parser.parse_args()
    return opt

接着使用使用CRNN模型的main()函数对输入的一系列等式图像进行识别。
它将会返回所有等式图像对应的等式字符串。

def main(opt):
    chinese = get_chinese(opt.chinese)
    converter = StrLabelConverter(chinese)
    nclass = len(chinese) + 1

    crnn = CRNN(opt.imgH, opt.nc, nclass, opt.nh)
    crnn.load_state_dict(torch.load(opt.weights))
    log_load_model(opt.weights)

    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    #device = torch.device('cpu')
    log_device(device)
    crnn = crnn.to(device)
    equations = detect_(crnn, opt.source, device, converter)
    return equations

4.3.2 效果展示

4.4 算式批改

对于速算批改，我只需将文本识别得到的等式文本信息作为输入，通过逆波兰式计算出等式的正确答案，判断是否相等即可。

4.4.1 代码实现

这里我调用outcome函数和painting函数，分别是来判断文本识别返回的结果是否正确，以及在网页上上绘制文本识别的结果。
首先是outcome函数，它将传入的式子以等号做切分，将等式左边的表达式利用逆波兰式计算出表达式的正确答案，再将其与等式右边的值进行比较，如果相等则返回1，如果不相等则返回0.

def outcome(exp):  # 传入表达式，返回判断结果
    input = exp.split('=')[0]
    output1 = float(exp.split('=')[1])
    output = cal(input)
    if (abs(output - output1) < 0.001):  # 计算正确
        return 1
    else:
        return 0

接着我利用利用painting函数对CRNN得到的等式字符串结果进行批改，并将结果呈现在web页面上。painting函数输入的是等式字符串equations，原始图像image，等式框坐标信息boxes。它将创建一个PIL的绘图对象，并设置字体类型和大小，接着遍历每一个等式字符串，调用outcome函数判定结果是否正确，然后利用对应的等式框坐标信息显示在原始图片上，然后将最终的图片呈现在网页上。

def painting(equations, image, boxes):
    st.subheader("Identification outcome")
    imgdraw = ImageDraw.ImageDraw(image)  # 创建一个绘图对象，传入img表示对img进行绘图操作
    font = ImageFont.truetype('Microsoft Sans Serif.ttf', image.size[1] // 50, encoding="utf-8")
    for i in range(len(boxes)):
        top, left, bottom, right = get4pos(boxes[i], image)
        if outcome(equations[i]):
            imgdraw.text(xy=(left, bottom + 3), text=equations[i] + '√', fill=(255, 0, 0), font=font)
        else:
            imgdraw.text(xy=(left, bottom + 3), text=equations[i] + '×', fill=(255, 0, 0),
                         font=font)  # 调用绘图对象中的text方法表示写入文字
    st.image(image, use_column_width=True)

4.4.1 效果展示

4.5 结果反馈

4.5.1 推理时间

可以看到时间上，文本识别时间比文本检测的时间要长一些，文本识别所花时间是15秒，说明我的CRNN模型推理速度优化上还存在提升空间，使得模型能更快地完成推理工作，这样才能给用户带来更好的使用体验。

4.5.2 用户答题情况

利用饼图将用户的答题情况进行可视化，这样就可以清晰地看到用户的答题情况，接下来可以继续优化，比如记录用户是哪一道题打错，并将其记录下来，用于后面的统计分析得到哪道题错误率最高，可以帮助老师更好辅导学生。

5. 模型压缩

随着现在模型越来越复杂，模型压缩也越来越受到重视，因为当模型的准确度达到一定程度后，如何用更少的硬件成本去做模型服务变得有意义。而常用的模型压缩方法有模型设计，知识蒸馏，网络剪枝，参数量化。在本次实验中我主要尝试的模型压缩方法是模型剪枝。
速算批改中的YOLO算法模型参数有240多MB，所以我采用NNI工具包中的模型剪枝的方法来对其进行压缩。NNI (Neural Network Intelligence) 是一个轻量但强大的工具包，帮助用户自动的进行特征工程，神经网络架构搜索，超参调优以及模型压缩。NNI 管理自动机器学习 (AutoML) 的 Experiment，调度运行由调优算法生成的 Trial 任务来找到最好的神经网络架构和/或超参，支持各种训练环境。
NNI 提供了一些支持细粒度权重剪枝和结构化的滤波器剪枝算法。细粒度剪枝通常会生成非结构化模型，这需要专门的硬件或软件来加速稀疏网络。滤波器剪枝一些剪枝算法使用 One-Shot 的方法，即根据重要性指标一次性剪枝权重（有必要对模型进行微调以补偿精度的损失）
而我采用的是L1Filter Pruner，这是一个 One-Shot Pruner，它修剪卷积层中的滤波器。除此之外，它还提供了依赖感知模式。

5.1 核心代码

这里对用cfg_list对剪枝模型进行配置，稀疏度设为0.6，即将会剪除 60%，同时设置剪枝类型为“conv2d”,即卷积层。除此之外，这里还加了个函数isinstance()来对模型是否能剪进行了判断

#模型压缩
    print(model)
    model.eval()
    dummy_input = torch.rand(8, 3, 320, 320)
    model(dummy_input)
    # Generate the config list for pruner
    # Filter the layers that may not be able to prune
    not_safe = not_safe_to_prune(model, dummy_input)
    cfg_list = []
    for name, module in model.named_modules():
        if name in not_safe:
            continue
        if isinstance(module, torch.nn.Conv2d):
            cfg_list.append({'op_types': ['Conv2d'], 'sparsity': 0.6, 'op_names': [name]})
    # Prune the model
    pruner = L1FilterPruner(model, cfg_list)
    pruner.compress()
    pruner.export_model('./compression/model.pth', './compression/mask.pth')
    pruner._unwrap_model()
    # Speedup the model
    ms = ModelSpeedup(model, dummy_input, './compression/mask.pth')
    ms.speedup_model()
    model(dummy_input)
    print(model)
    torch.save(model, './compression/YOLO.pth')

5.2 压缩效果

模型压缩前：

模型压缩后：

可以看到里面卷积层的参数已经被剪掉

最后我们再来看下模型最终压缩后的大小，为91.2MB，压缩了63%，效果还是不错的。

不过目前模型压缩还存在一些问题，压缩完后的模型还无法进行正常地推理，目前正在解决中，后面解决完后再完善哈。

6. 项目优化

目前项目已完成了预期的基本要求，但项目还有许多方面可以进行优化，下面就提一些可以优化的方向以供大家参考，有补充的也可以在评论区留言：

6.1 书的部分拱起

一般而言，新书在翻折的时候都会出现一定的拱起，这样会造成图片的局部扭曲。可以发现，由于用户在写速算题答案时，位置可能会存在不小的差异，导致如果存在局部扭曲的话，识别一整个题目+答案将会比较困难。对于这种情况，可以考虑将题目和答案由等号分隔开，建立在自动标记的基础之上，可以先对其自动打标，然后放大标记框，确保整个等式完全包含在框中，再通过像素分布找出等号的位置，从而将题目与答案分隔开来了。
当两者分隔开来以后，只需使用一个较为简单的模型就能轻松识别题目了，这是由于题目属于印刷体，就算存在一定的扭曲，也能达到较高的准确率；对于答案而言，由于答案占的区域较小，几乎不存在较大的倾斜，因此在CRNN下也依旧能得到很高的准确率。由此，便化解了书部分拱起带来的一系列困扰

6.2 模型泛化能力

当我们使用不清晰的图片时，可以看到推理的结果不是很理想，主要体现在等式右边的数字推理效果，等式左侧的推理效果是相当不错。不过这也是可以理解的，因为当时进行模型训练时，训练样本中是印刷体的数字和字符占大多数，其中印刷体数字样本是手写体数字样本的两倍，这才导致模型推理中手写体数字推理效果不佳。针对这个问题，如果想要在不额外增加数据集下，提升模型的性能，那么接下来的改进方向有：
(1) 采用图像增广方法，在不额外增加其他数据集下增加数据样本。可以尝试采用裁剪，翻转、颜色变化、灰度图等方法扩充数据样本。
(2) 单独把手写的那部分裁剪出来，当成训练集一起训练。具体做法：把手写的数字，裁剪下来，复制两份，最后3份拼接再一起，例如：裁剪出来123，最后拼接后是123123123。这样就可以保持和原图一样的长度，保证模型训练的效果达到最佳。

6.3 模型压缩

模型压缩这里我们只采用了模型剪枝的方法来对YOLO进行剪枝，还没对CRNN进行裁剪。除此之外，YOLO模型的压缩也还有进一步压缩的空间。一般来说，模型剪枝方法会与其他模型压缩方法进行搭配使用，所以接下来我们将首先尝试模型量化的方式，并将其与模型剪枝搭配使用来看看模型最终的压缩效果。同时我们还会尝试知识蒸馏以及模型设计等常用的模型方法来横向对比不同方法的压缩效果。待到对模型压缩足够了解后，我们会尝试设计自己模型压缩算法来针对性地对我们自己的模型进行压缩。

6.4 模型推广

手写体
本次实验中计算式子都是打印体，比较规整，识别效果也相当不错。但如果都用手写体的话，效果会不是很理想，所以接下来我们会收集大量的手写体数据来对我们的模型进行训练，使得它在识别手写体数字以及公式时也能得到不错的结果。
多张图片
当前进行速算批改时每次只能上传一张图片，但真实应用场景用户不可能一张一张照片的上传，而是多张照片，甚至是直接上传整个文档。所以接下来我们会继续完善我们的项目使得它能满足用户同时上传多张照片或者一个文档的需求，快速相应并对结果进行反馈。
高级运算
当前我们的模型只能识别简单的加减乘除四则运算，但这只能满足小学生批改作业的需求，无法满足中学生甚至大学生们的需求，所以接下来我们会对项目进行完善使得它可以处理线性代数的矩阵运算和积分运算以及微分运算。

三、项目演示

四、项目总结

本次项目收获颇多，要用一个词语来形容的话就是惊喜。首先是Streamlit，一开始我还在担心模型训练出来后如何将结果展示出来，毕竟要做一个网页来对模型进行展示需要花费相当多的时间，而Streamlit的到来可谓解决了我这个后顾之忧，它是第一个专门针对机器学习和数据科学团队的应用开发框架，它是开发自定义机器学习工具的最快的方法，可以帮助机器学习工程师快速开发用户交互工具。有了Streamlit我才能在本次项目中能将模型结果呈现给用户看。

其次我惊喜的是我居然完成了这个当初看上去很有挑战性的任务，从模型的训练、模型部署、模型压缩这整个流程我完整体验了一遍，也初步掌握了产品开发的整个流程。这在项目开始之前是不敢相信，但在我不断地努力中一点点地攻克完成，最终得到现在不错的结果，所以还是蛮有成就感的。在这次项目中，我从一个萌新小白逐渐初窥深度学习的门道，在一点点完成项目过程中去快速学习深度学习相关的知识：如何调参数使得训练效果更理想，如何让模型的推理速度加快等等。直到现在我还记得当时我在计软楼同时开几台电脑，用控制变量法来进行调参只为找到最佳的训练参数的场景。
这时我才真正体会到学习新知识的最好方法不是单纯的授课方式，而是像这样项目导向型的方式，尤其是深度学习这需要大量实践领域。当然这也有一定的弊端，就是在完成项目的过程中我可能不太关注技术的细节，而是专注于实现最后的功能。但是现在的我在完成项目过程中对其有了更浓厚的兴趣，所以本学期结束后我会继续专注研究其背后技术细节，提升自己对深度学习的理解。

最后说下这个项目，虽然现在已经完成了我初步设想的基本功能，但还是有许多地方可以改进优化，首先是模型的推理速度可以提升下，毕竟这个项目是面向用户的，结果反馈所花的时间太久会影响用户的体验，所以模型的相应速度必须提升。在本次项目中虽然我尝试了模型剪枝的方法来对模型进行压缩，模型是压缩成功了，但我对压缩过后的模型进行调用时仍会出现一些问题，现在还没有解决，所以项目中就没有展现最终压缩后模型的推理速度。但是在研究模型压缩过程中我也发现了些问题：首先是模型剪枝本身是没有剪层的，它只是修剪参数，所以当网络比较深的时候，他的压缩效果可能不会很好，但我似乎也没有看到很多从模型深度来进行压缩的方法。还有就是这里一般来说模型剪枝和模型量化来搭配使用会比较好，所以接下来我会进一步研究模型压缩这方面的内容，将模型进一步压缩。其次是模型的精度还需要提升，毕竟他的在推理模糊或者有阴影的图片时效果还是不理想，除此之外，我之后还打算对项目进行优化，比如：每次用户提交一些照片时，我就重新对模型进行训练，使得模型能在与用户进行交互时不断更新迭代使得模型性能进一步提升。

五、项目地址

如果觉得不错的话，就给我的项目star一下吧！！！
【Github】Quick-Calculation-Correction
【百度网盘】Quick-Calculation-Correction 密码: 37o4

六、参考资料

[1] https://zhuanlan.zhihu.com/p/137086882
[2] https://blog.csdn.net/leviopku/article/details/82660381
[3] https://github.com/zhijiezhong/crnn/tree/master
[4] https://github.com/bubbliiiing/yolo3-pytorch
[5] Redmon J, Farhadi A. Yolov3: An incremental improvement[J]. arXiv preprint arXiv:1804.02767, 2018.
[6] Otsu, N. A threshold selection method from gray-level histogram[J]. IEEE Transactions on Systems, Man and Cybernetics, 1979 (9): 62-66.
[7] Canny J. A computational approach to edge detection[J]. IEEE Transactions on pattern analysis and machine intelligence, 1986 (6): 679-698.
[8] Sobel I. History and definition of the sobel operator[J]. Retrieved from the World Wide Web, 2014, 1505.
[9] Shi B, Bai X, Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2016, 39(11): 2298-2304.
[10] 视频转GIF工具

你可能感兴趣的:(项目,深度学习,人工智能,深度学习,人工智能,计算机视觉)

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
快乐春节 Lilywo
春节肯定是大多小朋友都喜欢的节日吧，因为春节的娱乐项目可多啦，下面我就带大家去看一看某些娱乐项目吧！第一件肯定就是穿新衣啦！因为辞旧迎新，一年过去了，要迎来新的一年。所以过年穿新衣也是一项习俗吧；第二件，收压岁钱。压岁钱大家都知道吧，过年的时候，小朋友们肯定都会受到大人们的压岁钱吧，对啦！大家知道为什么亲人们会给我们压岁钱呢？答案是因为亲人们希望我们在新的一年里可以健健康康、平平安安，幸福福的生活
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
android 更改窗口的层次,浮窗开发之窗口层级 Ms.Bu android 更改窗口的层次
最近在项目中遇到了这样的需求：需要在特定的其他应用之上悬浮自己的UI交互(拖动、输入等复杂的UI交互)，和九游的浮窗类似，不过我们的比九游的体验更好，我们越过了很多授权的限制。浮窗效果很多人都知道如何去实现一个简单的浮窗，但是却很少有人去深入的研究背后的流程机制，由于项目中浮窗交互比较复杂，遇到了些坑查看了很多资料，故总结浮窗涉及到的知识点：窗口层级关系(浮窗是如何“浮”的)？浮窗有哪些限制，如何
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。