Mirrracle

Python下实现Tesseract OCR训练字符库（OpenCV-python边缘检测代替jTessBoxEditor手动矫正）

Python 下实现 Tesseract-OCR 训练字符库
（OpenCV 边缘检测代替 jTessBoxEditor 手动矫正）

作者：殷越

一、概述
二、环境搭建
- - - 1. 下载 Tesseract OCR：[https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe](https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe)
    - 2. 下载 opencv-python 和 pytesseract（可直接在cmd中下载）
三、生成数据集和训练所需文件
- - - 1. 导入需要的包，以及自己写的一个简单的data_agumentation.py
    - 2. 看一下生成数据集函数的形参和函数内部我预设的参数
    - 3. 生成 font_properties.txt 文件
    - 4. 生成.tif图像和.box文件 (写字符、扩充数据集、检测边缘、获取最小外接矩形框)
    - 5. 生成train.bat批处理文件
四、数据集扩充
五、训练
六、使用自己训练的字符库进行识别

一、概述

本文详细介绍在Python下实现Tesseract-OCR训练字符库的方法。如果数据集较大，使用jTessBoxEditor对字符进行一一矫正工作量巨大，因此本文讲解如何利用opencv-python对字符进行边缘检测并自动获取最小矩形框坐标，最终生成.box文件，从而完全脱离jTessBoxEditor。

二、环境搭建

1. 下载 Tesseract OCR：https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe

2. 下载 opencv-python 和 pytesseract（可直接在cmd中下载）

pip install opencv-python
pip install pytesseract

三、生成数据集和训练所需文件

1. 导入需要的包，以及自己写的一个简单的data_agumentation.py

import os
import cv2
import numpy as np
from data_augmentation import *

2. 看一下生成数据集函数的形参和函数内部我预设的参数

def dataset_producing(path, text_list, lang, fontname, exp_num=0, italic=0, bold=0, fixed=0, serif=0, fraktur=0):
    # 一、预设参数
    space = 80  # 一个字符所占区域大小
    row = 64  # 数据增强后排列组合的总数
    img_size = (row * space, len(text_list) * space)  # 画布大小(h, w)
    img = np.zeros(img_size, np.uint8)  # (h, w)
    img.fill(255)  # 填充白色背景
    x_box = 0  # 左上角坐标 x
    y_box = 0  # 左上角坐标 y

3. 生成 font_properties.txt 文件

with open(os.path.join(path, 'font_properties.txt'), 'w') as fp:
	fp.write('%s %d %d %d %d %d'
	% (fontname, italic, bold, fixed, serif, fraktur))

文件内的格式：< fontname > < italic > < bold > < fixed > < serif > < fraktur >
此处参考：https://blog.csdn.net/qq_30534935/article/details/83794638

fontname：字体名称
italic：斜体（0/1）
bold：粗体（0/1）
fixed：默认字体（0/1）
serif：衬线字体（0/1）
fraktur：德文黑体（0/1）

4. 生成.tif图像和.box文件 (写字符、扩充数据集、检测边缘、获取最小外接矩形框)

这里我们直接生成一张大图，并用opencv在图中依次写字符并进行增强，最后存储为.tif。当然如果是识别手写字符的话，可以掠过下述代码的1和2，直接从3开始。

下面我对每一个步骤做一个详细的解释（由于是生成一张很大的图像，有多行字符，所以这一部分代码在for循环中，以下先对for循环中的代码片段进行逐个的解释，这一块的完整代码在这一部分的最后）

1）获取字体大小和基准线

text_size = cv2.getTextSize(text=text_list[j], fontFace=cv2.FONT_HERSHEY_SIMPLEX,
							fontScale=get_scale(i) / 22, thickness=get_thickness(i))
w, h, baseline = text_size[0][0], text_size[0][1], text_size[1]

因为是一行一行地写字符（第 i 行，第 j 列），所以先在写下字符之前通过 getTextSize() 获取到当前正准备写的字符的 w, h, baseline，以供后面计算每个字符在每个小格子里居中时的起始位置。

getTextSize()中各参数的定义可参考这篇博客：https://blog.csdn.net/u010970514/article/details/84075776

我简单手画了一个图，方便理解 getTextSize() 获取的 baseline 的含义（但真正意义上的baseline指的是第二条红线）：

Python下实现Tesseract OCR训练字符库（OpenCV-python边缘检测代替jTessBoxEditor手动矫正）_第1张图片

2）写字符

top_left = (x_box, y_box)  # 方框左上角绝对坐标
subImg = img[top_left[1]:top_left[1] + space, top_left[0]:top_left[0] + space]  # 获取方框子图
text_org = (int((space - w) / 2), int((space - baseline + h) / 2))  # 字符转成左下角相对坐标并居中
cv2.putText(img=subImg, text=text_list[j], org=text_org, fontFace=cv2.FONT_HERSHEY_SIMPLEX,
            fontScale=get_scale(i) / 22, color=(0, 0, 0), thickness=get_thickness(i))

我们将整张图看成一个个的小方格，并将每个方格作为一个子图，然后依次在每个子图里进行一系列操作：

先获取每个方格左上角的坐标 top_left
获取子图 subImg 以便直接对每张子图进行操作
计算居中后的字符相对于每个 subImg 的坐标 text_org，转成左下角坐标（因为 putText() 函数中的 org 为字符左下角的坐标。
下图中红色的 baseline 指的是真正意义上的 baseline，而黄色的 baseline 指的是 opencv 中 getTextSize() 函数获取到的 baseline 这个值。对于英文字母而言，所有大写字母和绝大部分小写字母都在 baseline 之上（如下图的 ‘b’ ），而少数小写字母会延伸到baseline之下（如下图的 ‘g’ ）。但 getTextSize() 取到的 height 并不包含 baseline 之下的部分，因此如果要使每个字符都居中，则分别对两类字符进行不同的居中操作即可。但为了使生成的图像和我们平时看到的文字排列相同（以baseline为基准写的字），我们选择以延伸到baseline之下的这类字母为标准来居中，居中后的字符左下角坐标计算过程如下图。

（图中字符的边框并不是其最小外接矩形，而是通过 getTextSize() 获取到的，并没有紧贴字符，由于此时还没有开始写字符，因此起始坐标只能通过这种方式获得）

计算出可以使字符居中的左下角起始坐标后，使用 putText() 函数对 subImg 进行写字符的操作，org=text_org

3）均值滤波

ksize = (get_ksize(i))
cv2.blur(src=subImg, ksize=ksize, dst=subImg)

使用 blur() 函数对每张 subImg 进行均值滤波（当然也可以选择其它类型的滤波，并排列组合）。ksize 是核的大小，我在另一个文件 data_augmentation.py 中写了一个简陋的 get_ksize() 函数，根据是第几行来选取不同的 ksize，这里大家可以自己设计。

4）图像二值化

ret, binary = cv2.threshold(src=subImg, thresh=254, maxval=255, type=cv2.THRESH_BINARY_INV)

由于滤波之后，字符边缘会往外扩散，所以如果直接用 getTextSize() 得到的 w, h, baseline 和 2) 中算到的起始坐标 text_org 来定位并框出字符的话，box的位置必然是不准确的：

且经过实验发现，即使不进行滤波，getTextSize() 得到的 w, h, baseline本身也有一定偏差，框出的框并不是字符的（不旋转的）最小外接矩形：

因此，为了找到字符轮廓并画出最小外接矩形，我们需要先通过图像二值化来凸显字符的轮廓：

5）寻找字符的边缘轮廓

contours, hierarchy = cv2.findContours(image=binary, mode=cv2.RETR_EXTERNAL, method=cv2.CHAIN_APPROX_NONE)

binary 是 4) 中得到的二值化图像，**返回值 contours 是 n 组轮廓坐标（ n 指该字符由 n 个连通的部分组成，对于大多数英文字母，n=1，对于 i 和 j，n=2）

6）寻找字符的最小外接矩形

方法一（使用 boundingRect() 函数来找到最小外接矩形）(不推荐)：

bounding_boxes = [cv2.boundingRect(cnt) for cnt in contours]  # x, y 为矩形左上角坐标
if len(bounding_boxes) > 1:  # 组合两个不连通的图
    x0, y0, w0, h0 = bounding_boxes[0][0], bounding_boxes[0][1], bounding_boxes[0][2], bounding_boxes[0][3]
    x1, y1, w1, h1 = bounding_boxes[1][0], bounding_boxes[1][1], bounding_boxes[1][2], bounding_boxes[1][3]
    bounding_boxes = [(min(x0, x1), min(y0, y1), max(w0, w1), max(y1 - y0 + h1, y0 - y1 + h0))]
xmin, ymin, w, h = bounding_boxes[0][0], bounding_boxes[0][1], bounding_boxes[0][2], bounding_boxes[0][3]
xmax, ymax = xmin + w, ymin + h

使用 boundingRect() 函数获取最小外接矩形的左上角坐标 x, y 以及 w, h。
如果获取的 bounding box 长度大于1（即有不止一组轮廓最小外接矩形，如 i 和 j ），则我们需要将其组合。计算过程如下，其中 h 的计算，由于不确定两组坐标的先后，所以选取最大的。（此处只考虑了由两个不连通的图组成的情况，因为英文字母中，一个字母最多也只有两个不连通的图，而数字 0-9 更是不存在这种情况，因此 > 2 的情况暂时不考虑）

若一个字符由2个以上的不连通的部分组成，则上述方法较为麻烦，因此，我决定不用 boudingRect() 函数。

方法二（寻找xmin, xmax, ymin, ymax）（推荐使用）：

pts_x = []  # 存储所有的轮廓横坐标
pts_y = []  # 存储所有的轮廓纵坐标
for part in contours:
    for pts in range(len(part)):
        pts_x.append(part[pts][0][0])
        pts_y.append(part[pts][0][1])
xmin, ymin, xmax, ymax = min(pts_x), min(pts_y), max(pts_x), max(pts_y)  # 找到最小外接矩形

该方法直接遍历在一个subImg中找到的所有轮廓坐标，并找出横纵坐标分别的最小和最大值，即可确定最小外接矩形。

7）生成.box文件

xmin_new, xmax_new = x_box + xmin, x_box + xmax  # 将子图坐标转成相对于原图的坐标
ymin_new, ymax_new = img_size[0] - y_box - ymax, img_size[0] - y_box - ymin  # 转换成以左下角为原点的坐标系的坐标 (.box文件中以左下角为原点)
fp.write('%s %d %d %d %d %d'
         % (text_list[j], xmin_new, ymin_new, xmax_new, ymax_new, 0))  # 将(字符、x、y-h、x+w、y、页码)写入txt文件
fp.write('\n')

这个步骤主要在做一些坐标转换。由于我们之前的操作都是以左上角为原点的，而 .box 文件中的坐标是以左下角为原点的，因此需要做一个转换。

首先看一下 .box 文件的格式：
坐标转换计算：

8）将图像存储为.tif

tif = font + '.tif'
cv2.imwrite(filename=os.path.join(path, tif), img=img)
print('%s.tif generated successfully!' % font)

5. 生成train.bat批处理文件

这一部分的问题还未解决，问题写在最后两行的注释里了，如果有人知道原因和解决方法，希望可以与我交流。

train_bat = 'echo Run Tesseract for Training.. \r' \
            'tesseract.exe %s.tif %s nobatch box.train \r\n' \
            'echo Compute the Character Set.. \r' \
            'unicharset_extractor.exe %s.box \r' \
            'mftraining -F font_properties.txt -U unicharset -O %s.unicharset %s.tr \r\n' \
            'echo Clustering.. \r' \
            'cntraining.exe %s.tr \r\n' \
            'echo Rename Files.. \r' \
            'rename normproto %s.normproto \r' \
            'rename inttemp %s.inttemp \r' \
            'rename pffmtable %s.pffmtable \r' \
            'rename shapetable %s.shapetable \r\n' \
            'echo Create Tessdata.. \r' \
            'combine_tessdata.exe %s. \r\n' \
            'echo. & pause' \
            % (font, font, font, lang, font, font, lang, lang, lang, lang, lang)

with open(os.path.join(path, 'train.bat'), 'w') as fp:
    fp.write(train_bat)
print('train.bat generated successfully!')
# 上述生成的.bat文件无法直接执行、具体原因尚不明确，需要将文件以编辑的形式打开、复制下来，粘贴到新建的txt文件中，再更改后缀为.bat
# 已经过多次排查，只有上述方法可以得到可以执行的批处理文件，即使文件内容由复制粘贴得来完全一样，文件大小相差14kb，原因未知

第三部分的完整代码：

import os
import cv2
import numpy as np
from data_augmentation import *


def dataset_producing(path, text_list, lang, fontname, exp_num=0, italic=0, bold=0, fixed=0, serif=0, fraktur=0):
    # 一、预设参数
    space = 80  # 一个字符所占区域大小
    row = 64  # 数据增强后排列组合的总数
    img_size = (row * space, len(text_list) * space)  # 画布大小(h, w)
    img = np.zeros(img_size, np.uint8)  # (h, w)
    img.fill(255)  # 填充白色背景
    x_box = 0  # 左上角x
    y_box = 0  # 左上角y

    # 二、生成font_properties.txt文件
    with open(os.path.join(path, 'font_properties.txt'), 'w') as fp:
        fp.write('%s %d %d %d %d %d' % (fontname, italic, bold, fixed, serif, fraktur))
    print('font_properties.txt generated successfully!')

    # 三、生成.tif图像和.box文件 (写字符、检测边缘、获取最小外接矩形框)
    font = '%s.%s.exp%d' % (lang, fontname, exp_num)
    with open(os.path.join(path, '%s.box' % font), 'w') as fp:
        for i in range(int(img_size[0] / space)):  # 写第i行
            for j in range(int(img_size[1] / space)):  # 写第j列

                # 1、获取字体大小和基准线
                text_size = cv2.getTextSize(text=text_list[j], fontFace=cv2.FONT_HERSHEY_SIMPLEX,
                                            fontScale=get_scale(i) / 22, thickness=get_thickness(i))
                w, h, baseline = text_size[0][0], text_size[0][1], text_size[1]

                # 2、写字符
                top_left = (x_box, y_box)  # 方框左上角绝对坐标
                subImg = img[top_left[1]:top_left[1] + space, top_left[0]:top_left[0] + space]  # 获取方框子图
                text_org = (int((space - w) / 2), int((space - baseline + h) / 2))  # 字符转成左下角相对坐标并居中
                cv2.putText(img=subImg, text=text_list[j], org=text_org, fontFace=cv2.FONT_HERSHEY_SIMPLEX,
                            fontScale=get_scale(i) / 22, color=(0, 0, 0), thickness=get_thickness(i))

                # 3、均值滤波 (对子图进行滤波操作时需要加上dst，否则不对原图产生改变)
                ksize = (get_ksize(i))
                cv2.blur(src=subImg, ksize=ksize, dst=subImg)

                # 4、图像二值化
                ret, binary = cv2.threshold(src=subImg, thresh=254, maxval=255, type=cv2.THRESH_BINARY_INV)

                # 5、寻找字符边缘轮廓
                contours, hierarchy = cv2.findContours(image=binary, mode=cv2.RETR_EXTERNAL, method=cv2.CHAIN_APPROX_NONE)

                # 6、寻找字符最小外接矩形

                # # 方法一：
                # bounding_boxes = [cv2.boundingRect(cnt) for cnt in contours]  # x, y 为矩形左上角坐标
                # if len(bounding_boxes) > 1:  # 组合两个不连通的图
                #     x0, y0, w0, h0 = bounding_boxes[0][0], bounding_boxes[0][1], bounding_boxes[0][2], bounding_boxes[0][3]
                #     x1, y1, w1, h1 = bounding_boxes[1][0], bounding_boxes[1][1], bounding_boxes[1][2], bounding_boxes[1][3]
                #     bounding_boxes = [(min(x0, x1), min(y0, y1), max(w0, w1), max(y1 - y0 + h1, y0 - y1 + h0))]
                # xmin, ymin, w, h = bounding_boxes[0][0], bounding_boxes[0][1], bounding_boxes[0][2], bounding_boxes[0][3]
                # xmax, ymax = xmin + w, ymin + h

                # 方法二：
                pts_x = []  # 存储所有的轮廓横坐标
                pts_y = []  # 存储所有的轮廓纵坐标
                for part in contours:
                    for pts in range(len(part)):
                        pts_x.append(part[pts][0][0])
                        pts_y.append(part[pts][0][1])
                xmin, ymin, xmax, ymax = min(pts_x), min(pts_y), max(pts_x), max(pts_y)  # 找到最小外接矩形

                # # 画出最小外接矩形 (测试时可用)
                # cv2.rectangle(img=subImg, pt1=(xmin, ymin), pt2=(xmax, ymax), color=(0, 255, 0), thickness=1)

                # 7、生成box文件
                xmin_new, xmax_new = x_box + xmin, x_box + xmax  # 将子图坐标转成相对于原图的坐标
                ymin_new, ymax_new = img_size[0] - y_box - ymax, img_size[0] - y_box - ymin  # 转换成以左下角为原点的坐标系的坐标 (.box文件中以左下角为原点)
                fp.write('%s %d %d %d %d %d'
                         % (text_list[j], xmin_new, ymin_new, xmax_new, ymax_new, 0))  # 将(字符、x、y-h、x+w、y、页码)写入txt文件
                fp.write('\n')

                x_box += space  # 写下一列
            x_box = 0  # x返回第一列
            y_box += space  # 写下一行

    print('%s.box generated successfully!' % font)

    # # 画网格(测试居中时使用)
    # y = 0
    # for i in range(int(img_size[0] / space)):  # 画横线
    #     cv2.line(img=img, pt1=(0, y), pt2=(img_size[1], y), color=(0, 0, 0), thickness=1)  # 画网格
    #     y += space
    # x = 0
    # for i in range(int(img_size[1] / space)):  # 画竖线
    #     cv2.line(img=img, pt1=(x, 0), pt2=(x, img_size[0]), color=(0, 0, 0), thickness=1)  # 画网格
    #     x += space

    # 8、将图像存储为.tif以供训练
    tif = font + '.tif'
    cv2.imwrite(filename=os.path.join(path, tif), img=img)
    print('%s.tif generated successfully!' % font)

    # 四、生成train.bat批处理文件
    train_bat = 'echo Run Tesseract for Training.. \r' \
                'tesseract.exe %s.tif %s nobatch box.train \r\n' \
                'echo Compute the Character Set.. \r' \
                'unicharset_extractor.exe %s.box \r' \
                'mftraining -F font_properties.txt -U unicharset -O %s.unicharset %s.tr \r\n' \
                'echo Clustering.. \r' \
                'cntraining.exe %s.tr \r\n' \
                'echo Rename Files.. \r' \
                'rename normproto %s.normproto \r' \
                'rename inttemp %s.inttemp \r' \
                'rename pffmtable %s.pffmtable \r' \
                'rename shapetable %s.shapetable \r\n' \
                'echo Create Tessdata.. \r' \
                'combine_tessdata.exe %s. \r\n' \
                'echo. & pause' \
                % (font, font, font, lang, font, font, lang, lang, lang, lang, lang)

    with open(os.path.join(path, 'train.bat'), 'w') as fp:
        fp.write(train_bat)
    print('train.bat generated successfully!')
    # 上述生成的.bat文件无法直接执行、具体原因尚不明确，需要将文件以编辑的形式打开、复制下来，粘贴到新建的txt文件中，再更改后缀为.bat
    # 已经过多次排查，只有上述方法可以得到可以执行的批处理文件，即使文件内容由复制粘贴得来完全一样，文件大小相差14kb，原因未知

画上网格和最小外接矩形后生成的图像大概是这样的（生成用于训练的图像时请把网格和矩形框去掉）：

去掉网格线和最小外接矩形框，重新生成图像后，为了验证 .box 文件的正确性，也可在jTessBoxEditor 中打开该 tif 图像进行查看：

四、数据集扩充

这就是我前面提到的写的一个简单的 data_agmentation.py，为了快速实现走通流程，我还没有使用很多的图像增强方式，之后会完善。目前里面暂时只包含了字体缩放、字体粗细、均值滤波。其中，字体缩放和字体粗细直接传到 opencv 的 putText() 函数的 fontScale 和 thickness 里，均值滤波则是 blur() 函数。因为写得比较简陋，而且大家可以根据自己的想法去设置这些函数，然后排列组合，所以我就不暂时展示我写的了。

五、训练

接着第三步的生成了 train.bat 往后讲（注意最后两行我写的注释，需要重新新建 txt 文件，复制并粘贴上生成的 bat 文件中的代码，再将文件后缀改为 .bat，点开就执行了）。执行完之后，找到 .traineddata 文件，把它放入 Tesseract-OCR 文件夹下的 tessdata 中即可。

六、使用自己训练的字符库进行识别

把待测的图像放入一个空文件下（如我代码中的 testing_pics 文件夹），即会遍历文件夹下的文件进行逐个识别。language 的值就是第五步中生成的 .traineddata 文件的名字。

import os
import pytesseract
from PIL import Image

# 将待测图像放入项目文件下的testing_pics文件下，进行依次测试
pics_path = 'testing_pics'
language = 'num'


def test(path, lang=None):
    for img in os.listdir(pics_path):
        name = img
        img = Image.open(os.path.join(pics_path, img))

        text = pytesseract.image_to_string(image=img, lang=lang)
        print('testing result for', name, ':')
        print(text)


if __name__ == '__main__':
    test(path=pics_path, lang=language)

以上就是整个生成数据集、训练、测试的流程了，整个流程花了将近两天时间做完并完善到目前这一步。博客写了整整一天，写博客真的非常不容易，转载请注明出处，欢迎交流讨论。

——殷越（2021/12/19）

Python第六章08：元组操作练习题苹果.Python.八宝粥 python 开发语言
#元组定义操作练习题"""定义一个元组，内容是：('周杰伦',11,['football','music'])，记录一个学生的信息（姓名、年龄、爱好）请通元组（tuple）的功能，对其进行如下操作：1.查询其年龄所在的下标位置2.查询学生的姓名3.删除学生爱好中的football4.增加爱好：coding"""my_tuple=('周杰伦',11,['football','music'])#1.查
Python第六章07：元组的定义和操作苹果.Python.八宝粥 python 前端开发语言
#tuple元组的定义和操作#tuple元组定义用小括号：(1,2,3,4,5),可以是不同类型元素#给变量定义元组时，写括号不写tuple：a=(1,2,3,4,5)#变量=（）变量=tuple（）空元组变量#tuple元组定义完成后，不可以修改，但是，如果元组中嵌套了一个列表时，元组中列表的内容可以修改#封装数据后，不希望被篡改数据，就使用元组tuple#1.定义一个元组t1=("halibo
利用Python爬虫获取Shopee（虾皮）商品详情：实战指南小爬虫程序猿 python 爬虫开发语言
在跨境电商领域，Shopee（虾皮）作为东南亚及台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，获取Shopee商品详情都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Python爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Python爬虫获取Shopee商品详情，并提供完整的代码示例。一、为
在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证 ku_code_ku 机器学习 macos 推荐算法推荐系统
让推荐算法在AppleSilicon上全速运行概述作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在AppleSilicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。关键版本说明（2024年验证）组件推荐版本注意事项Python3.10.x向下兼容至3.7，但3.1
数据库数值函数详解 web安全工具库数据库 oracle jvm
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474数值函数是数据库中用于处理数值数据的函数，可以用于执行各种数学运算、统计计算等。数值函数在数据分析及处理时非常重要，能够帮助我们进行数据的聚合、计算和转换。在本篇博客中，我们将详细介绍常用的数据库数值函数，并通过Python和SQLite进行示例，帮助您理解和应用这些函数。1.数值函数的基本概念数值函数是用于
Python中Requests的Cookies的简单使用北条苒茗殇 python 开发语言 Requests
概述Python的Requests库中有一个cookies，是用于管理HTTPCookie的工具，可以像字典一样操作Cookie，支持自动处理作用域（域名、路径）和持久化，cookies是一个RequestsCookieJar的类型。一、概念1.作用自动存储服务器返回的Cookie根据请求域名和路径进行自动发送匹配的Cookie支持手动添加、修改、删除Cookie2.RequestsCookieJ
Pytest基础使用北条苒茗殇 pytest
概述Pytest是Python里的一个强大的测试框架，灵活易用，可以进行功能，自动化测试使用，可以与Requests，Selenium等进行结合使用，同时可以生成Html的报告。一、Pytest的基本使用在未指定Pytest的配置文件时，会对以下文件进行执行：test_*.py，如：test_1.py*_test.py，如：1_test.py会对以下的类和函数进行执行：类：以Test_开头的类，如
Visual Studio Code官网下载地址及使用技巧（含常用的拓展插件推荐） ITCTCSDN vscode ide 编辑器
VisualStudioCode（简称“VSCode”）是Microsoft于2015年4月发布的可运行于MacOS、Windows和Linux之上的跨平台源代码编辑器，它具有对JavaScript，TypeScript和Node.js的内置支持，并具有丰富的其他语言（例如C++，C＃，Java，Python，PHP，Go）和运行时（例如.NET和Unity）扩展的生态系统。VisualStudi
python中rmdir和rmtree的用法 Gin387 python
shutil.rmtree()是Python中shutil模块提供的一个函数，用于递归删除整个目录树（包括子目录和所有文件）。os.rmdir()（只能删除空目录）不同，shutil.rmtree()可以强制删除非空目录importshutil#删除指定目录及其所有内容shutil.rmtree('path/to/directory')
构建 Python 插件架构：打造灵活可扩展的模块化应用全栈探索者chen python python 架构开发语言学习机器学习程序人生插件
构建Python插件架构：打造灵活可扩展的模块化应用前言在现代软件开发中，单一的代码库往往难以满足不断变化的业务需求和多样化的扩展场景。如何设计一个应用，使其既能保持核心功能的稳定，又能轻松集成第三方功能、模块或定制化扩展？答案就是——插件架构。通过插件架构，你可以让应用具备极高的灵活性，支持动态加载、无缝扩展以及解耦维护。本文将深入探讨如何在Python中设计和构建一个插件架构。从核心概念、模块
OpenCV图像拼接（4）图像拼接模块的一个匹配器类cv::detail::BestOf2NearestRangeMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::BestOf2NearestRangeMatcher是OpenCV库中用于图像拼接模块的一个匹配器类，专门用于寻找两幅图像之间的最佳特征点匹配。它是基于“最近邻与次近邻距离比”原则来过滤匹配点对的，以提高匹配结果的准确性。这个类特别适用于需
31天Python入门——第11天:挑战一口气把闭包·装饰器讲明白安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录1.闭包扩展知识:闭包的自由变量是如何存储的2.装饰器装饰器的应用场景3.补充练习1.闭包闭包是指在一个函数内部定义的函数，并且这个内部函数可以访问外部函数的变量、参数.换句话说，闭包是一个包含了函数及其相关引用环境的组合体.在Python中，当一个函数返回了内部函数的引用时，这个内部函数可以访问并操作外部函数的局部变量，它就创建了一个闭包,即使外部函数已经执行完毕，它
opencv python rgb转yuv_OpenCV之色彩空间与色彩空间转换 xiao fei opencv python rgb转yuv
python代码：importcv2ascvsrc=cv.imread("test.jpg")cv.namedWindow("rgb",cv.WINDOW_AUTOSIZE)cv.imshow("rgb",src)#RGBtoHSVhsv=cv.cvtColor(src,cv.COLOR_BGR2HSV)cv.imshow("hsv",hsv)#RGBtoYUVyuv=cv.cvtColor(sr
【AI大模型】搭建本地大模型GPT-NeoX：详细步骤及常见问题处理 qzw1210 gpt 人工智能深度学习
搭建本地大模型GPT-NeoX：详细步骤及常见问题处理GPT-NeoX是一个开源的大型语言模型框架，由EleutherAI开发，可用于训练和部署类似GPT-3的大型语言模型。本指南将详细介绍如何在本地环境中搭建GPT-NeoX，并解决过程中可能遇到的常见问题。1.系统要求1.1硬件要求1.2软件要求操作系统:Linux(推荐Ubuntu20.04或更高版本)CUDA:11.2或更高版本Python
python 列表倒序输出小琳爱分享 python python
python列表倒序输出#使用reverseli1=[1,6,4,3,7,9]li2=['a','m','s','g']li1.reverse()li2.reverse()print(li1,li2)#利用list切片li1=[1,6,4,3,7,9]li2=['a','m','s','g']print(li1[::-1])print(li2[::-1])#利用算法进行转换，这里需要用到深层cop
python怎么输出倒序 hakesashou python基础知识 python java 服务器
python怎么输出倒序？下面给大家介绍四种方法：创建测试列表>>> lst = [1,2,3,4,5,6]方法1：>>> lst.reverse() #reverse()反转>>> lst[6, 5, 4, 3, 2, 1]方法2：>>> lst1 = [i for i in reversed(lst)] #reversed只适用于与序列(列表、元组、字符串)>>> lst1[6, 5, 4,
chatgpt赋能python：Python怎么倒序列表 aijinglingchat ChatGpt python chatgpt 人工智能计算机
Python怎么倒序列表列表是Python中最常用的数据结构之一，但在实际使用时，有时需要将列表进行倒序排列。Python提供了多种方法来实现这个需求，本文将简要介绍这些方法以及它们的使用场景。方法1：使用reverse()函数使用列表的reverse()方法是Python中最简单直接的方法来倒序列表。该方法会将原列表倒置。lst=[1,2,3,4,5]lst.reverse()print(lst
“统计视角看世界”专栏阅读引导赛卡统计视角看世界信息可视化数据分析
根据文章主题和逻辑关系，我为您设计以下阅读引导方案：1.六西格玛基础2.帕累托图3.直方图4.散点图基础5.散点图高阶6.多变量可视化7.密度图进阶8.回归分析配套文字说明：入门基石（必读）《1.六西格玛遇上Python》→方法论总纲，建议优先精读基础三剑客（可并行）├─《2.帕累托图》→重点数据排序与决策├─《3.直方图》→数据分布核心工具└─《4.散点图》→数据探索第一视角高阶应用链（递进学习
自定义mavlink 生成wireshark wlua插件错误（已解决） JasonComing 问题收集 wireshark wlua mavlink
进入正题python3-mpymavlink.tools.mavgen--lang=WLua--wire-protocol=2.0--output=output/developmessage_definitions/v1.0/development.xml编译WLUA的时候遇到一些问题1.ERROR:SCHEMASV:SCHEMAV_CVC_ENUMERATION_VALID3765:0:ERRO
吐血整理 python最全习题100道（含答案）持续更新题目，建议收藏！ Bejpse 面试学习路线阿里巴巴 python 开发语言 pycharm redis java-ee
最近为了提升python水平，在网上找到了python习题，然后根据自己对于python的掌握，整理出来了答案，如果小伙伴们有更好的实现方式，可以下面留言大家一起讨论哦~已知一个字符串为“hello_world_yoyo”,如何得到一个队列[“hello”,”world”,”yoyo”]test=‘hello_world_yoyo’使用split函数，分割字符串，并且将数据转换成列表类型print
2024年第五届MathorCup数学应用挑战赛--大数据竞赛思路、代码更新中..... 宇哥预测优化代码学习 1024程序员节
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️研赛及概况一、竞赛背景与目的二、组织机构与参赛对象三、竞赛时间与流程四、竞赛要求与规则五、奖项设置与奖励六、研究文档撰写建议七、参考资料与资源1找程序网站推荐2公式编辑器、流程图、论文排版324年研赛资源下载4思路、Python、Matlab代码分享......⛳
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
Python 用户账户(创建用户账户) 钢铁男儿 Python 从入门到精通 python sqlite 数据库
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
使用欧拉法数值求解微分方程的 Python 实现神经网络15044 python 深度学习算法 python 开发语言
编写函数y=Eular(x,h)，使用欧拉法数值求解微分方程初值为函数Eular(x,h)中Cx为计算结束时微分方程x的值，h为计算步长再编写脚本，通过调用函数分别以不同步长(例如h=1.0，h=0.5，h=0.25)计算y(3)，并分析步长和误差之间的关系。以下是使用欧拉法数值求解微分方程的Python实现。假设我们要求解的微分方程是dydx=f(x,y)\frac{dy}{dx}=f(x,y)
使用AirtableLoader轻松加载数据到Python bavDHAUO python 开发语言
在现代软件开发中，数据的管理与使用非常关键。Airtable作为一种灵活的数据库应用，提供了简便且强大的数据处理方式。而通过使用AirtableLoader这种工具，可以轻松地将Airtable中的数据加载到Python项目中进行处理。技术背景介绍Airtable是一款集电子表格和数据库功能于一体的工具，它以其简单易用、强大的扩展性而受到众多开发者的喜爱。AirtableLoader是一个文档加载
【Python工具】Jupyter Notebook常用快捷键清平乐的技术博客 Python高级应用由浅入深学Python jupyter ide python
1.JupyterNotebook的启动与停止环境为Windows10系统首先win+R进入命令提示符cmd，用cd命令切换到工作目录，键入命令jupyternotebook2.JupyterNotebook常用快捷键2.1模式切换当前cell侧边为蓝色时，表示此时为命令模式，按Enter切换为编辑模式当前cell侧边为绿色时，表示此时为编辑模式，按Esc切换为命令模式2.2命令模式快捷键H：显示
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
Python 单例模式的 5 种实现方式：深入解析与最佳实践做测试的小薄测试高阶 python 单例模式自动化测试测试框架
单例模式（SingletonPattern）是一种经典的设计模式，其核心思想是确保一个类在整个程序运行期间只有一个实例，并提供一个全局访问点。这种模式在许多场景中非常有用，例如全局配置管理、日志记录器、数据库连接池等。然而，Python的灵活性使得实现单例模式有多种方式，每种方法都有其特点和适用场景。本文将详细介绍Python中实现单例模式的5种常见方法，并深入分析它们的优缺点以及适用场景，帮助您
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S