计算机视觉【1】学习笔记

DataWhale–CV入门训练

详细介绍

数据标签

计算机视觉【1】学习笔记_第1张图片
计算机视觉【1】学习笔记_第2张图片

原始图片 图片JSON标注
计算机视觉【1】学习笔记_第3张图片 计算机视觉【1】学习笔记_第4张图片

完整代码

import matplotlib.pyplot as plt
import cv2
import numpy as np
import json
# 读取数据
train_json = json.load(open('/mypath/CV/dataset/mchar_train.json'))
# 数据标注处理
# 每张图片中有一个或者多个数字
def parse_json(d):
    arr = np.array([
        d['top'],d['height'],d['left'],d['width'],d['label']  # 分别取json中数据d的这些标签的数据
    ])
    arr = arr.astype(int)
    # 将得到的数据标签进行返回
    return arr
# 读取指定的图片
img = cv2.imread('/mypath/CV/dataset/mchar_train/000000.png')
# 将指定图片 000000.png中的图片中的位置信息进行读取
arr = parse_json(train_json['000000.png'])

plt.figure(figsize=(10,10))
plt.subplot(1, arr.shape[1]+1, 1)
plt.imshow(img)
plt.xticks([]);plt.yticks([])


for idx in range(arr.shape[1]):
    # arr.shape[1]表示arr有几行
    plt.subplot(1,arr.shape[1]+1,idx+2)
    plt.imshow(img[arr[0, idx]:arr[0,idx]+arr[1,idx],arr[2,idx]:arr[2,idx]+arr[3,idx]])
    plt.title(arr[4,idx])
    plt.xticks([]);plt.yticks([])
    

定长字符识别

你可能感兴趣的:(#,深度学习,计算机视觉,深度学习)