stroll丶life

卷积神经网络手写体识别

背景
卷积

LeNet网络结构

C1
S2
C3
S4
C5
F6
输出

数据集
代码及运行结果
测试

CNN

1995年, Yann LeCun 与Yoshua Bengio 提出了convolutional neural networks框架，并用于手写体数字识别。

背景

在BP网络用于图像处理中，如果要对输入图像分类，可设计多层网络结构。如果采用全连接结构，存在参数爆炸问题。如对10001000的图像进行卷积，大约需要1000100010001000个参数。利用局部卷积替换全连接结构，可将参数降低至100010001010≈100M。

如果进一步采用权值共享的策略，即同一特征图卷积核、Bias相同，将卷积参数将至1010。为尽可能地保存信息，可设计多个卷积特征图，将参数将至10K。

卷积

函数卷积
函数f(x)与g(x)卷积的定义（一维）为：

图像卷积
在图像处理中，卷积也被称为滤波，一般是由卷积核（滤波器） w与在图像中f(x, y)的卷积结果为：

LeNet网络结构

输入层为3232图像，一般限定字符最大范围为2020（居中）
C*：卷基层
S*：采样层（Pooling层）
F*：全连接层

C1

输入层为3232图像，卷积核大小为55
C1：卷积层为6副28*28的特征图。 C1层具有如下特点：

拓扑结构：输入层相邻节点卷积后仍然相邻
稀疏连接：每个像素仅与输入层的相邻结点相连
权值共享：同一副特征图共享相同的卷积核

C1层神经元连接数量为2828(55+1)6=122304，由于采用了权值共享，
因此待学习参数为(55+1)6=156。
如果采用全连接策略，总参数量可达(3232+1)(28*28)*6

S2

S2： Pooling层将2828的特征图将采样为1414的图像：

采用2*2非重叠采样。
S2层每个单元的4个输入相加，乘以一个可训练参数，再加上一个可
训练偏置。
结果通过sigmoid函数计算。

S2层神经元连接数量为1414(2*2+1)6=5880，待学习参数为62=12。

C3

C3：将6副2828的特征图卷积为16副1010的图像，卷积核为5*5：

C3 中每副特征图与S2中的若干副特征图相关。
C3层神经元连接数量为151600，待学习参数为1516。

S4

S4：将1010的特征图将采样为16副55的图像：

降采样过程与S2层一致
S4层神经元连接数量为55(2*2+1)16=2000，待学习参数为162=32

C5

C5：将16副5*5的特征图卷积为长度为120的向量：

F6中每个神经元与S4所有神经元相连。
C5层神经元连接数量为120*(16*25+1) = 48120，全部为待学习参数。

F6

F6：构建84个神经元，每个神经元与C5的120个神经元全连接：

F6层神经元连接数量为84*(120+1)=10164，全部为待学习参数。

输出

输出层：为10个神经元，每个神经元的激活值表示对应字符的相应强度，
最大值则为对应的识别结果。

数据集

0-9共十个数字每个数字训练集在6000张图片左右。
训练图片中倾斜，扭曲，粗细不一致，甚至旋转，如
倾斜

扭曲

粗细不一致

旋转（数字7）

代码及运行结果

import tensorflow as tf
import numpy as np
import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk
from tkinter import filedialog
import time


def creat_windows():
    win = tk.Tk() # 创建窗口
    sw = win.winfo_screenwidth()
    sh = win.winfo_screenheight()
    ww, wh = 400, 450
    x, y = (sw-ww)/2, (sh-wh)/2
    win.geometry("%dx%d+%d+%d"%(ww, wh, x, y-40)) # 居中放置窗口

    win.title('手写体识别') # 窗口命名

    bg1_open = Image.open("timg.jpg").resize((300, 300))
    bg1 = ImageTk.PhotoImage(bg1_open)
    canvas = tk.Label(win, image=bg1)
    canvas.pack()


    var = tk.StringVar() # 创建变量文字
    var.set('')
    tk.Label(win, textvariable=var, bg='#C1FFC1', font=('宋体', 21), width=20, height=2).pack()

    tk.Button(win, text='选择图片', width=20, height=2, bg='#FF8C00', command=lambda:main(var, canvas), font=('圆体', 10)).pack()
    
    win.mainloop()

def main(var, canvas):
    file_path = filedialog.askopenfilename()
    bg1_open = Image.open(file_path).resize((28, 28))
    pic = np.array(bg1_open).reshape(784,)
    bg1_resize = bg1_open.resize((300, 300))
    bg1 = ImageTk.PhotoImage(bg1_resize)
    canvas.configure(image=bg1)
    canvas.image = bg1

    init = tf.global_variables_initializer()

    with tf.Session() as sess:
            sess.run(init)
            saver = tf.train.import_meta_graph('save/model.meta')  # 载入模型结构
            saver.restore(sess, 'save/model')  # 载入模型参数
            graph = tf.get_default_graph()       # 加载计算图
            x = graph.get_tensor_by_name("x-input:0")  # 从模型中读取占位符变量
            keep_prob = graph.get_tensor_by_name("keep_prob:0")
            y_conv = graph.get_tensor_by_name("y-pred:0")  # 关键的一句  从模型中读取占位符变量
            prediction = tf.argmax(y_conv, 1)
            predint = prediction.eval(feed_dict={x: [pic], keep_prob: 1.0}, session=sess)  # feed_dict输入数据给placeholder占位符
            answer = str(predint[0])
    var.set("预测的结果是：" + answer)

if __name__ == "__main__":
    creat_windows()

#coding:utf8
import os 
import cv2 
import numpy as np
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

sess = tf.InteractiveSession()


def getTrain():
    train=[[],[]] # 指定训练集的格式，一维为输入数据，一维为其标签
    # 读取所有训练图像，作为训练集
    train_root="mnist_train" 
    labels = os.listdir(train_root)
    for label in labels:
        imgpaths = os.listdir(os.path.join(train_root,label))
        for imgname in imgpaths:
            img = cv2.imread(os.path.join(train_root,label,imgname),0)
            array = np.array(img).flatten() # 将二维图像平铺为一维图像
            array=MaxMinNormalization(array)
            train[0].append(array)
            label_ = [0,0,0,0,0,0,0,0,0,0]
            label_[int(label)] = 1
            train[1].append(label_)
    train = shuff(train)
    return train

def getTest():
    test=[[],[]] # 指定训练集的格式，一维为输入数据，一维为其标签
    # 读取所有训练图像，作为训练集
    test_root="mnist_test" 
    labels = os.listdir(test_root)
    for label in labels:
        imgpaths = os.listdir(os.path.join(test_root,label))
        for imgname in imgpaths:
            img = cv2.imread(os.path.join(test_root,label,imgname),0)
            array = np.array(img).flatten() # 将二维图像平铺为一维图像
            array=MaxMinNormalization(array)
            test[0].append(array)
            label_ = [0,0,0,0,0,0,0,0,0,0]
            label_[int(label)] = 1
            test[1].append(label_)
    test = shuff(test)
    return test[0],test[1]

def shuff(data):
    temp=[]
    for i in range(len(data[0])):
        temp.append([data[0][i],data[1][i]])
    import random
    random.shuffle(temp)
    data=[[],[]]
    for tt in temp:
        data[0].append(tt[0])
        data[1].append(tt[1])
    return data

count = 0
def getBatchNum(batch_size,maxNum):
    global count
    if count ==0:
        count=count+batch_size
        return 0,min(batch_size,maxNum)
    else:
        temp = count
        count=count+batch_size
        if min(count,maxNum)==maxNum:
            count=0
            return getBatchNum(batch_size,maxNum)
        return temp,min(count,maxNum)
    
def MaxMinNormalization(x):
    x = (x - np.min(x)) / (np.max(x) - np.min(x))
    return x


# 1、权重初始化,偏置初始化
# 为了创建这个模型，我们需要创建大量的权重和偏置项
# 为了不在建立模型的时候反复操作，定义两个函数用于初始化
def weight_variable(shape):
    initial = tf.truncated_normal(shape,stddev=0.1)#正太分布的标准差设为0.1
    return tf.Variable(initial)
def bias_variable(shape):
    initial = tf.constant(0.1,shape=shape)
    return tf.Variable(initial)


# 2、卷积层和池化层也是接下来要重复使用的，因此也为它们定义创建函数
# tf.nn.conv2d是Tensorflow中的二维卷积函数，参数x是输入，w是卷积的参数
# strides代表卷积模块移动的步长，都是1代表会不遗漏地划过图片的每一个点，padding代表边界的处理方式
# padding = 'SAME'，表示padding后卷积的图与原图尺寸一致，激活函数relu()
# tf.nn.max_pool是Tensorflow中的最大池化函数，这里使用2 * 2 的最大池化，即将2 * 2 的像素降为1 * 1的像素
# 最大池化会保留原像素块中灰度值最高的那一个像素，即保留最显著的特征，因为希望整体缩小图片尺寸
# ksize：池化窗口的大小，取一个四维向量，一般是[1,height,width,1]
# 因为我们不想再batch和channel上做池化，一般也是[1,stride,stride,1]
def conv2d(x, w):
    return tf.nn.conv2d(x, w, strides=[1,1,1,1],padding='SAME') # 保证输出和输入是同样大小
def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1],padding='SAME')
    
iterNum = 1000
batch_size=1024

print("load train dataset.")
train=getTrain()
print("load test dataset.")
test0,test1=getTest()


# 3、参数
# 这里的x,y_并不是特定的值，它们只是一个占位符，可以在TensorFlow运行某一计算时根据该占位符输入具体的值
# 输入图片x是一个2维的浮点数张量，这里分配给它的shape为[None, 784]，784是一张展平的MNIST图片的维度
# None 表示其值的大小不定，在这里作为第1个维度值，用以指代batch的大小，means x 的数量不定
# 输出类别y_也是一个2维张量，其中每一行为一个10维的one_hot向量，用于代表某一MNIST图片的类别
x = tf.placeholder(tf.float32, [None,784], name="x-input")
y_ = tf.placeholder(tf.float32,[None,10]) # 10列


# 4、第一层卷积，它由一个卷积接一个max pooling完成
# 张量形状[5,5,1,32]代表卷积核尺寸为5 * 5，1个颜色通道，32个通道数目
w_conv1 = weight_variable([5,5,1,32])
b_conv1 = bias_variable([32]) # 每个输出通道都有一个对应的偏置量
# 我们把x变成一个4d 向量其第2、第3维对应图片的宽、高，最后一维代表图片的颜色通道数(灰度图的通道数为1，如果是RGB彩色图，则为3)
x_image = tf.reshape(x,[-1,28,28,1])
# 因为只有一个颜色通道，故最终尺寸为[-1，28，28，1]，前面的-1代表样本数量不固定，最后的1代表颜色通道数量
h_conv1 = tf.nn.relu(conv2d(x_image, w_conv1) + b_conv1) # 使用conv2d函数进行卷积操作，非线性处理
h_pool1 = max_pool_2x2(h_conv1)                          # 对卷积的输出结果进行池化操作


# 5、第二个和第一个一样，是为了构建一个更深的网络，把几个类似的堆叠起来
# 第二层中，每个5 * 5 的卷积核会得到64个特征
w_conv2 = weight_variable([5,5,32,64])
b_conv2 = bias_variable([64])
h_conv2 = tf.nn.relu(conv2d(h_pool1, w_conv2) + b_conv2)# 输入的是第一层池化的结果
h_pool2 = max_pool_2x2(h_conv2)

# 6、密集连接层
# 图片尺寸减小到7 * 7，加入一个有1024个神经元的全连接层，
# 把池化层输出的张量reshape(此函数可以重新调整矩阵的行、列、维数)成一些向量，加上偏置，然后对其使用Relu激活函数
w_fc1 = weight_variable([7 * 7 * 64, 1024])
b_fc1 = bias_variable([1024])
h_pool2_flat = tf.reshape(h_pool2, [-1,7 * 7 * 64])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, w_fc1) + b_fc1)

# 7、使用dropout，防止过度拟合
# dropout是在神经网络里面使用的方法，以此来防止过拟合
# 用一个placeholder来代表一个神经元的输出
# tf.nn.dropout操作除了可以屏蔽神经元的输出外，
# 还会自动处理神经元输出值的scale，所以用dropout的时候可以不用考虑scale
keep_prob = tf.placeholder(tf.float32, name="keep_prob")# placeholder是占位符
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)


# 8、输出层，最后添加一个softmax层
w_fc2 = weight_variable([1024,10])
b_fc2 = bias_variable([10])
y_conv = tf.nn.softmax(tf.matmul(h_fc1_drop, w_fc2) + b_fc2, name="y-pred")


# 9、训练和评估模型
# 损失函数是目标类别和预测类别之间的交叉熵
# 参数keep_prob控制dropout比例，然后每100次迭代输出一次日志
cross_entropy = tf.reduce_sum(-tf.reduce_sum(y_ * tf.log(y_conv),reduction_indices=[1]))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
# 预测结果与真实值的一致性，这里产生的是一个bool型的向量
correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
# 将bool型转换成float型，然后求平均值，即正确的比例
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
# 初始化所有变量，在2017年3月2号以后,用 tf.global_variables_initializer()替代tf.initialize_all_variables()
sess.run(tf.initialize_all_variables())

# 保存最后一个模型
saver = tf.train.Saver(max_to_keep=1)


for i in range(iterNum):
    for j in range(int(len(train[1])/batch_size)):
        imagesNum=getBatchNum(batch_size,len(train[1]))
        batch = [train[0][imagesNum[0]:imagesNum[1]],train[1][imagesNum[0]:imagesNum[1]]]
        train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})
    if i % 2 == 0:
        train_accuracy = accuracy.eval(feed_dict={x: batch[0], y_: batch[1],keep_prob: 1.0})
        print("Step %d ,training accuracy %g" % (i, train_accuracy))
print("test accuracy %f " % accuracy.eval(feed_dict={x: test0, y_:test1, keep_prob: 1.0})) 
# 保存模型于文件夹
saver.save(sess,"save/model")

测试

自己的手写训练集

Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
Python计算机视觉编程——第二章局部图像描述子 adchloe python 计算机视觉开发语言
目录1Harris角点检测器2SIFT2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子1Harris角点检测器Harris角点检测算法是简单的角点检测算法，主要思想是，如果像素周围显示存在多于一个方向的边，认为该点为兴趣点，称为角点。把图像域中点x上的对称半正定矩阵Mr=Ml(x)M_{r}=M_{l}(\mathbf{x})Mr=Ml(x)定义为：M1=∇I ∇IT=[IxIy][IxI
Python计算机视觉编程pdf txt mobi下载及读书笔记 mrxllh0
Python计算机视觉编程pdftxtmobi读书笔记应该是这一学期图像分析比较有用的工具书了，numpy和matplotlib常用的方法基本都有，并且例子也不错。非常好的计算机视觉入门书，亮点在于没有直接使用OpenCV，而是先简单介绍算法原理，再利用NumPy、matplotlib等基本工具进行算法实现，对于已经学习了计算机视觉理论，但是不知道怎么把公式变成代码的人来说很有帮助。作者:[瑞典]
[笔记]Python计算机视觉编程《一》基本的图像操作和处理二进制怪兽 Python 人工智障读书笔记计算机视觉笔记 python
文章目录前言环境搭建计算机视觉简介Python和NumPy第一章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图图像的轮廓直方图1.2.3【交互式标注】1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3
python计算机视觉编程——第一章（基本的图像操作和处理） NCTU_to_prove_safety 算法
第1章基本的图像操作和处理1.1PIL：Python图像处理类库1.1.1转换图像格式——save()函数1.1.2创建缩略图1.1.3复制并粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib库1.2.1画图、描点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy库1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.
PIL–Python图像处理类库斯特凡1899
—–前言—–才开始看Python，感觉离时代好远。现在看的是《Python计算机视觉编程》，欢迎交流！—–正题—–PIL，PhthonImagingLibrary，Python图像图里类库。提供了通用的图像处理功能，以及大量有用的基本图像操作，如图像缩放、裁剪、旋转、颜色转换等。代码例子:fromPILimportImage#读取图像im=Image.open("empire.jpeg")thum
python计算机视觉编程.pdf微盘_Python计算机视觉编程pdf weixin_39860280
下载地址：网盘下载内容简介······《python计算机视觉编程》是计算机视觉编程的权威实践指南，依赖python语言讲解了基础理论与算法，并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态估计、全景创建、图像分割、降噪、图像分组等技术。另外，书中附带的练习还能让读者巩固并学会应用编程知识。《python计算机视觉编程》适合的读者
python画龙舟_Python计算机视觉编程第二章——局部图像描述子 weixin_39999781 python画龙舟
Python计算机视觉编程局部图像描述子(一)Harris角点检测器(二)SIFT(尺度不变特征变换)2.1兴趣点2.2描述子2.3检测兴趣点2.4匹配描述子(三)匹配地理标记图像3.1从Panoramio下载地理标记图像3.2使用局部描述子匹配3.3可视化连接的图像局部图像描述子本节旨在寻找图像间的对应点和对应区域。介绍用于图像匹配的两种局部描述子算法。图像的局部特征是许多计算机视觉算法的基础，
Python计算机视觉编程第三章图像到图像的映射 LuoY、 Python计算机视觉编程
第三章图像到图像的映射3.1单应性变换3.1.1直接线性变换算法3.1.2仿射变换3.2图像扭曲3.2.1图像中的图像3.2.2图像配准3.3创建全景图3.3.1RANSAC3.3.2稳健的单应性矩阵估计3.3.2拼接图像本章讲解图像之间的变换，以及一些计算变换的实用方法。这些变换可用于图像扭曲变形和图像配准。3.1单应性变换单应性变换是一个人平面内的点映射到另一个平面内的二维投影
Python计算机视觉编程第四章照相机模型与增强现实 LuoY、 Python计算机视觉编程 python 计算机视觉 ar
第四章照相机模型与增强现实4.1针孔照相机模型4.1.1照相机矩阵4.1.2三维点的投影4.1.3照相机矩阵的分解4.1.4计算照相机中心4.2照相机标定4.3以平面和标记物体进行姿态估计4.4增强现实4.1针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精确度。在针孔照相机模型中，在光线投影到
python图像处理笔记-八-针孔照相机模型与照相机标定 BluePing
参考教材：python计算机视觉编程视觉SLAM十四讲，从理论到实践针孔照相机模型针孔摄像机模型（有时称作摄影照相机模型），是计算机视觉中广泛应用的照相机模型。原因是：简单精度足够这个名字来源于一种简单的照相机，他利用小孔成像原理进行成像，换句话说就是：在光线投影到图像平面前，从唯一一个点经过，这个经过的点就叫做：照相机中心，记做C，如下图所示：（这张图来自于他人博客：https://blog.c
Python计算机视觉编程_03 chuxiao_scx python 机器学习
基于SIFT算法的全景拼接前言1.单应性变换2.RANSAC算法3.Multi-BandBlending策略4.代码实现前言什么是全景拼接？简单来说就是将两幅或多幅具有重叠区域的图像，合并成一张大图如图所示，7张不同的图像最后拼接成一幅大图，那么问题很明显，如何拼接呢？1.单应性变换如果是最简单图像拼接，很明显，我们只需要对其进行平移，将重叠区域叠加，很轻松的就能得到一幅拼接图像。但实际上两幅图像
Python计算机视觉编程——第6章图像聚类海鸥丸拉面 python 聚类计算机视觉
目录6.1K-means聚类6.1.1Scipy聚类包6.1.2图像聚类6.1.3在主成分上可视化图像6.1.4像素聚类6.2层次聚类图像聚类6.3谱聚类6.1K-means聚类K-means是一种将输入数据划分成k个簇的简单的聚类算法。K-means反复提炼初始评估的类中心，步骤如下：以随机或猜测的方式初始化类中心ui,i=1...k;将每个数据点归并到离他距离最近的类中心所属的类ci；对所有属
Python计算机视觉编程--第四章娇娇是大熊 python python
照相机模型与增强现实一、针孔照相机模型1.1照相机矩阵1.2三维点的投影1.3照相机矩阵的分解1.4照相机中心二、照相机标定一、针孔照相机模型针孔照相机模型（有时称为射影照相机模型）是计算机视觉中广泛使用的照相机模型。对于大多数应用来说，针孔照相机模型简单，并且具有足够的精准度。这个名字来源于一种类似暗箱机的照相机。该照相机从一个小孔采集射到暗箱内部的光线。在光线投影到图像平面之前，从唯一一个点经
Python计算机视觉编程——第8章图像内容分类海鸥丸拉面 python 计算机视觉分类
目录8.1K临近分类法（KNN）8.1.1一个简单的二维示例8.1.2用稠密SIFT作为图像特征8.1.3图像分类：手势识别8.2贝叶斯分类器用PCA降维8.3支持向量机8.3.1使用LibSVM8.1K临近分类法（KNN）在分类算法中，最简单且用的最多的一种方法之一就是KNN(K-NearsetNeighbor，K邻近分类法)，这种算法把要分类的对象（例如一个特征向量）与训练集中已知类标记的所有
Python计算机视觉编程——第10章 OpenCV 海鸥丸拉面计算机视觉 python opencv
目录10.1OpenCV的Python接口10.2OpenCV基础知识10.2.1读取和写入图像10.2.2颜色空间10.2.3显示图像及结果10.3处理视频10.3.1视频输入10.3.2将视频读取到NumPy数组中10.4跟踪10.4.2Lucas-Kanade算法1.使用跟踪器2.使用发生器10.1OpenCV的Python接口OpenCV是一个C++库，它包含了计算机视觉领域的很多模块。除
Python计算机视觉编程_01 chuxiao_scx python 计算机视觉 opencv
基本的图像操作和处理前言1.图像直方图1.1.原理1.2.结果演示2.高斯滤波2.1.原理2.2.结果演示3.直方图均衡化3.1.原理3.2.结果演示后记前言本篇博客介绍在vscode中使用opencv进行图像处理的基本操作，使用的语言为python，vscode中按照python可以参考我以前写的这篇博客：vscode中配置python环境至于在vscode导入opencv包就请各位自行百度解决
机器学习算法：支持向量机（SVM）夏天是冰红茶 #计算机视觉机器学习支持向量机算法
参考书籍：Solem《python计算机视觉编程》、李航《统计学习方法》、周志华《机器学习》要理解好支持向量机需要较好的数学功底，且能不被公式以及文字绕晕，这里我们就理清楚支持向量机的大体过程。具体的数学计算推导其实已经封装好了，那么理解算法的原理也对我们将来的学习很有帮助，比如以后做科研的时候，大家冥思苦想找不到方法的时候，你走上前去说，唉这个方法就能解决，是不是特别能得到满足。0、概念提前知超
Python计算机视觉编程第一章——基本的图像操作和处理海鸥丸拉面计算机视觉图像处理 python
目录1.1PIL：Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3Unmpy1.3.1图像数组表示1.3.2灰度变换1.3.3图像缩放1.3.4直方图均衡化1.3.5图像平均1.3.6图像的主成分分析（PCA）1.3.7使用p
Python计算机视觉编程第一章基本的图像操作和处理 LuoY、 python 计算机视觉图像处理
第一章基本的图像操作和处理1.1PIL:Python图像处理类库1.1.1转换图像格式1.1.2创建缩略图1.1.3复制和粘贴图像区域1.1.4调整尺寸和旋转1.2Matplotlib1.2.1绘制图像、点和线1.2.2图像轮廓和直方图1.2.3交互式标注1.3NumPy1.3.1图像数组表示1.3.2灰度变换1.3.3直方图均衡化1.3.4图像平均1.3.5使用pickle模块1.4SciPy1
python计算机视觉编程 Hesilan python 自然语言处理机器学习
@《python计算机视觉处理编程》第一章笔记Python计算机视觉编程笔记，还在学习之中红色：imtools函数蓝色：函数功能绿色：拓展知识1、fromPILimportImage输入pillow包，图像缩放，裁剪、旋转、颜色转换pil_im=Image.open(‘D:\RGB\Testpicture\pexels-photo-417173.jpg’)打开一张图片print(pil_img.s
《Python 计算机视觉编程》学习笔记（一）书生丶丶 python 计算机视觉学习
《Python计算机视觉编程》文章目录前言第1章基本的图像操作和处理引言1.1PIL：Python图像处理类库图像读取、显示、显示对应灰度图更改图像格式（后缀）创建缩略图复制和粘贴图像区域调整尺寸和旋转1.2Matplotlib绘制图像、点和线图像轮廓和直方图交互式标注1.3NumPy图像数组表示灰度变换直方图均衡化图像的主成分分析（PCA）1.4SciPy图像模糊图像导数形态学：对象计数一些有用
Python计算机视觉编程 - 第三章图像映射 -全景拼接煮酒忆南山 python
全景拼接原理简述在同一位置拍摄的两幅或者多幅图片是单应性相关的，我们经常使用该约束将很多图像缝补起来，拼成一个全景图。全景图像拼接最重要的两个步骤是：1.特征匹配2.图像拼接在本次测试中，我使用的是sift特征匹配,在特征匹配之后，我们使用RANSAC算法求解得到单应性矩阵。其基本思想是，数据中包含正确的点和噪声点，合理的模型能够在描述正确数据点的同时摒弃噪声点，在这里的用途就是排除掉不符合大部分
Python计算机视觉编程第二章局部图像描述子仙蓝计算机视觉计算机视觉 python 算法
Python计算机视觉编程第二章局部图像描述子1Harris角点检测1.1基本概念1.2例子2在图像中寻找对应点2.1基本概念2.2例子3SIFT(尺度不变特征变换)3.1介绍3.2兴趣点3.3描述子3.4检测兴趣点——例子3.5匹配描述子——例子4地理特征匹配4.1需要安装PCV环境4.2测试图片4.3实现代码1Harris角点检测1.1基本概念Harris角点检测算法（也称Harris&Ste
图像检索代码python tf_Python计算机视觉编程（八）图像检索埃斯蓬托的篡位者图像检索代码python tf
图像检索BOW模型基于BOW的图像检索特征提取视觉词典TF-IDF常用参数图像检索具体实现流程BOW模型Bag-of-wordsmodels模型(词袋模型)词袋模型对于给定的两个文档，进行分割可以建构出一个有n个元素词典，根据词典每个词在两个文档中的出现的频率，表示成两个n维向量。基于BOW的图像检索特征提取学习视觉词典针对输入特征集，根据视觉词典进行量化把输入图像，根据TF-IDF转化成视觉单词
python内实现k-means聚类 superdont 图像处理 python python计算机视觉
《Python计算机视觉编程》学习笔记fromscipy.cluster.vqimport*importnumpyasnpfrommatplotlibimportpyplotaspltclass1=1.5*np.random.randn(100,2)##print(class1)class2=np.random.randn(100,2)+np.array([8,8])##print(class2)
Python计算机视觉编程学习笔记十 OPENCV Belouga- 数字图像处理计算机视觉 python
OPENCV（一）OpenCV的Python接口（二）OpenCV基础知识2.1图像读取和写入2.2颜色空间2.3显示图像及结果2.4平移与缩放（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割cv2.watershed()5.3利用霍夫变换检测直线（一）OpenCV的Pyth
Python计算机视觉编程第十章——OpenCV基础知识 Dujing2019 Python计算机视觉编程
Python计算机视觉编程（一）OpenCV的Python接口（二）OpenCV基础知识2.1读取和写入图像2.2颜色空间2.3显示图像及结果（三）处理视频3.1视频输入3.2将视频读取到NumPy数组中（四）跟踪4.1光流4.2Lucas-Kanade算法（五）更多示例5.1图像修复5.2利用分水岭变换进行分割5.3利用霍夫变换检测直线（一）OpenCV的Python接口OpenCV是一个C++
Python计算机视觉编程学习笔记七图像搜索白鲸鱼2020 python 数字图像处理计算机视觉
图像搜索（一）基于内容的图像检索（二）视觉单词2.1：创建词汇2.2：创建图像索引2.3：在数据库中搜索图像（三）使用几何特性对结果排序（一）基于内容的图像检索CBIR（Content-BasedImageRetrieval，基于内容的图像检索）CBIR的实现依赖于两个关键技术的解决：图像特征提取和匹配。定义:即从图像库中查找含有特定目标的图像，也包括从连续的视频图像中检索含有特定目标的视频片段。
Python计算机视觉编程学习笔记三图像到图像的映射白鲸鱼2020 计算机视觉 python 数字图像处理
图像到图像的映射（一）单应性变换1.2仿射变换（二）图像扭曲2.1图像中的图像2.2图像配准（三）创建全景图3.1RANSAC3.2拼接图像（一）单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。本质上，单应性变换H，按照下面的方程映射二维中的点（齐次坐标
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

卷积神经网络手写体识别

CNN

背景

卷积

LeNet网络结构

C1

S2

C3

S4

C5

F6

输出

数据集

代码及运行结果

测试

你可能感兴趣的:(Python计算机视觉编程)