手写数字识别
简单手写数字识别系统 :我们对VC比较熟悉,采用VC开发.
数字的类别只有十种,笔划又简单,其识别问题似乎不是很困难。但事实上,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高,而只仅仅优于脱机手写体汉字识别。数字虽然只有十种,而且笔划简单,但同一数字写法千差万别,其书写上带有明显的个人特性,很难完全做到兼顾各人各种写法的极高识别率的通用性数字识别系统。
在网上我查了一些资料,根据人工神经网络的,模拟生物神经元的实现,从数字字符的轮廓或骨架上提取字符形状的基本特征,包括:圈、端点、节点、弧、突起、凹陷、笔画等等,获取手写字符的关键特征。运用了人工智能的分层神经网络思想,对识别的字体通过训练学习,达到识别手写字体的功能。
算法思想:
(1)界面方面:为了使程序跟用户有交流界面,我们必须提供一个给用户输入的终端,这里我们用鼠标代替手写,并绘制一个输入终端用于提取我们的输入,首先子类化一个静态控件,并给重绘重载,在里面绘制控件的背景(白色),和网格线(淡青色),通过矩阵的信息进行点的重绘,响应鼠标事件,用来绘制终端的点。
(2)神经网络:我们这里采用了10×10的网格结构,为了是算法清晰易见,所以输入采用100个输入,事实上用到的点没有那么多,用户可以根据需要更改,中间的隐层采用5个输入,因为我们只是识别数字,所以只是有10个输出就足够了,(其实不用10个输出也可以完成任务,1010就可以标识10了,可以只要四位,但是还是那句话,为了算法清晰易见),所以神经网络的结构是100:5:10.可以通过改变源代码的define来改变网络拓扑结构。
算法描述:
首先自己根据需要建立专门的样本库,然后根据采样的结果,所有样本图像均被归一化为28×28大小的256级灰度点阵,可以直接滤波采样,再与自己建立的10个数字样本标准库逐一进行匹配对比(引用数学形态学),根据对比结果,全局误差最小的那个,就是识别的对象。
指标性能:
正确识别率
A=正确识别样本数/全部样本数*100%
替代率(误识率)
S=误识样本数/全部样本数*100%
拒识率
R=拒识样本数/全部样本数*100%
三者的关系是:
A+S+R=100%
数字识别的应用中,人们往往很关心的一个指标是“识别精度”,即:在所有识别的字符中,除去拒识字符,正确识别的比例有多大,我们定义:
识别精度P=A/(A+S)*100%。
一个理想的系统应是R,S尽量小,而P,A尽可能大。而在一个实际系统中,S,R是相互制约的,拒识率R的提高总伴随着误识率S的下降,与此同时识别率A和识别精度P的提高。
因此怎么提高手写数字识别系统的识别精度,弄清每一个指标在怎样的样本集合下获得的等问题。
需要解决的问题:
1.如何建立自己的标准库;
2.如何对样本采样,采样样本与标准样本怎样对比;
3.如何用VC实现对识别的字体通过训练学习, 达到识别手写字体的功能;
4.怎样处理输入终端坐标偏移的问题