无聊的人做无聊的事情

公元2006.06.29下午无聊的很,就开始做无聊的事情,想学习一些图像识别,然后莫名的想到拿csdn做目标,虽然最后没有成功,但是提供一些思路吧。有些思路未必正确只是一种想象。

如上图所示:

1,去掉糙点:俺想的笨办法,糙点是不连续存在的一个面积,那么该面积的点数一定有个范围,去掉点数小于某个数字的连续面积;

2,去边框:这个就不说了;

3,去掉背景:从颜色本源来说,RGB,向CSDN这样图片中的字符如果要被肉眼识别,那么他的字符颜色一定很纯粹,也就是说字符的颜色的RGB中的某个数值一定很大,可以直接抠出这些数值很大的连续面;可以做一定程度的灰度变化再处理;

4,单独扣除连续面的内容作比较,不用考虑位移的问题;这个图片中的字符没有变形处理,所以相对简单。

PS:这是俺这没有任何图像处理知识的人的思路哈,不要打击俺

你可能感兴趣的:(无聊的人做无聊的事情)