最近12306对登陆验证过程进行了升级,让很多抢票软件失效,也引起众多网友的热议。
如图,用户在登陆时需要选择和题目给出的描述相同的图片,新的验证方式推出后,不少网友也在网上发表看法。大部分网友表示此举很给力,“黄牛抢票软件失效了,对于我们这样总是通过正常渠道购票的人来说,总算迎来了‘春天’,普通用户购票几率就大了。”一位网友表示。除了支持的声音,也有不少网友调侃,“新的验证方式很像游戏‘找你妹’。”“新的验证方式告诉你,没有好眼神出不了门。”
但是这种新的验证方法真的能抵制刷票软件么?12306验证码改版后,第一时间内,所有抢票工具都已经无法登录。但是当天晚上,有抢票软件公司发出声明,已在第一时间投入技术团队,出台应对措施,实现图像验证码自动识别,12306推出的新的验证措施对其抢票软件没有影响,甚至声称“成功率提升200%”。
验证被破解的消息可靠么?作为一个人工智能专业的学生,我可以告诉你,这非常有可能,而且用到的技术已经非常成熟。要破解这样的验证码,说到底就是图像识别问题。
利用机器学习和人工智能技术,计算机可以不断在互联网上搜集不同图片和其对应的“标签”
经过大量图片和对应标签的训练,计算机习得了各种不同标签图片之间的区别与关系,形成一个庞大的分类器,此时再向这个分类器输入一张图片,分类器将输出这个图片的“标签”,图片识别过程就完成了。
现在各大互联网公司,尤其是搜索引擎都在将图像识别技术逐渐应用到实际中,比如我们最熟悉的百度,很早以前就有了“以图搜图”的功能。
当我从本地上传一张刚刚下载的图片,点击“百度一下”
百度识图就能自动猜测图片的含义,给出最佳猜测,并推荐相关图片和搜索结果。
网站对于登陆者是否是真正的人类的判断,和利益驱使下,各种“外挂”“刷票”软件的斗争一直在进行。
想要设计好一个验证码,要明白验证码的目的和本质。
我认为,验证码是将自然人与机器相区别的一种判断方式。
现有的验证码大多是一张有噪声或形变的图片,要求用户输入图片中的字母和数字信息,如图所示。
这种简单的验证码是想利用人脑联想记忆的功能,将人与机器区别开来,但随着人工智能的发展,机器的联想记忆能力已经不弱于人类,甚至在一些复杂情况下,凭借高于人脑的计算能力还会超过人类,我在博客里曾经就写过一篇利用hopfield神经网络分类有噪声的数字图片的文章http://blog.csdn.net/zjccoder/article/details/38170125。所以这样的验证码只能挡住那些“傻傻的”抢票软件。
当然,更有些“奇葩”的验证方式
上面的两种验证方式,前一个似乎认为复旦大学的学生数学能力比电脑还要好,后一个验证码想要破解,需要涉及自然语义分析和一个庞大的常识知识库,提取其中的A,B,在知识库中找到对应数字,计算最后的式子才能解开,但这也仅仅是麻烦一些而已,想要破解,技术上没有问题,没人破解估计也是无利益可图罢了。
随着人工智能的发展,验证码越来越显得无力,人工智能与自然人类之间的区别越来越小,在不久的将来,人工智能将实现人类大部分功能,验证将无比困难。
但是验证的意义和需求依然存在,我们必须发现其他的途径,区别开人与机器。
这个可能要等到几十年后,科技发展的高度发达时,人类已经开发出能够区别C基生命和Si基生命的传感器,验证过程只需要一扫描就知道你是人类还是机器人。
人工智能的语义识别已经做的不错了,但是对于情感方面的识别还做得不好,可以利用这一点,区分开人类与机器。
我们知道,图灵测试的基本思想,而且通过图灵测试的机器人屈指可数。那何不以图灵测试作为验证人类与否的标准?但其中一个重要的问题是,验证过程的判断是后台服务器完成的,也就是一个机器,一个机器是否能判断一个对象是人类还是机器?
说了这么多,其实就讨论了两个事实:人工智能的发展让机器越来越像人类,验证的需求、现状和展望。
推荐一个工具:caffe神经网络库,官网上的介绍是这样的The Caffe neural network library makes implementing state-of-the-art computer vision systems easy.
这是它的在线识图demo,http://demo.caffe.berkeleyvision.org/,还不够完善,大家可以体验一下,利用它方便的建立自己的图像学习工具。
人工智能已经离我们越来越近,我们应该怀着开放、探索的精神去了解它、学习它、利用它。
(转载请注明作者:张竞成process-z.com)