防shua文摘

最近应朋友之约 测试他做的投票网站 防刷票机制能力如何,下面有一些心得和体会。

朋友网站用PHP写的,走的是HttpRequest,他一开始认为IP认证应该就差不多了。但说实话这种很low,手动更换代理服务器手动刷都可以。但程序员的手就是程序,于是,

首先先 百度到 一些 免费代理服务器,非常多网站分享这些。按一定格式来储存到TXT文件。

第二步使用Fiddler来进行截取消息,拿到其http request header和body:

第三步使用.NET HTTPREQUEST。逻辑是遍历代理txt里代理,伪造 fiddler监听到的request 消息(当然其中一些cookie和其他的细节需要改变根据不同情况讨论)

_contentsList = File.ReadAllLines(@"C:Proxy.txt");
           var contents = _contentsList.ToList();
     
           var proxy = string.Empty;
           var port = 0;
     
           foreach (var item in contents)
           {
               new Thread(() =>
               {
                   try
                   {
                       // 获取代理
                       var list = item.Split(':');
                       proxy = list[0];
                       port = Convert.ToInt32(list[1]);
     
                       // 伪造消息
                       var request =
                           (HttpWebRequest)
                               WebRequest.Create(
                                   @"http://XXX.COM");
                       request.Proxy = new WebProxy(proxy, port);
                       request.UserAgent = @"Mozilla/5.0 (Windows NT 6.3; WOW64; rv:28.0) Gecko/20100101 Firefox/28.0";
                       request.Referer = @"http://XXX.COM";
                       request.Method = "GET";
                       request.Host = @"XXX.COM";
                       request.Accept = @"*/*";
     
                       request.Headers.Add(@"Accept-Language", @"zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3");
                       request.Headers.Add(@"Accept-Encoding", @"gzip, deflate");
                       request.Headers.Add(@"X-Requested-With", @"XMLHttpRequest");
                       var response = request.GetResponse();
                       Console.WriteLine(response.ToString());
                   }
                   catch (Exception e)
                   {
                       Console.WriteLine(e.Message);
                   }
               }
               ).Start();

然后我朋友发现这样的确问题很大,于是他采用了验证码验证模式,即首先服务器会发给你验证码,你发的request的uri里参数必须要包含相同的验证码。

这种方式非常好,至少干掉了绝大多数的刷票软件。但我仍然想试验一下,这有一种battle的味道。哈哈

其实这个逻辑来说就是一来一回。给我验证码图片,我识别出来,然后再发送就好了。难度就在于验证码的OCR。

一开始我朋友验证码非常简单,就是几个数字,于是我直接使用最基础的OCR识别就干掉了。

后来他加了噪点,OK,这个也没有问题。我们降噪,然后再识别,虽然机器学习需要一段时间,但正确率还是有一些的。

最后他采用了随机产生汉字,我发现,汉字的OCR是个很麻烦的事情。这也是我下一步要研究的点,以后会出一篇关于OCR的文章。

随后他说还会加入一些cookie验证什么的,到这里我觉得我朋友的网站现在算是挺完善了。然后我就问下我老大,如果是他,他会怎么来刷票。

我老大回复非常简单,租人人工刷,随你技术怎样,我给他们两毛一票,你算算时间成本,完全划得来。

虽然这可能就是他随口一说,但我有一些感悟。

你可能感兴趣的:(防shua文摘)