san_yun

谈谈反垃圾

由于常年从事用户产品的开发工作，工作中难免遇到过各种各样反垃圾的事，一回生二回熟，在摸爬滚打的对抗中，也摸出了一些门道，此文算是对个人经验的总结，非专业视角的分享。

这里说的垃圾主要针对诸如垃圾评论，机器注册，机器刷接口等等。

反垃圾很重要的两步是：垃圾识别，垃圾处理。

垃圾识别

对于判别垃圾，通常有下面一些方法。

基于内容的识别

在基于内容的判别上，最直接的是关键词过滤，比如包含“xxx”、“xxx”这类词的极有可能是垃圾内容，我们通过字符串匹配来判断是否有这类关键词。这里有一个难题，如果是检索一段内容是否包含某一个词还算简单，有很多算法可以实现，比如经典的KMP算法，很多语言内置的字符串查找方法效率也很高。但是，要判断一段内容是否包含一堆关键词中的某一个或某几个，那就有一些难度了，总不能循环一遍所有关键词挨个做匹配吧，所以此法必不可取。

这里推荐两个方法，一个是基于trie树的关键词树，具体有没有开源实现的不清楚，我们使用中是自己基于Memcached改了一个，保留Memcached的简单协议，修改内部逻辑为trie树的查找，简单来说就是将关键词做字节切分，建立一棵trie树，判断一段话中是否包含这些关键词，只需要从根节点向下检索即可。

另外一个方法，是利用贝叶斯算法来进行垃圾概率计算。贝叶斯算法这里就不多展开说了，其原理简单来说就是，收集一组正常内容和一组垃圾内容，用此内容对系统进行训练，让系统能够知道每个词在正常内容中和是在垃圾内容中的概率。做完训练后，再有一段新内容过来，可以直接对其中的词进行综合加权计算，得出整段内容是正常或垃圾的概率。

基于特殊内容的识别

上面是纯粹基于随机内容的识别，而实际上我们可能还有一些省力的方法，比如一般的垃圾内容经常会有下面一些特征：带链接（因为要把用户引导到自己的垃圾网站），带图片（为了更醒目），带数字串（比如QQ号，电话号等等），通过这些特征做字符串匹配也是一个好方法，而且就个人经验来看，还比较奏效。其中需要注意的一点就是，上面的链接、数字串这些，通常攻击者都会搞一些变体，不会直接写链接和数字让你判断。比如换成中文数字和字母，你知道，UTF8是很博大精深的。比如：1҉2҉3҉4҉5҉6҉7҉8҉9҉0҉ 这种。所以判断规则上需要多做一些兼容，比如把这种东西先全转成数字来判断。

基于请求方式的识别

另外，垃圾毕竟是通过我们暴露给用户的各种接口进来的，而攻击者请求我们接口的方法难免与真实用户有差距。比如说，正常用户会先进入注册页面，再填表单，再提交注册按钮。但是恶意注册程序，很可能是不会先访问你的注册页面的，而是直接请求注册接口（利用这一点我们就可以作文章，比如对用户访问路径进行记录，如果未访问页面就直接请求接口的，判为恶意请求）。另外就是攻击者的http头信息，比如最常见的，UA字段是否是cUrl或者其它非正常浏览器。或者像很多前端团队都有在请求url上添加随机数的习惯，这样本来是为了避免后端缓存，但有些低水平的垃圾请求会原样的每次都用同一个随机数，这就很容易识别他们了。总之，从http请求的层面可识别的东西很多，只要攻击者伪装有一点纰漏，咱们就可以抓到他的尾巴。

基于请求主体的识别

如果我们遇到UGC内容的垃圾攻击，那么发起请求的肯定得是一个正常用户（如果是匿名社区请忽略此条）。这时候，内容发送主体的信用级别，就可以转移为对信息质量的判别上来。就像我们都懂的，某些大的平台也会对不同用户执行不同的审核策略（比如都知道的先审后放，还是先放后审），这也需要我们对内容发布主体有充分的信用分级。比如，一个注册24小时内的用户相对一个注册三年发帖无数的用户来说，信用等级就低得多。

基于内容载体的识别

垃圾内容之所以能形成黑色产业链，通常绝不会是恶作剧玩玩而已，所以跟互联网最传统的广告模式一样，垃圾也希望能够多曝光，多赚点击。那怎么做呢，通常就是选择在用户扎堆的地方去发。比如时下热门的电视剧，热点的新闻事件下面就是垃圾流量的公共厕所了。另外，在一些政治军事内容版块发xxx言论，在一些娱乐美女内容版块发成人网站，这些也都是常用的路数。总的来说就是，同样一条内容，在热门版块发布，更有可能会是垃圾内容，需要我们更多的关注。

垃圾处理

好吧，上面说了一大堆的方法去给内容和用户评级，以便我们能够对一个用户或者一段发布的内容进行预估，那么，在我们了解了一个用户或者一段内容是否可能是垃圾后，我们脑子里首先蹦出来的可能就是：封杀！但实际处理方法可能不仅封杀一种，下面我们就来探讨一下对垃圾攻击的几种处理方法。

制定封杀方法

如果我们已经确切掌握了垃圾流量的规律，比如某一个IP或一组IP，比如同一组参数，比如内容总是包含某网址的变体，那么我们就可以直接大开杀戒，用这些特征直接进行封杀操作。

制定审核级别

顺着上面的思路，我们可以对不同的用户和内容施加不同的审核策略，比如是直接放行、先审后放、先放后审还是直接毙掉。我们还可以对用户施加不同的限制策略，比如新注册用户每天只能发3条内容（在审核通过一条后又可以再发）。

工作量证明

工作量证明是一个在反垃圾邮件中的方法，最近火得不得了的比特币，工作量证明也是其核心理论支柱之一。通过引入工作量证明方法，我们甚至可以不用对垃圾流量进行判别。只要加一道隐形的门槛，就足以让很多攻击者却步。

举个例子，如果攻击者原来只需要请求一次接口就能够发布一条信息，现在我们需要他在接口请求之前先填一个验证码，他就没那么容易自动狂发内容了。上面这个逻辑大家都能理解，也确实能奏效，但是很抱歉，这样做很伤用户体验，产品经理说不行。

那我们换一种做法，我们让用户在请求前先做大约10w次的md5运算，普通用户的机器偶尔进行一次这样的计算不算什么，但是对攻击者来说，它需要单机发布大量内容，如果我们要求每条内容都需要做10w次md5的话，对的硬件资源是很大的挑战，也是让他放弃对你网站进行攻击的一个方法。

当然，如果我们直接用上面的10w次md5的方法，我们在服务端也需要做同样多的工作才能对传入的接口进行验证，对我们服务器本身也是很大的挑战。所以上面只是一个为了让我们理解的例子，通常的做法是，服务端给定一个随机字符串 s1，客户端需要找到一个数 d，这个数要满足下面条件：这个数破加在这个随机串后同组成一个新串 s2，这个新串进行md5后，前5位都要是0。大家可以想一下，要达到这样的标准，客户端需要不断循环来寻找这个合适的d，而服务端验证却是只需要进行一次md5就可以了。这就是所谓的工作量证明。

请求签名

请求签名也是一个省时省力的好方法，前后端约定一种hash算法（最好是自创的），前端对请求内容进行签名，后端验证签名。通过对前端代码进行混淆，让攻击者很难实现你的hash算法。增加他的攻击成本。

查出源头

发垃圾内容的攻击者通常都不会用自己机器或服务器IP（要不你就赚到了，直接封IP就行了），而是用手里控制的肉鸡或者扫描来的http代理来做，其实识别肉鸡和代理也比较简单，最直接的方法就是看看开没开着80、8080、3128等端口。这是一般代理的常用接口，另外一般情况下被拿下的肉鸡也都是web接口防范不严造成的。如果是普通http代理，很可能会很有良心的通过x-forward-for，或者x-real-ip等http头信息把源ip传给你，而对于肉鸡找到肉鸡，如果你的黑客水平够，你可以直接也黑上去，看看是哪个IP在控制它，从而查到真实IP。查到攻击者的真实IP后如何处理就看你的了，是联系攻击方和平解决，直接报案还是把攻击者给黑了。那就看个人想法和水平了。

策略与战略

上面说了一堆战术层面的东西，下面聊一点战略上的原则。

1.反垃圾是一场成本的较量

反垃圾，其实不是一项技术竞赛，更不像是个人恩怨，更多的是成本较量。如果你的网站流量大，但防护措施做得不够，那垃圾流量过来是必然的。我们所有的反垃圾策略只有一个目的，就是增加攻击者的成本，当成本上升到某一阀值时，攻击者会发现在你的网站玩太费劲，投入产出比太低，于是会去找同类型的其它网站。所以就像狮子和羊群一样，只要不是跑得最慢的那一只，就能逃过狮子的爪牙。

2.多数攻击者痛点在IP

无论是用代理，还是肉鸡，攻击者的IP资源总是比较有限的，所以收集到足够多的IP进行封杀，通常能够解决大问题。

3.实而示之虚

上面说反垃圾是一场成本较量，但在我们实际操作中，却要尽量避免真正的较上劲。比如当你发现了恶意请求的规律，如果你选择直接对此规则的请求返回404，那么攻击者也会马上知道它的攻击特征被你发现了，从而迅速进行升级对抗。但是如果你只是让他的操作无实际效果，但还照样返回“注册成功”、“发布成功”，那么攻击者可能会麻痹大意很长时间才会发现。正如《孙子兵法》中说的：“实而示之虚”。实际上在垃圾与反垃圾的较量中，最忌讳的就是无止境的军备竞赛。

4.发现特征之钓鱼策略

有的攻击者很高明，能够将自己的请求伪装得得正常用户一模一样，所有的http头信息，请求参数，都完全仿真。对于这样的攻击者，我们有什么办法抓到他的尾巴呢。这里给大家介绍一种钓鱼策略。首先你修改一下你的网站的前后端逻辑，比如前端增加某一个参数，后端判断没有这个参数请求就会失败，这时候攻击者马上就会发现自己请求失败了，通过对正常请求的抓包，他很快发现你增加了一个参数，那他会跟着进行修改。这时我们让他爽几天。然后偷偷地把这个无关紧要的参数撤掉。这时候，所有正常用户请求中都不会有这个参数了，但是，攻击者不会时时关注我们的请求参数，所以还会在一段时间内，继续加上这个参数请求。这时钓鱼成功，正是我们的好机会，在这段时间内，我们可以尽量收集垃圾的IP，发布账号等信息。等收集到一定程度一起封掉（当然，这里的封掉也不要暴力封掉，而是让看起来没有被封掉）。

总的来说，反垃圾工作其实不是一个技术活，要求更多的是细致、谨慎与耐心，希望上面东西对你有用。

Python 统计字符串里每个字符出现的次数的三种方法咻咻职位搜索引擎后端开发 Python python 字符统计字典
记录一下，怕忘记了~setdefault()的介绍介绍：setdefault()方法提供了一种方式，在一行中完成这件事。传递给该方法的第一个参数，是要检查的键。第二个参数，是如果该键不存在时要设置的值。如果该键确实存在，方法就会返回键的值~spam={'name':'Pooka','age':5}print(spam.setdefault('color','black'))>>blackprint
python 字典排序 SkTj
orderedDict保持元素插入时的顺序fromcollectionsimportOrderedDictd=OrderedDict()d['foo']=1d['bar']=2d['spam']=3d['grok']=4Outputs"foo1","bar2","spam3","grok4"forkeyind:print(key,d[key])
Python创建字典的八种方式 Python_P叔 python 开发语言
1.创建空字典dic={}type(dic)#2.直接赋值创建dic={'spam':1,'egg':2,'bar':3}print(dic)#{'bar':3,'egg':2,'spam':1}3.通过关键字dict和关键字参数创建dic=dict(spam=1,egg=2,bar=3)print(dic)#{'bar':3,'egg':2,'spam':1}4.通过二元组列表创建lis=[('
秀！一下子就搞明白了键值对是否在字典中的判断函数金陵驿 Python python 开发语言 ipython
目录1.判断键是否在字典中2.判断值是否在字典中3.判断键值对是否在字典中我们先建立一个字典：spam={’name’:’Zophie’,’age’:7,'color':'red'}1.判断键是否在字典中in或in.keys()例：>>>’name’inspam.keys()True>>>’age’inspam2.判断值是否在字典中in.values()例：>>>’Zophie’inspam.va
Chapter One | 5-Not Mass, Not spam, Not Shameful... Curtain_d9d5
Let'shaveacasestudy.Whypenguinmagicaresucceed?Theyareprofessional.Thepeoplewhorunthesiterealizedthatprofessionalmagiciansrarelybuytricksbecausetheyonlyneedtenortwentyregulartricksintheirbag.Sincetheau
从知乎[悟空]看一个成熟的Anti-Spam系统演进之路 cool1998
导读：作弊是互联网应用最常碰见的问题之一。有作弊就有反作弊，如果高效的对作弊内容进行识别，识别后又该如何处理作弊内容，每家公司都有自己的独门绝技。本文作者对知乎反作弊系统的演进进行了介绍，深入剖析了该系统的架构设计和演进历程，十分耐读。Hithere!距离2015年4月「悟空」正式与大家见面，已经整整三个年头了。随着知乎的不断发展壮大，过去的一段时间，「悟空」不断面临着新的考验，并持续地在优化升级
从知乎「悟空」看一个成熟的Anti-Spam系统演进之路 weixin_34075551 数据库人工智能运维
Hithere!距离2015年4月「悟空」正式与大家见面，已经整整三个年头了。随着知乎的不断发展壮大，过去的一段时间，「悟空」不断面临着新的考验，并持续地在优化升级。接下来跟大家系统分享一下这几年「悟空」的架构演进和构建过程中积累的经验与教训。业务现状截止2018年5月，知乎已拥有1.6亿注册用户，近几年在问答，专栏文章之外，社区衍生出了一些新的产品线和产品形态。因此「悟空」对接的业务形态也得到了
统一威胁管理 Zh&&Li 网络安全运维安全运维网络
旨在提供全面的威胁防护和安全管理UTM是由传统防火墙观念进化而成，它将多种安全功能都整合在单一的产品之上，其中包括了网络防火墙，防止网络入侵（IDS），防毒网关（gatewayantivirus，AV），反垃圾信件网关（gatewayanti-spam），虚拟私人网络（VPN），内容过滤（contentfiltering），负载平衡，防止资料外泄，以及设备报告等。该UTM方案是由美国公司提出，是指
Python学习笔记（五）- 动态类型间奏（The Dynamic Typing Interlude）小黑LLB Learning Python 5th Edition Python Learning Python 5th Edition 奥莱理
1.考虑下面三个语句。它们是否更改了A的值？A='spam'B=AB='shrubbery'答：没有改变，A仍然打印'spam'。当B被赋值字符串'shrubbery'，所有发生的事是变量B被重新设置为指向新的字符串对象。A和B初始指向相同的字符串对象'spam'，但是在Python中，变量名字从来不会联系到一起（变量名之间没关系，只是引用相同对象）。因而，把B设置为不同对象对A没有影响。当最后的
python 集合 MZP_man python
“集”这个概念在Python中算是比较年轻的，同时它的使用率也比较低。set和它的不可变的姊妹类型frozenset直到Python2.3才首次以模块的形式出现，然后在Python2.6中它们升级成为内置类型。集合的本质是许多唯一对象的聚集。因此，集合可以用于去重：l=['spam','spam','eggs','spam']set(l)#{'eggs','spam'}list(set(l))#[
一篇文章带你了解谷歌reCAPTCHA验证码的所有版本和前世今生 ForRunner123 人工智能机器人
reCAPTCHA简介数字时代带来了许多便利和机会，消除了隔阂，并以以前难以想象的方式连接了世界。然而，随着这些先进技术的发展，网络世界也见证了Spam（广告信息）和数据滥用等恶意活动的激增。在这个不断发展的数字环境中，像reCAPTCHA这样的工具已经成为网络防御的关键组成部分，提供强大的安全措施来保护网站，并保持用户友好的体验。CAPTCHA（CompletelyAutomatedPublic
wordpress删除各种类型评论的sql语句大猫会长 wordpress php mysql
//删除待审评论、垃圾主论，回收站评论DELETEFROM`wp_comments`WHERE`comment_approved`NOTLIKE'1';//只删除待审评论DELETEFROM`wp_comments`WHERE`comment_approved`='0';//只删除垃圾评论DELETEFROM`wp_comments`WHERE`comment_approved`='spam';/
Python 字典排序大梦三千秋
字典排序问题创建字典，并在迭代或序列化字典的时候控制元素的顺序。解决方法Python提供的collections模块中OrderedDict，就能够控制字典中元素的顺序。在执行迭代操作的时候，元素会保持插入时的顺序，示例代码如下：fromcollectionsimportOrderedDictd=OrderedDict()d['foo']=1d['bar']=2d['spam']=3d['grok
Bayes贝叶斯识别Spam Email垃圾邮件取名真难. 机器学习机器学习人工智能深度学习 python
目录介绍：一、GaussianNaiveBayes(连续型变量)1.1数据处理1.2建模1.3cross_val_score函数评估1.4classification_report函数评估1.5classification_report函数和cross_val_score函数的区别二、MultinomialNaiveBayes（离散型变量）2.1数据处理2.2建模2.3CountVectorize
python发送邮件报错554 雷霹霹
今天在用python的smtplib从163发邮件给qq邮箱时报错提示smtplib.SMTPDataError:(554,b'DT:SPM163smtp13,EcCowAAHKbvOPZ9caJ15OA--.46887S21553939919,pleaseseehttp://mail.163.com/help/help_spam_16.htm?ip=183.128.104.30&hostid=s
解密垃圾邮件分类：基于SVM的数据挖掘项目袁既望数据挖掘分类支持向量机
垃圾邮件（Spam）的泛滥成灾一直是电子邮件系统中的一个严峻问题。随着垃圾邮件技术的不断演变，传统的过滤方法逐渐显得力不从心。因此，本项目旨在利用支持向量机（SVM）这一强大的机器学习工具，实现对垃圾邮件的高效分类，为用户提供更清爽、高效的电子邮件体验。一、项目目标本项目的主要目标是构建一个基于SVM的垃圾邮件分类系统。通过对两个不同来源的数据集（trec和enron）进行综合分析和处理，我将展示
捕获组部落大圣
可以通过用括号包围正则表达式的部分来创建组，意味着一个组可以作为元字符（例如*或？）的参数。importrepattern=r"egg(spam)*"ifre.match(pattern,"egg"):print("Match1")ifre.match(pattern,"eggspamspamspamegg"):print("Match2")ifre.match(pattern,"spam"):p
Python编程快速上手第章4章列表忘记他 Python 列表 python
列表数据类型整型，浮点型，字符串，bool型，None型>>>[1,2,3][1,2,3]>>>['cat','bat','rat','elephant']['cat','bat','rat','elephant']>>>['hello',3.1415,True,None,42]['hello',3.1415,True,None,42]>>>spam=['cat','bat','rat','ele
python快速上手自动化15.12.2答案,Python编程快速上手-让繁琐工作自动化第四章列表练习题及其答案... 波兰蜜蜡世家 python快速上手自动化15.12.2答案
第四章列表练习题及其答案1、什么是[]?答：空的列表值，它是一个列表，不包含任何列表项。这类似于‘‘是空的字符串值。2、如何将‘hello‘赋值给列表的第三个值，而列表保存在名为spam的变量中？(假设变量包含[2,4,6,8,10])答：spam[2]=‘hello‘(注意列表中的第3个值下标是2，因为第一个值下标是0。)对接下来的3个问题，假定spam包含列表[‘a‘,‘b‘,‘c‘,‘d‘]
浅谈自动化测试中的验证码处理方法小总结茶浅呀
今天跟大家聊一聊自动化测试中的验证码处理方法一些小总结，希望对你们有帮助，有说的不好的地方，还请多多指教！目前，不少网站在用户登录、用户提交信息登登录和输入的页面上使用了验证码技术。验证码技术可以有效防止恶意用户对网站的滥用，使得网站可以有效避免用户信息失窃、广告SPAM等问题。但与此同时，验证码技术的使用却使得WEB自动化测试面临了较大的困难。验证码一般应用在WEB系统涉及登录和输入的页面上，其
Pandas进阶：20个实用的Pandas函数的基本使用金戈鐡馬 Python pandas python 数据分析数据运维
1.ExcelWriter很多时候dataframe里面有中文，如果直接输出到csv里，中文将显示乱码。而Excel就不一样了，ExcelWriter是pandas的一个类，可以使dataframe数据框直接输出到excel文件，并可以指定sheets名称。df1=pd.DataFrame([["AAA","BBB"]],columns=["Spam","Egg"])df2=pd.DataFram
python 正则表达式符号学习路慢慢
来自《Python编程快速上手-让繁琐工作自动化》?匹配零次或一次前面的分组*匹配零次或多次前面的分组+匹配一次或多次前面的分组{n}匹配n次前面的分组{n,}匹配n次或更多前面的分组{,m}匹配零次到m次前面的分组{n,m}匹配至少n次，至多m次前面的分组{n,m}?或?或+?对前面的分组进行非贪心匹配^spam意味着字符串必须以spam开始spam$意味着字符串必须以spam结束.匹配所有字符
python 3.7官方文档学习 caokai001
python3.7官方文档py3-cookbook在线的jupyterlab,点击即可numpyreshape(-1)解读python模块关系1.str1.1相邻字符串合并作为单一表达式组成部分，之间只由空格分隔的多个字符串字面值会被隐式地转换为单个字符串字面值。也就是说，("spam""eggs")=="spameggs"1.2str.lstrip([chars])返回原字符串的副本，移除其中的
虚拟主机网站怎样搬到服务器,老站长教你网站迁移虚拟主机服务器的技巧刘子栋虚拟主机网站怎样搬到服务器
原标题：老站长教你网站迁移虚拟主机服务器的技巧作为广大的站长，其实是一群弱势群体，当我们掏钱之后，IDC说啥就是啥，个人基本是无能为力的。于是，更换虚拟主机，成为各个站长最普遍的问题。那么在更换虚拟主机流程是什么呢？一、检测待用主机通常情况下，应该先测试新主机的IP地址是否是安全的，检测其是否被列入SPAM名单，是否被搜索引擎屏蔽，上面是否有其他非法网站等，通过电信、网通、国外等多个不同线路是否能
“秃头”所有人对Python程序员的印象，一集在手，避免抓狂，薅发，预防秃头（错题集）清风烟雨&程序猿 python python 编程语言面试
“秃头”所有人对Python程序员的印象，一集在手，避免抓狂，薅发，预防秃头（错题集）1）尝试修改string的值（导致“TypeError:‘str’objectdoesnotsupportitemassignment”）string是一种不可变的数据类型，该错误发生在如下代码中：spam='Ihaveapetcat.'spam[13]='r'print(spam)而你实际想要这样做：spam=
adb remount 报错：Binder ioctl to enable oneway spam detection failed: Invalid argument Dnelic- Android AOSP android adb remount Linux
问题执行adbremount时提示failed$adbrootrestartingadbdasroot$adbremountBinderioctltoenableonewayspamdetectionfailed:Invalidargumentremountsucceeded分析AOSPS中ProcessState.cpp包含该报错信息，可以查看以下两个文件：/system/libhwbinder
Exchange Server 2003反垃圾邮件配置黑名单RBL 杨俊峰的博客 mysql java 运维 linux 数据库
什么是RBL呢？RBL是英文RealtimeBlackholeList的缩写，即实时黑名单列表，假使你进入了黑名单那么你就是发过spam的企业或是个人了。对应的也有白名单之说，就是买个保单！给大家证明，我不是垃圾邮件的发送者，大家可以信任我滴。那么spam是什么？哈哈，其实就是以前的一个午餐肉的名称。是美军二战军用口粮，本名叫斯帕姆午餐肉。在二战的时候在斯帕姆午餐肉被美军大兵厌倦，他们的英国(19
Python常用语句 BeautifulBoydad python 开发语言
python常用语句：(1)、赋值：创建变量引用值1a,b,c='aa','bb','cc'(2)、调用：执行函数1log.write('spam,name')打印、输出：调用打印对象，print语句1print('abc')(3)if、elif、else：选择条件语句，if语句、else与elif语句12if'iplaypython'intext:print(text)(4)for、else：序
IOS Spam 上架被拒原因分析及处理办法剩饭
#IOSSpam上架被拒原因分析及处理办法问题描述上传审核了一个马甲应用，根据之前的经验，在上架之前详细分析和对比的生成的ipa文件然后根据别人给的意见添加了一定比例的垃圾代码，删除了多余的资源文件以减少相同比例，甚至将每个图片资源的名称都改了名称，但还是提示了如下问题：4.3Design:SpamGuideline4.3-DesignWenoticedthatyourappprovidesthe
浅谈一下自动化测试中的验证码处理方法小总结程序员威子自动化测试职场和发展软件测试 python 功能测试
今天跟大家聊一聊自动化测试中的验证码处理方法一些小总结，希望对你们有帮助，有说的不好的地方，还请多多指教！目前，不少网站在用户登录、用户提交信息登登录和输入的页面上使用了验证码技术。验证码技术可以有效防止恶意用户对网站的滥用，使得网站可以有效避免用户信息失窃、广告SPAM等问题。但与此同时，验证码技术的使用却使得WEB自动化测试面临了较大的困难。验证码一般应用在WEB系统涉及登录和输入的页面上，其
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt