Jsoup的clean

最近在学习Jsoup,发现里面有一个clean方法,该方法用来 消除不受信任的HTML (来防止XSS攻击) ,至于什么叫xss跨站脚本,请参考http://publish.it168.com/2007/0704/20070704004201.shtml


Jsoup里面内置了一些常见的白名单规则,可以帮开发者转换html,以免html被植入恶意代码


String unsafe = 
  "<p><a href='http://example.com/' onclick='stealCookies()'>Link</a></p>";
String safe = Jsoup.clean(unsafe, Whitelist.basic());

unsafe的html代码,只要点击该连接,将会触发恶意代码,比如获取用户的cookies,cookies一般会存储用户的用户名和密码

进行白名单过滤后,unsafe的html代码变成

// <p><a href="http://example.com/" rel="nofollow">Link</a></p>

你可能感兴趣的:(Jsoup的clean)