XSS介绍
Cross-Site Scripting(跨站脚本攻击)简称XSS,是一种代码注入攻击。为了和CSS区分,这里将其缩写的第一个字母改成了X,于是叫做XSS。恶意攻击者在web页面里插入恶意JavaScript代码,当浏览者浏览网页时就会触发恶意代码,从而导致用户数据的泄露如Cookie、SessionID等,及造成其他类型的攻击。
XSS的本质是:恶意代码未经过滤,与网站正常代码混在一起,浏览器无法分辨哪些脚本是可信的,导致恶意脚本被执行。从源头上讲,就是代码和数据被攻击混淆,导致浏览器将攻击者输入的数据解释为代码。
案例介绍
对于下面的代码
">
您搜索的关键词是:<%= getParameter("keyword") %>
当构造链接:
http://xxx/search?keyword=">
浏览器请求该链接时,服务端会解析出参数keyword,得到">
,拼接后,得到:
">
您搜索的关键词是:">
因为参数中的数据和页面代码产生了混淆,浏览将用户参数中的,解析为代码执行。
修复这个问题可以对用户输入参数进行转义。
使用函数escapeHTML()
">
您搜索的关键词是:<%= escapeHTML(getParameter("keyword")) %>
escapeHTML()
的转义规则为:
字符 | 转义后的字符 |
---|---|
& |
& |
< |
< |
> |
> |
" |
" |
' |
' |
/ |
/ |
经过转义,浏览器就可以很好的区分用户提交的数据和页面中的代码。
您搜索的关键词是:"><script>alert('XSS');</script>
- 用户输入的为数据,目的是以文本显示出来
- 攻击者利用输入精心构造的片段,导致代码和数据混淆,使得浏览器将用户输入解析为代码
- 通过HTML转移可以防止XSS攻击
有时仅仅做HTML转义也是不够的。如:如果将JSON内联在HTML中
这时就不能使用escapeHTML()
,因为会破坏JSON格式。
但此时并不安全
- 当 JSON 中包含
U+2028
或U+2029
这两个字符时,不能作为 JavaScript 的字面量使用,否则会抛出语法错误。 - 当 JSON 中包含字符串
时,当前的 script 标签将会被闭合,后面的字符串内容浏览器会按照 HTML 进行解析;通过增加下一个
标签等方法就可以完成注入。
所以我们要丢此种情景单独进行转义。
字符 | 转义后的字符 |
---|---|
U+2028 | \u2028 |
U+2029 | \u2029 |
< | \u003c |
根据不同的场景需要采用不同的转义规则
避免自己写转义库,可能出现考虑不到的地方,尽量使用成熟、通用的转义库
有时就算是做了所有的转义,但是还是可能存在XSS,如对于下面代码:
">跳转...
构造链接:
http://xxx/?redirect_to=javascript:alert('XSS')
此时,服务端的响应为:
跳转...
在点击a
标签时,实现了XSS。
因在在于用户输入的并不是我们预期的数据。这里可以采取白名单策略,过滤非期望输入。
对用户输入数据做要求限制,过滤非期望的输入
做黑名单要考虑完全,如果考虑不周,可能会被绕过。如,上面的例子,如果仅仅过滤
JavaScript
,那么利用大小写就可以绕过。
XSS攻击分类
XSS攻击可以分为三类,反射性、存储型和DOM型。
类型 | 存储区 | 插入点 |
---|---|---|
存储型 XSS | 后端数据库 | HTML |
反射型 XSS | URL | HTML |
DOM 型 XSS | 后端数据库/前端存储/URL | 前端 JavaScript |
存储区:恶意代码存放位置
插入点:由谁取得恶意代码,并插入网页
反射型XSS
攻击步骤:
- 攻击者构造特殊的URL,其中包含了攻击者的恶意代码
- 攻击者将构造URL发送给用户。用户访问URL,服务端将恶意代码拼接在HTML中返回给浏览器
- 用户浏览器接收响应后解析执行,攻击者构造的恶意代码被当作代码执行
- 恶意代码窃取用户数据发送给攻击者,或者执行特定操作
攻击常见于通过 URL 传递参数的功能,如网站搜索、跳转等。
POST请求也可以触发反射型XSS,但触发条件苛刻,较少见。
存储型XSS
攻击步骤:
- 攻击者将恶意代码提交到目标网站的数据库中。
- 用户打开目标网站时,网站服务端将恶意代码从数据库取出,拼接在 HTML 中返回给浏览器。
- 用户浏览器接收到响应后解析执行,混在其中的恶意代码也被执行。
- 恶意代码窃取用户数据并发送到攻击者的网站,或者冒充用户的行为,调用目标网站接口执行攻击者指定的操作。
攻击常见于带有用户保存数据的网站功能,如论坛发帖、商品评论、用户私信等。
反射型 XSS 跟存储型 XSS 的区别是:存储型 XSS 的恶意代码存在数据库里,反射型 XSS 的恶意代码存在 URL 里。
DOM型XSS
攻击步骤:
- 攻击者构造出特殊的 URL,其中包含恶意代码。
- 用户打开带有恶意代码的 URL。
- 用户浏览器接收到响应后解析执行,前端 JavaScript 取出 URL 中的恶意代码并执行。
- 恶意代码窃取用户数据并发送到攻击者的网站,或者冒充用户的行为,调用目标网站接口执行攻击者指定的操作。
DOM 型 XSS 跟前两种 XSS 的区别:DOM 型 XSS 攻击中,取出和执行恶意代码由浏览器端完成,属于前端 JavaScript 自身的安全漏洞,而其他两种 XSS 都属于服务端的安全漏洞。
XSS注入点
HTML节点内容
如果用户在评论去输入
"评论“
如果没有任何防御措施,最终会解析为:
"评论“
HTML属性/参数
如上面说到的
">跳转...
当用户输入的地址为:
http://xxx/?redirect_to=javascript:alert('XSS')
就会构成XSS。
JavaScript代码
如果用户输入为JavaScript中的变量,则可以被精心构造,导致字符串提前关闭,实现注入。
>ript>,过滤一次关键词时,返回值正好时指定的恶意代码。
利用除script之外的标签
不仅script标签可以实现XSS,其他标签也是可以的。如,等
将关键词编码绕过
如果防御规则是将关键词过滤,可以将关键词进行编码,来绕过规则,然后利用eval()来执行。
如alert(1)编码后是\u0061\u006c\u0065\u0072\u0074(1)
组合方式
XSS危害
-
窃取用户信息
最常见的就是窃取用户的cookie。窃取cookie后,攻击者就可能能够直接利用令牌而不用密码就登录用户账户。
劫持流量实现恶意跳转
控制受害者机器向其它网站发起攻击
强制发送电子邮件
控制企业数据,包括读取、篡改、添加、删除企业敏感数据的能力
XSS攻击防御
XSS攻击的两个前提:
- 攻击者提交恶意代码
- 浏览器执行恶意代码
过滤
对诸如\x3csVg/\x3e
它能够检测到存在于 HTML 属性、HTML 文字内容、HTML 注释、跳转链接、内联 JavaScript 字符串、内联 CSS 样式表等多种上下文中的 XSS 漏洞,也能检测 eval()
、setTimeout()
、setInterval()
、Function()
、innerHTML
、document.write()
等 DOM 型 XSS 漏洞,并且能绕过一些 XSS 过滤器。
只要在网站的各输入框中提交这个字符串,或者把它拼接到 URL 参数上,就可以进行检测。
检测工具:
Arachni
Mozilla HTTP Observatory
w3af
引用
- 前端安全系列(一):如何防止XSS攻击?
- 浅谈XSS攻击的那些事(附常用绕过姿势)
- XSS攻击原理分析与防御技术
原文地址:渗透技术基础之XSS原理分析