Python爬取FLASH播放器中的资料

Python爬取FLASH播放器中的资料。

一、首先了解一下AMF协议:

AMF(Action Message Format)是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层面上传输。现在很多Flash WebGame都采用这样的消息格式。
AMF协议是基于Http协议的.
它的内容处理过程大致是这样:
1.从客户端获取Http请求(Request)流.
2.对流进行解串行化(Deserialize),得到服务器端程序能够识别的数据,并建立一个响应(Response)消息
3.Debug开始
4.对流进行各种处理(记录、许可、服务)得到返回值
5.对响应流进行串行化
6.发送Http响应给客户端

二、Python与amf进行互通需要用到PyAMF

1、下载pyamf
https://pypi.python.org/pypi/PyAMF
2、安装pyamf
下载完成之后解压出来,打开DOS命令进入pyamf目录,
执行下列命令,安装pyamf框架
python setup.py install --disable-ext

三、获取关键字节伪造访问

首先使用charles抓包工具,抓取AMF包,得到请求/应答的AMF数据,对AMF格式的请求和响应的数据进行分析。
解密的POST DATA如下图所示:


Python爬取FLASH播放器中的资料_第1张图片

构建flex.messaging.messages.RemotingMessage信息

msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),\
    clometOd=None,\
    operation='playeSource',\
    destination='metaDataService',\
    timeTolive=0,\
    timestamp=0
    )
msg.body=['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
msg.headers['DSEndpoint']='my-amf'
msg.headers['DSId']=str(uuid.uuid1()).upper()
......

得到的Response如下图:


Python爬取FLASH播放器中的资料_第2张图片

四、具体实现代码如下:

import urllib2
import uuid
import pyamf
from pyamf import remoting
from pyamf.flex import messaging

# 构造flex.messaging.messages.RemotingMessage消息
msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),\
    clometOd=None,\
    operation='playeSource',\
    destination='metaDataService',\
    timeTolive=0,\
    timestamp=0
    )
msg.body = ['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
msg.headers['DSEndpoint'] = 'my-amf'
msg.headers['DSId'] = str(uuid.uuid1()).upper()
# 按AMF协议编码
req = remoting.Request('null', body=(msg,))
env = remoting.Envelope(amfVersion=pyamf.AMF3)
env.bodies = [('/1',req)]
data = bytes(remoting.encode(env).read())

# 提交请求
url = 'http://xxxx.xx.xx/amf'
req = urllib2.Request(url,data,headers={'Content-Type':'application/x-amf'})

# 解析返回数据
oepner = urllib2.build_opener()

# 解码AMF协议返回的数据
resp = remoting.decode(opener.open(req).read())
print resp.bodies[0][1].body.body['xxxx']
......

你可能感兴趣的:(Python爬取FLASH播放器中的资料)