js逆向

做爬虫总是会遇到js的所以今天写一篇js逆向的文章,首先打开目标网址(http://ggzy.gzlps.gov.cn/jyxxgcgs/index_2.jhtml?tdsourcetag=s_pcqq_aiomsg)
首先我们打开网站就会发现进入详情页的链接是做了处理如下
js逆向_第1张图片js逆向_第2张图片
这种就是前端js做了处理,所以要分析出js是在哪里做处理的,下面是实现代码,复制代码可用
import base64
from Crypto.Cipher import AES
def add_to_16(text):
while len(text) % 16 != 0:
text += ‘\0’
return str.encode(text)

def parseurl(url):
text = url.split(’/’)[-1].split(’.’)[0]
BS = AES.block_size
pad = lambda s: s + (BS - len(s) % BS) * chr(BS - len(s) % BS)
key = ‘qnbyzzwmdgghmcnm’
aes = AES.new(add_to_16(key), AES.MODE_ECB) # ECB模式
encrypted_text = str(base64.encodebytes(aes.encrypt(add_to_16(pad(text)))), encoding=‘utf8’).replace(’\n’, ‘’)
encrypted_text = encrypted_text[:-2].replace("/", “^”)
url1 = ‘http://ggzy.gzlps.gov.cn/jyxxgcgs/%s.jhtml’ % encrypted_text
return url1

print(parseurl(“http://ggzy.gzlps.gov.cn:80/jyxxgcgs/22564.jhtml”))

你可能感兴趣的:(js逆向)