密码学中的高级加密标准(Advanced Encryption Standard,AES),又称Rijndael加密法。
在做网络爬虫的时候,会遇到经过AES加密的数据,可以使用python来进行解密。
在做爬虫的时候,通常可以找到一个key,这个key是一个十六进制的一串字符,这传字符是解密的关键。所以对于想要解密的内容,首先要找到这个key,一般在Chrome浏览器按F12键,在network里面可以找到这个key。如下图:
本例中,以一个视频片段为例,视频片段我已经事先保存到电脑中。此时处于加密状态。打开后会出现下面的结果:
“此文件无法播放。这可能是因为文件类型不受支持、文件扩展名不正确或文件已损坏。”
这个加密的视频片段为 “91j0PUhx.ts”
解密需要导入 Crypto 模块,需要导入 from Crypto.Cipher import AES
,如果导入的语句报错,这里需要使用 pip 安装这个模块,教程我之前的文章中写到过,或者到网上找教程,都会有解决方法,这里不再赘述。
下面直接上代码:
from Crypto.Cipher import AES
import requests
with open("91j0PUhx.ts","rb") as FO: # 以二进制的形式读取视频片段
content = FO.read() # 保存到content中
keyUrl = "" # 这里字符串中填入找到的 key 的 url
# 这里是十六进制 key 的 url
key = requests.get(keyUrl).content # 请求 key
cryptor = AES.new(key, AES.MODE_CBC) # 创建一个解密器
decryption = cryptor.decrypt(content)
with open("decryption.ts", 'ab') as FO:
FO.write(decryption)
这里的大致思路就是把加密的二进制文件读取下来,然后解密,再写入文件,这时再打开就可以看到正常的视频了。
网络上的视频流数据,都是分片发送的,也就是一个个的片段。每个片段只有几百 kb 的大小,所以视频内容只有几秒的时间。想要获得完整视频,可以使用爬虫,将所有的视频片段爬取下来,然后逐个解密,将解密后的内容以二进制流的形式追加到一个视频文件上,这样最后得到的视频就是完整的视频。
这篇文章对您有帮助吗?有疑问的可以私信。