众所周知,为了保障商用密码的安全性,国家商用密码管理办公室制定了一系列密码标准,包括SM1(SCB2)、SM2、SM3、SM4、SM7、SM9、祖冲之密码算法(ZUC)那等等。
SM1、SM4、SM7、祖冲之密码(ZUC)是对称算法;SM2、SM9是非对称算法;SM3是哈希算法。其中SM1、SM7算法不公开,调用该算法时,需要通过加密芯片的接口进行调用;
声明
本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!
本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除,请各位自觉遵守相关法律法规。
事实上从 2010 年开始,我国国家密码管理局就已经开始陆续发布了一系列国产加密算法,这其中就包括 SM1、SM2、SM3 、SM4、SM7、SM9、ZUC(祖冲之加密算法)等,SM 代表商密,即商业密码,是指用于商业的、不涉及国家秘密的密码技术。SM1 和 SM7的算法不公开,其余算法都已成为ISO/IEC 国际标准。
在这些国产加密算法中,SM2、SM3、SM4 三种加密算法是比较常见的,在爬取部分网站时,也可能会遇到这些算法,所以作为爬虫工程师是有必要了解一下这些算法的,如下图所示某网站就使用了 SM2 和 SM4 加密算法:
算法名称 | 算法类别 | 应用领域 | 特点 |
---|---|---|---|
SM1 | 对称(分组)加密算法 | 芯片 | 分组长度、密钥长度均为 128 比特 |
SM2 | 非对称(基于椭圆曲线 ECC)加密算法 | 数据加密 | ECC 椭圆曲线密码机制 256 位,相比 RSA 处理速度快,消耗更少 |
SM3 | 散列(hash)函数算法 | 完整性校验 | 安全性及效率与 SHA-256 相当,压缩函数更复杂 |
SM4 | 对称(分组)加密算法 | 数据加密和局域网产品 | 分组长度、密钥长度均为 128 比特,计算轮数多 |
SM7 | 对称(分组)加密算法 | 非接触式 IC 卡 | 分组长度、密钥长度均为 128 比特 |
SM9 | 标识加密算法(IBE) | 端对端离线安全通讯 | 加密强度等同于 3072 位密钥的 RSA 加密算法 |
ZUC | 对称(序列)加密算法 | 移动通信 4G 网络 | 流密码 |
SM4 | DES | AES | ||
---|---|---|---|---|
计算轮数 | 32 | 16(3DES 为 16*3) | 10/12/14 | |
密码部件 | S 盒、非线性变换、线性变换、合成变换 | 标准算术和逻辑运算、先替换后置换,不含线性变换 | S 盒、行移位变换、列混合变换、圈密钥加变换(AddRoundKey) |
以 SM2算法为例,实现如下(其他算法和详细用法可参考其官方文档):https://openstd.samr.gov.cn/bzgk/gb/
SM2加密(encrypt)和解密(decrypt):
// npm install sm-crypto --save
const sm2 = require('sm-crypto').sm2
// 1 - C1C3C2,0 - C1C2C3,默认为1 算法模式
const cipherMode = 1
// 获取密钥对
let keypair = sm2.generateKeyPairHex()
let publicKey = keypair.publicKey // 公钥
let privateKey = keypair.privateKey // 私钥
let msgString = "this is the data to be encrypted"
let encryptData = sm2.doEncrypt(msgString, publicKey, cipherMode) // 加密结果
let decryptData = sm2.doDecrypt(encryptData, privateKey, cipherMode) // 解密结果
console.log("encryptData: ", encryptData)
console.log("decryptData: ", decryptData)
若要使用 SM9 算法,可下载 gmssl-python 源码手动安装。
pip install gmssl
示例如下:
from gmssl import sm2
# 16 进制的公钥和私钥
private_key = '00B9AB0B828FF68872F21A837FC303668428DEA11DCD1B24429D0C99E24EED83D5'
public_key = 'B9C9A6E04E9C91F7BA880429273747D7EF5DDEB0BB2FF6317EB00BEF331A83081A6994B8993F3F5D6EADDDB81872266C87C018FB4162F5AF347B483E24620207'
sm2_crypt = sm2.CryptSM2(public_key=public_key, private_key=private_key)
# 待加密数据和加密后数据为 bytes 类型
data = b"this is the data to be encrypted"
enc_data = sm2_crypt.encrypt(data)
dec_data = sm2_crypt.decrypt(enc_data)
print('enc_data: ', enc_data.hex())
print('dec_data: ', dec_data)
先发包,对各类参数进行分析
请求头参数中,初步推测有变化的是以下几个
X-Tif-Nonce: k3WPg33U
X-Tif-Paasid: undefined 不需要进行分析
X-Tif-Signature: 0cd52866692085e798ef0ae26c05f79a8761589e08fa0cd719787803ce1f64c2
X-Tif-Timestamp: 1691201261 初步推测为时间戳
X-Tingyun: c=B|4Nl_NnGbjwY;x=0b6f424553e94bc2
即请求标头部分分析三个参数
载荷部分
encData: "3DFBCA4667B978F639BB23B95DCE4CC7DCE52C499A10A562377DE69F5F324190CCD20943B4DAE96380B41164D761DE9742C84A985FE3BABC31CB352556BB87C9C1495DB24A29AB6BC3A85AB7FCA00F338EE714ACFC4C924F01CF575098AEF16755EE6C2B00989F3CBDACE061021CBD579720F6A86E9EFCBA77082625D345D5DFD130FEBBE62DBFF03225CA796232EA15C36959880C2647559E3C97B56FD4F10F"
encType: "SM4"
signData: "C9MFlzW3KIjkULauoIGe7ogtospAMs3qODpvT1ZuLDzL36ldwW7nlHSnB4ZFabX3thjoGaNQV/nMJ5gHnOXDMg=="
signType: "SM2"
timestamp: 1691201261 时间戳
即载荷部分有两个参数进行分析
预览部分(返回的参数部分)
encData
encType: "SM4"
signData: "iLyf85PTOuV4RJFUqsgZq/Jk2fw1goR11F/nzdhnx8jZS1d/PBEIfA0DRkMZENZnLMYL4CruXBLl8C6ZWHr0Xg=="
signType: "SM2"
timestamp: "1691201260062" 时间戳
即预览返回部分也许需要分析两个参数加密
那就先对请求标头参数进行逐步分析
直接全局搜索 encData 或 signData,搜索结果仅在 app.1691****.js 有,非常明显,上面还有设置 header的地方,所有参数都在这里,埋下断点,可以看到这里就是加密的地方,如下图所示:
头部参数处理
解决x-tif-nonce 和 x-tif-signature
encData参数处理
signdata处理
好吧我承认,因为感觉太复杂了,所以偷懒了,最后放一张逆向结果图
最后结果
写在最后:
本人写作水平有限,如有讲解不到位或者讲解错误的地方,还请各位大佬在评论区多多指教,共同进步.如有需要代码和讲解交流,可以加本人微信18847868809