Pytorch模型加密的方法

目录

  • 一、难点和原理
  • 二、代码
  • 三、整体代码
  • 四、硬件绑定

一、难点和原理

  1. 对一个文件进行加密或者解密其实有很多种方法,难点主要在于,得到加密文件之后,如何在程序运行时进行解密,而不是先解密再运行程序,这相当于没加密。(脱裤子放屁的感觉。。。)
  2. 对于pytorch框架,我们进入torch.load里面查看代码,如下图所示:
    Pytorch模型加密的方法_第1张图片
    pytorch是可以读取 io.BytesIO 类型的数据的,因此,可以有如下的加密和解密过程:
  • 加密过程
  1. 我们可以将读取的模型先保存成 io.BytesIO的格式;
  2. 再把io.BytesIO格式的数据保存成 bytes格式的数据;
  3. 再对bytes数据进行加密;
  4. 然后保存成加密文件。
  • 解密过程
  1. 读取加密文件(用open去读取),得到加密的bytes格式数据;
  2. 解密,得到解密后的bytes格式数据;
  3. 将解密后的bytes格式数据,转换成io.Bytes格式数据;
  4. 使用torch.load直接读取io.Bytes格式数据,得到pytorch模型。

二、代码

  1. 对于加密算法,我们这里引入 cryptography库,利用其中的Fernet算法进行加密(Fernet具体是啥就不做介绍了),首先安装cryptography库
pip install cryptography
  1. 首先生成一串密钥,可以借助cryptography.fernet.Fernet库生成,也可以根据硬件信息的mac地址、硬件序列号啥的生成,这里以用cryptography.fernet.Fernet生成密钥为例,代码如下:
from cryptography.fernet import Fernet

key = Fernet.generate_key()
print(key)  # b'RtqikMWYdz45HAuXx-dguw6lmNXgOyT0XIMV8r0TtvU='

会随机生成一串bytes类型的字符串,我们将这串密钥保存到一个文件license当中,

with open('license', 'wb') as fw:
    fw.write(key)

加密过程,假设现在有pytorch的模型文件xxx.pth,则加密过程如下:

import io
import torch
# step1: 读取pytorch模型,并转成io.Bytes
model = torch.load(pth_file)
b = io.BytesIO()
torch.save(model, b)
b.seek(0)  # 这一句不能漏掉

# step2:io.Bytes格式数据转成bytes格式数据
pth_bytes = b.read()

# step3:读取加密license获取密钥,进行加密
 with open(license, 'rb') as fr:
     key = fr.read()
encrypted_data = Fernet(key).encrypt(pth_bytes)

# step4:保存加密文件
with open('encrypt.pth', 'wb') as fw:
    fw.write(encrypted_data)

  1. 解密过程
# step1:读取加密文件,得到加密的bytes格式数据
with open('encrypt.pth', 'rb') as fr:
    encrypted_data = fr.read()

# step2:解密,得到解密后的bytes格式数据
with open(''license, 'rb') as fr:
    key = fr.read()
decrypted_data = Fernet(key).decrypt(encrypted_data)

# step3:解密后的bytes数据转成io.Bytes格式数据
b = io.BytesIO(decrypted_data)
b.seek(0)

# step4:torch.load读取解密后的io.Bytes格式数据
model = torch.load(b)

三、整体代码

将上述代码进行封装,整体代码如下所示:

import io
import torch
from cryptography.fernet import Fernet

key = b'vlu3T4bs2WWK5lc2QB-yKvGc_20P4gh6TqD7nhuh7pU='


def write_license(license_file, key):
    with open(license_file, 'wb') as fw:
        fw.write(key)


def read_license(license_file):
    with open(license_file, 'rb') as fr:
        key = fr.read()
    return key


def model_encryption(pth_file, encryp_file, license):
    model = torch.load(pth_file)
    b = io.BytesIO()
    torch.save(model, b)
    b.seek(0)
    pth_bytes = b.read()
    key = read_license(license)
    encrypted_data = Fernet(key).encrypt(pth_bytes)
    with open(encryp_file, 'wb') as fw:
        fw.write(encrypted_data)


def model_decryption(encryt_file, license):
    with open(encryt_file, 'rb') as fr:
        encrypted_data = fr.read()
    key = read_license(license)
    decrypted_data = Fernet(key).decrypt(encrypted_data)
    b = io.BytesIO(decrypted_data)
    b.seek(0)
    model = torch.load(b)
    return model

四、硬件绑定

  1. 一般可以利用硬件信息生成密钥,如获取机器的mac地址、ip、hostname,把这些信息编码成密钥。每次运行程序时,获取这串密钥,与license中的密钥比较,若不一致,则令程序无法正常进行。

  2. python中可以利用socket、uuid库获取mac地址、ip地址、hostname的代码如下所示:

import uuid
import socket
mac = uuid.UUID(int=uuid.getnode()).hex[-12:]
mac = ':'.join([mac[e:e + 2] for e in range(0, 11, 2)])

hostname = socket.gethostname()

address = socket.gethostbyname(hostname)

ps:有的同学可能想到获取硬件的序列号,如CPU的序列号、硬盘的序列号等,在windows系统比较好获取,但是例如在ubuntu想获取序列号需要root权限,在代码中不好实现,所以其实通过mac地址就足够了,因为mac地址也是唯一的。

结束。

你可能感兴趣的:(Coding,CV,pytorch,模型加密,深度学习,python)