随着大语言模型(LLM, Large Language Model)在各行各业的广泛应用,其安全性和隐私保护变得尤为重要。为了防止敏感数据泄露或未经授权的访问,透明数据加密(TDE, Transparent Data Encryption)技术被引入到大语言模型的文件管理中。本案例将详细介绍如何使用TDE技术对大语言模型的文件进行加密,并探讨其优势和实现步骤。
TDE是一种数据库级别的加密技术,能够对存储在磁盘上的数据进行实时加密和解密。其核心特点包括:
将TDE应用于大语言模型文件的存储,可以有效提升模型的安全性,防止未经授权的访问和数据泄露。
透明加解密:在模型加载/保存时自动执行加解密操作。 密钥生命周期管理: 密钥服务平台(KSP) → 主密钥 → 数据加密密钥(DEK)
本文档以ubuntu20.04进行部署。以下是使用TDE加密大语言模型文件的主要步骤:
1.选择支持TDE的存储系统
确保所使用的存储系统(如数据库、文件系统)支持TDE功能。
2.下载模型文件 本文以 Hugging Face模型库 中的DeepSeek-R1模型为例进行加密。将模型下载至/home/zn/models/ 目录下
3.安装配置 vLLM运行环境。
4.安装TDE透明加密软件
1.配置策略
将大语言模型文件导入保护点目录中,下发策略后系统会自动对文件进行加密。在系统已经导入策略的情况下,向保护目录导入大誉满模型文件也会自动加密。
python -m vllm.entrypoints.openai.api_server --host 0.0.0.0 --model/home/zn/models/deepseek_model
curl http://localhost:8000/v1/models
响应:
{
"object": "list",
"data": [
{
"id": "/home/zn/models/deepseek_model",
"object": "model",
"created": 1740389894,
"owned_by": "vllm",
"root": "/home/zn/models/deepseek_model",
"parent": null,
"max_model_len": 131072,
"permission": [
{
"id": "modelperm-4b3dca9b012f48f180ff0307ceb03865",
"object": "model_permission",
"created": 1740389894,
"allow_create_engine": false,
"allow_sampling": true,
"allow_logprobs": true,
"allow_search_indices": false,
"allow_view": true,
"allow_fine_tuning": false,
"organization": "*",
"group": null,
"is_blocking": false
}
]
}
]
}
curl http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "/home/zn/models/deepseek_model",
"messages": [
{"role": "user", "content": "hello?"}
],
"temperature": 0.7
}'
响应:
{
"id": "chatcmpl-a3e579aebebb4a7388eb3cc1e3e32bce",
"object": "chat.completion",
"created": 1740389919,
"model": "/home/zn/models/deepseek_model",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"reasoning_content": null,
"content": "Alright, the user greeted me with \"hello?\" which is a friendly way to ask me how they're doing. I should respond in a warm and welcoming manner to keep the conversation going smoothly. I'll let them know I'm here to help with whatever they need. Keeping it open-ended will encourage them to share more about what they're interested in or need assistance with.\n\n\nHello! How can I assist you today?",
"tool_calls": []
},
"logprobs": null,
"finish_reason": "stop",
"stop_reason": null
}
],
"usage": {
"prompt_tokens": 7,
"total_tokens": 94,
"completion_tokens": 87,
"prompt_tokens_details": null
},
"prompt_logprobs": null
}
1. 增强模型文件安全性 TDE能够有效防止数据在存储介质上的未授权访问,即使物理硬盘被盗,攻击者也无法使用改模型文件。
2. 对大模型运行过程透明
加密和解密过程对应用程序完全透明,无需修改现有代码或流程。
3. 加解密速度快 结合CPU的加解密硬件加速,加解密对模型运行影响有限,实测运算开销在5%甚至更低。
4. 安全的密钥管理
TDE的加密策略、密钥收到密钥管理系统KSP的统一管控,密钥的生成、存储、轮换和备份都安全可控,核心根密钥采用硬件加密机保护,安全有保障。
文章作者:终南 ©本文章解释权归安当西安研发中心所有