是Yu欸

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）数据窃取攻击对抗攻击（用途：漏洞隐藏）后门攻击（加触发器+标签翻转）

代码大模型的应用及其安全性研究

写在最前面
- 一些想法
- - 大型模型输出格式不受控制的解决方法
大模型介绍
- （很有意思）GPT 模型家族的发展
- Chatgpt
- - 优点
  - 缺点
  - GPT4
- 其他模型
- - 补充：self-instruct合成数据
- Code Llama
代码大模型的应用
- （第一次理解清楚hh，这图好清晰，学长的讲解也好好）“预训练-微调”范式和“预训练-prompt”范式
- 课堂讨论：预训练一般是无监督的，一般为下一个token预测
- 提示工程——漏洞检测（召回率上升，精确率几乎没变）
- - 基本提示
  - 增强提示1
  - 思维链提示（角色扮演、API和DF只加一个效果更好）
- 提示工程——漏洞修复
- - 增强提示2
- 提示工程——代码摘要（效果不行、给出的原因：单词不一样，但表述更好）
- 学长自己做的“微调——漏洞检测”评估实验（和参数量呈正比关系）
代码大模型的安全问题
- 模型窃取攻击（API和网页接口）
- 数据窃取攻击
- 对抗攻击（用途：漏洞隐藏）
- 后门攻击（加触发器+标签翻转）
参考文献

写在最前面

本文为邹德清教授的《网络安全专题》课堂笔记系列的文章，本次专题主题为大模型。

第一次课上，文明老师的博士生杜小虎学长进行了代码大模型的应用及其安全性研究的相关介绍

将我之前不太明白的一些概念解释得深入浅出，醐醍灌顶

另有部分个人不成熟的理解，欢迎交流
后面如果有进一步理解，将对文章进行更新

一些想法

大型模型输出格式不受控制的解决方法

大型模型输出格式不受控制的情况，一些可能的解决方法：

输出处理：

后处理和过滤： 可以通过编写自定义的后处理代码来筛选和处理大型模型的输出。这可能包括解析输出以识别关键信息、删除不必要的内容、转换输出格式，以及对输出进行筛选和排序。
数据存储： 将输出存储到数据库中（可以理解为，输出转换为结构化数据，而不是自由的文本），以便按需检索和查询。
数据过滤和清理： 对于文本数据，可以使用自然语言处理技术来过滤和清理输出，以去除噪音和非关键信息。
增量处理： 如果模型生成的输出是不断增长的，可以采取增量处理的方法，仅处理新增数据，而不必重新处理整个输出。
限定词汇表： 缩小模型可以选择的词汇表，只允许特定的词汇或短语。这可以限制生成的内容，使其更加可控。

模型处理：

提供明确的指令或提示： 向模型提供明确和具体的指令或提示，以引导它生成所需的内容。指令可以包括问题、主题、关键词或上下文。通过明确的指令，您可以控制模型生成的内容，使其符合您的预期。
限制生成长度： 设置生成文本的最大长度，以确保输出不会变得太长或无效。这可以通过截断或修剪生成的文本来实现。
温度参数调整： 调整生成模型的温度参数。较低的温度值会使生成更加确定性，较高的温度值会增加随机性。通过调整温度参数，您可以控制生成的创造性和多样性。
抽样策略： 使用不同的抽样策略来生成文本。例如，贪婪抽样会选择最有可能的词语，而随机抽样会引入更多的随机性。选择适当的抽样策略可以影响生成文本的可控性。
模板或脚本： 创建文本生成的模板或脚本，然后将模型的输出填充到模板中。这种方式可以确保生成的文本符合特定的结构或格式。
多轮对话： 进行多轮对话，以逐步引导模型生成所需的内容。在每一轮中，提供反馈并指导模型生成下一步内容。
领域特定模型微调： 如果可能的话，可以微调预训练模型，以使其在特定领域或任务上更具可控性。

大模型介绍

国内外生成式大模型研究现状总结

GPT 系列模型的发展历程总结

（很有意思）GPT 模型家族的发展

GPT 模型家族的发展从 GPT-3 开始分成了两个技术路径并行发展：
1、一个路径是以 Codex 为代表的代码预训练技术
2、另一个路径是以 InstructGPT 为代表的文本指令(Instruction)预训练技术。

但这两个技术路径不是始终并行发展的，而是到了一定阶段后(具体时间不详)进入了融合式预训练的过程，并通过指令学习(Instruction Tuning)、有监督精调(SupervisedFine-tuning)以及基于人类反馈的强化学习(Reinforcement Learning with HumanFeedback，RLHF) 等技术实现了以自然语言对话为接口的 ChatGPT 模型。

GPT 演化图，图源How does GPT Obtain its Ability? Tracing Emergent Abilities of Language Models to their Sources

Chatgpt

优点

零样本泛化能力、参数量大、逐步推理

缺点

输出格式不受控制（感觉是目前所有生成式模型的通用问题？）
训练一次时空复杂度高，导致：时效性差、成本高昂

GPT4

主要引入多模态，并达到SOTA性能

其他模型

由于个人目前没有涉猎相关研究，待后续补充想法

斯坦福Alpaca：self-instruct、instruction数据上监督微调
清华ChatGLM：双语能力

补充：self-instruct合成数据

self-instruct是一种将预训练语言模型与指令对齐的方法。可以通过模型自己来生成数据，而不需要大量的人工标注。
参考：https://blog.csdn.net/dzysunshine/article/details/130390587

Step1：通过模型生成新的指令；
根据人工设计的175个任务，每个任务都有对应的（指令，输入，输出）或（指令，输出）；使用模型生成新的指令；
Step2：对模型生成的指令进行判断（指令是否是一个分类任务）；
Step3：根据Step2的判断结果，给出不同的输出
如果是分类任务，就通过模型输出 Class_label 和 Input（Output-first）；
如果不是分类任务，就通过模型输出 Input 和 Output（Input-first）。
Step4：过滤及后处理
对上述模型生成的数据进行过滤和后处理，将经过过滤和后处理的数据添加到种子池中。

对于以上4个步骤进行不断循环，直到种子池有足够多的数据（通常会设定一个具体的参数，比如：52000），生成过程停止。

Code Llama

所有 Code Llama 模型均使用 Llama 2 模型权重进行初始化，并使用来自代码密集数据集的 500B token 进行训练.
Code Llama Python 模型从 Llama 2 模型初始化，并使用 Code Llama 数据集的 500B token 进行训练，并使用 Python 数据集进一步专门针对 100B token训练。
Code Llama - Instruct 模型基于 Code Llama 并使用额外的5B token 进行了微调，可以更好地遵循人类指令。
Unnatural model.。为了进行比较，它们还对 Code Llama - Python 34B 对 15,000 个非自然指令进行了微调。Meta没有发布这个模型，但观察到 HumanEval 和 MBPP 的明显改进，这表明可以通过一小组高质量编码数据来实现改进。

代码大模型的应用

（第一次理解清楚hh，这图好清晰，学长的讲解也好好）“预训练-微调”范式和“预训练-prompt”范式

神经网络需要大量数据的训练才能使得模型的效果更好，但训练是非常漫长的过程。我们可以把整个训练过程裁成两个部分：

开始的占比最大的部分称为预训练，后面的占比较小的部分称为微调

随着的着技术的发展，对于很多不同的任务，可以共享同一个预训练过程和不同的微调过程。这就是“预训练-微调”范式，

大模型还给出了另一个范式，“预训练-prompt”

课堂讨论：预训练一般是无监督的，一般为下一个token预测

（马兴宇学长补充，预训练一般是无监督data，但可以添加部分监督data）
微调可以理解为对齐任务，以符合人类期望

补充：prompt为提示工程

提示工程——漏洞检测（召回率上升，精确率几乎没变）

基本提示

（单词积累：漏洞vulnerability、脆弱（或者翻译为存在漏洞更合适？）vulnerable）

写该漏洞是否包含在Yes/no格式的代码中: write whether the vulnerability is contained in the code in the Yes/no format:

下面的功能包含一个漏洞写在Yes/no格式和为什么? does the following function contain a vulnerability write in Yes/no format and why?

判断该函数是否在Yes/no格式下存在漏洞: tell whether this function is vulnerable in the Yes/no format:

写这个函数是否脆弱: write whether this function is vulnerable:

增强提示1

你是一个提示优化者。 You are a prompt optimizer.

请优化以下提示: Please optimize the following prompt:

“你是智能合约的漏洞检测器。 “You are a vulnerability detector for a smart contract.

请检查此合同中的以下九种漏洞:[vULs]。 Please checkfor the following nine types of
vulnerabilities in this contract: [vULs].

让我们一步一步来思考。 Let’s think step by step.

智能合约的源代码如下:[输入]。 The source code for the smart contract is asfollows:
[Input].”

没有问题。 No problem.

我的优化提示如下: My optimized prompt is as follows:

您是一个智能合约漏洞检测器，请分析提供的以下9个漏洞的源代码:[vULS]。 “You are a smart contract vulnerability detector, please analyze theprovided source code for the following nine vulnerabilities: [vULS].

一步一步仔细思考。 Think step by step carefully.

合同源代码:[输入]。” The contract source code: [Input]."

思维链提示（角色扮演、API和DF只加一个效果更好）

请描述给定代码的意图。 Please describe the intent of the given code.[CODE].

我想让你扮演一个漏洞检测系统。 I want you to act as a vulnerability detection system.

上面的代码有bug吗? Is the above code buggy?

只回答是或否。 Only answer Yes or No.

下面是你可以使用的API调用序列/数据流信息:[API描述]/[DF描述]。 Here is its API call sequence/data flow information that you may use: [API description]/[DF description].

提示工程——漏洞修复

增强提示2

模板:下面的代码是为一个训练在[Y]上的[X]问题设计的。 Template: The following code is designed for a [X] problem trained on [Y].

请修理它以便[Z]。(代码)
Please repair it in order to [Z].[Code]

示例:下面的代码是为在Iris数据集上训练的分类问题而设计的。 Example: The following code is designed for a classification problem trained on Iris dataset.

为了提高精度，请修理一下代码。 Please repair it in order to improve the accuracy.[Code]

对话:修错了。 Dialogue: The repair is wrong.

故障可能发生在以下位置:[Loc]。 Faults may happen in the following locations:[Loc].

请修理一下。 Please repair it.

提示工程——代码摘要（效果不行、给出的原因：单词不一样，但表述更好）

这个工作，效果肉眼可见的差hh

学长自己做的“微调——漏洞检测”评估实验（和参数量呈正比关系）

学长是用A800完成的实验
补充：A100比A800更好，但都是80G的

闭源api接口，微调差不多60刀一次

代码大模型的安全问题

模型窃取攻击（API和网页接口）

模型窃取指的是攻击者依靠有限次数的模型询问，从而得到一个和目标模型的功能和效果一致的本地。这类攻击的性价比非常高. 因为攻击者不需要训练目标模型所需的金钱、时间、脑力劳动的开销，却能够得到一个原本花费了大量的时间、金钱、人力、算力才能得到的模型。由于 ChatGPT 和GPT4 的模型参数很大并且功能十分广泛，要完整窃取其整个模型是具有极大困难的。

但是攻击者可以只窃取其某一部分的能力，例如窃取的模型在关于金融领域的知识上能够与 ChatGPT/GPT4 的能力相一致，就可以免费使用 ChatGPT 和GPT4 的能力。特别是在现在 ChatGPT 呈现专业化应用的情况下，具有某一领域中强大能力的模型是受人追捧的。并且 ChatGPT 已经开放了 API 的使用，这更为模型窃取提供了询问入口。

数据窃取攻击

数据窃取攻击指的是通过目标模型的多次输出去获取训练过程中使用过的数据的分布。如果攻击者能够知晓 GPT 模型训练过程中使用过的数据是哪些，就有可能会造成数据隐私损害。

在此之前研究者就发现人工智能模型使用过程中产生的相关计算数据，包括输出向量、模型参数、模型梯度等，可能会泄露训练数据的敏感信息。这使深度学习模型的数据泄露问题难以避免。

例如，
1、模型逆向攻击，攻击者可以在不接触隐私数据的情况下利用模型输出结果等信息来反向推导出用户的隐私数据；
2、成员推断攻击，攻击者可以根据模型的输出判断一个具体的数据是否存在于训练集中。

ChatGPT 和 GPT4 虽然没有输出向量等特征因素，但是由于其模型结构，训练方式的一部分已经被人所知，并且开放了 API 接口来访问，因此针对 ChatGPT 和 GPT4 的数据逆向攻击已经具有相当威胁。

Bard承认自己是GPT3

对抗攻击（用途：漏洞隐藏）

大模型鲁棒性差


标识符（label）随机替换对预训练模型容易产生误导，因而影响较大

后门攻击（加触发器+标签翻转）

代码搜索、死代码插入、修改标识符

代码风格转换

参考文献

生成式大模型安全与隐私白皮书，之江实验室
GPT-4 Technical Report，OpenAI

多模态AI Agent技术栈解析：视觉-语言-决策融合的算法原理与实践
多模态AIAgent技术栈解析：视觉-语言-决策融合的算法原理与实践嗨，我是IRpickstars！总有一行代码，能点亮万千星辰。在技术的宇宙中，我愿做永不停歇的探索者。✨用代码丈量世界，用算法解码未来。我是摘星人，也是造梦者。每一次编译都是新的征程，每一个bug都是未解的谜题。让我们携手，在0和1的星河中，书写属于开发者的浪漫诗篇。目录编辑多模态AIAgent技术栈解析：视觉-语言-决策融合的算
Android Studio在移动开发中的性能优化案例分析移动开发前沿 android studio 性能优化 android ai
AndroidStudio在移动开发中的性能优化案例分析关键词：AndroidStudio、移动开发、性能优化、内存管理、CPU优化、APK大小优化、工具链摘要：本文深入解析AndroidStudio在移动开发中的核心性能优化能力，通过内存管理、CPU调度、APK体积优化等典型场景的实战案例，系统讲解Profiler、Lint、Gradle等工具链的深度应用。结合具体代码示例和数学模型，分析内存泄
Android Profiler 功耗分析教程及案例 summerkissyou1987 android
以下是基于最新AndroidStudio工具链的EnergyProfiler功耗分析完整指南及实战案例，结合行业最佳实践和深度优化策略：⚙️一、环境配置与核心功能启用EnergyProfilerAndroidStudio→Profiler图标→连接设备（Android8.0+）→选择目标进程→点击Energy模块关键要求：测试设备需支持batteryhistorian数据采集（推荐Android1
Kotlin 函数与 Lambda 表达式 Devil枫安卓 kotlin 开发语言 android
今天继续分享Kotlin学习内容。目标：掌握函数定义、调用、参数传递，以及Lambda表达式的基础用法1.函数：Kotlin的代码模块化工具定义：函数是可重复调用的代码块，用于封装逻辑。语法：fun函数名(参数列表):返回类型{//函数体return结果//可省略（若表达式函数或返回类型可推断）}示例1：基础函数fungreet(name:String):String{return"Hello,$
为什么 Python 是 AI 的首选语言？
文章目录一、简洁优雅，易于上手二、丰富的库和框架1.数据处理与分析2.数据可视化3.机器学习与深度学习框架三、强大的社区支持四、跨平台性和可移植性五、与其他语言的互操作性文章配套代码已上传，点击查看：https://download.csdn.net/download/2501_92578370/91180848在人工智能（AI）技术飞速发展的今天，编程语言的选择对AI开发者来说至关重要。当你翻开
TypeScript基本类型
一、前言TypeScript是JavaScript的一个超集，它通过添加静态类型系统帮助开发者写出更健壮、可维护性更强的代码。而理解TypeScript的基本类型是学习TypeScript的第一步。本文将带你全面了解TypeScript中的常用基本类型，包括：✅数值类型✅字符串类型✅布尔类型✅null与undefined✅any与unknown✅never与void✅数组类型✅元组类型并通过大量代
TypeScript编译选项
一、前言在开发TypeScript项目时，一个非常关键的文件就是tsconfig.json。它不仅定义了项目的根目录、模块解析方式，还控制着TypeScript编译器的行为。本文将带你全面了解：✅tsconfig.json的作用✅常用编译选项（compilerOptions）详解✅不同环境下的配置建议（开发/生产）✅配置继承与共享设置✅实际开发中的常见问题与解决方法并通过完整的代码示例帮助你掌握如
HTTP 协议深入理解大曰编程 java面试 http 网络协议网络
在Web服务与API设计中，HTTP协议是客户端与服务器通信的基石。本文从协议演进、核心机制、缓存策略、安全特性及面试高频问题五个维度，系统解析HTTP的底层原理与工程实践。一、HTTP协议演进与版本差异1.1版本特性对比版本发布年份核心改进局限性HTTP1.01996基础请求-响应模型，支持GETPOSTHEAD方法无持久连接，每次请求需建立TCP连接HTTP1.11999持久连接（Connec
RocketMQ 5.x 架构与端口差异、Java客户端代码示例及修改 RocketMQ Proxy 默认端口
RocketMQ5.x端口差异及代码解释端口差异的原因在RocketMQ5.x版本中，端口使用与之前版本不同，主要原因如下：架构变化：RocketMQ5.x引入了新的Proxy模块，作为客户端与Broker之间的中间层默认端口：4.x版本：NameServer默认端口9876，Broker默认端口109115.x版本：Proxy默认端口8080/8081分离设计：5.x将路由发现与消息传输分离，客
【设计模式04】单例模式鼠鼠我呀2 设计模式设计模式单例模式
前言整个系统中只会出现要给实例，比如Spring中的Bean基本都是单例的UML类图无代码示例packagecom.sw.learn.pattern.B_create.c_singleton;publicclassMain{publicstaticvoidmain(String[]args){//doublechecklocking线程安全+懒加载⭐️//SingletonDCLinstance=
AI 时代下，普通人不能错过的五大变现机会 Jasonakeke AI 人工智能大数据
AI时代下，普通人不能错过的五大变现机会关键词：轻资产低门槛强需求机会1：知识付费——借“AI”做知识博主核心逻辑：AI降低知识生产门槛AI这个领域有巨大的科普红利和流量红利操作步骤：定位细分领域用AI工具快速生成内容选择平台机会2：AI自媒体——流量即现金变现模式：自媒体商单广告分成带货私域转化核心逻辑：目前AI存在巨大的科普红利和流量红利+AI能够提升创作效率爆款公式：选题：AI工具测评+具体
【RabbitMQ】消息丢失问题排查与解决
RabbitMQ消息丢失是一个常见的问题，可能发生在消息的生产、传输、消费或Broker端等多个环节。消息丢失的常见原因及对应的解决方案：一、消息丢失的常见原因1.生产端（Producer）原因(1)消息未持久化原因：生产者发送消息时未设置持久化（deliveryMode为非持久化模式），且Broker未持久化队列或交换器。场景：Broker宕机或重启时，未持久化的消息会丢失。(2)生产者通道或连
【AI Infra】基础学习汇总篇逆羽飘扬 AI基础知识人工智能学习
系列综述：目的：本系列是个人整理为了学习训练框架优化的，整理期间苛求每个知识点，平衡理解简易度与深入程度。来源：材料主要源于【DeepEP官方介绍】进行的，每个知识点的修正和深入主要参考各平台大佬的文章，其中也可能含有少量的个人实验自证。结语：如果有帮到你的地方，就点个赞和关注一下呗，谢谢！！！请先收藏！！！，后续继续完善和扩充(●’◡’●)文章目录一、分布式与并行基础分布式计算高性能并行GPU硬
【Python基础】13 知识拓展：CPU、GPU与NPU的区别和联系智算菩萨 python 开发语言人工智能
引言：处理器大战背后的技术革命在人工智能蓬勃发展的今天，我们经常听到CPU、GPU、NPU这些术语，但你是否真正理解它们之间的区别和联系？作为Python开发者，我们更关心的是：在什么场景下选择哪种处理器？如何在Python中充分发挥它们的性能优势？这篇文章将从技术原理出发，结合Python实战代码，深入解析这三种处理器的特点、应用场景和发展趋势，帮助你在面对不同计算任务时做出最优选择。第一章：C
【Python基础】15 Python并发编程进阶智算菩萨 python 人工智能
在现代软件开发中，随着多核处理器的普及和网络应用的复杂化，并发编程已经成为提升程序性能的关键技术。Python作为一门优雅且强大的编程语言，提供了多种并发编程方案，包括多线程、多进程和异步编程。然而，很多开发者在面对具体场景时，往往不知道该选择哪种方案，或者对这些技术的底层原理缺乏深入理解。本文将深入探讨Python并发编程的三大核心技术，从底层原理到实际应用，通过详实的案例分析帮助读者掌握在不同
【教程4＞第7章＞第26节】基于FPGA的RS(204,188)译码verilog实现10——RS译码模块整体实现与性能仿真评估 fpga和matlab #第7章·通信—信道编译码 fpga开发 RS verilog RS译码教程4
本课程学习成果预览目录1.软件版本2.RS译码模块整体实现介绍2.1伴随式计算（SyndromeCalculation）2.2擦除位置处理（ErasureHandling）2.3多项式乘法（PolynomialMultiplication）2.4欧几里得算法（EuclideanAlgorithm）2.5钱搜索（ChienSearch）3.RS译码模块整体FPGA实现4.RS译码仿真测试5.视频操作
MVC与MVVM架构模式详解：原理、区别与JavaScript实现布兰妮甜 javascript mvc mvvm 架构
Hi，我是布兰妮甜！在当今复杂的前端开发领域，如何组织代码结构一直是开发者面临的核心挑战。MVC和MVVM作为两种经典的架构模式，为前端应用提供了清晰的责任划分和可维护的代码组织方案。本文将深入探讨这两种模式的原理、实现差异以及在实际项目中的应用场景，通过JavaScript代码示例展示它们的核心思想，帮助开发者理解如何根据项目需求选择合适的架构模式。文章目录一、架构模式概述二、MVC架构模式2.
八股文——JAVA基础：什么是反射？反射的优点和缺点都有哪些？反射的原理是什么？ Hellyc java 开发语言
简单来说，反射是一种可以让jvm在动态运行时拿到类的信息的一种方法。在编程时可以通过类对象来获取该类中基本信息，包括类方法、继承关系等。反射的优点在于使得代码的编写更加灵活，比如配置文件的加载，只需要在配置文件中进行修改，而不需要修改代码。反射的最大优势就在于反射是框架编写的基石，比如使用的spring框架、AOP面向切面编程等都是使用到了反射。缺点在于安全性不足，因为使用反射可以绕过java的语
JOIN顺序优化：小表驱动大表的执行原则数据狐（DataFox） 2025年爬虫实战项目 sql 性能优化数据库
在数据库查询优化中，特别是在使用SQL语句进行数据查询时，遵循“小表驱动大表”的原则是一种常见且有效的策略。这个原则的核心思想是首先处理小表，然后再与大表进行连接操作，这样可以显著提高查询的效率。下面详细解释这一原则及其背后的原因：为什么“小表驱动大表”有效？减少数据扫描量：当数据库系统执行JOIN操作时，如果先处理小表，那么只需要扫描小表中的每一行与大表中的行进行匹配。这样可以大幅度减少需要扫描
分区表设计：历史数据归档与查询加速
以下从核心原理、归档设计与查询优化三个维度系统阐述分区表技术，结合主流数据库实践提供可落地方案：‌一、分区表核心原理与价值‌‌物理存储与逻辑分离‌‌分区策略‌：通过分区键（如时间戳、ID范围）将单表数据划分为多个物理子表（分区），逻辑上仍视为整体表。‌双重优化机制‌：‌集群级‌：通过DISTRIBUTEBY分布数据到不同节点，实现负载均衡；‌节点级‌：通过PARTITIONBY在节点内细分数据，减
MIT 6.S184 Lec01 Flow and Diffusion Models 克斯维尔的明天_ 机器学习人工智能
MIT6.S184Lec01FlowandDiffusionModels本节中，我们将描述如何通过模拟一个适当构造的微分方程来获得所需的转换。例如，流匹配和扩散模型分别涉及模拟常微分方程（ODE）和随机微分方程（SDE）。因此，本节的目标是定义和构建这些生成模型。具体来说，我们首先定义ODE和SDE，并讨论它们的模拟。其次，我们描述如何使用深度神经网络对ODE/SDE进行参数化。从中推导出流模型和
服务器异常宕机或重启导致 RabbitMQ 启动失败问题分析与解决方案代码怪兽大作战 RabbitMQ 服务器 rabbitmq 宕机启动失败
服务器异常宕机或重启导致RabbitMQ启动失败问题分析与解决方案一、深度故障诊断与解决方案1.权限配置不当故障2.端口占用故障3.数据目录残留故障二、故障类型对比与诊断矩阵三、完整恢复流程（10步法）四、风险规避与最佳实践️数据保护策略预防性配置五、高级故障排除技巧诊断工具集容器特有故障处理容器维护命令速查主机与容器方案对比总结⚡快速恢复决策树六、总结当服务器异常宕机或重启后，RabbitMQ启
【设计模式05】原型模式鼠鼠我呀2 设计模式设计模式原型模式
前言通过clone来实例化对象，适用于复杂大对象的创建，一般用不着UML类图无代码示例packagecom.sw.learn.pattern.B_create.d_prototype;importjava.lang.reflect.Array;importjava.util.*;importjava.util.Scanner;publicclassMain{/***广告主可以在页面上复制已有订单模
【Python基础】14 内存管理与性能优化智算菩萨 python 性能优化开发语言
前言在现代软件开发中，性能优化已经成为每位开发者必须掌握的核心技能。Python作为一门高级编程语言，虽然在语法简洁性和开发效率方面具有显著优势，但其解释型语言的特性也带来了性能上的挑战。深入理解Python的内存管理机制，掌握有效的性能优化策略，不仅能够帮助我们编写出更高效的代码，还能在处理大规模数据和高并发场景时游刃有余。本文将从Python内存管理的底层原理出发，深入探讨垃圾回收机制、内存分
JAVA八股文：异常有哪些种类，可以举几个例子吗？Throwable类有哪些常见方法？ Hellyc java 开发语言
Throwable、Error与Exception所有的异常类型都继承自java.lang.Throwable。其中Error（比如OutOfMemoryError、StackOverflowError、类加载失败等）表示JVM自身或运行环境的问题，不应该也通常无法由应用程序去捕获或恢复，出现Error通常意味着程序无法继续安全运行。Exception则代表应用层“可感知”的问题。CheckedE
BAAI/BGE-VL多模态模型部署、原理、代码详解（实现图像文本混合检索），包含BEG-VL多模态模型的本地部署详细步骤及代码原理解析令令小宁 python 语言模型自然语言处理 nlp 人工智能
本文包含BGE-VL多模态模型的本地部署详细步骤及代码原理解析文章目录前言一、模型下载二、计算流程解析1.BGE-VL-base/Large2.BGE-VL-MLLM-s1/s2三、总结前言提示：这里可以添加本文要记录的大概内容：包含四个模型及数据集，数据集未开源，四个模型可以分别下载：其中，BGE-VL-base/Large是基于CLIP训练的模型，BGE-VL-MLLM-S1/S2是基于LLM
本地部署Jina-CLIP v2:多语言多模态文本图像向量模型（包含一些踩坑记录和技巧）令令小宁 jina 语言模型 python
JinaCLIPv2：Jina-CLIP-v2是一个全新的通用多语言多模态向量模型，该模型基于jina-clip-v1和jina-embeddings-3构建，实现了一些关键改进。关于Jina-CLIP-v2的更多介绍点此可了解模型特点模型开源链接：https://huggingface.co/jinaai/jina-clip-v2在它的开源链接的介绍中，我们可以得知，Jina-CLIP-v2的参
[精选] 2025最新MySQL和PostgreSQL区别、迁移、安全、适用场景全解析猫头虎数据库技术专区 #MySQL专栏 #PostgreSQL专栏 mysql postgresql 安全运维云原生数据库容器
[精选]2025最新MySQL和PostgreSQL区别、迁移、安全、适用场景全解析在当前的数据库技术领域，MySQL和PostgreSQL作为两大主流数据库，拥有各自独特的优势和应用场景。随着技术的不断演进，特别是2025年的最新动态和趋势，两者在功能、迁移、性能、安全性等方面都有了一定的变化和优化。因此，本文将通过详细的对比和分析，帮助初学者更好地理解这两种数据库，帮助你做出选择，或者顺利进行
从 TCP/IP 协议栈角度深入分析网络文件系统 (NFS)
一、引言：NFS与TCP/IP的关系概述网络文件系统(NetworkFileSystem,NFS)是一种分布式文件系统协议，允许客户端通过网络访问远程服务器上的文件系统，就像访问本地文件系统一样。NFS是SunMicrosystems在20世纪80年代开发的，旨在提供一种透明的、与平台无关的文件共享机制。从设计理念来看，NFS的核心目标是"消除本地文件和远程文件之间的区别"，使用户能够像操作本地文
mbuf 全面分析：从概念到应用的深度解析
一、mbuf基础概念与原理1.1mbuf的定义与基本原理mbuf（memorybuffer，内存缓冲区）是一种高效的内存管理机制，主要用于存储和处理网络数据包及其他需要临时存储的数据。它最初由BSD（BerkeleySoftwareDistribution）操作系统引入，并在后续的网络处理框架中得到广泛应用，特别是在高性能网络数据处理领域，如DPDK（DataPlaneDevelopmentKit
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口） 数据窃取攻击 对抗攻击（用途：漏洞隐藏） 后门攻击（加触发器+标签翻转）