Atara8088

我的隐私计算学习——联邦学习（3）

本篇笔记主要是根据这位老师的知识分享整理而成【公众号：秃顶的码农】，我从他的资料里学到了很多，期间还私信询问了一些困惑，都得到了老师详细的答复，相当nice！

（五）纵向联邦学习 — 安全树思路

可以通过以下脉络学习：

决策树 ---------> 集成方法Bagging & Boosting ---------> GBDT ---------> XGBoost ---------> Secure Boost Tree

这个版块的内容和机器学习高度相关，关于机器学习各类模型的优化算法此处不再赘述，但对于模型效果评估，特别是分类模型，有几个容易混淆的概念需要理清：

a. 准确率，这是最常用的分类性能指标，它衡量的是分类正确的样本数量占总样本数量的比例。
b. 精确率，很容易和准确率混为一谈，事实上，它评估的是模型预测值为 1 的样本中有多少真的是 1 的，即预测出正样本里面有多少真的是正的。
c. 召回率，度量的是在所有的正样本中，有多少正样本能够被模型预测出来，即正确预测的正例数除以实际正例总数。
d. F值，又称为 F1 Score，是精确率和召回率的调和平均数。

以上指标均依赖于混淆矩阵，然而实际的模型输出值往往不是直接的分类结果，而是每个样本属于各个类别的概率值，对于二分类问题，从概率值到类别还需要确定一个阈值，这个阈值的确定也会直接决定混淆矩阵的结果，进而对效果评估指标的计算造成影响。既然这样，是否有什么指标是不受阈值选择影响的呢？这就需要用到 AUC( Area Under Curve ) 了，即曲线下的面积，这里的曲线指的是 ROC 曲线。

而对于回归模型，最常见的评估指标是平均平方误差 MSE、平均绝对误差 MAE 或均方根误差 RMSE。然而这些指标都有缺点，比如容易受到异常值的影响，以及受到预测标签本身的量级影响大，不利于效果比较等。因此，一个更好的回归模型评估指标是可决系数，又被称为 R²。

R² 的取值范围实际上是负无穷到 1，由公式可知，其取值越大，模型的拟合效果就越好。

1. 决策树

首先需要了解熵的概念，简单来说，混乱程度越大，熵值就越高。代入一些例子可以发现，我们追求的是熵值或者基尼系数越小越好。那么如何构造一棵决策树呢？基本想法是随着树深度的增加，节点的熵迅速地降低。熵降低的速度越快越好，这样我们有望得到一颗高度最矮的决策树。关于信息熵，信息增益选取决策树根结点的过程，参考机器学习教材书实例。

---------- ID3（信息增益）----------

传统的根据信息增益选取根节点的算法就是 ID3 算法，但这个算法有一个很大的问题：由于我们往往会给属性各自分配一个编号，1，2，3……n，依据信息增益的原理，如果把编号作为划分属性，信息增益很有可能最大化，而我们对属性的划分当然要和其编号是无关的，所以这种方法有些弊端。

---------- C4.5（信息增益率）----------

光看信息增益是不靠谱的，那么在这个基础上做个改进，引入信息增益率。除了计算信息增益，还要再计算其本身的熵值，用信息增益去除以这个熵值，得到信息增益率。

---------- CART（Gini系数）----------

基尼系数的计算方法在上图有提到，和熵值的计算方法相差不大。

---------- 评价函数 ----------

我们总需要一个指标，来判断决策树是否达到决策目标或决策效果，所以此处引入评价参数。里面的 ${H(t)}$ 代表的是每个叶子节点的熵值或基尼系数， $N_t$ 代表的是叶子节点所拥有的样本数量，可以理解为权重值。决策树决策过后，我们希望每个叶子节点的纯度越高越好，也就是说 ${H(t)}$ 应该越小越好。所以这个评价函数其实类似于损失函数。

如果碰到连续值，我们可以让其离散化，比如排序后使用二分法，把原本连续的属性值划分出来，划分之后再使用决策树算法。

构造决策树的原则是让其高度尽量地矮。但有的时候决策树为了划分每一个样本，对样本的划分太碎，会构造得非常庞大，这就造成了过拟合的问题。所以在构造决策树的时候，我们常常需要进行预剪枝或者后剪枝操作。判断决策树是否有必要进行剪枝操作，我们采用这么一个 $C_a(T)$ 函数，相当于对原本有关叶子节点的损失函数做个改进，如果决策树的叶子节点越多，那损失函数就会越大， $\alpha$ 是一个预设的值，可以衡量叶子节点的数量增减情况。剪枝的思想就是，计算一个节点分枝前和分枝后的损失值，如果分枝后的损失值更大了，那就进行剪枝操作，否则的话就保留。

很多棵决策树组合到一起，就变成了随机森林，这些决策树的决策结果最终影响随机森林的决策结果。随机森林具有双重随机性，第一重是数据随机性，在选取样本构造决策树的时候，不会选取所有样本，而是随机选取一定比例的样本数据，第二重随机性是特征随机性，也是随机选取一定比例的特征数据来构造决策树。

2. 集成方法Bagging & Boosting

集成学习主要分为两种模式，Bagging 与 Boosting 模式，由于树模型是比较有效的机器学习模型，所以集成学习里面与树模型的结合非常紧密，将 Bagging 和 Boosting 分别和树模型结合分别生成：

Bagging + 决策树 = 随机森林
Boosting + 决策树 = GBDT
Boosting + 二阶可导 Loss 函数 = Xgboost

这两种模式的区别主要是，弱学习器的组合方式。机器学习里面有两个非常重要的基础概念：Variance 与 Bias，就是方差与偏差，用来衡量模型，但是他们两个本身其实是矛盾的，Bagging 与 Boosting 分布针对 Variance 与 Bias 进行探索。Bagging 的重点在于获得一个方差更小的集成模型，而 Boosting 则将主要生成偏差更小的集成模型（即使方差也可以被减小）。

------------------------ Bagging ---------------------------

Bagging 即套袋法，通过并行地计算多个弱学习器，将多个弱学习器的结果进行投票或者均值等粗略，进行融合凝练，表征模型的判断。

Bagging 的主要过程是这样的：

从原始样本集中抽取训练集。每轮从原始样本集中使用 Bootstraping 的方法抽取 n 个训练样本（在训练集中，有些样本可能被多次抽取到，而有些样本可能一次都没有被抽中）。共进行 k 轮抽取，得到 k 个训练集。（ k 个训练集之间是相互独立的）

每次使用一个训练集得到一个模型，k个训练集共得到 k 个模型。k 个模型相互独立，没有依赖关系。

集体智慧生成最终模型：

对分类问题：针对 k 个模型的结果，采用投票的方式得到分类结果

对回归问题，针对 k 个模型的结果，计算数学期望作为最后的结果

------------------------ Boosting ---------------------------

其主要思想是将弱学习器组装成一个强学习器，并且通过一些列的顺序迭代过程，通过弱学习器的迭代组合，调整关键样本权重，训练出一组弱分类器，进行模型的迭代。注意，Boosting 过程中会基于上一轮的训练结果来更新训练集的数据权重。

关于 Boosting 的两个核心问题：

如何改变训练数据的概率分布与样本权重？

通过提高那些在前一轮被弱学习器判断错误的样例的权值，减小前一轮判断准确的样本权值，达到对错误信息的纠正的目标，亦或者通过学习残差的方式进行拟合。

如何组合弱分类器？

通过加法模型将弱分类器进行线性组合，比如 AdaBoost 通过加权多数表决的方式，即增大错误率小的分类器的权值，同时减小错误率较大的分类器的权值，亦或基于 GBDT 的残差加法模型组合，通过拟合残差的方式逐步减小残差，将每一步生成的模型叠加得到最终模型。

3. GBDT、Adaboost 与 XGBoost

（1）GBDT (Gradient Boosting Decision Tree)

即梯度提升迭代决策树，是 Boosting 算法的一种。与 AdaBoost 不同，GBDT 每一次的计算是都为了减少上一次的残差，进而在残差减少（负梯度）的方向上建立一个新的模型。它的原理简单来说，就是所有弱分类器的结果相加等于预测值，然后下一个弱分类器去拟合误差函数对预测值的梯度/残差(这个梯度/残差就是预测值与真实值之间的误差)。当然了，它里面的弱分类器的表现形式就是各棵树。

GBDT 的约束条件是：

「GBDT使用的弱学习器必须是CART，且必须是回归树」。
「GBDT用来做回归预测，当然也可以通过阈值的方式进行分类，不过主要是进行回归预测」。

所以一定要记住，「GBDT的弱学习器一定只能是CART树」，一般是基于 MSE 的 Loss 利用最小二乘法计算**「一阶梯度」**。而 Xgb 的弱学习器非常灵活，一般只要求具备二阶导数就可以了。所以很多人把 GBDT 和 Xgb 的概念混淆，或者只说一阶导与二阶导的区别，都是太片面的。

------------------------ 什么是CART树？ ---------------------------

数据挖掘或机器学习中使用的决策树有两种主要类型：

分类树分析是指预测结果是数据所属的类（比如某个电影去看还是不看）

回归树分析是指预测结果可以被认为是实数（例如房屋的价格，或患者在医院中的逗留时间）

而术语分类回归树（CART，Classification And Regression Tree）分析是用于指代上述两种树的总称。

（2）Adaboost（Adaptive Boosting）

它的自适应在于：前一个基本分类器分错的样本会得到加强，加权后的全体样本再次被用来训练下一个基本分类器。同时，在每一轮中加入一个新的弱分类器，直到达到某个预定的足够小的错误率或达到预先指定的最大迭代次数。具体说来，整个 Adaboost 迭代算法就 3步：

初始化训练数据的权值分布。如果有N个样本，则每一个训练样本最开始时都被赋予相同的权值：1/N。
训练弱分类器。具体训练过程中，如果某个样本点已经被准确地分类，那么在构造下一个训练集中，它的权值就被降低；相反，如果某个样本点没有被准确地分类，那么它的权值就得到提高。然后，权值更新过的样本集被用于训练下一个分类器，整个训练过程如此迭代地进行下去。
将各个训练得到的弱分类器组合成强分类器。各个弱分类器的训练过程结束后，加大分类误差率小的弱分类器的权重，使其在最终的分类函数中起着较大的决定作用，而降低分类误差率大的弱分类器的权重，使其在最终的分类函数中起着较小的决定作用。换言之，误差率低的弱分类器在最终分类器中占的权重较大，否则较小。

（3）XGBoost

对于回归树，我们没法再用分类树那套信息增益、信息增益率、基尼系数来判定树的节点分裂了，需要采取新的方式评估效果，包括预测误差（常用的有均方误差、对数误差等）。而且节点不再是类别，是数值（预测值），那么怎么确定呢？有的是节点内样本均值，有的是最优化算出来的比如 Xgboost。Xgboost 本质上还是一个GBDT，但是力争把速度和效率发挥到极致。

XGBoost 属于 Boosting 方法，基于残差去训练模型来拟合真实数据场景，基于梯度直方图进行高效计算，实现了超大规模并行计算 Boosting Tree，是目前最快最好的开源 Boosting Tree 框架，比常见的其他框架快 10 倍以上。类似的实现方式还有 LightGBM、HistGradientBoostingClassifier 等。详情可参考博客文章辅助理解：通俗理解 kaggle 比赛大杀器 XGBoost

4. 安全树

对于 Secure Boost Tree来说，只需要进行简单的同态运算就解决，达到和 Xgboost 同样的建模效果。在深入理解 Secure Boost Tree 之前，务必要回顾上面所记录的 Xgb 的关键流程，因为我们要做的事情是基于整个底层的构建，整个模型训练运行态的隐私保护，并不是在 Xgb 上套个壳就可以解决的，所以需要对底层有着深刻的理解与认知，清楚其理念、流转机制、关键数据结构与关键算法。

首先引入一个需要适配的场景，方便理清问题的本质：

根据以上，我们要做到的是：

保护双方的特征不被泄露。
保护持有label的一方的标签不被泄露。
在不泄露双方数据信息的基础上完成联合建模，提振业务。

也就是说，对经过 Xgboost 或其他 boosting 算法生成的树群，是需要隐私保护的。可以供选择的隐私计算方法其实还是比较多的，包含同态加密、秘钥分享、混淆电路以及不经意传输等，不过不同的加密有不同的适配场景。接下来看看 Xgboost 这个算法过程哪里需要加密，如何加密：

整个 Xgb 计算的核心在于梯度直方图的计算，但是梯度直方图的计算是需要 label 的，所以需要持有 label 的一方将计算好的一阶与二阶梯度加密传递给没有label 的一方，进行梯度直方图的构建。

但是，如果直接传输一阶与二阶导数，以分类任务中常用的 Logistic Loss 为例，观察一阶梯度，那么对于正样本，其梯度恒负，对于负样本，其梯度恒正，所以直接传输会暴露 label 标签，所以我们需要进行隐私加密算法的引入。由于梯度直方图的建立过程中只需要使用加法计算（一阶导与二阶导分别累加，然后代入最终的目标函数），所以可以采用同态加密（半同态，只有加法运算）的方式将梯度传递给无 label 的一侧，进行梯度直方图的构建，梯度直方图构建好之后，再传递给持有 label 的一方进行整体的计算，这样的话 feature 和 label 都没有泄露。

同时，由于通过了梯度直方图，实现了未持有 label 一侧特征数据分布的压缩变换刻画，使其不具备具体的精确信息，所以基于大数据、特征分布离散的情况下，想要针对这个进行反推，基本是不太可能。

综上，Secure Boost Tree 算法需要对样本梯度进行加密保护。由于梯度直方图的构建只含有加法运算，所以满足加法同态。接下来讲解下这个具体的全链路轮转流程：(首先，定义持有 label 一方为 Active Party；不持有 label 的一方称为 Passive Party。)

Actice Party 侧对梯度的加密：在建立一颗新的树的构建过程中，以 Active Party 的视角进行分析
- 对于特征在本侧即 Active Party 侧，因为无需与 Passive Party 进行交互，所以直接计算分裂点的信息增益，无需同步到 Passive Party 侧。
- 对于特征在对侧即 Passive Party 侧，则需要 Acive Party 侧根据当前预测值（初始自己设置超参，比如 0）和 label 进行计算一阶与二阶导数，并将一阶与二阶导数进行半同态加密（可以采用比较出名的 Paillier 库），然后发送至 Passive Party 侧。
构建梯度直方图
双侧根据自己的特征数据建立梯度（一阶与二阶导数）直方图，并且 Passive Party 侧将加密后的梯度直方图发送给 Active Party 侧。
至此，Active Party 拥有全部的特征的直方图信息，本侧的直方图是明文，对侧发来的是加密的，使用半同态加密方法进行解密。

寻找最优分裂点：到这里，Active Party 侧已经完成了对端的梯度直方图的解密，拥有双方联合的所有特征的梯度直方图，所以并根据分裂增益计算公式，枚举每个特征基于直方图进行计算最优解，找到全局最优分裂点；
若最优分裂点属于 Active Party 侧，则无需传递分裂信息到对端。
若最优分裂点属于 Passive Party 侧，Active Party 侧需要将分裂信息（ID 分位线，不包含信息增益）返回给 Passive Party 方进行解析。

树结点：拥有最优分裂点的一侧，对该树结点上的样本进行分裂，划分成左右两个子数据集，并将划分结果发送给对侧，作为子节点的分裂样本。
预测值的更新：Active Party 侧根据计算公式，计算叶子结点的预测值；但是不会同步，所以 Passive Party 侧无法得知叶子结点的权重。

至此，整体全链路流程描述完毕。以上就是 Secure Boost Tree 算法完整的构建过程。

扩展：这个方案有没有不安全的地方？

上述流程中，针对双方交互中传输的信息，进行隐私安全分析，主要针对两个维度，一个是 label 的维度，一个是 feature 的维度，这个也是整个训练过程中涉及到的所有的数据要素，要泄露也就是从这两方面有隐患了。

那么，针对以上问题，建模训练的时候可以注意：

2023年10月份新开了一个GitHub账号，里面已放了一些密码学，隐私计算电子书资料了，之后会整理一些我做过的、或是我觉得不错的论文复现、代码项目也放上去，欢迎一起交流！Ataraxia-github

TypeScript简介難釋懷 typescript ubuntu javascript
一、前言随着前端开发的快速发展，JavaScript已经成为构建现代Web应用的核心语言。然而，随着项目规模的增长，JavaScript在类型安全性、代码可维护性和团队协作方面逐渐显现出不足。为了解决这些问题，TypeScript应运而生。它不仅保留了JavaScript的灵活性，还引入了强大的静态类型系统和面向对象编程能力，极大地提升了大型项目的开发效率与稳定性。本文将带你全面了解TypeScr
我的创作纪念日勤勉螺丝钉学习
手指轻敲键盘，一下又一下，思绪如潮水般涌来。我写了很多字，又反复斟酌，最终一个个删除。不是无话可说，而是想表达的太多，怕言语不够真挚，怕文字不够动人。官方提供的模板固然规范，但总觉得少了些属于自己的温度与风格。于是，我选择放下模板，回归内心，用最真诚的方式写下这段话。从开始创作至今，已经整整512天了。这五百多个日夜，有过迷茫、有过坚持、也有过收获。一路走来，我在CSDN这个知识平台上不断学习、不
数据结构学习之栈楼田莉子数据结构学习笔记算法数据结构 c语言
本篇博客我们将深入学习数据结构中栈与队列相关的内容作者的个人gitee：楼田莉子(riko-lou-tian)-Gitee.com目录概念栈的实现初始化销毁入栈判空出栈获取栈顶元素栈的有效元素个数源代码与栈相关的算法题（力扣）有效的括号编辑概念栈是一种特殊的线性表，只允许在固定的一端进行插入删除元素的操作。进行数据插入和删除操作的一端叫栈顶，另一端叫栈底。遵循“后进先出”的原则。下图就是对栈后进先
基于PLC的楼宇自动化监控系统方案大雨淅淅物联网大数据人工智能
目录一、系统概述二、系统组成三、功能模块四、系统优势五、系统实施步骤六、系统安全性与隐私保护七、结语一、系统概述本系统采用先进的PLC（可编程逻辑控制器）作为核心控制单元，旨在实现对楼宇内各项设施的自动化监控与管理。通过智能化的手段，提高楼宇的运行效率，确保环境的舒适性与安全性，同时达到节能减排的目的。二、系统组成PLC控制器：作为系统的大脑，负责接收传感器信号，处理数据，并发出控制指令给执行器。
基于PLC的智能楼宇控制系统设计（源码+万字报告+部署讲解等) 炳烛之明科技 PLC
目录摘要2第一章绪论51.1引言51.2智能楼宇的课题背景51.3智能楼宇的功能和优势6第二章智能楼宇系统总体方案确定72.1智能楼宇系统总体方案的设计72.1.1智能楼宇概述72.1.2智能楼宇的分类71、建筑设备自动化系统(BA)72、通讯自动化系统（CA）73、办公自动化系统（OA）74、火灾报警于消防联动自动化系统（FA）85、安全保卫自动化系统（SA）82.1.2总体控制方案的设计82.
Instrct-GPT 强化学习奖励模型 Reward modeling 的训练过程原理实例化详解 John_今天务必休息一天 2_大语言模型基础 #2.2 生成式预训练语言模型GPT gpt log4j 语言模型人工智能自然语言处理算法
Instrct-GPT强化学习奖励模型Rewardmodeling的训练过程原理实例化详解一、批次处理的本质：共享上下文的比较对捆绑（1）为什么同一prompt的比较对必须捆绑？（2）InstructGPT的优化方案二、输入输出与损失函数的具体构造（1）输入输出示例（2）人工标注数据的处理（3）损失函数的计算过程（4）反向传播的核心逻辑三、为什么不需要人工标注分值？（1）排序数据的天然属性（2）避
基于土壤湿度信息的智能农田灌溉系统设计
自己淋过雨，想为你撑把伞之所以会把自己三年前的本科毕业设计发布至平台上，其主要原因是对自己以前的过往再做个总结。人生嘛，只有一路走来回头再看的时候，才会感慨万千，触目良多，时不时会想，到底什么样的结局才配得上我这二十几年的颠沛流离（狗头^_^）。个人强烈建议高中学弟学妹们一定要好好学习，考上一个都是传道授业()的好大学（表达的可能有些不妥，但懂得都懂……）。本文为2021年本人本科毕业设计。时间跨
可编程电子安全相关系统_编程中的安全生态系统概述 danpu0978 编程语言 python java 人工智能 linux
可编程电子安全相关系统就像近年来的情况一样，安全漏洞已越来越被接受。仅以最近的Equifax违规为例。无论我们在哪里看，似乎总有人会遭受某种形式的恶意攻击或其他形式的攻击。尽管我们最近想到了最近的漏洞，但我还是想花一点时间来概述有关软件开发的安全生态系统。我将从建设性和积极的角度介绍您可以做的一些关键事情，以提高您的应用程序的安全性，以应对安全漏洞。为此，我将研究四个关键领域。他们将主要讨论具体的
Red Bull红牛携手Fortinet，全球能量饮料巨头筑牢网安防线 Fortinet_CHINA 网络安全 web安全
作为全球知名的能量饮料品牌，在网络安全威胁日趋严峻的当下，RedBull（红牛）面临着诸多网络安全挑战。为应对这些挑战，RedBull选择了Fortinet的网络安全解决方案，通过部署FortiEDR和FortiGuardMDR服务等，成功提升了公司的安全防护能力。客户简介全球能量饮料领军者RedBull作为全球能量饮料领域的巨头，其品牌影响力遍及五大洲，产品畅销175个国家和地区。RedBull
Android学习笔记 LXR小朋友 android 学习笔记
一、Android四大组件精要1.Activity生命周期：onCreate()→onStart()→onResume()→onPause()→onStop()→onDestroy()重点场景：屏幕旋转：onSaveInstanceState()保存临时数据返回栈管理：launchMode（standard/singleTop/singleTask/singleInstance）页面跳转：Inte
成为高级Python开发人员的完整学习路线与核心知识体系
引言Python已成为全球最受欢迎的编程语言之一，其简洁的语法和强大的生态系统使其在数据科学、Web开发、自动化、人工智能等领域占据重要地位。然而，从初级Python程序员到真正的高级开发人员，需要掌握一系列深入的知识点和实践经验。本文将详细介绍成为高级Python开发人员必备的核心知识体系，并提供系统化的学习资源，帮助你规划专业发展路径。第一部分：Python语言基础进阶1.Python语言特性
15、云原生安全的核心原则二进制温柔云原生安全：从理论到实践云原生安全最小权限原则深度防御
云原生安全的核心原则1.引言在当今数字化的世界中，信息安全已成为企业生存和发展的重要组成部分。随着云计算的普及，云原生安全（CloudNativeSecurity）逐渐成为信息安全领域的新焦点。云原生安全不仅继承了传统安全的基本原则，还结合了云计算的独特特点，为企业提供了更高效、更灵活的安全解决方案。本文将深入探讨云原生安全的核心原则，帮助读者理解和掌握这些原则在实际应用中的意义和方法。2.云原生
【AI】闭环反馈：构建从用户处学习的人工智能秋说 AI广延人工智能 AI
文章目录前言AI产品性能的双重视角：模型指标vs用户信号模型指标：AI系统的“内部视角”用户信号：AI产品的“外部视角”用户信号类型用户信号的价值模型指标为何难以独立支撑产品成功如何设计AI产品的全面反馈闭环一、统一成功标准：模型指标+用户价值二、用户信号的数据采集策略三、整合多源数据流四、分析与洞察从反馈到改进：迭代驱动的闭环循环一、识别并优先解决核心问题二、将用户信号转化为模型改进方向三、产品
安全左移（Shift Left Security）：软件安全的演进之路秋说 Security 安全建设软件安全
文章目录一、背景：传统安全的尴尬处境二、安全左移：让安全成为开发的“第一等公民”三、安全左移的关键实施阶段1.需求阶段：嵌入安全需求建模2.设计阶段：威胁建模与架构审计3.编码阶段：安全编码规范与静态分析4.构建与测试阶段：自动化安全检测5.发布阶段：容器与CI/CD安全审计6.运营阶段：安全监控与持续响应四、实现路径：从理念到落地的三步走Step1：安全理念转型Step2：工具链集成与自动化保障
AppML 案例简介沐知全栈开发开发语言
AppML案例简介引言AppML，全称为“应用程序机器学习”，是一种将机器学习技术与移动应用开发相结合的技术框架。它旨在简化移动应用的机器学习功能集成，使得开发者无需深入了解复杂的机器学习算法，即可将强大的AI功能引入他们的应用中。本文将简要介绍AppML的一些成功案例，展示其在不同领域的应用和价值。AppML案例一：健康监测应用案例概述：一款名为“HealthMate”的健康监测应用利用AppM
ARP 协议全面分析：原理、安全与应用 Dsocc 安全网络网络协议
一、ARP协议基础原理1.1ARP协议的基本概念ARP（AddressResolutionProtocol，地址解析协议）是TCP/IP协议栈中的一个重要低层协议，负责将网络层的IP地址转换为数据链路层的物理MAC地址，使得数据包能够在局域网中准确传输。在计算机网络通信中，当一个设备需要向另一个设备发送数据时，不仅需要知道对方的IP地址，还需要知道其MAC地址。ARP协议就是通过IP地址查询MAC
Amazon WorkSpaces：解锁云端高效办公，重塑企业生产力未来国际云1688 亚马逊云网络数据库云计算云原生服务器 aws
AmazonWorkSpaces：云端办公的“终极形态”，如何驱动企业生产力跨越式发展？摘要：在数字化浪潮势不可挡的今天，企业如何打破传统办公的边界，实现真正的高效协作与生产力飞跃？想象一下，无论员工身处地球的哪个角落，都能即时、安全地访问自己熟悉的桌面环境，无需繁琐的设备管理，也无需背负高昂的硬件投入——这并非遥不可及的未来，而是AmazonWorkSpaces正在带来的深刻变革。作为亚马逊云科
【数据标注师】事件标注2 试着数据标注师数据标注师事件标注
目录一、**深入理解事件标注的核心架构**1.**事件五要素（标注核心对象）**2.**三大项目特性**二、**四阶段系统学习法**▶**阶段1：掌握标注指南（20%理论+80%案例）**▶**阶段2：触发词精准识别训练**▶**阶段3：要素抽取实战技巧**▶**阶段4：复杂场景突破三、**高效标注工具使用指南**1.**快捷键流操作（以主流工具为例）**2.**颜色编码法**四、**错误防御体系
MVI+Compose架构实战 Android洋芋 MVI JetpackCompose Kotlin Flow 状态管理声明式UI
简介本文将深入探讨为什么LiveData不适合在JetpackCompose中使用，并通过完整代码示例展示MVI+Compose架构的实现。从Android架构演进历史到Composable函数的重组机制，从单向数据流原理到StateFlow的线程安全特性，全面解析这一技术趋势背后的深层原因。一、为什么LiveData不适合在JetpackCompose中使用？LiveData与Compose的单
IPS防御原理和架构 hao_wujing 安全
大家读完觉得有帮助记得关注和点赞！IPS（入侵防御系统）是网络安全防御体系的**主动盾牌**，其核心突破在于将IDS的“检测告警”升级为“实时阻断”，通过**深度流量解析+智能决策+硬拦截**实现攻击链的熔断式处置。以下从原理到架构的深度解析：---###⚙️IPS核心防御原理####1.**三位一体拦截机制**|**拦截层级**|**技术实现**|**典型防御场景**||------------
广州华锐互动：以创新科技赋能教育，开启沉浸式学习广州华锐视点 VR ar 虚拟现实
在教育领域，广州华锐互动致力于打破传统教学的局限性，为师生们带来全新的沉浸式学习体验。广州华锐互动通过开发VR虚拟教学课件，将抽象的知识转化为生动、逼真的虚拟场景，让学生能够身临其境地感受知识的魅力。比如在历史课上，学生可以借助VR设备穿越时空，来到古代的战场、宫殿，亲身体验历史事件的发生；在地理课上，学生可以“置身”于世界各地的名胜古迹、自然奇观，直观地了解地理环境的特点。互动学习平台也是广州华
塞浦路斯VPS MySQL 8.7量子安全索引测试 cpsvps_net mysql 安全数据库
在数字化时代背景下，数据安全已成为全球企业关注的核心议题。本文将深入解析塞浦路斯VPS环境下MySQL8.7量子安全索引的突破性测试成果，揭示其如何通过先进的加密算法重构数据库防护体系，为金融、医疗等敏感行业提供符合后量子密码学标准的解决方案。塞浦路斯VPSMySQL8.7量子安全索引测试-下一代数据库防护技术解析量子计算威胁下的数据库安全新挑战随着量子计算机的快速发展，传统加密算法正面临前所未有
(论文总结)思维链激发LLM推理能力靈镌sama 论文解读人工智能
研究背景&动机背景:扩大模型规模已被证实具有提升模型性能和模型效率的功效，但是LLM对于完成推理、算术任务仍有较大不足。动机:从之前的应用和研究中得知，可以用生成自然语言解释、使用神经符号等形式语言的方法来提高大模型的算术推理能力，当时采用了从头预训练和微调模型的方法，耗费的成本较多；而且大模型具有根据少量文本提示进行上下文少样本学习的能力，使用少量输入输出示例即可提高LLM的推理性能，而不必对单
＜电子幽灵＞开发笔记:BAT基础笔记(一）
BAT脚本基础笔记(一)介绍费曼学习法最重要的部分，即把知识教给一个完全不懂的孩子——或者小白。为了更好的自我学习，也为了让第一次接触某个知识范畴的同学快速入门，我会把我的学习笔记整理成电子幽灵系列。提示：作为低代码工具的笔记，这里会用特殊字体表示要用到的函数等等。请若要学习，请结合相关工具边用边学。BAT基础笔记（一）BAT脚本基础笔记(一)介绍简介在哪里编写BAT代码？BAT基本语法1.基本命
＜电子幽灵＞前端第一件：HTML基础笔记下靈镌sama 电子幽灵随手记前端 html 笔记
HTML基础笔记（下）介绍费曼学习法最重要的部分，即把知识教给一个完全不懂的孩子——或者小白。为了更好的自我学习，也为了让第一次接触某个知识范畴的同学快速入门，我会把我的学习笔记整理成电子幽灵系列。提示：文章的是以解释-代码块-解释的结构呈现的。当你看到代码块并准备复制复现的时候，最好先保证自己看过了代码块前后的解释。＜电子幽灵＞前端第一件：HTML基础笔记上中，最基础的一部分HTML标签和已经以
深度学习之分类手写数字的网络 newyork major 卷积神经网络CNN 深度学习人工智能
面临的问题定义神经⽹络后，我们回到⼿写识别上来。我们可以把识别⼿写数字问题分成两个⼦问题：把包含许多数字的图像分成⼀系列单独的图像，每个包含单个数字；也就是把图像，分成6个单独的图像分类单独的数字我们将专注于编程解决第⼆个问题，分类单独的数字。这样是因为，⼀旦你有分类单独数字的有效⽅法，分割问题是不难解决的。⼀种⽅法是尝试不同的分割⽅式，⽤数字分类器对每⼀个切分⽚段打分；如果数字分类器对每⼀个⽚段
Windows 7上IIS7.0的全面应用侯昂
本文还有配套的精品资源，点击获取简介：IIS7.0是微软为Windows7操作系统推出的Web服务器软件，具备模块化设计、高效管理和丰富的开发环境。它支持多种网络协议，包括HTTP、HTTPS和FTP，并通过集成安全机制和优化的性能特性，如应用程序池、FTP服务、URL重写等，为用户提供了强大的Web服务管理能力。IIS7.0的设计旨在提高资源利用率、管理便捷性，并确保服务器的安全稳定运行。1.I
springboot+websocket+微信小程序（实现后端主动推送消息小程序的实时报警功能）
Listitem本项目主要实现的需求为：主要功能汽车在行驶的过程中如果前方遇到限高杆，车前的摄像头在安全距离前测出限高杆的高度后，小程序能够实时报警（当前车辆内否安全通过）。次要功能1.车主利用微信用户名登录后能够绑定车牌，实现车牌的增删改查2.车主可以为自己的车牌号添加家庭成员（绑定微信用户名的方式）3.简单权限管理（车主拥有其名下车牌的增删改查权限，家庭成员则没有）实现方式1.后端使用spri
阿里云OSS跨账号迁移过程 IT_狂奔者《玩转Linux终极指南》阿里云云计算对象存储OSS
阿里云OSS跨账号迁移过程关于OSS在线迁移服务的更新说明旧版在线迁移已停止服务，用户需切换至新版在线迁移。与旧版相比，新版在线迁移的主要区别在于身份验证方式的调整。新版不再使用AK/AS（AccessKeyID和AccessKeySecret）进行认证，而是采用了角色授权机制。这一变化旨在提升安全性和简化权限管理。用户需根据新的认证方式进行配置，以确保迁移任务的正常运行。准备工作本文以标准存储进
2024年Python最全人脸检测实战高级：使用 OpenCV、Python 和 dlib 完成眨眼检测 2401_84691757 程序员 python opencv 开发语言
然而，一旦人眨眼（右上），眼睛的纵横比就会急剧下降，接近于零。下图绘制了视频剪辑的眼睛纵横比随时间变化的图表。正如我们所看到的，眼睛纵横比是恒定的，然后迅速下降到接近零，然后再次增加，表明发生了一次眨眼。在下一节中，我们将学习如何使用面部标志、OpenCV、Python和dlib实现眨眼检测的眼睛纵横比。使用面部标志和OpenCV检测眨眼==============================
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象