NigeloYang

差分隐私与机器学习

注意事项

文章原文：How to deploy machine learning with differential privacy
要求需要有一定的机器学习、差分隐私基础
差分隐私基础知识
文章介绍了机器学习引入差分隐私的原因，以及如何在机器学习中部署带有差分隐私的实例和部署的困难，文章最后介绍了本文没有涵盖到的差分隐私领域
如果对联邦学习和差分隐私感兴趣，请点击联邦学习与差分隐私
如果想了解联邦学习是什么可以看这几篇论文：
Communication-Efficient Learning of Deep Networks from Decentralized Data
Federated Machine Learning: Concept and Applications

如何部署具有差异隐私的机器学习？

在机器学习的许多应用中，例如用于医学诊断的机器学习，我们希望机器学习算法不记住有关训练集的敏感信息，例如个体患者的特定病史。差分隐私是一个概念，它允许量化算法在其运行的底层（敏感）数据集上提供隐私保护程度。通过差分隐私的视角，我们可以设计机器学习算法以至于在私有数据上负责任地训练模型。

为什么我们需要私有机器学习算法？

机器学习算法的工作原理是研究大量数据并更新其参数以编码该数据中的关系。理想情况下，我们希望这些机器学习模型的参数能够编码一般模式（例如，“吸烟的患者更容易患心脏病”），而不是关于特定训练示例的事实（例如，“Jane Smith患有心脏病”）。不幸的是，机器学习算法不会学会默认忽略这些细节。如果我们想使用机器学习来解决一项重要任务，比如制作癌症诊断模型，那么当我们发布机器学习模型时（例如，通过制作一个开源的癌症诊断模型供世界各地的医生使用），我们也可能无意中透露了有关训练集的信息。恶意攻击者可能能够检查已发布模型的预测并了解有关 Jane Smith 的私人信息。例如，攻击者可以发起成员资格推理攻击，以了解 Jane Smith 是否将她的数据贡献给了模型的训练集 [SSS17]。攻击者还可以基于成员推断攻击，通过反复猜测可能的训练点来提取训练数据，直到它们从模型的预测中产生足够强的成员信号[CTW20]。在许多情况下，模型本身可能由一些数据样本表示（例如，其对偶形式的支持向量机）。

一个常见的误解是，如果模型泛化（即，在测试示例上表现良好），那么它保护了隐私。如前所述，这远非事实。其中一个主要原因是泛化是模型的平均情况行为（在数据样本的分布上），因此必须为每个人提供隐私，包括异常值（这可能偏离我们的分布假设）。

多年来，研究人员提出了各种方法来保护学习算法中的隐私（k-anonymity [SS98]，l-diversity [MKG07]，m-invariance [XT07]，t-closeness [LLV07]等）。不幸的是，[GKS08]所有这些方法都容易受到所谓的组合攻击，这些攻击使用辅助信息来破坏隐私保护。众所周知，当个人也在互联网电影数据库 (IMDb)[NS08] 上公开分享他们的电影评分时，该策略允许研究人员对发布给 Netflix 奖参与者的电影评分数据集的一部分进行去匿名化处理。如果简·史密斯（Jane Smith）在Netflix Prize数据集中为电影A，B和C分配了相同的评级，并在相似的时间在IMDb上公开，那么研究人员可以在两个数据集中链接与Jane对应的数据。这反过来又会为他们提供恢复Netflix奖中包括的收视率的方法，而不是在IMDb上。这个例子表明，定义和保证隐私是多么困难，因为很难估计对手可以获得的关于个人的知识范围。虽然Netflix发布的数据集已被删除，但很难确保其所有副本都已被删除。近年来，基于数据样本实例编码的方法，如InstaHide [HSL20]和NeuraCrypt [YEO21]也被证明容易受到这种组合攻击。

因此，研究界已经趋同于差分隐私[DMNS06]，它提供了以下语义保证，而不是临时方法：对手学习关于个人的几乎相同的信息，无论他们是否存在于训练数据集中。特别是，它提供了算法的条件，与可能攻击它的人或数据集实例化的细节无关。换句话说，差分隐私是一个框架，用于评估旨在保护隐私的系统提供的保证。此类系统可以直接应用于可能仍包含敏感信息的"原始"数据，完全消除了对数据进行清理或匿名化处理的程序的需求，并且容易出现上述故障。也就是说，首先尽量减少数据收集仍然是限制其他形式的隐私风险的良好做法。

通过差分隐私设计私有机器学习算法

差分隐私 [DMNS06] 是隐私的一个语义概念，它解决了以前方法（如 k-anonymity）的许多局限性。基本思想是随机化部分机制的行为以提供隐私。在我们的例子中，所考虑的机制是一种学习算法，但差分隐私框架可以应用于研究任何算法。

我们为什么要在学习算法中引入随机性的直觉是，它掩盖了个人的贡献，但并没有掩盖重要的统计模式。如果没有随机性，我们将能够提出这样的问题："当我们在这个特定的数据集上训练学习算法时，它会选择哪些参数？对于学习算法中的随机性，我们反而会问这样的问题："当我们在这个特定的数据集上训练它时，学习算法在这组可能的参数中选择参数的概率是多少？

我们使用一个差分隐私版本，它要求（在我们的机器学习用例中）如果我们更改训练集中的单个数据记录，则学习任何特定参数集的概率大致相同。数据记录可以是来自个人的单个训练示例，也可以是个人提供的所有训练示例的集合。前者通常称为示例级别/项目级别隐私，后者称为用户级别差分隐私。虽然用户级隐私提供了更强的语义，但可能更难实现。有关这些概念的分类的更全面的讨论，请参阅[DNPR10，JTT18，HR12，HR13]。在本文档中，为了便于阐述技术结果，我们将重点放在示例级别概念上。这可能意味着添加训练示例、删除训练示例或更改一个训练示例中的值。直觉是，如果一个病人（简·史密斯）对学习的结果没有多大影响，那么这个病人的记录就无法被记住，她的隐私也会得到尊重。在本文的其余部分中，单个记录对学习结果的影响程度称为算法的灵敏度。

差分隐私的保证是，对手无法区分基于三个用户中的两个数据随机算法产生的答案与基于所有三个用户数据的相同算法返回的答案。我们还将不可区分的程度称为隐私损失。较小的隐私损失对应于更强的隐私保证。

人们通常认为，隐私是获得机器学习算法的良好预测准确性/泛化的根本瓶颈。事实上，最近的研究表明，在许多情况下，它实际上有助于设计具有强大泛化能力的算法。DP导致设计更好的学习算法的一些例子是在线线性预测[KV05]和在线PCA [DTTZ13]。值得注意的是，[DFH15]正式表明，任何DP学习算法的泛化都是免费的。更具体地说，如果DP学习算法具有良好的训练精度，则可以保证具有良好的测试精度。这是真的，因为差分隐私本身就是一种非常强大的正则化形式。

有人可能会争辩说，DP算法可以实现的泛化保证可能低于其非私有基线。对于一大类学习任务，可以证明渐近DP除了固有的统计误差[SSTT21]之外不会引入任何进一步的误差。[ACG16，BFTT19]强调，在存在足够数据的情况下，DP算法可以任意接近固有的统计误差，即使在强隐私参数下也是如此。

私人经验风险最小化

在我们进入特定差分私有学习算法的设计之前，我们首先将问题设置形式化，并标准化一些符号。考虑训练数据集D=(x1,y1)……（xn,yn）提取 i.i.d。从某些固定（未知）分布中∏, 确定特征向量为xn和标签yn。我们定义任何模型 θ 的训练损失为：

相应的测试损失为：

我们将设计DP算法来输出模型，这些模型可以最大限度地减少测试损失，同时只能访问训练损失。

在文献中，有多种方法可以设计这些DP学习算法[CMS11，KST12，BST14，PAE16，BTT18]。研究者可以将它们大致分类为：

假设单个损失函数 l(θ; ·) 的算法在模型参数中凸起以确保差分隐私，
即使损失函数本质上是非凸的，算法也是差分私有的（例如，深度学习模型）
模型不可知的算法，不需要关于模型 θ 的表示或损失函数l(θ; ·)的任何信息

在我们目前的讨论中，我们将只专注于为 (2) 和 (3) 设计算法。这是因为事实证明（2）的最知名算法已经与特定于（1）的算法产生了竞争

用于训练深度学习模型的私有算法

由于 SCS13、BST14 和 ACG16，所以第一种方法被命名为 微分私有随机梯度下降（DP-SGD）。它建议修改深度学习中最常用的优化器计算模型的更新：随机梯度下降（SGD）。

DP-SGD

图一：随机梯度下降 (SGD) 和差分私有 SGD (DP-SGD)。为了实现差分隐私，在更新模型参数之前，DP-SGD 对梯度进行剪辑并添加噪声，基于每个示例计算。 DP-SGD 所需的步骤以蓝色突出显示；非私有 SGD 省略了这些步骤。
DP-SGD算法来源可以查看文章：Deep Learning with Differential Privacy

通常，随机梯度下降以迭代方式训练。在每次迭代中，都会从训练集中抽取少量训练示例（“小批次”）。优化程序计算这些示例的平均模型误差，然后根据每个模型参数区分此平均误差，以获得梯度向量。最后，模型参数: ( $\theta_t$ ) 通过减去此梯度:（ $\nabla_t$ ）乘以一个小常量： $\eta$ （学习速率控制优化程序更新模型参数的速度）。

在较高层次上，DP-SGD进行了两项修改以获得差分隐私：梯度是按每个示例计算的（而不是在多个示例中平均），首先被裁剪以控制其灵敏度, 其次，球面高斯噪声 $b_t$ 添加到它们的总和中以获得DP所需的不可区分性。简言之，更新步骤可以编写如下：
$\nabla_{t+1} \leftarrow \theta_t - \eta·(\nabla_t + b_t)$
让我们以医院训练模型的例子来预测患者在出院后是否会再次入院。为了训练模型，医院使用来自患者记录的信息，例如人口统计变量和入院变量（例如，年龄，种族，保险类型，重症监护病房的类型），以及随时间变化的生命体征和实验室（例如，心率，血压，白细胞计数）[JPS16]。DP-SGD所做的修改确保几个方面（1）如果Jane Smith的个人患者记录包含异常特征，例如，她的保险提供商对她这个年龄的人来说不常见，或者她的心率遵循不寻常的模式，则产生的信号将对我们的模型更新产生有限影响。（2）如果 Jane Smith 选择不向训练集贡献（即选择退出）她的患者记录，则模型的最终参数将基本相同。当一个人能够引入更多噪声（即具有更大标准偏差的样本噪声）并训练尽可能少的迭代时，可以实现更强的差分隐私。

上述DP-SGD算法与传统SGD不同的两个主要组成部分是：

每个实例都要进行剪切
高斯噪声加法。

此外，为了保持分析，DP-SGD 要求从训练数据集中随机对迷你批次进行均匀抽样。虽然这不是DP-SGD本身的要求，但在实践中，SGD的许多实现并不满足这一要求，而是在每个训练时期分析数据的不同排列。

虽然梯度剪切在深度学习中很常见，通常用作正则化的一种形式，但它与DP-SGD不同如以下所示：对小批量的平均梯度进行裁剪，而不是在平均之前裁剪单个示例的梯度（即 $l(θ_t;(x,y)$ )。这是一个持续的研究方向，既要了解模型训练中 DP-SGD 中每个示例裁剪的效果[SSTT21]，也要了解其在准确性[PTS21]和训练时间[ZHS19]方面减轻其影响的有效方法。

在标准随机梯度下降中，子采样通常用作加速训练过程的一种方式[CAR16]，或作为正则化[RCR15]的一种形式。在DP-SGD中，小批量子采样中的随机性用于保证 DP。这种隐私分析的技术组成称为通过子采样进行隐私放大[KLNRS08，BBG18]。由于采样随机性用于保证DP，因此采样步骤中的均匀性具有加密强度显得至关重要。DP-SGD的另一个（可能）违反直觉的特征是，为了获得最佳的隐私/实用性权衡，通常最好采用具有更大的批量。事实上，全批次 DP-梯度下降可能提供最好的隐私

对于固定的DP保证，在 DP-SGD 的每个步骤中添加到梯度更新中的高斯噪声的大小与训练模型的 $\sqrt{the\ number\ of\ steps}$ 成正比。因此，调整训练步骤的数量以获得最佳隐私/实用性权衡非常重要。

在下面的教程中，我们提供了一个小代码段来训练使用 DP-SGD 训练模型。

Model agnostic private learning（模型不可知的私人学习）

DP-SGD 在模型训练期间向梯度添加噪声，这会损害准确性。我们能做得更好吗？ Model agnostic private learning 采用了不同的方法，并且在某些情况下，与 DP-SGD 相比，在相同隐私级别上实现了更好的准确性。

Model agnostic private learning 利用了样本和聚合框架 [NRS07]，这是一种在不关心其内部工作的情况下向非私有算法添加差异隐私的通用方法，即模型不可知。在机器学习的背景下，可以这样陈述主要思想：考虑一个多类分类问题。获取训练数据，并拆分为大小相等的 k 个不相交子集。在不相交的子集上训练独立模型 ${\theta_1\ \theta2\ ……\theta_k}$ 。为了在测试示例 x 上进行预测，首先，在 k 个预测集 ${\theta_1(x),\ \theta_2(x)\,……\theta_k(x)}$ 上计算一个私有直方图。然后，在将少量 拉普拉斯/高斯噪声 添加到计数后，根据最高计数选择并输出直方图中的箱。在DP学习的背景下，这种特殊的方法被用于两个不同的工作领域：i）PATE [PAE16] 和 ii）模型不可知论的私人学习[BTT18]。而后者专注于为一类学习任务获得理论上的隐私/效用权衡(例如：agnostic PAC learning)，但 PATE 方法侧重于实际部署。这两条工作路线都有一个共同的观察。如果来自 ${\theta_1(x),\ \theta_2(x)\,……\theta_k(x)}$ 预测都相当一致，那么就DP而言，隐私成本非常小。因此，可以运行大量预测查询，而不会违反 DP 约束。在下文中，我们将详细描述PATE方法。
PATE 框架。 PATE 不是在梯度中添加噪声，而是在数据子集上训练许多非私有模型（“教师”），然后要求模型使用差分私有聚合机制对正确的预测“投票”。
该方法来自与论文：Semi-supervised Knowledge Transfer for Deep Learning from Private Training Data

教师融合（PATE）的私有聚合特别表明，这种方法允许人们学习具有微分隐私的深度神经网络。它建议通过让这些模型进行聚合预测而不是揭示其个人预测，在没有隐私的情况下训练模型，并使用差分隐私进行预测。在 PATE 中，我们首先将私有数据集划分为较小的数据子集。这些子集是分区，因此任何分区对中包含的数据之间没有重叠。如果 Jane Smith 的记录位于我们的私有数据集中，则它仅包含在其中一个分区中。也就是说，只有一位老师在培训期间分析了简·史密斯的记录。我们在每个分区上训练一个 ML 模型（称为教师）。我们现在有一套教师模型，这些模型是独立训练的，但没有任何隐私保证。我们如何利用这个融合来做出尊重隐私的预测？在 PATE 中，我们添加噪声，同时聚合每个教师单独做出的预测，以形成一个单一的通用预测。我们计算每个班级投票的教师人数，然后通过添加从拉普拉斯或高斯分布中抽样的随机噪声来扰动该计数。噪声聚合机制预测的每个标签都附带严格的差分隐私保证，这些保证将花费的隐私预算绑定到标记该输入上。同样，当我们能够在聚合中引入更多噪声并能够回答尽可能少的查询时，可以实现更强的差异隐私。现在让我们回到运行示例。想象一下，我们想使用PATE的输出来了解Jane是否喜欢某部电影。唯一一位在包含简·史密斯数据的分区上接受过培训的老师现在已经了解到，与简相似的记录是喜欢类似电影的个人的特征，因此，在类似于简的测试输入上更改其预测，以预测简分配的电影评级。但是，由于教师只对聚合贡献了一票，并且聚合注入了噪声，因此我们无法知道教师是否将其预测更改为 Jane 分配的电影评级，因为教师确实根据 Jane 的数据进行了训练，或者因为在聚合过程中注入的噪声"翻转"了该教师的投票。添加到投票计数中的随机噪声会阻止聚合结果反映任何单个教师的投票，以保护隐私。

在机器学习中实际部署差分隐私

我们介绍的两种方法的优点是概念上易于理解。幸运的是，这些方法也存在几种开源实现。例如，DP-SGD在TensorFlow Privacy，Objax和Opacus中实现。这意味着人们能够采用现有的TensorFlow，JAX或PyTorch管道来训练机器学习模型，并将非私有优化器替换为DP-SGD。PATE的示例实现也可以在TensorFlow Privacy中找到。那么，部署具有差异隐私的机器学习的具体潜在障碍是什么？

第一个障碍是隐私保护模型的准确性。数据集通常从长尾分布中采样的。例如，在医疗应用中，具有特定医疗状况的患者通常（幸运的是）比没有该病症的患者少。这意味着对于患有每种疾病的患者来说，可以学习的培训示例较少。因为差分隐私阻止我们学习在训练数据中通常找不到的模式，所以它限制了我们从这些患者身上学习的能力，而我们很少有SPG的例子。更一般地说，模型的准确性和训练它所采用的差分隐私保证的强度之间通常存在权衡：隐私预算越小，对准确性的影响通常越大。也就是说，这种紧张关系并不总是不可避免的，在某些情况下，隐私和准确性是协同的，因为差分隐私意味着泛化[DFH15]（但反之亦然）。

第二个障碍可能是计算开销。例如，在DP-SGD中，必须计算每个示例的梯度，而不是平均梯度。这通常意味着在机器学习框架中实现的优化以利用底层硬件加速器（例如 GPU）支持的矩阵代数更难利用。在另一个例子中，PATE要求一个训练多个模型（教师）而不是单个模型，因此这也会在训练过程中引入开销。幸运的是，这种成本在最近的私有学习算法的实现中得到了很大的缓解，特别是在Objax和Opacus中。

在机器学习中但更普遍地在任何形式的数据分析中，部署差异隐私的第三个障碍是隐私预算的选择。预算越小，保证越强。这意味着人们可以比较两种分析，并说出哪一种是"更私密的"。然而，这也意味着目前尚不清楚隐私预算的"足够小"。这尤其成问题，因为将差分隐私应用于机器学习通常需要提供很少理论保证的隐私预算，以便训练一个准确度足够大以保证有用部署的模型。因此，对于从业者来说，通过自己攻击机器学习算法来评估其机器学习算法的隐私可能会很有趣。虽然对算法的差异隐私保证的理论分析提供了最坏情况的保证，限制了算法可以针对任何对手泄漏多少私人信息，但实施特定攻击对于了解特定对手或对手类别的成功程度很有用。这有助于解释理论保证，但不能被视为直接替代它。此类攻击的开源实现越来越多：例如，在这里和这里进行成员资格推断。

结论

在上面，我们讨论了一些用于微分私有模型训练的算法方法，这些方法在理论和实践环境中都是有效的。由于这是一个快速增长的领域，我们无法涵盖研究领域的所有重要方面。一些突出的包括：
1：在DP模型训练中选择最佳超参数。为了确保整体算法保留差分隐私，一个需求就是确保超参数本身保留DP。最近的研究提供了以差分私有方式选择最佳超参数的算法[LT19]。
2：网络架构的选择：用于非私有模型训练的最知名的模型架构确实最适合具有微分隐私的训练，这并不总是正确的。特别是，我们知道模型参数的数量可能会对隐私/效用权衡产生不利影响[BST14]。因此，选择正确的模型体系结构对于提供良好的隐私/实用性权衡非常重要 [PTS21]。
3：在联合/分布式设置中进行训练：在上面的阐述中，我们假设训练数据位于单个集中位置。但是，在联邦学习（FL）[MMRHA17]设置中，数据记录可以高度分布，例如，在各种移动设备之间。在 FL 设置中运行 DP-SGD，这是 FL 为训练数据提供隐私保证所必需的，它提出了一系列挑战 [KMA19]，这些挑战通常由专为 FL 设置设计的分布式私有学习算法 [BKMTT20，KMSTTZ21] 来促进。FL 背景下的一些具体挑战包括，有限且不统一的客户端可用性（持有个人数据记录）以及训练数据的未知（和可变）大小[BKMTT18]。另一方面，PATE 风格的算法一旦与现有的密码原语相结合，就会自然地适用于分布式设置，如 CaPC 协议 [CDD21] 所示。这是一个活跃的研究领域，以应对上述挑战。

致谢

The authors would like to thank Thomas Steinke and Andreas Terzis for detailed feedback and edit suggestions. Parts of this blog post previously appeared on www.cleverhans.io.

引用

[ACG16] Abadi, M., Chu, A., Goodfellow, I., McMahan, H. B., Mironov, I., Talwar, K., & Zhang, L. (2016, October). Deep learning with differential privacy. In Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security (pp. 308-318). ACM.

[BBG18] Balle, B., Barthe, G., & Gaboardi, M. (2018). Privacy amplification by subsampling: Tight analyses via couplings and divergences. arXiv preprint arXiv:1807.01647.

[BKMTT18] Balle, B., Kairouz P., McMahan M., Thakkar O. & Thakurta A. (2020). Privacy amplification via random check-ins. In NeurIPS.

[MMRHA17] McMahan, B., Moore, E., Ramage, D., Hampson, S., & y Arcas, B. A. (2017, April). Communication-efficient learning of deep networks from decentralized data. In Artificial intelligence and statistics (pp. 1273-1282). PMLR.

[KMSTTZ18] Kairouz P., McMahan M., Song S., Thakkar O., Thakurta A., & Xu Z. (2021). Practical and Private (Deep) Learning without Sampling or Shuffling. In ICML.

[BFTT19] Bassily, R., Feldman, V., Talwar, K., & Thakurta, A. Private Stochastic Convex Optimization with Optimal Rates. In NeurIPS 2019.

[BST14] Raef Bassily, Adam Smith, and Abhradeep Thakurta. Private empirical risk minimization: Efficient algorithms and tight error bounds. In Proceedings of the 55th Annual IEEE Symposium on Foundations of Computer Science.

[BTT18] Bassily, R., Thakurta, A. G., & Thakkar, O. D. (2018). Model-agnostic private learning. Advances in Neural Information Processing Systems.

[CDD21] Choquette-Choo, C. A., Dullerud, N., Dziedzic, A., Zhang, Y., Jha, S., Papernot, N., & Wang, X. (2021). CaPC Learning: Confidential and Private Collaborative Learning. arXiv preprint arXiv:2102.05188.

[CMS11] Chaudhuri, K., Monteleoni, C., & Sarwate, A. D. (2011). Differentially private empirical risk minimization. Journal of Machine Learning Research, 12(3).

[CTW20] Carlini, N., Tramer, F., Wallace, E., Jagielski, M., Herbert-Voss, A., Lee, K., … & Raffel, C. (2020). Extracting training data from large language models. arXiv preprint arXiv:2012.07805.

[DFH15] Dwork, C., Feldman, V., Hardt, M., Pitassi, T., Reingold, O., & Roth, A. (2015). Generalization in adaptive data analysis and holdout reuse. arXiv preprint arXiv:1506.02629.

[DMNS06] Dwork, C., McSherry, F., Nissim, K., & Smith, A. (2006, March). Calibrating noise to sensitivity in private data analysis. In Theory of Cryptography Conference (pp. 265-284). Springer, Berlin, Heidelberg.

[DNPR10] Dwork, C., Naor, M., Pitassi, T., & Rothblum, G. N. (2010, June). Differential privacy under continual observation. In Proceedings of the forty-second ACM symposium on Theory of computing (pp. 715-724).

[DTTZ14] Dwork, C., Talwar, K., Thakurta, A., & Zhang, L. (2014, May). Analyze gauss: optimal bounds for privacy-preserving principal component analysis. In Proceedings of the forty-sixth annual ACM symposium on Theory of computing (pp. 11-20).

[HSL20] Huang, Y., Song, Z., Li, K., & Arora, S. (2020, November). Instahide: Instance-hiding schemes for private distributed learning. In International Conference on Machine Learning (pp. 4507-4518). PMLR.

[HR12] Hardt, M., & Roth, A. (2012, May). Beating randomized response on incoherent matrices. In Proceedings of the forty-fourth annual ACM symposium on Theory of computing (pp. 1255-1268).

[HR13] Hardt, M., & Roth, A. (2013, June). Beyond worst-case analysis in private singular vector computation. In Proceedings of the forty-fifth annual ACM symposium on Theory of computing (pp. 331-340).

[JPS16] Johnson, A., Pollard, T., Shen, L. et al. MIMIC-III, a freely accessible critical care database. Sci Data 3, 160035 (2016). https://doi.org/10.1038/sdata.2016.35

[JTT18] Jain, P., Thakkar, O. D., & Thakurta, A. (2018, July). Differentially private matrix completion revisited. In International Conference on Machine Learning (pp. 2215-2224). PMLR.

[INS19] Iyengar, R., Near, J. P., Song, D., Thakkar, O., Thakurta, A., & Wang, L. (2019, May). Towards practical differentially private convex optimization. In 2019 IEEE Symposium on Security and Privacy (SP) (pp. 299-316). IEEE.

[KST12] Kifer, D., Smith, A., & Thakurta, A. (2012, June). Private convex empirical risk minimization and high-dimensional regression. In Conference on Learning Theory (pp. 25-1). JMLR Workshop and Conference Proceedings.

[KMA19] Kairouz, P., McMahan, H. B., Avent, B., Bellet, A., Bennis, M., Bhagoji, A. N., … & Zhao, S. (2019). Advances and open problems in federated learning. arXiv preprint arXiv:1912.04977.

[KV05] Kalai, Adam, and Santosh Vempala. “Efficient algorithms for online decision problems.” Journal of Computer and System Sciences 71.3 (2005): 291-307.

[KLNRS08] Raskhodnikova, S., Smith, A., Lee, H. K., Nissim, K., & Kasiviswanathan, S. P. (2008). What can we learn privately. In Proceedings of the 54th Annual Symposium on Foundations of Computer Science (pp. 531-540).

[LLV07] Li, N., Li, T., & Venkatasubramanian, S. (2007, April). t-closeness: Privacy beyond k-anonymity and l-diversity. In 2007 IEEE 23rd International Conference on Data Engineering (pp. 106-115). IEEE.

[LT19] Liu, J., & Talwar, K. (2019, June). Private selection from private candidates. In Proceedings of the 51st Annual ACM SIGACT Symposium on Theory of Computing (pp. 298-309).

[M17] Mironov, I. (2017, August). Renyi differential privacy. In Computer Security Foundations Symposium (CSF), 2017 IEEE 30th (pp. 263-275). IEEE.

[MKG07] Machanavajjhala, Ashwin; Kifer, Daniel; Gehrke, Johannes; Venkitasubramaniam, Muthuramakrishnan (March 2007). “L-diversity: Privacy Beyond K-anonymity”. ACM Transactions on Knowledge Discovery from Data.

[NRS07] Nissim, K., Raskhodnikova, S., & Smith, A. (2007, June). Smooth sensitivity and sampling in private data analysis. In Proceedings of the thirty-ninth annual ACM symposium on Theory of computing (pp. 75-84).

[NS08] Narayanan, A., & Shmatikov, V. (2008, May). Robust de-anonymization of large sparse datasets. In Security and Privacy, 2008. SP 2008. IEEE Symposium on (pp. 111-125). IEEE.

[PAE16] Papernot, N., Abadi, M., Erlingsson, U., Goodfellow, I., & Talwar, K. (2016). Semi-supervised knowledge transfer for deep learning from private training data. ICLR 2017.

[PTS21] Papernot, N., Thakurta, A., Song, S., Chien, S., & Erlingsson, U. (2020). Tempered sigmoid activations for deep learning with differential privacy. AAAI 2021.

[RCR15] Rudi, A., Camoriano, R., & Rosasco, L. (2015, December). Less is More: Nyström Computational Regularization. In NIPS (pp. 1657-1665).

[SCS13] Shuang Song, Kamalika Chaudhuri, and Anand D Sarwate. Stochastic gradient descent with differentially private updates. In Proceedings of the 2013 IEEE Global Conference on Signal and Information Processing, GlobalSIP ’13, pages 245–248, Washington, DC, USA, 2013. IEEE Computer Society.

[SPG] Chasing Your Long Tails: Differentially Private Prediction in Health Care Settings. Vinith Suriyakumar, Nicolas Papernot, Anna Goldenberg, Marzyeh Ghassemi. Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency.

[SS98] Samarati, Pierangela; Sweeney, Latanya (1998). “Protecting privacy when disclosing information: k-anonymity and its enforcement through generalization and suppression” (PDF). Harvard Data Privacy Lab. Retrieved April 12, 2017

[SSS17] Shokri, R., Stronati, M., Song, C., & Shmatikov, V. (2017, May). Membership inference attacks against machine learning models. In Security and Privacy (SP), 2017 IEEE Symposium on (pp. 3-18). IEEE.

[SSTT21] Song, S., Thakkar, O., & Thakurta, A. (2020). Evading the Curse of Dimensionality in Unconstrained Private GLMs. In AISTATS 2021.

[XT07] Xiao X, Tao Y (2007) M-invariance: towards privacy preserving re-publication of dynamic datasets. In: SIGMOD conference, Beijing, China, pp 689–700

[YEO21] Yala, A., Esfahanizadeh, H., Oliveira, R. G. D., Duffy, K. R., Ghobadi, M., Jaakkola, T. S., … & Medard, M. (2021). NeuraCrypt: Hiding Private Health Data via Random Neural Networks for Public Training. arXiv preprint arXiv:2106.02484.

[ZHS19] Jingzhao Zhang, Tianxing He, Suvrit Sra, and Ali Jadbabaie. Why gradient clipping accelerates training: A theoretical justification for adaptivity. In International Conference on Learning Representations, 2019.

Posted by Nicolas Papernot and Abhradeep Thakurta on October 25, 2021.

你可能感兴趣的:(差分隐私,机器学习,机器学习,安全,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
直返的东西正品吗?直返APP安全吗?直返是正规平台吗? 氧惠购物达人
亲们，你们是不是经常在直返APP上买东西呀？但是，你们有没有想过，里面的东西到底是不是正品呢？这个APP安全吗？它是不是一个正规的平台呀？别着急，今天我就来给大家揭秘一下！氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
TDengine 签约前晨汽车，解锁智能出行的无限潜力涛思数据（TDengine） tdengine 汽车大数据
在全球汽车产业转型升级的背景下，智能网联和新能源技术正迅速成为商用车行业的重要发展方向。随着市场对环保和智能化需求的日益增强，企业必须在技术创新和数据管理上不断突破，以满足客户对高效、安全和智能出行的期待。在这一背景下，前晨汽车凭借其在新能源智能商用车领域的前瞻性布局和技术实力，成为行业中的佼佼者。前晨汽车采用整车数据采集和全车数据打通策略，能够实时将数据推送至APP端客户。然而，这导致整体写入和
“这才好”麻辣香锅能够增加人身体的免疫能力小补文知
我就来介绍一种香锅，那就是“这才好”麻辣香锅，它产出于著名的蜀地文化，具有悠久的历史土家风味，麻辣鲜香，健康安全。采用传统秘制麻辣香锅油辣子，还有贴心加料“孜然包”满足人们的不同口味需求，香锅底料辣椒，微辣且香，含有丰富微量元素和维生素，具有辣而不躁，味道纯正，醇厚温和。花椒采用历史悠久，被列为宫廷供品的“贡椒”的汉源花椒。我们还挑选了“川菜之魂”郫县豆瓣的鼻祖品牌豆瓣，保留最原始的郫县豆瓣味道，
xilinx vivado PULLMODE 设置思路坚持每天写程序 fpga开发
1.xilinx引脚分类XilinxIO的分类：以XC7A100TFGG484为例，其引脚分类如下：1.UserIO(用户IO)：用户使用的普通IO1.1专用(Dedicated)IO：命名为IO_LXXY_#、IO_XX_#的引脚，有固定的特定用途，多为底层特定功能的直接实现，如差分对信号、关键控制信号等，不能随意变更。1.2多功能(Multi-Function)IO：命名为IO_LXXY_ZZ
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2024.9.14 Python，差分法解决区间加法，消除游戏，压缩字符串 RaidenQ python 游戏开发语言算法力扣
1.区间加法假设你有一个长度为n的数组，初始情况下所有的数字均为0，你将会被给出k个更新的操作。其中，每个操作会被表示为一个三元组：[startIndex,endIndex,inc]，你需要将子数组A[startIndex…endIndex]（包括startIndex和endIndex）增加inc。请你返回k次操作后的数组。示例:输入:length=5,updates=[[1,3,2],[2,4,
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
2022-10-10 幸福芳芳
10.10日觉察日记1.事件：开晨会员工来不齐，路远的请假，离得近的也请假，一律不批！2.感受：生气，气愤（情绪如何转化或使用）3.想法：1.今年已经很少开晨会了，非必要不会通知开会的，临近点了再打电话请假，又不是特别忙的季节，借口都会找～～2.不来的按公司标准执行负激励，待岗处理！我为你们负责，你们安全重要会议都不参加，自己都不为自己负责！以后有事也别找我！尤其是经销商老板，自己都不清楚自己用工
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
计算机木马详细编写思路小熊同学哦 php 开发语言木马木马思路
导语：计算机木马（ComputerTrojan）是一种恶意软件，通过欺骗用户从而获取系统控制权限，给黑客打开系统后门的一种手段。虽然木马的存在给用户和系统带来严重的安全风险，但是了解它的工作原理与编写思路，对于我们提高防范意识、构建更健壮的网络安全体系具有重要意义。本篇博客将深入剖析计算机木马的详细编写思路，以及如何复杂化挑战，以期提高读者对计算机木马的认识和对抗能力。计算机木马的基本原理计算机木
基于STM32的汽车仪表显示系统：集成CAN、UART与I2C总线设计流程极客小张 stm32 汽车嵌入式硬件物联网单片机 c语言
一、项目概述项目目标与用途本项目旨在设计和实现一个基于STM32微控制器的汽车仪表显示系统。该系统能够实时显示汽车的速度、转速、油量等关键信息，并通过CAN总线与其他汽车控制单元进行通信。这种仪表显示系统不仅提高了驾驶的安全性和便捷性，还能为汽车提供更智能的用户体验。技术栈关键词微控制器：STM32显示技术：TFTLCD/OLED传感器：速度传感器、温度传感器、油量传感器通信协议：CAN总线、UA
3286、穿越网格图的安全路径 Lenyiin 题解 c++算法 leetcode
3286、[中等]穿越网格图的安全路径1、题目描述给你一个mxn的二进制矩形grid和一个整数health表示你的健康值。你开始于矩形的左上角(0,0)，你的目标是矩形的右下角(m-1,n-1)。你可以在矩形中往上下左右相邻格子移动，但前提是你的健康值始终是正数。对于格子(i,j)，如果grid[i][j]=1，那么这个格子视为不安全的，会使你的健康值减少1。如果你可以到达最终的格子，请你返回tr
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
不安全依恋徐猛_Merlin
11.2不安全依恋在关系中自由的心里是不受她人情绪所影响和去发展新的关系两种。而不安全的依恋是对自己的关系存在恐惧的因素，也就是对周边的环境很陌生，而当在这个环境中存在一个熟悉的声音就是一种安全的依恋。这种依恋可能是一个熟悉的表情或者熟悉的面庞等等。
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
4 大低成本娱乐方式: 小说, 音乐, 视频, 电子游戏穷人小水滴娱乐音视频低成本小说游戏
穷人如何获得快乐?小说,音乐,视频,游戏,本文简单盘点一下这4大低成本(安全)娱乐方式.这里是穷人小水滴,专注于穷人友好型低成本技术.(本文为58号作品.)目录1娱乐方式1.1小说(网络小说)1.2音乐1.3视频(b站)1.4游戏(电子游戏/计算机软件)2低成本:一只手机即可3总结与展望1娱乐方式这几种,也可以说是艺术的具体形式.更专业的说,(娱乐)是劳动力再生产的重要组成部分.使人放松,获得快乐
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分