绒绒毛毛雨

KNOWLEDGE UNLEARNING FOR MITIGATING PRIVACY RISKS IN LANGUAGE MODELS

文章目录

- 摘要
- 1 引言
- 2 相关工作
- - 2.1 语言模型的隐私方法
  - 2.2 机器去学习
  - 2.3 语言模型中的记忆
- 3 语言模型中的知识去学习
- - 3.1 方法论
  - 3.2 量化语言模型的隐私风险
- 4 实验
- - 4.1 模型、数据集和配置
  - 4.2 主要实验
  - 4.3 知识去学习的分析
- 5 结论

摘要

预训练语言模型（LMs）在初始预训练过程中记忆了大量知识，包括可能侵犯个人隐私和身份的信息。以往针对语言模型隐私问题的研究主要集中在数据预处理和差分隐私方法上，这两者都需要重新训练基础语言模型。我们提出了一种知识去学习的方法，作为减少语言模型后期隐私风险的替代方案。我们展示了，仅仅对目标标记序列执行梯度上升就能有效地遗忘这些信息，并且对大型语言模型的整体语言建模性能几乎没有或只有很小的下降；有时，这甚至在经过几次迭代后显著改善了基础语言模型的性能。我们还发现，顺序去学习优于一次性尝试去学习所有数据，并且去学习的效果高度依赖于需要遗忘的数据类型（领域）。通过与以前的数据预处理方法和一种已知能够减少语言模型隐私风险的解码方法进行比较，我们表明，在已知易受提取攻击的数据场景中，去学习可以提供更强的经验隐私保证，同时效率和鲁棒性更高。我们在 https://github.com/joeljang/knowledge-unlearning 发布了复制我们结果所需的代码和数据集。

1 引言

最近的研究表明，攻击者可以从预训练的语言模型（LMs）中提取训练数据，包括个人可识别信息（PII），例如姓名、电话号码和电子邮件地址，以及其他信息，如许可代码、私人临床记录和128位UUID（Carlini等，2021；Lee等，2022；Huang等，2022；Lehman等，2021）。在2021年，AI聊天机器人Iruda成为第一个因生成实际个人的确切家庭地址和银行账户号码而被起诉违反个人信息保护法的AI系统（Park，2021）。Heikkilä（2022）还展示了当前商业上最知名的语言模型之一GPT-3（Brown等，2020）提供了关于《麻省理工科技评论》主编的详细私人信息，包括他的家庭成员、工作地址和电话号码。考虑到随着语言模型规模增大，提取训练数据变得更加容易的发现（Carlini等，2022a），并且从业者通常会发布数十亿参数的预训练语言模型供公众使用（Gao等，2020；Black等，2021；Zhang等，2022），因此为大型语言模型提供隐私保障变得尤为重要。

从业者被要求在个人要求下从语言模型中删除个人信息，因为每个人都有“被遗忘权”（RTBF）（Mantelero，2013；Graves等，2021），并且可以限制其个人信息的直接和间接商业使用（Villaronga等，2018）。之前针对语言模型隐私风险的方法试图通过数据预处理（Aura等，2006；Dernoncourt等，2017；Lison等，2021；Kandpal等，2022）删除训练数据中的所有私人信息，或者设计确保差分隐私（DP）的方法（Dwork，2008；Dwork等，2006；Abadi等，2016；Anil等，2021；Li等，2022；Yu等，2022）。这两种方法都要求在每次个人想要行使其被遗忘权时重新训练基础语言模型，这使得它们对大型语言模型而言显得不够有效，因为重新训练的成本极高。此外，正如Brown等（2022）所指出的数据预处理方法假设个人隐私信息易于识别、具体化和删除，而差分隐私算法只能对具有明显隐私边界的信息提供保护，这在现实世界中难以适用，因为每个人对隐私的标准可能有所不同。

为此，我们提出知识去学习（见图1），作为一种高效的解决方案，仅需经过少量参数更新，而无需重新预训练基础语言模型。我们对GPT-Neo语言模型（125M、1.3B、2.7B）（Black等，2021）进行了实验，结果表明，在语言建模过程中简单地将梯度下降的方向改变为相反方向（也可以视为最大化而不是最小化损失函数）对于保护目标序列免受提取攻击非常有效，并且对初始语言模型能力的影响几乎为零，这些能力通过9个常见的NLP分类基准（Hellaswag（Zellers等，2019）、Lambada（Paperno等，2016）、Winogrande（Sakaguchi等，2021）、COPA（Gordon等，2012）、ARC-Easy（Clark等，2018）、ARC-Challenge（Clark等，2018）、Piqa（Bisk等，2020）、MathQA（Amini等，2019）和PubmedQA（Jin等，2019））和4个对话任务（Wizard of Wikipedia（Dinan等，2019）、Empathetic Dialogues（Rashkin等，2019）、Blended Skill Talk（Smith等，2020）和Wizard of Internet（Komeili等，2022））进行测量。在某些情况下，知识去学习意外地在某些基准上显著提高了语言模型的性能。

我们将我们的方法与数据去重方法（Kandpal等，2022）和差分隐私解码方法（Majmudar等，2022）进行了比较，这两者都被认为可以降低隐私风险，并通过提供强大的隐私保护来展示知识去学习的有效性，同时效率和鲁棒性更高。我们还提供了一个通用指南，用于量化目标标记序列的记忆和提取可能性，并建议在何时可以实证认为它们已经被“遗忘”。具体来说，我们引入了一种新颖的度量，衡量提取可能性，通过改变目标标记序列的前缀长度，量化从语言模型实际提取的后缀量。

令人惊讶的是，对于知识去学习，我们发现顺序遗忘一部分实例比试图一次性遗忘全部实例更容易。我们提供了进一步的分析，并表明知识去学习的难度在很大程度上取决于遗忘的目标数据，尤其是目标数据的领域。我们还提供了执行提取攻击的实证示例，以及知识去学习如何确切提供语言模型的隐私保护。

我们的主要贡献可归纳为四点：

我们将知识去学习与文献中已知的两种降低隐私风险的方法进行了比较：数据预处理方法和差分隐私（DP）解码方法。我们显示出我们的方法在一般能力上几乎没有性能下降（有时还出现改善），同时在个人行使被遗忘权时提供强大的隐私保护，而数据预处理方法提供较弱的隐私保护，并且计算成本高达数个数量级，DP解码方法则导致建模性能严重下降。
我们进行了额外的实验，以确定哪些因素影响知识去学习的难度，发现（1）一次性遗忘大量样本会导致显著的语言模型性能下降，而通过顺序遗忘数据块可以减轻这种影响，以及（2）目标数据的领域（代码、许可、维基百科等）在决定遗忘难度方面起着关键作用。
我们提供了一种新颖的度量及通用指南，用于量化语言模型的隐私风险，并确定何时可以认为它们已经“遗忘”给定的目标序列。
知识去学习意外地似乎使语言模型更强大，极端情况下对GPT-NEO 125M、1.3B和2.7B的Lambada基准分别带来了+8.0%（从37.6%提高到45.6%）、+10.1%（从57.4%提高到67.5%）和+7.9%（从62.2%提高到70.1%）的提升。

2 相关工作

2.1 语言模型的隐私方法

旨在减轻语言模型隐私风险的先前工作主要可以分为数据预处理/后处理方法和差分隐私方法。

(数据)预处理/后处理
数据预处理的目的是清理训练数据，消除所有可能违反隐私的数据。这些方法主要利用解析器和分类模型来识别和预测构成私人信息的模式。这在识别格式良好的私人信息（如社会安全号码或特定形式的医疗记录）方面是有效的（Aura等，2006；Dernoncourt等，2017；Lison等，2021；Kandpal等，2022）。然而，正如Brown等（2022）所指出的，私人信息主要依赖于上下文，有时又不是以特定格式存在，因此数据预处理方法无法完全保证提供隐私保障，尤其是无法满足每个个体的标准。使用后处理方法（例如对语言模型输出进行审查）仍然面临相同的局限性。

在这项工作中，我们将我们提出的方法与Kandpal等（2022）提出的数据预处理方法进行比较，后者表明，在预训练之前去重训练语料库有助于预训练出对提取攻击表现出更强鲁棒性的语言模型，而在相同条件下未去重的预训练语言模型则效果较差。然而，我们强调这种方法虽然在减轻整体隐私风险方面可能仍然有效，但在考虑个体请求从语言模型隐式参数中删除其信息的现实场景时并不是最合适的方法。

差分隐私
差分隐私（DP）旨在保证个体输入对特定函数输出的影响是有限的（Dwork，2008；Dwork等，2006）。在深度神经网络的背景下，DP需在训练阶段应用，以构建可以提供一般性保证的模型，从而确保训练数据中的个体信息无法被推断（Abadi等，2016）。虽然DP在微调语言模型方面表现出惊人的有效性（Li等，2022；Yu等，2022），但在使用DP进行预训练时仍面临显著的性能差距、高昂的计算成本和缓慢的收敛速度（Anil等，2021）。此外，正如Brown等（2022）所指出的，DP只能为语言模型提供有限的保障，因为DP需要对隐私边界进行统一定义，而这对于自然语言数据来说是固有的不可行。在一个现实场景中，个体可能在模型部署后动态行使被遗忘权（RTBF），在这种情况下，仅使用现有的基于梯度下降的DP算法（如DP-SGD）来保护针对目标提取攻击的防护是非平常的。

2.2 机器去学习

机器去学习作为解决机器学习中的数据隐私问题的替代方法受到了关注（Cao & Yang，2015；Ginart等，2019；Bourtoule等，2021；Graves等，2021）。一些研究试图探索深度神经网络的机器去学习（Golatkar等，2020；Mehta等，2022）。然而，他们大多集中在为图像分类模型提出算法，旨在遗忘整个类别；即实现特定图像类别（如“猫”或“船”）的随机性能。根据我们所知，我们是第一个探索针对语言模型遗忘特定标记序列的研究，这与传统的图像分类模型设置有很大不同（数十个图像类别与可以被分类为50000个标记的序列）。在这项工作中，我们将这种方法称为知识去学习，因为我们更关注遗忘由标记序列表示的特定知识。Zhou等（2022）关注如何利用遗忘来提高基础模型的性能。他们提出了“遗忘与重学”，通过选择性地去除不需要的信息并重新学习良好的特征，来统一现有的迭代训练算法，从而提升图像分类和多智能体交流中的性能。他们的基本假设是，定义和阻止不良行为通常比教导良好行为更容易。在第4节中，我们也展示了这一现象，我们意外地发现仅仅遗忘少量标记序列有时会增强语言模型的整体能力。

2.3 语言模型中的记忆

先前的研究探讨了语言模型在多大程度上记住了其训练数据，从不同的角度来看待这一现象。一些研究将语言模型的记忆视为对个体隐私的威胁（Carlini等，2021；2022a；Jagielski等，2022），并利用量化语言模型对对抗性攻击的脆弱性的指标。这些指标通常依赖于特定类型的攻击，例如成员推断攻击（Shokri等，2017），通过量化这些攻击的成功率来衡量语言模型的隐私风险。而在我们的工作中，我们更关注针对性的提取攻击。

另一条研究方向则量化了在预训练过程中积累和遗忘了多少知识，通过提取关于世界的关系知识（Petroni等，2019；Lazaridou等，2021；Jang等，2022b；a）。这条研究路线并不将记忆视为负面特质，而是将其视为一种积极特征，可以利用它从隐式参数中提取世界知识，并执行知识密集型任务，例如问答或训练知识丰富的对话代理。

我们的工作与Jagielski等（2022）的研究高度相关，该研究也认为遗忘可以被视为一种放松的差分隐私。然而，我们的工作与他们的研究有两个主要区别。首先，他们仅将遗忘分析为一种被动的隐私减轻形式，声称在大规模训练中早期看到的数据具有隐私保护效益，而我们则提出一种更主动的遗忘形式。其次，他们只展示了图像分类和音频生成模型的分析结果，而我们则专注于大型语言模型。

3 语言模型中的知识去学习

3.1 方法论

我们提出通过简单地否定最小化标记序列负对数似然的原始训练目标，作为我们在语言模型中进行知识去学习的主要方法。具体来说，给定一个标记序列 $(x_1, x_2, \ldots, x_T)$ ，我们的去学习训练目标就是最大化以下损失函数：

$L_{UL}(f, x) = \sum_{t=1}^{T} \log(p(x_t | x_{LUL(f,x)=t=1∑Tlog(p(xt∣x<t))$

这里的 $p(x_t | x_{p(xt∣x<t)$

3.2 量化语言模型的隐私风险

在本小节中，我们介绍两个用于量化特定标记序列隐私风险的指标，以及我们如何经验性地定义要被遗忘的标记序列。在这项工作中，我们不使用诸如成员推断攻击召回率（Shokri等，2017）等指标，因为我们并不希望量化语言模型的整体隐私风险，而是关注特定目标标记序列的隐私风险。

提取可能性（EL）
我们首先介绍一个新指标 EL。给定一个标记序列 ( x = (x_1, x_2, \ldots, x_T) ) 和一个具有预训练参数的语言模型 ( f )，我们将 EL 定义如下：

$EL_n(x) = \frac{\sum_{t=1}^{T} OVERLAP_n(f(x_{ELn(x)=T∑t=1TOVERLAPn(f(x<t),xt)$

$OVERLAP_n(a, b) = \frac{c\_n\text{-grams}(a) \cap c\_n\text{-grams}(b)}{c\_n\text{-grams}(a)}$

$n\text{-grams}(a)$ 表示给定标记序列中的 n-grams 列表，而 $f(x_{f(x<t)$

变化前缀长度 $x_{x<t$

我们将 ( n ) 视为一个超参数，可以根据隐私标准的严格性进行调整。设置更高的 ( n ) 值会提高成功提取攻击的标准。

记忆准确率（MA）
记忆准确率（MA）定义如下：

$\frac{1}{T} \sum_{t=1}^{T} 1_{\{ \text{argmax}(p(x_{MA(x)=T1t=1∑T1{argmax(p(x<t))=xt}$

MA 量化了语言模型 $f$ 对给定标记序列的记忆程度，最初由 Tirumala 等人（2022）提出，用于分析大型语言模型的训练动态。

遗忘的经验定义
通过利用 EL $_n$ 和 MA，我们经验性地定义标记序列 $x$ 为被遗忘，并在满足以下条件时不再容易受到提取攻击：

$EL_n(x) < \frac{1}{D} EL_n(x) \quad \text{且} \quad MA(x) < \frac{1}{D} MA(x)$

其中 $D$ 代表在训练过程中未见的验证语料库。换句话说，当 EL $_n(x)$ 和 MA(x) 达到低于未见训练的标记序列的平均 EL $_n$ 和 MA 时，我们定义 $x$ 为被遗忘。

4 实验

4.1 模型、数据集和配置

基线模型
在实验中，我们使用 GPT-NEO（125M、1.3B、2.7B）语言模型（Black 等，2021），该模型最初在所有 Pile 语料库（825GB）（Gao 等，2020）上进行预训练，以及 OPT（125M、1.3B、2.7B）语言模型（Zhang 等，2022），该模型在去重版本的 Pile 子集以及来自不同领域的其他语料库上进行预训练。在实验中，我们对 GPT-NEO 语言模型进行去学习，并量化与 OPT 语言模型相比的目标数据的隐私风险，以衡量我们提出的方法在与 Kandpal 等（2022）提出的在预训练基础模型之前去重训练语料库的有效性。由于 Kandpal 等（2022）中的语言模型并未开放源代码，因此我们使用 OPT 语言模型代替。

我们还考虑将差分隐私（DP）解码（Majmudar 等，2022）作为基线之一；该方法提出了一种解码策略，通过对原始 logits 与均匀分布进行线性插值并执行核采样，理论上表明提供了 DP 保障。设置为线性插值权重，其中 ( \alpha = 0 ) 时从均匀分布进行核采样，而 $\alpha = 1$ 时则执行常规核采样，在随机采样过程中使用 logits 作为权重。

目标数据
为了量化语言模型的隐私风险，我们从训练数据提取挑战 1 中抽取实例，其中提供了来自 Pile 语料库 16 个不同领域的 15,000 个示例（每个示例为 200 个标记序列），这些示例被识别为相对易于提取。对于我们的实验，我们随机从 15,000 个示例中抽取 ( s ) 个样本，并使基础语言模型一次性忘记这 ( s ) 个样本。作为默认，我们展示了所有实验设置中 5 次随机抽样的平均结果。我们仅提供 5 次抽样的平均值，不单独报告标准差，而是在附录 A 中提供每个单独运行的结果。

评估数据集
为语言模型提供更强的隐私保护可能会变得毫无意义，如果这需要牺牲其原始能力。因此，在量化语言模型的隐私风险时，我们还通过在 9 个不同的分类任务上评估语言模型，量化其原始能力：使用 Hellaswag（Zellers 等，2019）和 Lambada（Paperno 等，2016）基准来测量语言推理能力，使用 Winogrande（Sakaguchi 等，2021）和 COPA（Gordon 等，2012）来测量常识推理能力，以及使用 ARC-Easy（Clark 等，2018）、ARC-Challenge（Clark 等，2018）、Piqa（Bisk 等，2020）、MathQA（Amini 等，2019）、PubmedQA（Jin 等，2019）基准来测量科学推理能力。我们还在 4 个对话任务（Wikipedia 吟游诗人（Dinan 等，2019）、同理心对话（Rashkin 等，2019）、混合技能对话（Smith 等，2020）和互联网吟游诗人（Komeili 等，2022））上评估语言模型的生成能力。我们使用 Lambada 的测试集和其他数据集的验证集。我们还在附录 B 中展示了在 Pile 和 Wikitext 的验证语料库上测量困惑度的结果。我们不将困惑度作为主要评估之一，因为困惑度可能不是量化语言模型整体性能的最合适指标，特别是在去学习的情况下（附录 B 中有进一步说明）。我们仅在 4 个对话任务上评估 DP 解码，因为解码策略无法应用于分类任务，而分类任务是通过使用口头化工具进行评估的。

配置
对于学习率，我们将其设置为 5e-5。我们在附录 D 中展示了不同学习率的影响。在整个运行过程中，我们使用固定的学习率调度。我们将全局批量大小固定为与 ( s ) 相同（即一次遗忘的样本数量），因为全局批量大小小于 ( s ) 会降低语言模型的总体能力。对于 EL $_n$ ，我们设置 ( n=10 )，这意味着 EL 测量提取 n 个连续标记的提取可能性。为了计算 EL $_{10}$ 和 MA，我们使用简单的贪婪解码策略。我们将 dropout 和权重衰减率都设置为 0。最后，尽管我们在第 3.2 节中提供了经验性决定单个标记序列被遗忘的指导，但对于考虑一块 ( s ) 个标记序列被遗忘的情况，我们使用平均 EL $_{10}$ 和 MA 作为个别 EL $_{10}$ 和 MA 的近似值。

4.2 主要实验

遗忘阈值
首先，我们展示如何获得 EL $_{10}$ 和 MA 的遗忘阈值，即我们认为标记序列被遗忘且不再易受提取攻击的值，对于所有 GPT-NEO 语言模型的不同大小见表 1。对于 ( D )，我们对来自 Pile 验证语料库的 10,000 个实例（每个实例的标记长度为 200）进行加权抽样，并测量平均 EL $_{10}$ 和 MA（方程 5），这些值被经验性地设定为遗忘阈值。

主要结果
表 2 显示了对不同大小语言模型和基线进行去学习的主要结果。虽然我们在表 2 中提供了 5 次随机抽样的平均性能，但我们在附录 A 中为参考提供了每个单独运行的结果。

我们对结果提出五个主要观察。 (1) OPT 语言模型的 EL $_{10}$ 和 MA 远低于 GPT-NEO 语言模型，确认去重预训练语料库确实有助于减轻隐私风险。 (2) NEO + DP 解码能够有效防护提取攻击，显示出最低的 EL 和 MA 分数；然而，它在 4 个对话生成任务中的平均 F1 分数上导致生成能力严重下降。 (3) NEO + UL+ 对 125M 模型的分类和对话任务均造成严重下降，而对 1.3B 模型仅对对话任务造成严重下降，而 2.7B 模型则能够保留大部分之前的能力。 (4) 随着语言模型规模的增大，目标序列被遗忘所需的 Epoch 数减少。结合 (3)，这意味着更大的语言模型是在牺牲其性能以适应 NEO，而对于 2.7B 模型，其计算效率（3,500,000 倍）远高于重新训练基础语言模型，这对于所有数据预处理方法来说都是必需的。

总体而言，结果显示去学习是一种有效的方法，能够在保留甚至改善语言模型整体能力的同时提供强有力的隐私保护。

顺序去学习比批量去学习更稳定。 我们展示了在不同模型规模下，变化 ( s )（一次性遗忘的数据实例数量）的效果，如图 2 所示。我们将这种方法称为批量去学习。如图 2a 所示， $s = 128$ 的结果表明，一次性遗忘更多样本更困难，导致平均语言模型性能显著下降，无论模型大小如何。由于 $s = 32$ 并未显示出太多下降，我们探索顺序去学习是否能成为解决方案。在图 2b 中，我们展示了将 128 个样本分为 4 个 32 个的块并进行顺序去学习的结果；我们逐块遗忘，直到每块达到遗忘阈值。令人惊讶的是，尽管遗忘的实例完全相同，但在 $s = 128$ 的虚线（图 2a 中 $s = 128$ 的性能）与实线之间的性能差距显示最终结果截然不同。顺序去学习几乎没有降低平均语言模型的性能。在附录 G 中，我们展示了一旦遗忘的块将保持遗忘状态，并且后续块比初始块遗忘得更快。这个结果暗示了去学习的普遍性，而我们在本研究中没有进一步探讨。结果还表明，知识去学习可以在需要时持续应用于语言模型。

4.3 知识去学习的分析

更好地理解知识去学习期间发生的情况
为了展示知识去学习期间语言模型究竟发生了什么，我们展示了在对 GPT-NEO（1.3B）模型进行 10 次去学习运行（每次运行 ( s = 1 )）时，各个语言模型基准的性能变化，如图 3 所示。图中显示，每个基准的语言模型性能在选择遗忘的样本时差异巨大。此外，每次运行的结束时间也不同，表明某些样本比其他样本被遗忘得更快。为了更好地理解知识去学习如何保障隐私，我们进行了一次提取攻击，使用表 3 中的标记序列样本，展示了应用知识去学习前后模型生成文本的变化。尽管在去学习之前，提取攻击极其成功地提取了剩余的后缀（100% 的标记序列），但在应用去学习后，仅提取了后缀中的一小部分（3% 的标记序列）。

理解为何某些实例更难以遗忘
为了测量为何某些实例更难以遗忘，我们从训练数据提取挑战中进行 5 次随机抽样 ( s = 8 ) 的样本，来自 8 个不同领域，并对 GPT-NEO 1.3B 语言模型进行去学习。我们还在附录 A 中展示了每次单独运行的结果。如表 4 所示，尽管经历了相同数量的标记更新（10 个去学习的 Epoch），但不同领域的结果却截然不同；ENRON EMAILS 的平均语言模型性能下降仅为 -0.4%，而 USPTO BACKGROUNDS 则导致 -4.5% 的下降。此外，最终的 EL(_{10}) 随领域而异，表明某些领域（例如 FREELAW）更难被遗忘。最后，更加结构化的领域，意味着数据包含某种模式，例如电子邮件列表（ENRON EMAILS）或代码（GITHUB (CODE)），似乎导致语言模型性能的下降较少，而与数据主要由原始英文文本构成的非结构化领域（例如期刊提交的评论（PUBMED CENTRAL））相比，后者的性能下降更大。我们在附录 E 中提供了每个领域的示例。然而，关于理解哪些具体组件使得去学习有效的进一步分析应在未来的工作中进行。

5 结论

在本文中，我们提出了知识去学习作为一种减轻语言模型隐私风险的方法，提供强有力的隐私保护，同时对通过在 9 个常见语言模型分类基准和 4 个对话基准对更大规模语言模型进行评估时，其整体能力几乎没有下降。随着大型语言模型使用案例的扩展，可能会影响人们的日常生活，研究界应确保不因这些模型的隐式参数存储的知识而故意或无意地侵犯个人隐私。由于在预训练语言模型之前，固有地无法防止和预测所有未来的隐私问题，我们建议社区考虑知识去学习，以确保在个人请求的情况下，在预训练后维护隐私。

高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
AI MCP教程之什么是 MCP？利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 mcp deepseek
介绍利用模型上下文协议(MCP)的工具吸引了我们的注意力—将AI变成触手可及的生产力引擎。它们巧妙、高效，让人难以抗拒。但如果您可以将这样的功能添加到自己的工具中，会怎么样呢？在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。推荐文章《AnythingLLM教程系列之12AnythingLLM上的Olla
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【实战AI】macbook M1 本地ollama运行deepseek 东方鲤鱼 chat AI macos ai llama AIGC chatgpt
由于deepseek官网或者Aapi调用会有网络延迟或不响应的情况，故在本地搭建部署；前提条件1.由于需要拉取开源镜像，受网络限制，部分资源在前提中会下载的更快！请自行；2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端（MacOS、Windows、Linux），专为无缝部署大型语言模型（LLM）（如Llama2、Mistral、Llava等）而设计。通过一键式
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门 kakaZhui 前沿多模态大模型：论文与实战 llama 交互 LLM TTS 语音识别语音合成人工智能
一、引言：语音交互大模型今天我们来看语音交互大模型LLaMA-Omni，它由中国科学院计算技术研究所的研究者们推出，是一个基于强大的Llama-3.1-8B-Instruct构建的语音语言模型。LLaMA-Omni不仅实现了低至226ms的惊人交互延迟，还能同时生成高质量的文本与语音回复，真正意义上让大语言模型（LLM）具备了“听说”的能力。这篇博客将带你由浅入深，全方位地探索LLaMA-Omni
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
在LLM快速迭代时代构建持久AI应用：架构设计与实施策略
引言：技术浪潮下的开发困境大型语言模型(LLM)的发展速度令人瞠目：从GPT-3到GPT-4，从Claude1到Claude3，从Llama1到Llama3，迭代周期正在从"年"缩短到"月"。作为一名AI应用开发者，我亲身经历了这种技术浪潮带来的挑战：昨天精心调优的prompt今天可能失效；上个季度集成的模型这个季度已有更优选择；刚完成的功能设计瞬间被新模型的能力超越。在如此快速变化的环境中，如何
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方