无脑敲代码，bug漫天飞

论文阅读-Identifying Coordinated Accounts on Social Media through Hidden Influence and Group Behaviours

摘要

1 INTRODUCTION

2 RELATED WORK

3 TASK DEFINITION AND PRELIMINARIES

3.1 Task Definition

3.2 时间点处理

4协调检测方法

4.1 账户活动建模

4.1.1 AMDN 架构和训练。

4.2 隐藏组建模

4.3 共同学习

5 实验结果

5.1 Data Collection

5.1.1 俄罗斯互联网研究局（IRA）协调行动

5.1.2 COVID-19 大流行。

5.2 基线和模型变体

5.3 协调检测结果

5.4协调检测分析

5.4.1 从影响结构中揭示特征行为

5.4.2 发现 COVID-19 数据中的协调群体

论文链接：https://arxiv.org/pdf/2008.11308.pdf

摘要

社交媒体上的虚假信息活动越来越普遍，其中包括从恶意账户为操纵公众舆论而开展的协调活动。

现有的检测协调帐户的方法要么对协调行为做出非常严格的假设，要么需要揭露协调组中的部分恶意帐户才能检测其余帐户。

为了解决这些缺点，我们提出了一种生成模型 AMDN-HAGE（具有隐藏帐户组估计的注意混合密度网络），它基于时间点过程（TPP）和高斯混合模型（GMM）联合建模帐户活动和隐藏组行为，为了捕捉协调的内在特征，即协调的账户必须强烈影响彼此的活动，并且总体上与正常账户表现出异常。

为了解决优化所提出模型的挑战，我们提供了一种具有收敛理论保证的双层优化算法。

我们对从 Twitter 收集的与俄罗斯互联网研究机构针对 2016 年美国总统选举的协调活动相关的现实世界社交网络数据验证了所提出的方法和训练算法的有效性，并确定了与 COVID-19 大流行相关的协调活动。

利用学习的模型，我们发现协调帐户对之间的平均影响力最高。

关于 COVID-19，我们发现有协调一致的团体散布反疫苗接种、反口罩阴谋，表明这种流行病是一场骗局和政治骗局。

1 INTRODUCTION

在最近一个时期，持久性滥用的社会媒体对于传播虚假信息并影响公众舆论和社会成果已经成为一个越来越紧迫的问题[20]. 它已经在很大程度上被用作一种手段来影响选举[2],公众对在社会问题，如社会与政策相关的COVID-19[21个]和其他当地和全球活动。该问题已经得到甚至更多的相关性，在正在进行COVID-19流行病，更加依赖社会媒体的信息，关于医疗保健和政策，已经使它成为一个容易的目标的大规模散布虚假消息运动的[21]. 最早报道的虚假信息活动案例是在美国国会调查发现俄罗斯“互联网研究机构”(IRA) 或俄罗斯“巨魔农场”在社交媒体上运营的协调账户通过宣传虚假信息和政治影响 2016 年美国大选时出现的分裂的叙述[2]。识别用于操纵社交媒体的协调账户至关重要。

GAP

为了解决这一关键任务，早期的方法试图根据个人行为、账户特征和虚假信息宣传参与情况 [1] 或集体群体行为（例如时间同步的活动）来发现协调账户 [4, 17]。然而，它们都面临着固有的局限性。依靠虚假信息线索或自动行为来检测协同行动者的方法，在检测由人工操作的账户方面存在不足，这些账户使用说服、诽谤和极化手段来操纵舆论（协同影响行动中注意到的特征[13]）。

利用集体行为的现有方法严重依赖于协调行为的假设特征，例如类似的主题标签序列作为协调签名或及时同步的活动 [17,24,28]。然而，这些特征可能不一致[30]，限制了对未知账户的泛化。此外，依赖手工制作的协调签名只能捕获有限范围的行为，并且无法有效减少误报，对协调群体做出严格的假设，而这些假设不一定成立。图 1 显示了 Twitter 正式暂停的帐户示例以及在 COVID-19 数据中观察到的帐户活动（也被确定为与我们的方法相协调）。从账户中观察到的协调活动的时间差异多种多样，有的不到 6 小时，有的则超过半周。在这项工作中，为了解决这些缺点，我们建议对协调的以下固有特征进行建模：

（Twitter 在 COVID-19 数据中暂停的协调账户（也用提议的方法识别）。这些账户的示例推文显示了协调推动的政治阴谋。他们协调活动的时间差从一处不到 6 小时到另一处超过半周不等。）

协调的固有特征

• 隐性影响力强。如果帐户协调起来放大社交媒体帖子或针对特定个人，那么他们的活动之间应该存在很强的隐藏（潜在）影响。最近重要的计算宣传是由政治人物和政府制作和运作的[25]。

• 高度协调的活动。协调账户的集体行为应该是集体异常的，不同于网络上活动模式组织较少的其他正常账户（即，由不同机制生成时偏离正常的观察结果[10]）。

捕获协调特征的方法

无监督生成模型

为了捕获它们，我们提出了AMDN-HAGE（带有隐藏账户组估计的注意混合密度网络），这是一种用于识别协调账户的无监督生成模型，它基于神经时间点过程（NTPP）和联合建模账户活动和隐藏账户组高斯混合模型（GMM）。

对未来活动的分布进行建模

为了了解帐户活动之间的潜在相互作用或影响，我们根据具有时间差异的所有帐户的过去活动对未来活动的分布进行建模，并通过同时学习帐户的组成员身份来共同捕获集体异常行为。

联合优化问题

为了解决联合优化问题，我们根据观察到的活动轨迹，提出了一种使用随机梯度下降和期望最大化的双层优化算法。

使用账户 ID 和活动时间戳的活动跟踪中学习账户表示和隐藏组

由于 AMDN-HAGE 以无监督的方式直接从仅使用账户 ID 和活动时间戳的活动跟踪中学习账户表示和隐藏组，因此它不需要了解协调组中部分未覆盖的账户或预定义的单个特征，尽管它们也可以被插入如有必要，可轻松进入。

假设协调帐户是具有协调活动的异常群体

此外，与依赖时间戳同步等严格群体行为假设的现有模型不同，我们的模型仅假设协调帐户是具有协调活动的异常群体，从而允许对协调群体进行更多数据驱动的识别。除了上述有效性优势之外，通过结合显式注意力模块，我们使我们的模型能够学习并输出网络上帐户之间潜在交互的强度。总的来说，我们的贡献如下：

我们建议 AMDN-HAGE 从基于 NTTP 和 GMM 的帐户活动推断出的集体群体行为中检测协调的活动。

• 我们提供了具有理论和实证保证的活动轨迹建模（NTPP）和社会群体建模（GMM）联合学习的双层优化算法。

• 对有关已知协调活动的真实世界 Twitter 数据进行的大量实验，验证了我们的方法在协调检测方面非常有效。从学习模型中，我们发现协调帐户的可识别模式，例如它们之间的影响力最高，但衰减最快。

• 我们应用该方法来识别 COVID-19 数据中未知的协调活动，并找到西班牙语和英语帐户的协调组（NoMask、NoVaccine、NoALaVacuna、NoAlNuevoOrdenMundia、QAnon），内容涉及无口罩、无疫苗、无新世界秩序阴谋、反对比尔·盖茨认为，COVID-19 是一场骗局和政治骗局。

2 RELATED WORK

虚假信息和社交媒体滥用问题降低了人们对在线平台的信任。打击虚假和误导性信息的努力已在许多不同的背景下得到了广泛研究[20]，从从内容特征检测虚假信息和社交媒体上对其的反应，到了解传播模式[19]和参与其传播的账户[7]。与社交机器人和个人恶意帐户不同，越来越多的研究领域是检测协调帐户（协调的虚假信息或影响活动），也称为“巨魔农场”，由一组人类和/或机器人帐户精心策划，以发挥作用联合传播虚假信息或其他叙事[12]。

个体行为：参与虚假信息传播情况分配置信度分数

识别协调账户的主要技术是：个体行为。现有作品主要使用两种个体行为。第一种是参与虚假信息传播[18, 19]。例如Ruchansky 等人提出了一种假新闻检测模型，根据帐户参与假新闻级联的情况为其分配可疑性分数 [18]。

个体特征：定义各类特征

第二类是个体特征，例如欺骗性语言特征、共享链接数量、主题标签和设备发帖和跨平台活动 [1, 11, 29]。除了上述预定义的特征之外，巨魔帐户的活动痕迹对于理解恶意行为也很有用。在最近的工作中，Twitter 帐户的推文、转发和回复模式被用来推断其活动背后的激励或奖励，并表述为逆强化学习问题 [12]。根据估计的奖励，作者发现巨魔的行为与普通用户不同，因为他们似乎不管响应如何都会执行他们的活动。

集体行为：学习潜在的帐户交互来自动学习和检测观察到的帐户活动中的协调行为

集体行为。从整体上检查集体或群体行为以检测异常恶意帐户的方法与我们的方法相关。曹等人和古普塔等人基于恶意帐户活动及时同步的假设，对大约在同一时间采取类似操作的帐户进行集群 [4, 9]。其他工作对通过手工制作的特征定义的帐户相似性图进行聚类或分区，这些特征被认为表示协调行为，包括由一大群帐户共同共享的主题标签或文章的序列[17, 24]。这种方法的显着局限性在于，用于定义协调的同步或手工特征的假设可能不成立。相反，我们建议通过学习潜在的帐户交互来自动学习和检测观察到的帐户活动中的协调行为。

3 TASK DEFINITION AND PRELIMINARIES

3.1 Task Definition

在本节中，我们介绍了从帐户的集体群体行为中检测社交网络中协调帐户的任务。协调的活动是精心策划的努力，其中帐户串通无机地传播并放大特定叙述的传播以进行舆论操纵，我们要解决的任务是识别这种协调的帐户。在这项工作中，我们提出了 AMDN-HAGE（具有隐藏帐户组估计的注意混合密度网络），这是一种用于协调检测的无监督生成模型。它对账户活动痕迹和潜在账户组进行联合建模，从观察到的账户活动中学习集体群体行为，并检测具有集体异常行为的协调账户。

活动痕迹：我们考虑的唯一输入是社交网络上帐户的活动痕迹。活动轨迹可以表示为按时间排序的事件序列，可以表示为 = [(1, 1), (2, 2), (3, 3), ··· (, )] 。每个元组 ( , ) 对应于帐户在时间进行的活动。这些活动代表网络上的帐户操作，例如发布原始内容、重新共享、回复或对其他帖子作出反应。为了提供独立于平台/语言的检测，我们不包括操作类型或帖子内容和帐户元数据等特征，尽管可以轻松地将其他可用特征合并到该方法中。对于任何社交网络来说，基本输入都是最容易获得的。此外，我们对协调行动做出的唯一假设是：

与正常账户相比，协调账户的数量相当少(即，集体异常)。

协调用户具有高度协调的活动模式

隐藏账户组： 在真实的社会网络中，具有类似活动的账户形成社会群体，既可以构成正常的社区，也可以构成协调的群体。

假设在账户集合U中有N个组。我们可以定义一个成员关系函数: : → {1, · · · , } ，它将每个帐户映射到它的组索引。这种成员关系在许多情况下是隐藏的或未知的[3]。获取M可以帮助我们识别集体异常群体行为来检测协调群体。在这项工作中，我们的目标是从观察到的活动痕迹中学习隐藏的群体。

3.2 时间点处理

时间点过程（TPP）是一个随机过程，其实现是连续时间 $t\in R^+$ 中的一系列离散事件[5]。截至时间序列中事件的历史通常表示为其中 U 表示事件类型的集合（此处为帐户）。点过程的条件强度函数被定义为给定历史的无限小窗口中事件的瞬时速率，即其中 N(t)是截至时间的事件数。第 i个事件的条件密度函数可以从条件强度 [6] 导出为

在社交网络数据中，广泛使用的条件强度公式是多元霍克斯过程（HP）[32]，定义为，其中是条件强度基本强度 0 且相互触发强度时的事件类型捕获事件类型的影响，并且是一个衰减内核，用于模拟影响随时间的衰减。 $\mu$ 和 $\alpha$ 是可学习的参数。由于 HP 的固定公式和很少的可学习参数限制了其表达能力，最近的工作提出用神经网络对强度函数进行建模 [6,14,16,22,31,33]。

4协调检测方法

为了捕获账户活动与协调群体的集体行为之间的潜在影响，以及此类账户协调活动的多样性，我们引入了所提出的模型 AMDN-HAGE。

AMDN-HAGE 由两个组件组成：一个将观察到的活动轨迹建模为时间点过程的注意力混合密度网络（AMDN）和一个将帐户组建模为多个分布的混合的隐藏帐户组估计（HAGE）组件。概述如图 2 所示。

(图 2：提议的 (AMDN-HAGE) 架构，用于对社交媒体上帐户活动和隐藏群体的条件密度函数进行建模。)

这两个组件共享帐户嵌入层，反映了帐户首先从多个隐藏组中提取，然后相互交互以观察活动痕迹的完整生成过程。利用观察到的活动轨迹，我们可以通过最大化联合模型的似然函数来学习生成模型，不仅获得帐户嵌入，还获得活动轨迹模型和组成员函数。将账户嵌入表示为E ，AMDN 中的参数为 $\theta _\alpha$ ，HAGE 中的参数为 $\theta _g$ ，联合似然函数可以写为：

是在给定已知帐户集的情况下观察到活动痕迹的概率密度，是我们观察从潜在的隐藏社会群体中提取的帐户集的概率密度。通过账户嵌入和学习到的成员资格，我们获得集体异常组作为潜在组，其异常分布与其余账户相比具有较小的方差或大小，以检测协调。

4.1 账户活动建模

在本节中，我们介绍 AMDN 组件（注意力混合密度网络）来对帐户活动进行建模以进行协调检测。 AMDN 由两部分组成：历史编码器和事件解码器。假设我们对活动进行建模，历史编码器将之前发生的所有活动表示为向量 $H_{t_i}$ 。然后，事件解码器（即条件密度函数）根据历史表示和已知账户集预测。该编码器-解码器架构对活动进行建模，可能性因式分解为：

我们在以下段落中提供架构详细信息.

4.1.1 AMDN 架构和训练。

在表1中，我们总结了现有的点过程模型（详见附录）；这些模型存在不同的缺点，需要在灵活的强度函数（更好的表达能力）、封闭形式的可能性（减少训练中的梯度噪声）和可解释的影响（事件对的显式影响得分）之间进行权衡。对于协调账户建模，以上属性都很有用.

因此，我们开发了AMDN，它具有所有上述属性。我们使用屏蔽自注意力[23]（使用额外的时间编码来处理不规则的事件间时间）来对事件历史进行编码，以实现过去和未来事件之间可解释的影响（替代[22]中使用的循环神经网络），但仍然使用对数正态混合分布作为事件解码器来对给定历史的下一个事件的条件密度进行建模（类似于[22]），实现所有属性.

使用屏蔽自注意力对事件序列进行编码。令 $\tau \in R^+$ 表示事件间时间，表示条件密度。历史使用神经网络进行编码，以自动提取有用的特征，类似于其他神经点过程模型.

带位置编码的屏蔽自注意力。为了可解释过去事件对未来事件的影响，我们用屏蔽自注意力对事件序列进行编码[23].

具有来自先前事件的成对影响的屏蔽注意力权重A，输入序列表示 $X\in R^{L*d}$ （序列长度，特征维度），以及可学习权重。最后，我们应用层归一化、dropout 和前馈层来获得输出。为了保持历史事件的顺序，我们将第 i-th 事件的位置信息表示为 m-dim 位置编码，并使用下面的三角积分函数[23]。

帐户和时间编码。我们还使用可学习的账户嵌入矩阵来表示账户类型和时间和平移不变的时间核函数[26]，使用具有不同频率 $\omega$ 的多个周期函数的特征映射 $\phi$ 来嵌入事件间时间

第i个事件的输入（到注意力头）是事件、位置和时间嵌入的串联，

事件历史上下文向量。注意力机制使用对之前事件的注意力来为我们提供每个事件的表示。我们可以使用最后一个事件的表示或注意力输出上的循环网络层将事件历史总结为上下文向量，其中L是事件序列长度。每个都是一个上下文向量，编码事件的历史到，即时间点过程的历史 $H_{t_i}$ 。

条件概率密度函数。通过编码的事件历史记录（上下文向量），事件解码器（可学习的条件密度函数）用于生成以历史记录为条件的下一个事件时间的分布。

虽然我们可以为选择任何函数形式，但唯一的条件是它应该是一个有效的 PDF（非负数，并且在上积分为 1）。为了维持有效的 PDF，点过程模型中通常使用指数分布或具有可学习参数的其他分布 [6,22,32].我们将PDF定义为对数正态分布的混合，因为的域是非负的(如[22])，并且混合分布可以任意地近似R上的任何密度[22]，而不限于指数函数或其他单调函数。条件PDF定义为:

其中混合权重、均值 $\mu _i$ 和标准差由提取的上下文历史和可学习的V b参数化。

编码器-解码器参数（联合表示为 $\theta _a$ ）和可学习的帐户嵌入（E）可以使用最大似然估计（对于方程 3 中定义的对数似然）从观察到的活动序列和帐户集进行学习，并使用梯度回训练- 传播为。

4.2 隐藏组建模

为了根据观察到的活动轨迹对隐藏的社交群体进行建模，我们将隐藏的账户群体建模为账户嵌入空间中高斯多元分布（GMM）的混合。

形式上，第i-个社会群体被建模为高斯分布，其中 $\mu _i$ 是聚类均值，Σ_i 是协方差矩阵。由于帐户的组成员身份未知，我们假设帐户嵌入是从混合中提取的，帐户的嵌入分布为，其中 p(i)表示组i 的先验概率。

隐藏组估计：与一般高斯混合模型的一个显着区别是，与过度观察的变量相比，我们在可学习的帐户嵌入（潜在空间）上定义 GMM。因此，AMDN-HAGE 的优化和学习需要双层优化来共同学习模型参数和账户嵌入（如下一节所述）。

这里提出的模型旨在从活动痕迹中捕获潜在或隐藏的群体，而不是从观察到的帐户特征中捕获。这是因为协调模式（例如，协调账户的活动可能会相互强烈影响）保留在活动痕迹中，并提供有关其集体行为的信息，从而能够识别协调的隐藏群体。

为了对协调账户和正常账户的不同组进行建模，我们对所有组使用了并列协方差 Σ。将 GMM 的参数（均值、共享协方差和先验）表示为 $\theta _g$ ，帐户上的社会群体U建模的对数似然为：

4.3 共同学习

对于联合学习，我们最大化以下对数似然:

上述损失函数有一个简单的无限渐近解，其中所有嵌入向量等于簇的平均值并且 det(Σ) = 0。为了避免这种解，我们将 det(Σ) 限制为大于一个小的常数 $\lambda$ ，下界为损失函数。

对数似然（方程 11）是参数 $\theta _a, \theta _g,E$ 的函数。其中，第二项（共享潜在嵌入的高斯混合）的优化是一个约束优化问题。因此，直接使用随机梯度下降（SGD）或其变体（如 ADAM）优化联合似然不考虑混合权重（归一化非负）和协方差（正定）的约束，导致训练中的对数似然无效（消融） ADAM 损失的研究在扩展部分）。为了解决上述缺点，我们提供了等效的双层优化公式来解决联合学习问题.

上述双层优化可以通过迭代优化来解决。在每次迭代中，我们首先冻结E 和 $\theta _a$ ，然后用 EM 算法进行估计 $\theta _g$ 。之后，我们冻结 $\theta _g$ 并使用 SGD（或其变体）来优化E 和 $\theta _a$ 。由于潜在嵌入的对数似然在第二项（方程 11）中进行了优化，因此我们需要通过预训练E 和 $\theta _a$ 来初始化嵌入，并在联合优化这两项之前通过最大化目标函数中的第一项来对观察到的序列进行初始化。具体算法见算法1。

这种交替优化算法的普遍关注点是其收敛性。因此，我们给出以下理论保证，即通过适当选择基于梯度的优化器（将表示为负对数似然（损失函数），所提出的算法使模型至少收敛于局部最小值或鞍点））。

定理 1 如果在任何迭代中神经网络优化器满足以下条件，我们提出的优化算法将收敛于局部最小值或鞍点：

证明可以在附录中找到。理论上，当我们的损失函数是L-smooth并且我们应用学习率低于1的标准梯度下降算法时，这两个条件就可以得到保证[15]。但在实践中，由于找到严格的局部最小值并不像训练速度和泛化那么重要，因此我们可以选择应用 Adam 或其他变体

5 实验结果

我们验证了所提出的方法 AMDN-HAGE 和训练算法在从 Twitter 收集的与俄罗斯互联网研究机构协调账户相关的真实数据集上的有效性，以及在 COVID-19 中识别和分析协调的有效性。我们提供数据收集、基线和模型变体。实施和实验设置的详细信息见附录

5.1 Data Collection

5.1.1 俄罗斯互联网研究局（IRA）协调行动

2752 个 Twitter 账户被美国国会认定为由俄罗斯机构（称为“巨魔农场”）运营的协调账户，旨在操纵 2016 年美国大选。这些账户子集的社交媒体帖子（活动）是可用的学术界通过付费的Twitter API访问来研究协调账户检测[2, 12]。我们从Luceri等人那里获得了收集的数据集，其中包含312个俄罗斯协调账户（称为协调“巨魔”）他们的 120 万条推文，还包括 1713 个参与美国大选讨论的普通账户，在此期间协调的巨魔很活跃（使用 Twitter API 根据选举相关关键词收集）；收集的数据集中的帐户是活跃帐户，至少有 20 条主动和被动推文 3 [12]。

活动痕迹：活动痕迹是根据推文构建的，因为任何帐户的帖子和其他帐户的后续参与（转发、回复帖子）形成了按时间排序的活动序列。利用账户集（2025 个账户）和活动轨迹来训练 AMDN-HAGE，并保留 15% 的序列子集作为模型的验证损失。

5.1.2 COVID-19 大流行。

出于对围绕 COVID-19 的虚假信息和社交媒体滥用的担忧，我们在 2020 年 3 月 1 日至 7 月 22 日期间使用 Twitter 的流媒体 API 服务收集了与 COVID-19 相关的关键词的社交媒体帖子。 119,298 个活跃账户，至少有 20 条主动和被动收集的推文(主动推文是帐户发帖（推文、转发、回复）的地方，被动推文是帐户被提及、转发或回复的地方 [12)，以及它们的 1390 万条推文。

未知协调：与 IRA 数据集不同，COVID-19 数据没有任何标记的协调组。但重要的是要检查我们是否能发现任何未知的协同运动。我们在完整的 119k 帐户集上运行 AMDN-HAGE，其活动轨迹与 IRA 数据集相同，并检查来自已识别协调组的推文，以及帐户与暂停的 Twitter 帐户（因违反平台政策而被 Twitter 手动暂停）的重叠。可能存在尚未被 Twitter 发现并暂停的违规帐户。此外，帐户被暂停可能是由于各种原因（例如垃圾邮件、自动化、多个帐户），但 Twitter 暂停不仅限于协调帐户。因此，我们不能使用 Twitter 暂停来估计协调检测的精确召回率。

5.2 基线和模型变体

我们与利用账户活动来识别协调账户的现有方法进行比较。

基线 - 从账户活动中提取协调特征，并将其用于基于个人或集体行为的监督或无监督协调检测。

（1）无监督基线：协同活动聚类[18]和点击流聚类[24]基于预定义的活动特征。协同活动对内容共享中的联合活动进行建模，点击流聚类对发帖、转发和回复操作中的模式进行建模。 SOTA 方法是基于逆强化学习的 IRL [12]，从活动痕迹中提取特征，用于聚类协调帐户。

(2) 监督基线：IRL(S) [12] 是逆强化方法的 sota 监督变体，它根据从活动轨迹（带有标记的帐户子集）中提取的特征来训练监督分类器。

我们使用 HP（Hawkes Process）[32] 添加另一个基线，以从活动跟踪中无监督地学习帐户特征。 HP(S) 是监督变体。 HP 使用附加函数对帐户之间的影响进行建模。该基线作为所提出模型的消融，以表明协调群体的潜在影响和交互模式更加复杂，神经点过程可以更好地提取这些协调特征。

为了消除所提出的模型 AMDN-HAGE 的不同组成部分，我们还与 (i) AMDN（无隐藏组估计）进行比较，后者仅学习活动轨迹模型；我们可以用它来提取帐户嵌入并使用 GMM 或 KMeans 进行聚类，以将协调组识别为异常组。

(ii) AMDN-HAGE 直接使用联合学习的 GMM 来输出组成员资格。 AMDN-HAGE + Kmeans 相反，使用 AMDN-HAGE 的帐户嵌入和 KMeans 聚类来查找异常协调组。

（iii）为了与监督设置（IRL（S）[12]）进行比较，我们类似地在提取的特征上训练分类器，即学习帐户嵌入来检测协调帐户（假设标记的协调帐户和正常帐户的子集可用于训练））。这些变体是 AMDN + NN 和 AMDN-HAGE + NN，它们对从 AMDN 和 AMDN-HAGE 分别提取的嵌入使用两层 MLP 分类器。

5.3 协调检测结果

IRA 数据集上的检测结果：我们评估两种设置 - 无监督和监督（如早期工作 [12]）。在这两种情况下，所提出的模型都经过活动跟踪的无监督训练，以获得组成员资格和帐户嵌入。

在无监督情况下，直接使用群组成员身份来报告异常协调群组。

在监督中，学习到的嵌入被用作训练分类器的特征（以根据正常帐户预测协调）。

分类器在 IRA 数据集中标记的协调帐户和正常帐户的子集上进行训练，其余部分（按 5 倍分层的 20%）保留用于评估。表 2 提供了针对 IRA 数据集中标记的正常帐户和协调帐户的 5 倍分层交叉验证平均基线的模型评估结果，超过五个随机种子。

我们比较平均精度 (AP)、ROC 曲线下面积 (AUC)、F1、精度、召回率和 0.5 阈值的 MacroF1，以及最大化阈值的 maxF1。 AMDN-HAGE 在无监督和监督设置上都优于其他方法，因为它能够通过学习潜在影响和隐藏群体行为来捕获不同帐户行为的协调特征，而无需预先指定其他基线所依赖的特征。

此外，与 IRL 和 IRL(S) [12] 不同，用所提出的方法学习到的协调特征对于无监督或有监督设置具有鲁棒性（尽管 IRL(S) 可以学习有用的特征，但在无监督设置中表现不佳）。相比之下，由于 AMDN-HAGE 模拟了更内在的协调行为，因此它可以提取能够以无监督方式有效识别异常协调群体的模式。在无监督环境中，边缘比在监督环境中更大，在监督环境中，群体行为更重要，因为没有已知的协调帐户集来根据提取的特征来训练分类器。

所提出的模型和训练的消融：除了基线之外，我们还将 AMDN-HAGE 与其变体进行比较，以验证联合学习和优化算法的重要性。为了验证联合学习的重要性，在表2中，AMDN-HAGE与AMDN进行了比较，AMDN只学习活动轨迹模型，没有隐藏组估计。提出的模型 AMDN-HAGE 始终捕捉到更好的协调行为，这表明联合建模群体或集体行为比仅通过观察到的活动跟踪建模来建模帐户对之间的潜在影响更有用。

为了证明双层训练算法的有效性，我们在训练过程中呈现了验证损失（保留 15% 的活动轨迹的负对数似然），比较使用 Adam（SGD 的变体）对联合对数似然的直接优化）和图3中我们提出的双层算法。正如我们所看到的，对于所提出的优化，预训练和联合训练阶段验证集上的损失都下降并最终收敛。然而，在 Adam 的直接优化中，验证损失会减少到一个点，但当它达到无效参数点时就会中断。在没有约束的情况下，Adam 得到的协方差矩阵不是正定的，并且是无效的对数似然 (NaN)。

5.4协调检测分析

5.4.1 从影响结构中揭示特征行为

在本节中，我们研究 AMDN-HAGE 对 IRA 数据的潜在影响结构和账户交互。观察到的痕迹中的帐户活动之间的潜在影响由模型的可解释注意力权重捕获。事件（账户活动）对历史事件（任何账户的早期活动）给予的关注度越高，表明历史事件对所考虑的未来事件有更强的触发影响。

5.4.2 发现 COVID-19 数据中的协调群体

如前所述，收集的有关 COVID-19 的数据不包含一组真实的标记协调账户。但是，我们可以使用所提出的方法 AMDN-HAGE 通过特征分析来发现任何可疑的协调帐户。 AMDN-HAGE 针对 119K 个账户的 COVID-19 数据中观察到的账户活动进行了训练。该方法识别两个异常帐户集群（基于附录中提供的聚类轮廓分数）。我们检查每个帐户组中的特征分布。

在表 3 中，我们比较了被暂停的 Twitter 帐户的分布。 Twitter 另外将一些暂停的帐户标记为国家支持的帐户，即 Twitter 发现与国家资助的业务相关的帐户（例如来自俄罗斯等试图干涉其他国家政治的帐户）[8]。此外，我们还考虑收集到的数据中与 Twitter 国家支持的账户双向互动的“耦合”账户，以及国家支持账户在推文中提到（或瞄准）的账户。

在所有 119k 个账户中，Twitter 账户的分布（已暂停，国家支持的，耦合的)是1.5-2倍之间高于随机机会在确定的异常集群，即使这样的帐户被发现，从大集合的帐户是小数目。对于 Target 来说，这种分布更加统一，因为与 Couple 不同的目标账户只捕获了国家支持账户的单向参与尝试，这是可以预期的，因为国家支持账户试图操纵，从而提到或参与其他正常账户

在图 6 中，我们在组中帐户发布的推文中找到最常见的主题标签，并绘制每个组特有的顶级主题标签（附录中提供了较小异常簇的主题标签）。我们发现协调组中突出的前一百个标签宣传反口罩和反疫苗（“No-Masks”、“NoVaccine”、“NoALaVacuna”）和反科学理论（“Plandemic”、“Covid-Hoax” ”），并包含与臭名昭著的极右阴谋组织“QAnon”（“WWG1WGA”）相关的主题标签。

在表 4 中，我们使用主题建模来查找异常帐户发布的最具代表性的虚假信息推文。我们发现了 4 个主题集群在与低可信度（虚假信息）新闻来源相关的推文中。该表显示了最接近主题集群中心的推文。主题标签和主题中的叙述表明西班牙语和英语推文的大量存在（NoALaMascarillaObligatori、NoALaVacuna）、NoAlNuevoOrdenMundia、NoVaccine）关于没有新的世界秩序、没有口罩、没有疫苗和 QAnon，所有这些都反对比尔盖茨，并暗示 COVID-19 是一个骗局和深层国家或政治骗局，旨在通过疫苗货币化。

在这项工作中，我们提出了一种技术，可以根据帐户的集体行为来检测协调帐户，直接从他们在社交媒体上的活动推断出来。所提出的方法独立于语言、元数据或平台特定功能，因此可以跨平台、语言或虚假信息活动发起的国家/地区进行推广。这些特征也可以很容易地合并到所提出的模型中。

通过对俄罗斯干扰和 COVID-19 数据集的分析，我们调查了已识别的协调账户的行为，发现协调账户之间的影响力更高，并且随着时间的推移，协调账户对之间的影响力比非协调账户对之间的影响力下降得更快。在 COVID-19 数据中，我们识别了协调组，分析表明协调组中的主要叙述是 COVID-19 是一个骗局和政治骗局，其中有反疫苗、反口罩的社交媒体帖子

你可能感兴趣的:(社交机器人检测,论文阅读)

为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
Omics精进03|一文彻底搞明白Germline Mutation和Somatic Mutation qq_21478261 #生物信息生物学生物信息学
胚系突变（GermlineMutation）和体细胞突变（SomaticMutation）在WES、WGS、GenePanel检测时常常遇到，二者最大的区别是胚系突变可以遗传给后代，而体细胞突变不能够遗传给后代。本文将从形成原因、遗传性、功能、发生时期、变异检测几个方面介绍二者的区别。上图，直观理解二者区别形成原因Germlinemutations主要是由于生殖细胞（germcells）突变导致，
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
【Freertos实战】零基础制作基于stm32的物联网温湿度检测(教程非常简易)持续更新中......... 熬夜的猪仔 stm32 物联网嵌入式硬件
本次记录采用Freertos的第二个DIY作品，基于Onenet的物联网温湿度检测系统，此次代码依然是全部开源。通过网盘分享的文件：物联网温湿度检测.rar链接:https://pan.baidu.com/s/1uj9UURVtGE6ZB6OsL2W8lw?pwd=qm2e提取码:qm2e大家也可以看看我上个的开源项目【Freertos实战】零基础制作基于stm32智能小车(教程非常简易)实物演示
12 个强大的 DeepSeek AI 提示将彻底改变您的日常生活知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
内容写作的最佳提示让我们从写作开始吧。无论您是博主、学生还是社交媒体创作者，这些提示都将帮助您创作出精彩的内容。提示1：“扮演专业文案撰稿人，为[产品/服务]撰写引人注目的广告文案。文案应引人入胜、具有说服力，且字数不得超过100个字。”这使得ChatGPT的响应结构就像真实的广告文案一样。提示2：“以更具吸引力和说服力的方式重写此段落，同时保持含义不变：[插入文本]。”推荐文章《Neo4j上使用
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
NVIDIA 系列之使用生成式 AI 增强 ROS2 机器人技术：使用 BLIP 和 Isaac Sim 进行实时图像字幕制作知识大胖 NVIDIA GPU和大语言模型开发教程人工智能机器人
简介在快速发展的机器人领域，集成先进的AI模型可以显著增强机器人系统的功能。在本博客中，我们将探讨如何在ROS2（机器人操作系统2）环境中利用BLIP（引导语言图像预训练）模型进行实时图像字幕制作，并使用NVIDIAIsaacSim进行模拟。我们将介绍如何实现一个ROS2节点，该节点订阅摄像头源、应用BLIP模型进行图像字幕制作，并实时显示结果。这种集成展示了生成式AI在增强人机交互方面的强大功能
基于STM32金属探测器设计
摘要随着便携式金属探测器在安防，考古及工业检测等领域需求的增加，现有探测器的体积大，能耗高，操作复杂的缺点亟需解决。本文针对便携式金属探测器的设计进行探索，在硬件上使用了STM32F103C8T6单片机模块，WL02涡流传感器模块，ADS1115模数转换模块，蜂鸣器模块等设计出本系统的电路，在软件上设计出主程序，信号采集及报警子程序等，对系统进行基础功能，灵敏度，抗干扰和耐久性测试，测试结果表明探
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
iOS应用性能优化指南
在移动应用开发领域，iOS应用性能优化一直是开发者关注的焦点。优化应用性能不仅能够提升用户体验，还能增强应用的竞争力。本文将从多个方面详细阐述iOS应用性能优化指南，帮助开发者打造更高效、更流畅的应用。优化内存管理内存泄漏的预防与检测内存泄漏是导致应用性能下降的常见问题。开发者应遵循ARC（自动引用计数）原则，合理管理对象的引用关系。同时，可以使用Xcode的Instruments工具检测内存泄漏
电梯开关状态人员进出检测数据集VOC+YOLO格式2220张4类别 fl176831 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：2220标注数量(xml文件个数)：2220标注数量(txt文件个数)：2220标注类别数：4标注类别名称:["CloseElevator","People-in-elevator","The-elevator-was-
uni-app X APP在线升级解决【uni-upgrade-center-app】未配置uni-upgrade-center 问题
着急解决问题的同学可以直接查看第7项和7.3项。1、按照官网的指导文档进行升级中心配置。App升级中心uni-upgrade-center|uniCloud2、升级中心分为两个部分：uni-upgrade-centerAdmin管理后台和uni-upgrade-center-app前台检测更新3、后台管理部分按照上面的连接操作即可。4、当执行到前台检测更新时遇到了这个问题“PossibleUnha
如何将大视频文件从 iPhone 传输到 PC？ Coolmuster iPhone iOS 苹果手机 iphone ios
假设您的iPhone充满了大视频文件（超过1GB），这可能会迅速消耗存储空间并导致设备运行缓慢。幸运的是，您可以将这些大型视频文件从iPhone传输到PC，以释放存储空间或在上传到社交媒体之前进行编辑。方式1：如何通过专业工具将iPhone中的大视频传输到电脑CoolmusteriOSAssistant是一款多功能且用户友好的软件，旨在促进从计算机高效管理iOS设备。它提供了一系列功能来简化iOS
Matplotlib-图像处理与可视化
Matplotlib-图像处理与可视化一、图像数据的本质：从数组到像素二、基础操作：加载与显示图像1.加载图像数据2.显示单张图像3.显示灰度图像三、进阶可视化：通道分离与色彩调整1.分离RGB通道2.调整亮度与对比度四、实用技巧：色彩映射与像素值分析1.自定义色彩映射（Colormap）2.像素值分布直方图五、多图对比与标注：算法结果可视化1.边缘检测结果对比2.图像标注：突出感兴趣区域六、注意
任鸟飞FPS类型游戏绘制,骨骼,u3d,UE4和游戏安全,反外挂研究 (三) 任鸟飞逆向~ FPS C语言网络安全 3d 游戏 ue4
书接上文,我们非矩阵的方式绘制是没有那么的精确的在学习矩阵之前,我们先来了解下绘制的几种方法绘制的几种方法和反外挂建议第一种hookd3d/opengl优点:不闪,代码简单缺点:非常容易被检测第二种窗口上自行绘制,但是会闪优缺点适中第三种自建透明窗口,覆盖游戏窗口,透明窗口上绘制优点:稳定确定:代码复杂,会闪反外挂:无非就是针对外挂使用的函数进行检测深入学习矩阵对象的世界坐标列向量xyzw(w为了
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
车身焊接机器人系列编程：Yaskawa MA2010_（11）.机器人维护与保养 zhubeibei168 机器人（二）机器人网络
机器人维护与保养1.机器人维护的必要性在汽车制造行业中，车身焊接机器人（如YaskawaMA2010）的高效运行对于生产线的稳定性和生产质量至关重要。机器人维护不仅能够延长机器人的使用寿命，还能确保其在长时间运行中的性能稳定。维护工作主要包括定期检查、清洁、润滑、更换易损件和故障诊断等。本节将详细介绍这些维护工作的具体步骤和注意事项。2.定期检查定期检查是机器人维护的基础，可以及时发现潜在问题并进
同城搭子交友小程序：千亿级社交市场的下一个风口？
传统婚恋网站式微，Z世代“轻社交”需求爆发！搭子经济正成为新蓝海：1.市场规模与增长潜力数据：2023年中国陌生人社交市场规模达1500亿元，年复合增长率超20%；趋势：搭子类小程序用户规模突破8000万，预计2025年将占社交市场30%份额。2.竞争格局与差异化机会头部平台：Soul、探探聚焦泛社交，搭子类小程序仍属蓝海；细分场景：运动、美食、游戏等垂直领域搭子需求未被充分满足；下沉市场：三四线
短剧小程序开发全攻略：从0到1打造爆款内容平台 weixin_lynhgworld 小程序短剧
核心内容：行业趋势分析：短剧市场年增长率超300%，用户规模突破5亿，抖音、快手等平台加速布局。小程序成为短剧分发核心渠道：轻量化、低成本、社交裂变优势显著。开发核心功能模块：内容管理：支持多格式上传、分集管理、标签分类。播放体验优化：弹幕互动、倍速播放、清晰度切换、离线缓存。付费系统：单集付费、会员订阅、广告解锁等多元化盈利模式。社交裂变：分享奖励、邀请排行榜、拼团观影功能。技术实现难点：视频流
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(