无脑敲代码，bug漫天飞

论文阅读- Uncovering Coordinated Networks on Social Media:Methods and Case Studies

链接：https://arxiv.org/pdf/2001.05658.pdf

摘要：

引言

Methods

Case Study 1: Account Handle Sharing

Coordination Detection

分析

Case Study 2: Image Coordination

Coordination Detection

Analysis

Case Study 3: Hashtag Sequences

Coordination Detection

Analysis

Case Study 4: Co-Retweets、

Coordination Detection

Analysis

Case Study 5: Synchronized Actions

Coordination Detection

Analysis

Discussion

摘要：

协调一致的活动被用来影响和操纵社交媒体平台及其用户，这是对在线信息自由交换的严峻挑战。

无监督，基于网络的方法

在这里，我们介绍一种通用的、无监督的基于网络的方法来发现可能协调的帐户组。所提出的方法基于帐户之间共享的任意行为轨迹构建协调网络。

检测协调的推特账户

我们提供了五个影响力活动的案例研究，其中四个是在美国选举、香港抗议、叙利亚内战和加密货币操纵等不同背景下进行的。在每种情况下，我们都会通过检查 Twitter 帐户的身份、图像、主题标签序列、转发或时间模式来检测协调的 Twitter 帐户网络。事实证明，所提出的方法广泛适用于发现跨信息战场景的不同类型的协调。

引言

背景现状

在线社交媒体彻底改变了人们获取新闻和信息以及形成观点的方式。通过实现不受地理障碍阻碍的交流，并降低信息生产和消费的成本，社交媒体极大地扩大了公民和政治话语的参与。

尽管这可能会加强民主进程，但越来越多的证据表明，恶意行为者通过虚假信息和操纵活动污染了信息生态系统（Lazer 等人，2018 年；Vosoughi、Roy 和 Aral，2018 年；Bessi 和 Ferrara，2016 年；Shao 等人，2018 年； Ferrara 2017；Stella、Ferrara 和 De Domenico 2018；Deb 等人 2019；Bovet 和 Makse 2019；Grinberg 等人 2019）。

虽然影响力活动、错误信息和宣传一直存在（Jowett 和 O’Donnell 2018），但社交媒体创造了新的漏洞和滥用机会。正如志同道合的用户可以轻松地联系起来支持合法事业一样，具有边缘、阴谋或极端主义信仰的团体也可以达到临界规模，并不受专家或温和观点的影响。平台 API 和商品化的虚假账户使得开发软件来冒充用户并隐藏控制这些社交机器人的人的身份变得很简单——无论他们是传播垃圾邮件的欺诈者、放大误导性叙述的政治人物，还是发动在线战争的民族国家（Ferrara 等）等人，2016）。认知和社会偏见使我们更容易受到社交机器人的操纵：有限的注意力促进了未经检查的主张的传播，确认偏见使我们无视事实，群体思维和回声室扭曲了对规范的看法，而跟风效应使我们关注机器人放大的模因（Weng et al. 2012；Hills 2019；Ciampaglia et al. 2018；Lazer et al. 2018；Pennycook et al. 2019）。

尽管社交媒体平台使用机器学习算法和人类事实检查员来检测错误信息和不真实账户等对策取得了进步，但恶意行为者仍在继续有效地欺骗公众，放大错误信息并推动两极分化（Barrett 2019）。我们观察到一场军备竞赛，其中攻击的复杂性不断演变以逃避检测。

大多数打击网络滥用的机器学习工具都以检测社交机器人为目标，并且主要使用针对个人账户的方法（Davis et al. 2016；Varol et al. 2017；Yang et al. 2019；2020；Sayyadiharikandeh et al. 2020））。然而，恶意团体可能会采用在个人层面上看似无害的协调策略，并且只有在观察帐户之间的交互网络时才能检测到其可疑行为。例如，一个帐户更改其句柄可能是正常的，但一组帐户轮流更改名称不太可能是巧合。

稀疏相似性矩阵

在这里，我们提出了一种方法来揭示多个参与者之间的协调行为，无论其自动化/有机性质或恶意/良性意图如何。这个想法是从社交媒体数据中提取特征来构建协调网络，如果两个帐户表现出意想不到的相似行为，则它们具有很强的联系。这些相似性可以源于任何元数据，例如内容实体和配置文件特征。网络为稀疏相似性矩阵提供了有效的表示，以及检测重要的协调帐户集群的自然方法。我们的主要贡献是：

我们提出了一种检测协调的通用方法，原则上可以应用于任何有数据可用的社交媒体平台。由于该方法是完全无监督的，因此不需要标记的训练数据。

使用 Twitter 数据，我们通过实例化检测不同类型协调的方法来展示五个案例研究，这些方法基于 (i) 处理更改、(ii) 图像共享、(iii) 主题标签的顺序使用、(iv) 共同转发和 ( v) 同步。

案例研究说明了我们方法的普遍性和有效性：我们能够根据身份呈现、图片显示、文本书写、转发或采取这些行动的时间来检测协调的活动。

我们表明，协调行为并不一定意味着自动化。在案例研究中，我们检测到可能有机器人和人类帐户在恶意活动中协同工作。

• 代码和数据可在github.com/IUNetSci/coordination-detection 上获取，以重现当前结果并将我们的方法应用于其他案例。

Methods

所提出的检测在社交媒体上协调行动的帐户的方法如图 1 所示。它可以分为四个阶段：

（图 1：协调检测方法。在左侧，我们看到可以从社交媒体配置文件和消息中提取的行为痕迹。文中描述的四个步骤可识别可疑帐户群。）

行为痕迹提取：

协调检测的起点应该是对可疑行为的猜想。假设真实的用户在某种程度上彼此独立，我们认为令人惊讶的缺乏独立性作为协调的证据。该方法的实施是通过选择捕获此类可疑行为的跟踪来指导的。例如，如果我们推测帐户由某个实体控制，其目的是扩大虚假信息源的曝光，我们可以提取共享 URL 作为痕迹。协调场景可能与几大类可疑痕迹相关：

a) 内容：如果协调是基于共享的内容，则可疑痕迹可能包括单词、ngram、主题标签、媒体、链接、用户提及等。

(b) 活动：协调可以通过活动的时空模式来揭示。可以揭示可疑行为的痕迹示例包括时间戳、地点和地理坐标。

(d) 组合：协调的检测可能需要多个维度的组合。例如，人们可以将这两种跟踪结合起来，形成一种临时内容检测方法，而不是像基于内容或基于活动的可疑跟踪那样仅跟踪使用了哪些主题标签或帐户何时处于活动状态。组合版本的限制性更强，因此可以减少误报的数量。

一旦识别出兴趣痕迹，我们就可以根据类似的行为痕迹建立一个帐户网络。可以应用初步的数据清理，过滤缺乏支持的节点——活动性低或与所选跟踪的交互很少——因为没有足够的证据来建立它们的协调。例如，共享少量图像将无法可靠地计算基于图像的相似性。

2. 双向网络构建：

下一步是构建一个双向网络，连接帐户以及从其个人资料和消息中提取的特征。

在这个阶段，我们可以使用行为痕迹作为特征，或者设计从痕迹衍生的新特征。例如，内容分析可以产生基于情绪、立场和叙述框架的特征。

诸如一天中的小时和星期几之类的时间特征可以从时间戳元数据中推断出来。

可以通过聚合痕迹来设计特征，例如将位置合并为国家或将图像合并为颜色配置文件。可以通过考虑轨迹集或序列来设计更复杂的特征。

二分网络可以根据帐户和特征之间的关联强度进行加权——多次共享同一张图像比仅共享一次的信号更强。权重可以包含归一化（例如 IDF）以考虑流行特征；如果许多帐户提到同一名人并不可疑。

3. 投影到帐户网络上：

将二分网络投影到保留帐户节点的网络上，并根据特征的某些相似性度量在节点之间添加边。所得到的无向协调网络中的边的权重可以通过简单的共现、杰卡德系数、余弦相似性或更复杂的统计度量（例如互信息或χ 2 ）来计算。在某些情况下，协调网络中的每条边都因构造而可疑。

在其他情况下，边缘可能会提供有关帐户之间协调的噪声信号，从而导致误报。

例如，如果这些模因非常受欢迎，则共享多个相同模因的帐户不一定是可疑的。在这些情况下，可能需要手动管理来过滤掉协调网络中的低权重边缘，以专注于最可疑的交互。实现此目的的一种方法是保留权重最高百分位的边缘。讨论部分介绍了一些案例研究中的边缘权重分布，说明了积极的过滤如何允许人们优先考虑精度而不是召回率，从而最大限度地减少误报。

4. 聚类分析：

最后一步是找到其行为可能在帐户网络上协调的帐户组。可用于此目的的网络社区检测算法包括连接组件、k-core、k-cliques、模块化最大化和标签传播等（Fortunato 2010）。在这里介绍的案例研究中，我们使用连接组件，因为我们只考虑可疑边缘（通过设计或过滤）。

总之，所提出的检测协调方法的四个阶段被转化为八个可操作的步骤：（i）对可疑行为提出猜想； (ii) 选择此类行为的痕迹，或 (iii) 必要时设计特征； (iv) 根据支持度对数据集进行预过滤；选择（v）二分网络的权重和（vi）相似性度量作为账户协调网络的权重； (vii) 过滤掉低权重边缘；最后，(viii)提取协调组。尽管所提出的方法是无监督的，因此不需要标记的训练数据，但我们建议手动检查可疑集群及其内容。此类分析将提供方法验证以及协调组是否恶意和/或自动化的证据。在以下部分中，我们提出了五个案例研究，其中我们实施了所提出的方法，通过共享身份、图像、主题标签序列、共同转发和活动模式来检测协调。

Case Study 1: Account Handle Sharing

在Twitter和其他一些社交媒体平台上，尽管每个用户帐户都有一个不可变的ID，但许多关系是基于帐户句柄(称为屏幕名）是可变的并且通常可重用。一个例外是，已暂停帐户的句柄在 Twitter 上不可重复使用。用户可能有正当理由更改句柄。然而，更改和重复使用句柄的可能性会使用户面临诸如用户名抢注1和冒充等滥用行为（Mariconti et al. 2017）。在最近的一个例子中，同一个 Twitter 帐户使用与不同角色相关的Twitter 句柄来传播美国总统弹劾案中乌克兰举报人的名字。2

有关如何利用句柄更改的具体示例，请考虑以下按时间顺序排列的事件： 1. 用户 1（名为 @super cat）关注发布猫科动物图片的用户 2（名为 @kittie）。

2. 用户3（名为@superdog）发布犬类照片。

3. 用户 1 的推文提到用户 2：“我爱@kittie”。 Twitter 上的提及会创建指向所提及帐户个人资料的链接。因此，在时间步骤 3，用户 1 的推文链接到用户 2 的个人资料页面。

4. 用户 2 将其句柄重命名为@tiger。

5. 用户 3 将其句柄重命名为 @kittie，重复使用用户 2 的句柄。

尽管无论名称如何更改，用户 1 的社交网络都不会改变（用户 1 仍然关注用户 2），但名称更改不会反映在以前的帖子中，因此单击步骤 3 中的链接的任何人都将被重定向到用户 3 的个人资料，而不是按照用户 1 的最初意图，将用户 2 抢注到用户 2。这种类型的用户抢注与多个账户配合，可用于推广实体、开展“跟进”活动、渗透社区，甚至促进两极分化（Mariconti 等人，2017 年））。由于社交媒体帖子通常由搜索引擎索引，因此这些操作可用于将内容推广到社交媒体边界之外。

为了检测 Twitter 上的这种协调，我们应用了使用身份跟踪（即 Twitter 句柄）的方法。我们从对 Botometer.org 的请求日志开始，Botometer.org 是印第安纳大学社交媒体观测站的社交机器人检测服务（Yang 等人，2019 年）。每个日志记录都包含时间戳、Twitter 用户 ID 和句柄以及机器人分数。我们关注至少有十个条目（查询）的用户，以便可以观察到多个句柄更改。这产生了 5400 万条记录和 190 万个句柄。详细信息请参见表 1。

Coordination Detection

我们创建了一个由可疑用户名和帐户组成的双向网络。如果一个句柄被至少两个帐户共享，我们就认为该句柄是可疑的；如果该帐户至少使用了一个可疑句柄，那么我们就认为该帐户是可疑的。因此没有边缘被过滤。可以采取更具限制性的措施，例如，如果某个帐户获取了多个可疑句柄，则将该帐户视为可疑帐户。

为了检测可疑的集群，我们对网络进行投影，根据帐户共享句柄的次数来连接帐户。这相当于使用共现，即最简单的相似性度量。生成的网络中的每个连接组件都会标识一组协调帐户以及它们共享的句柄集。表 1 总结了方法决策。

分析

图2显示了句柄共享网络。它是一个加权、无向网络，拥有 7,879 个节点（Twitter 帐户）。我们可以将组件分为三类：

1. 星型组件捕获进行域名抢注和/或劫持的主要帐户（中心节点）。为了证实这一点，我们分析了涉及星状组件的句柄转换的时间序列。通常，句柄从帐户（大概是受害者）切换到集线器，然后（大概在支付某种形式的赎金之后）它从集线器切换回原始帐户。这些类型的相互转换在恒星中发生的频率是任何其他组件的 12 倍。

（图 2：句柄共享网络。一个节点代表一个 Twitter 账户，其大小与与其共享句柄的账户数量成正比。边的权重是两个账户共享的唯一句柄的数量。可疑的协调群组用不同颜色标识。我们举例说明几个协同组的特征，即账户数、共享句柄数、共享句柄的账户平均数以及句柄在账户间切换的最大次数和中位次数。切换次数是根据我们的数据样本估计的下限。我们还展示了揭露了几个协调小组恶意活动的独立人士发布的推文，这些推文将在正文中讨论）

2. 这个庞大的组件包括 722 个帐户，共享 181 个名称（图 2 中心的橙色组）。使用 Louvain 社区检测算法 (Blondel et al. 2008)，我们进一步将巨型组件分为 13 个子组。我们怀疑它们代表了与同一组的不同协调活动相对应的时间集群。这项调查留待未来研究。

3. 其他组件可能代表需要进一步调查的不同情况，如下所述。图 2 展示了与两个协调句柄共享组相对应的恶意行为的几个故事，这些故事已被其他人发现。 2015 年 6 月，@GullyMN49 账号因发布攻击奥巴马总统的推文而被新闻报道。3 一年多后，同一账号仍在发布类似内容。 2017 年 3 月，我们观察到 23 个不同的账户在 5 天内获取了该账号。我们推测，这可能是为了让 2015 年创建的角色保持活力，并逃避 Twitter 在平台被滥用的报道后被暂停的行为。目前，@GullyMN49 账号已被禁止，但 23 个帐户中的 21 个仍然活跃。

图 2 中的第二个示例显示了共享七个句柄的六个帐户的集群。此后他们全部被停职。有趣的是，该集群正在共享似乎属于冲突政治团体的句柄，例如@ProTrumpMvmt 和@AntiTrumpMvmt。随着时间的推移，一些可疑账户不断改变立场。进一步调查显示，这些账户非常活跃；他们制造了政治筹款活动的假象，试图从双方那里获取资金。

Case Study 2: Image Coordination

图像构成了社交媒体内容的很大一部分。一组发布许多相同或相似图像的帐户可能会揭示可疑的协调行为。在本案例研究中，我们利用媒体图像作为内容痕迹，在 2019 年香港抗议运动的背景下识别 Twitter 上的此类群体。我们使用 BotSlayer 工具（Hui et al. 2019）收集与六种语言的抗议相关的几十个主题标签相匹配的推文，随后下载了收集的推文中的所有图像和缩略图。我们重点关注包含一张或多张图像的 31,772 条推文，并删除所有转发以避免相同图像的微不足道的复制。有关数据源的更多信息请参见表 2。

（图 3：Twitter 上有关香港抗议活动的账户协调网络。节点代表账户，其大小与其度数成正比。在左侧，如果帐户可能协调，则帐户颜色为蓝色，否则帐户颜色为灰色。在右侧，我们关注与可能的协调组相对应的连接组件。三个最大的组成部分根据其图像的内容进行着色——一个支持抗议的集群，两个反对抗议的集群，分别为紫色和橙色。我们展示了这些群组共享的一些示例图像，以及相应的不同 URL 数量）

Coordination Detection

每次发布图像时，都会为其分配不同的 URL。因此，检测相同或相似的图像并不像比较 URL 那么简单；有必要分析实际图像内容。我们用 RGB 颜色直方图来表示每个图像，将每个通道分为 128 个间隔，并生成一个 384 维向量。分箱直方图允许匹配变体：具有相同向量的图像要么相同或相似，并且对应于相同的特征。虽然扩大箱子会提供更多的变体匹配，但我们希望确保空间足够稀疏以保持高匹配精度。

我们排除了发布少于五张图片的推文的帐户，以减少因支持不足而产生的噪音。人们可以通过调整这一支持阈值来调整精确度和召回率。我们设置阈值以最大限度地提高精度，同时保持合理的召回率。精度对支持阈值参数的敏感性在讨论部分进行了分析。然后，我们通过将帐户与其共享图像的向量链接起来，构建一个由帐户和图像特征组成的未加权二分网络。我们对二分网络进行投影以获得加权帐户协调网络，其边权重由杰卡德系数计算。我们认为在共享相同图像方面高度相似的帐户是协调的。为此，我们保留权重最大的 1% 的边（见图 11）。排除单例（没有协调证据的帐户），我们按大小对网络的连接组件进行排名。表 2 总结了本例中的方法决策。

（图 11：三个案例研究的协调网络权重分布。虚线代表边缘过滤器：我们保留案例 2 中权重最高 1% 的边缘，以及案例 4 和 5 中权重最高 0.5% 的边缘）

Analysis

图3显示了账户协调网络。我们发现了三个可疑集群，涉及 315 个账户，这些账户发布了支持或反对抗议的图片。反抗议团体分享带有中文文字的图片，针对的是华语观众，而支持抗议团体则分享带有英文文字的图片。我们观察到一些共享图像特征对应于完全相同的图像，其他特征则略有不同。例如，支持抗议集群中与同一特征对应的 59 个图像 URL 包含不同亮度和裁剪的细微变化。 61张相应的反抗议图像也是如此。

虽然这种方法确定了帐户的协调，但它并没有将协调描述为恶意或良性，也没有将其描述为自动或有机。事实上，有很多协调账户的行为就像人类一样(见讨论)。这些群体之所以被确定，是因为他们的组成账户比其他人群更经常地传播相同的图片内容。

Case Study 3: Hashtag Sequences

造谣活动的一个关键因素是要影响大量的受众。为了传播到追随者之外，恶意行为者可以使用标签来瞄准对某个话题感兴趣并可能搜索相关推文的其他用户。

如果一组自动帐户使用相同的文本发布消息，这将看起来很可疑，并且很容易被平台的反垃圾邮件措施检测到。很容易想象恶意用户利用语言模型（例如 GPT-2 ）来解释他们的消息。由于应用程序代表用户发布释义文本，检测可能会变得更加困难。这种行为的一个例子是“适得其反的特朗普”推特应用程序，每当枪支暴力造成死亡时，该应用程序就会向特朗普总统发送推文。然而，我们推测，即使是释义文本也可能包含基于协调活动目标的相同主题标签。因此，在本案例研究中，我们探讨如何识别在多条推文中发布高度相似的主题标签序列的协调帐户。

我们在原始推文数据集上评估了这种方法(没有转发)是在2018年美国中期选举前后收集的。关于数据源的更多信息见表3。在应用我们的框架之前，我们将数据集划分为每日间隔，以检测何时对帐户进行协调。

Coordination Detection

数据预处理步骤会过滤掉推文和主题标签很少的帐户。阈值取决于评估的时间段。在这种情况下，我们在 24 小时内至少使用 5 条推文和 5 个唯一的主题标签，以确保为可能的协调提供足够的支持。可以应用更严格的过滤来降低两个帐户偶然产生相似序列的可能性。

在这种情况下，我们设计了结合内容（主题标签）和活动（时间戳）跟踪的功能。特别是，我们为每个用户使用有序的主题标签序列（图 4）。二分网络由一层中的帐户和另一层中的主题标签序列组成. 在投影阶段，我们会在具有相同标签序列的两个账户之间画一条边。这些边缘是未加权的，我们不应用任何过滤，基于两个独立用户不太可能在同一天发布五个或更多主题标签的相同序列的假设。我们还考虑了一种模糊方法来匹配序列略有不同的帐户，并发现了相似的结果。

（图 4：标签序列特征。主题标签及其位置是从推文元数据中提取的。发布相同主题标签序列的推文的帐户很容易被识别。）

Analysis

我们确定了由 1,809 个唯一帐户执行的 617 个日常协调实例。图5显示了一天内识别出的32个可疑群体。最大的组件由 404 个节点组成，这些节点通过“Backfire Trump”Twitter 应用程序发送一系列推文，倡导更严格的枪支管制法。该应用程序不再有效。这些推文中的一些说法与非营利性枪支暴力档案馆的报告不一致。最小的组仅由帐户对组成。其中一对在推特上发布了一个现已不复存在的页面链接，该页面宣传在线赌场的奖金。另一对账户还提供了一个链接，指向已得到人道协会立法基金认可的民选公职候选人名单。当然，我们可以使用更长的时间窗口，并有可能揭示更大的协调网络。例如，图 5 中的 Backfire Trump 集群是由 1,175 个帐户组成的更大网络的一部分。

Case Study 4: Co-Retweets、

信息源的放大也许是最常见的操纵形式。在 Twitter 上，一组转发相同推文或同一组帐户的帐户可能表示协调行为。因此，我们在此案例研究中重点关注转发。

我们应用所提出的方法来检测放大与“白头盔”相关叙述的协调帐户，白头盔是一个志愿者组织，在叙利亚内战期间成为虚假信息活动的目标。最近报道确定了这些活动背后的俄罗斯来源（Wilson 和 Starbird 2020）。数据是使用英语和阿拉伯语关键词从 Twitter 收集的。有关数据的更多详细信息，请参见表 4。

Coordination Detection

我们在转发帐户和转发消息之间构建二分网络，不包括自我转发和转发次数少于 10 次的帐户。该网络使用 TF-IDF 进行加权，以折扣流行推文的贡献。因此，每个帐户都表示为转发的推文 ID 的 TFIDF 向量。然后，通过帐户向量之间的余弦相似度对投影的共同转发网络进行加权。最后，为了关注潜在协调的证据，我们只保留最可疑的 0.5% 边缘（见图 11）。可以调整这些参数以在精确度和召回率之间进行权衡；阈值对精度的影响在讨论部分进行了分析。表 4 总结了方法决策。

Analysis

图6显示了共同转发网络，并突出显示了两组协调的帐户。橙色组和紫色组的账户分别转发了支持和反对“白头盔”的信息。图中显示的示例tweet已不再公开。

Case Study 5: Synchronized Actions

“拉高抛售”是一种阴暗的计划，通过虚假陈述（拉高）模拟买家兴趣激增，以更高的价格出售廉价购买的股票（抛售），从而抬高股票价格。投资者很容易受到这种操纵，因为他们希望在购买似乎有望带来高额未来利润的股票时迅速采取行动。通过在短时间内让投资者接触看似来自不同来源的信息，欺诈者会制造一种虚假的紧迫感，促使受害者采取行动。社交媒体为此类诈骗提供了肥沃的土壤（Mirtaheri 等人，2019）。我们研究了我们的方法在检测 Twitter 上协调的加密货币拉高和转储活动方面的有效性。使用与 25 种易受攻击的加密货币相关的关键字和现金标签（例如 $BTC）作为查询词来收集数据。我们会考虑原始推文和转发，因为它们都会添加到潜在买家考虑的信息流中。有关数据集的更多详细信息请参见表 5。

Coordination Detection

我们假设协调的拉高和抛售活动使用软件让多个帐户在时间上非常接近地发布拉高消息。因此，推文时间戳被用作帐户的行为轨迹。两条推文发布的时间间隔越短，它们巧合的可能性就越小。然而，较短的时间间隔会导致匹配明显减少并增加计算时间。另一方面，较长的间隔（例如每天）会产生许多误报匹配。为了平衡这些问题，我们使用 30 分钟的时间间隔。直观上，任何两个用户都可能在任意时间间隔内发布一两条推文；然而，对于一组更多的推文来说，情况并非如此。为了重点关注具有足够协调支持的帐户，我们只保留那些发布至少 8 条消息的帐户。选择这个特定的支持阈值是为了最大限度地减少误报匹配，如讨论部分所示。

然后，根据发布推文的时间间隔对推文进行分类。这些时间特征用于构建帐户和推文时间的二方网络。使用 TF-IDF 对边缘进行加权。与之前的情况类似，投影账户协调网络通过 TF-IDF 向量之间的余弦相似度进行加权。经过手动检查，我们发现该网络中共享的许多推文与加密货币无关，而只有一小部分边缘与该主题有关。这些边缘也具有很高的相似性并产生强烈的协调信号。因此，我们只保留余弦相似度最大的 0.5% 边缘（见图 11）。表 5 总结了方法决策。

Analysis

图 7 显示了同步动作网络。对网络中的连接组件进行定性分析以评估精度。紫色子图标记了观察到可疑拉高和转储计划的协调帐户集群。我们发现了不同的例子许多加密货币的方案。

（图 7：时间协调网络。如果节点（帐户）在相同的 30 分钟内发布或转发，则它们被连接。单例被省略。紫色簇中的账户和 8 点钟位置的黄色小簇中的账户对运行拉高转储计划高度怀疑。显示了一些推文摘录；这些推文不再公开。）

由于市场波动，股票市场的变化，尤其是那些专注于短期交易的加密货币，很难捕捉到。此外，很难将价格变化归因于单一原因，例如与推高和抛售相关的 Twitter 活动。这使得定量验证我们的结果变得困难。然而，在 2017 年 12 月 15 日至 21 日这一周，代币 Verge (XVG)、Enjin (ENJ) 和 DigiByte (DGB) 均呈每日上涨趋势。每天，在大量同步推文评论其移动价格后，价格都会飙升。这些趋势先于这些代币迄今为止的创纪录价格，XVG 的创纪录价格为 2017 年 12 月 23 日，ENJ 和 DGB 的创纪录价格为 2018 年 1 月 7 日。图 7 中以黄色突出显示了大量提取这三种代币的账户集群。

Discussion

本文提出的五个案例研究只是说明如何实施我们提出的方法来寻找协调。该方法原则上可以应用于除 Twitter 之外的其他社交媒体平台。例如，图像协调方法可以应用于Instagram，而Facebook页面之间的协调可以通过它们共享的内容来发现。

相关工作部分中讨论的几种无监督方法，就像这里介绍的我们方法的五个应用一样，侧重于不同类型的协调。因此，这些方法不能直接比较。本文的一个关键贡献是提供了一种灵活且通用的方法来以统一的方案描述这些不同的方法。例如，Debot（Chavoshi、Hamooni 和 Mueen 2016）可以被描述为我们的方法的一个特例，该方法基于保留动态时间扭曲距离的复杂时间哈希方案（Keogh 和 Ratanamahatana 2005），而 SynchroTrap（Cao 等人 2014））通过在时间窗口内匹配动作来利用同步信息。 Giglietto 等人的方法。 (2020) 以及 Chen 和 Subramanian (2018) 是使用基于共享链接的相似性的特殊情况。 Ahmed 和 Abuaish (2013) 的方法使用了一个列联账户表，其特征相当于我们的二分网络。

我们的方法旨在识别账户之间的协调，但它并没有表征协调的意图或真实性，也不允许发现潜在的机制。最近的新闻报道强调了一个恶意意图的例子，该网络由青少年组成的协调网络发布有关选举的虚假叙述。然而，重要的是要记住，协调的活动可能是由具有善意意图的真实用户发起的。例如，社会运动参与者以协调的方式使用主题标签来提高对其事业的认识。

图 8 显示了案例研究 1-3 中机器人分数的分布。（由于数据集中的匿名化，我们无法分析案例 4-5 中的机器人分数。）我们观察到，虽然协调帐户更有可能具有较高的机器人分数，但许多协调帐户的分数较低（类似于人类）——大多数在这三种情况中的两种情况下。因此，检测社交机器人不足以检测协调的活动。

（可疑和非可疑账户的机器人数量。我们的方法识别出的可疑帐户与其他帐户的机器人分数直方图。顶部、中间和底部面板分别代表帐户句柄共享（案例研究 1）、图像协调（案例研究 2）和主题标签序列（案例研究 3）。案例研究 1 的机器人分数是从 Botometer 第 3 版获得的（Yang 等人，2019），收集于 2018 年 5 月至 2019 年 4 月。对于其他两个案例，机器人分数是从 BotometerLite 获得的（Yang 等人，2020）。数据集可能包括同一帐户的多个分数。）

尽管这里介绍的案例研究基于不同来源的数据，但它们并不是为了夸大所提出方法的有效性，也不是为了关注恶意帐户。图 9 显示案例研究 1 和 3 中分析的帐户集的机器人分数分布与从推文随机样本中获得的分数分布一致。我们注意到这不是一个随机的账户样本-它是有偏见的账户活动。案例研究2是个例外;我们推测，在香港抗议期间，机器人被用来发布大量图片。

（机器人分数分布。 Q-Q 图将三个案例研究中的机器人得分分布与从 24 小时 1% 随机推文样本中获得的得分分布进行比较。机器人得分的来源如图 8 所示。所有分布都严重偏向较低的机器人得分值（即，人类多于机器人），但案例研究 2 除外，其中机器人得分较高，且分布接近均匀。）

你可能感兴趣的:(社交机器人检测,论文阅读)

6-NBDG 葡萄糖摄取荧光探针，使用方法和注意事项强化生物实验室 leetcode 决策树最小二乘法散列表逻辑回归启发式算法支持向量机
一、试剂描述6-NBDG，一种非水解形式的脱氧葡萄糖类似物的荧光素，可用来监测分离活细胞和完整组织对葡萄糖的摄取和转运，判断细胞活力的指标之一。可用实时共聚焦、高分辨率或宽视野荧光显微镜，以及流式细胞仪来检测。尽管6-NBDG荧光对环境比较敏感，但约在465/540nm下表现出激发和发射波长，使用荧光素（如FITC）的光学滤片来进行结果观察即可。二、试剂信息英文名称：6-(N-(7-Nitrobe
Netty基础—Netty实现私有协议栈工业甲酰苯胺 netty
1.私有协议介绍(1)什么是私有协议跨节点的远程服务调用(跨节点通信)，除了链路层的物理连接外，还需要对请求和响应消息进行编解码。在请求和应答消息本身以外，也需要携带一些其他控制和管理类指令。例如链路建立的握手请求和响应消息、链路检测的心跳消息等。当这些功能组合到一起后就会形成私有协议。私有协议并没有标准的定义，只要是能够用于跨进程、跨主机数据交换的非标准协议，都可以称为私有协议。(2)公有协议与
联核科技AGV无人叉车有哪些常见的安全防护措施？ m0_66581510 科技安全自动驾驶自动化人工智能机器人
联核科技的AGV无人自动化叉车作为自动化设备，它的安全防护措施通常涵盖多个层面，以确保在复杂环境中安全运行。以下是联核AGV无人叉车常见的安全防护措施及技术实现方式：联核科技官网-AGV叉车十大品牌-无人叉车厂家-自动化叉车-智能搬运码垛机器人-智能叉车系统解决方案专家1.紧急停止功能措施：配备急停按钮或远程急停功能，可立即切断动力或触发紧急制动。作用：在突发情况下（如人员闯入、设备故障）快速停止
Autoformer 架构详细解释及举例说明 six.学长 autoformer 人工智能
Autoformer架构详细解释上述图片展示了Autoformer架构的工作流程，包含编码器和解码器的结构。我们来详细解析图中的各个组件及其功能：编码器部分（AutoformerEncoder）输入数据（EncoderInput）：输入的是需要预测的时间序列数据。自动相关机制（Auto-Correlation）：这个模块通过检测时间序列中的周期性依赖关系，生成相关矩阵（K,Q,V表示键、查询和值）
通用具身智能机器人首次进厂造芯！量子位
在全球半导体产业竞争日益激烈的背景下，半导体生产在部分高度依赖人力的生产环节，传统的智能化生产模式仍暴露出效率瓶颈与污染问题。人工操作易导致污染，且效率不高、污染控制难度大。如今，随着通用智能机器人的应用，这一难题正迎来全新解决方案。3月18日，国内领先的具身智能机器人公司智平方与全球知名科技创新企业吉利科技集团旗下浙江晶能微电子有限公司正式签署战略合作协议。双方将基于智平方自研的端到端具身大模型
工业机器人：现代工业的智能力量机器人之树小风机器人科技经验分享
在当今科技飞速发展的时代，工业机器人已成为现代工业不可或缺的重要组成部分。它如同一位不知疲倦、高度精准且功能强大的“智能工匠”，以其独特的魅力和卓越的能力，深刻地改变着工业生产的面貌。工业机器人是一种能够自动执行任务的可编程机械装置。它通常由机械臂、控制系统和编程装置等部分组成。机械臂是机器人的主体结构，能够实现多自由度的灵活运动，模拟人类手臂的各种动作。控制系统则犹如机器人的“大脑”，负责指挥和
Ai斗地主智能出牌算法 zzzzzzzzzzzw___ ——灌水算法人工智能斗地主
去年有想写个斗地主的小游戏，自己玩玩。找了很多资料，后来好不容易在网上找到了一个AI算法。转过的的时候是贴在自己电脑的TXT文本上，再次感谢下原作者。现在借花献佛发给你参考下。我以前写过一个斗地主机器人。思路如下，希望对你有帮助。斗地主AI设计一、牌型1火箭：大小王在一起的牌型，即双王牌，此牌型最大，什么牌型都可以打。2炸弹：相同点数的四张牌在一起的牌型，比如四条A。除火箭外，它可以打任何牌型，炸
HarmonyOS Next 用户认证应用架构教育
随着HarmonyOSNext的不断发展，其用户认证功能在安全性、个性化和分布式场景中的应用展现了强大的扩展性和适应性。本文将从进阶功能、分布式场景应用以及定制与优化案例三个方面，深入探讨HarmonyOSNext用户认证的创新与优势。一、HarmonyOSNext用户认证的进阶功能生物特征认证的高级特性HarmonyOSNext在生物特征认证方面引入了多项先进技术。指纹认证通过活体检测技术，能够
【SoC基础】第2节：CPU简介望闻问嵌 #SoC 单片机嵌入式硬件
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载注明出处文章目录CPU结构设计CPU生产厂商CPU工作原理CPU的组成CPU的类型CPU内核与CPU的关系CPU内核种类参考CPU结构设计结构类型结构特点优点
【SoC基础】单片机之RCC模块望闻问嵌 #SoC 单片机
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载注明出处RCC模块简介RCC（ResetandClockControl）即复位和时钟控制模块，其基本功能总结如下：时钟源管理多源选择：支持多种时钟源，包含内部
前端应用更新通知机制全解析：构建智能化版本更新策略斯~内克前端前端
引言：数字时代的更新挑战在持续交付的现代软件开发模式下，前端应用平均每周产生2-3次版本迭代。但据Google研究报告显示，38%的用户在遇到功能异常时仍在使用过期版本的应用。如何优雅地实现版本更新通知，已成为提升用户体验的关键技术挑战。本文将深入探讨从基础到进阶的更新通知方案，结合最新Web技术提供完整的解决方案。一、核心检测机制剖析1.1版本标识策略语义化版本控制：采用major.minor.
JG/T 331-2011建筑幕墙用氟碳铝单板制品检测 Tongyongtest88 建筑材料检测铝单板检测氟碳铝单板检测检测报告
幕墙氟碳铝单板制品是指以铝合金板为基材，经加工成型，装饰面为氟碳涂层，用于建筑幕墙的单层板，按照涂装工艺的不同，分为辊涂和液体喷涂。JG/T331-2011建筑幕墙用氟碳铝单板制品检测项目：测试项目测试方法涂层厚度GB/T4957光泽度偏差GB/T9754涂层附着力GB/T9286铅笔硬度GB/T6739耐盐酸JG/T331耐硝酸JG/T331耐砂浆JG/T331耐溶剂JG/T331耐磨GB/T2
摄像头技术OpenCV yzx991013 计算机视觉项目机器学习人工智能 python
进一步添加功能：运动检测、调整亮度对比度、截图时添加日期水印、保存视频时可选择不同编码格式完整代码：importcv2importtimeimportdatetimedefcamera_system():#打开摄像头cap=cv2.VideoCapture(0)ifnotcap.isOpened():print("无法打开摄像头")return#获取摄像头的宽度和高度frame_width=int
服务器数据恢复—服务器raid5阵列中多块硬盘故障离线的数据恢复案例数据恢复
服务器数据恢复环境&故障：某公司一台服务器，服务器上有一组由8块硬盘组建的raid5磁盘阵列。磁盘阵列中2块硬盘的指示灯显示异常，其他硬盘指示灯显示正常。上层应用不可用。服务器数据恢复过程：1、将服务器中所有硬盘编号后取出，经过硬件工程师的检测发现2块异常硬盘磁头损坏。将完好的硬盘以只读方式进行全盘镜像，将2块存在坏道的硬盘进行更换磁头后镜像。后续的数据分析和数据恢复操作都基于镜像文件进行，避免对
PyCharm 2024.1最新变化望舒巴巴 pycharm
截至2024年1月，PyCharm2024.1的最新变化是：支持Python4.0：PyCharm2024.1更新了对Python4.0的支持，包括语法高亮、代码补全和调试功能等。新的代码分析工具：PyCharm2024.1引入了新的代码分析工具，可以更准确地检测代码中的错误和潜在问题，并提供相关建议。增强的调试功能：PyCharm2024.1改进了调试器，增加了更多的调试选项和功能。现在，开发人
配置 VSCode 的 C# 开发环境 Q_w7742 vscode c#ide
1.安装必要的依赖1.1VSCode扩展安装C#相关插件（如C#、C#Extensions等）。1.2.NETSDK下载地址：.NETSDK下载页面1.3安装检测在命令行输入以下命令，如果正确返回了版本号，则表示.NETSDK安装成功：dotnet--version2.创建C#项目2.1使用命令行创建项目打开终端（或命令提示符）。运行以下命令以创建一个新的控制台应用程序：dotnetnewcons
分布式节点池：群联云防护抗DDoS的核心武器群联云防护小杜安全问题汇总分布式 ddos 前端 node.js udp 网络 npm
一、节点池的核心作用与架构设计1.全球分布式节点布局物理层防御：根据产品文档，群联在全球部署“海量分布式节点”，每个节点具备独立清洗能力，攻击流量被分散至不同区域节点处理。优势：避免传统单节点防护的瓶颈，即使单个节点被击溃，其他节点仍可接管流量（文档提到“节点数量很多，即使打死几个对绝大多数用户无影响”）。逻辑层调度：节点池分为“正常组”和“风险组”，智能调度系统实时检测节点健康状态，动态分配最优
自己用 Node 搭个 DeepSeek 用起来香麻了李游Leo 环境配置 AI 视频教程 node.js deep 语言模型
不知道大家最近有没有关注DeepSeek，确实是火出圈了，过年串亲戚的大爷大妈们都能聊几句，而且不管是刷短视频，还是逛社交平台，到处都能看到大家在讨论DeepSeek。而且目前这把火还烧到美国去了，整的GPT都要免费了，而且文心外加开源+免费，就连王毅外长念完了诗之后都对外说了，不懂可以去查查deepseek。好家伙，这buff越叠越高啊，那这么好的东西，咱们是不是就要看一看了！！！不研究一下似乎
扫盲系列--Web3智能合约+Solidity简介「已注销」前端框架
前言这几天web3智能合约这个概念，频繁映入我的眼帘。web3.0这个概念我听说过，核心特征是去中心化、开放性、隐私保护和数据所有权回归个人。Web1.0是信息浏览时代，Web2.0是用户参与和社交网络时代，Web3.0是去中心化与智能化时代。在Web3.0这一新的互联网架构下，用户不再仅仅是内容的消费者，更是自己数字身份和数据的拥有者。Web3.0旨在构建一个更加透明、安全且高效的信息网络。我对
网络协议与安全：前端安全防护之CORS/CSP/CSRF(3) 双囍菜菜前端随记网络协议安全 csrf
前端安全三剑客：CORS、CSP、CSRF防护实战手册文章目录前端安全三剑客：CORS、CSP、CSRF防护实战手册一、当安全防线失守：某社交平台的XSS噩梦二、同源策略：Web安全的基石与枷锁2.1同源定义与限制2.2现实中的妥协方案三、CORS：跨域资源共享的守门人3.1预检请求机制3.2服务端配置示例（Nginx）3.3前端实践注意四、CSP：堵住XSS的最后防线4.1策略配置解析4.2Re
爬虫获取 item_get_video 接口数据：小红书笔记视频详情的深度解析 API快乐传递者小红书API API 爬虫笔记音视频
在当今内容驱动的互联网时代，小红书作为国内领先的社交电商平台，其笔记视频内容成为品牌营销、内容创作和用户体验的重要组成部分。通过爬虫技术获取小红书笔记视频详情，不仅可以帮助开发者更好地理解用户需求，还能为电商运营、内容推荐和数据分析提供强大的支持。本文将详细介绍如何使用Python爬虫获取小红书item_get_video接口的返回数据，并对其数据结构进行详细解析。一、item_get_video
ROS学习笔记之深度相机仿真、小结要好好养胃 ROS学习笔记人工智能机器学习 c++
通过Gazebo模拟kinect摄像头，并在Rviz中显示kinect摄像头数据。实现流程:kinect摄像头仿真基本流程:已经创建完毕的机器人模型，编写一个单独的xacro文件，为机器人模型添加kinect摄像头配置；将此文件集成进xacro文件；启动Gazebo，使用Rviz显示kinect摄像头信息。1.Gazebo仿真Kinect1.1新建Xacro文件，配置kinetic传感器信息//这
ROS学习笔记之摄像头仿真及显示要好好养胃 ROS学习笔记人工智能机器学习 c++
通过Gazebo模拟摄像头传感器，并在Rviz中显示摄像头数据。实现流程:摄像头仿真基本流程:已经创建完毕的机器人模型，编写一个单独的xacro文件，为机器人模型添加摄像头配置；将此文件集成进xacro文件；启动Gazebo，使用Rviz显示摄像头信息。1.Gazebo仿真摄像头1.1新建Xacro文件，配置摄像头传感器信息有几个要自行修改的地方，基本设置和laser有相同的部分，不做赘述。//实
手机零部件三维光学测量解决方案 yy229382036 人工智能 3d 光学成像算法
在移动互联网时代，智能终端深受市场追捧，而智能手机占据了第一大移动智能终端的地位。市场的火热造就了手机厂商白热化的竞争，继CPU、屏幕、摄像头等硬件配置大战之后，以外观、设计、质量为切入点的设计及功能竞争，也日趋激烈。在手机设计、质量检测中，无论是手机中框还是屏幕，利用三维光学测量技术，有助于优化从原型和模具构建、首件检验报告到装配分析等环节的质量控制，并有效节省检测时间，快速推进新产品上市。另外
手机租赁系统开发核心技术解析红点租赁系统开发其他
内容概要如果把手机租赁系统比作一台精密运转的智能管家，那它的骨架可不是用代码随便搭的乐高积木。这玩意儿得同时搞定三件事：让用户像刷短视频一样流畅下单，让风控系统比小区门禁还难糊弄，还得让物流信息比外卖小哥的定位更透明。想象一下，当你在APP里滑动挑选最新款折叠屏手机时，后台其实正在上演三重加密的信用评分大战——你的芝麻信用分、电商平台消费记录甚至社交账号活跃度，都被塞进算法熔炉里炼成租赁权限的通行
微软开源神器OmniParser V2.0 介绍魔王阿卡纳兹开源项目观察大模型知识札记 microsoft OmniParser 开源项目
微软开源的OmniParserV2.0是一款基于纯视觉技术的GUI智能体解析工具，旨在将用户界面（UI）截图转换为结构化数据，从而实现对计算机屏幕上的可交互元素的高效识别和操控。这一工具通过结合先进的视觉解析技术和大型语言模型（LLM），显著提升了AI智能体在复杂环境下的识别能力和操作效率。核心功能与特点高精度识别：OmniParserV2.0在检测小尺寸可交互UI元素时的准确率显著提升，达到了3
功能强大的电脑硬件检测及驱动安装工具开开心心就好 pdf tcp/ip macos 网络协议 android python django
今天给大家带来一款超实用的电脑硬件检测软件——入梦工具箱。它是开源的，全程无广告干扰，使用起来清爽又安心。打开入梦工具箱，进入“硬件信息”选项，电脑各个配件的详细参数一目了然。无论是CPU的型号、频率，还是显卡、内存等硬件的具体规格，都能轻松获取，让你对电脑的“内部构造”了如指掌。入梦工具箱功能十分丰富，内含80多款实用工具。以CPU工具为例，无需安装，点击任意一款就能直接使用，快速满足你的相关需
基于STM32蓝牙智能温控风扇系统设计与实现（代码+原理图+PCB+蓝牙APP）科创工作室li 毕业设计1 stm32 智能家居嵌入式硬件单片机物联网
STM32蓝牙智能温控风扇系统设计与实现资料齐全:源代码，原理图，PCB和机智云相关教程，参考lun文等！摘要：本文设计并实现了一种基于STM32F103C8T6单片机的蓝牙智能温控风扇系统。该系统具备OLED显示、自动/手动模式切换、温湿度检测、风扇档位调节、人体红外检测、倒计时以及蓝牙APP远程控制等功能。通过集成多种传感器和执行器，系统能够根据当前温湿度变化自动控制风扇转动，同时支持手机AP
python的try和except_Python 异常处理(Try...Except) weixin_40001309
版权所有，未经许可，禁止转载try块让你可以检测代码块中的错误。except块让你可以处理错误。finally块让你可以执行最终代码，不管try与except块的结果如何，finally块的代码都将执行。异常处理当错误(或者异常)发生时，Python通常会停止执行，并报错。这些异常可以使用try/except语句处理：示例下面try块会产生异常，因为x没有定义:try:print(x)except
基于STM32单片机的人脸识别电子密码锁RFID刷卡门禁锁设计+红外避障检测人流量液晶显示设计DIY25-147 通旺科技单片机 stm32 嵌入式硬件
STM32单片机+红外人流量统计+人脸识别(管理)+RFID刷卡+密码可设+TFT屏+舵机+蜂鸣器+矩阵按键本系统由STM32F103C8T6单片机核心板、1.44寸TFT彩屏、红外避障传感器、人脸识别模块、RFID射频卡读写模块、舵机驱动电路、蜂鸣器报警电路、矩阵按键电路及电源组成。【1】设备识别到已录入的人脸信息、已录入的RFID卡号信息、输入密码正确，则进行舵机控制，打开门禁；同时液晶能够显
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23