无脑敲代码，bug漫天飞

论文阅读 - Detecting Social Bot on the Fly using Contrastive Learning

摘要：

引言

3 问题定义

4 CBD

4.1 框架概述

4.2 Model Learning

4.2.1 通过 GCL 进行模型预训练

4.2.2 通过一致性损失进行模型微调

4.3 在线检测

5 实验

5.1 实验设置

5.2 性能比较

5.5 少量检测研究

6 结论

https://dl.acm.org/doi/pdf/10.1145/3583780.3615468

摘要：

社交机器人检测正在成为社会安全领域广泛关注的任务。一直以来，社交机器人检测技术的发展都因缺乏高质量的标注数据而受到阻碍。此外，人工智能生成内容（AIGC）技术的快速发展正在极大地提高社交机器人的创造力。例如，最近发布的ChatGPT[2]可以以74%的概率欺骗最先进的人工智能文本检测方法[3]，这给基于内容的机器人检测方法带来了巨大的挑战。为了解决上述缺点，我们提出了一种对比学习驱动的社交机器人检测框架（CBD）。 CBD 的核心特点是两阶段模型学习策略：对比预训练阶段，从大量未标记的社交图中挖掘泛化模式，然后是半监督微调阶段，对潜藏在社交图中的特定任务知识进行建模，只需少量标注。上述策略赋予我们的模型在标记数据极度匮乏的情况下具有良好的检测性能。在系统架构方面，我们提出了智能反馈机制以进一步提高检测性能。对真实机器人检测数据集的综合实验表明，对于使用很少（5 个镜头）标记数据的少镜头机器人检测，CBD 始终大幅优于 10 个最先进的基线。 CBD已上线：robot-monitor

引言

大规模多媒体社交网络的普及使人们更多地参与日常生活。因此，人们不可避免地会受到社交网络的影响。与此同时，人工智能（AI）的快速发展在许多领域取得了惊人的成就，但也带来了挑战，例如恶意社交机器人。社交机器人是在社交媒体上自主通信的软件代理[43]，而人工智能驱动的恶意机器人越来越多地在社交媒体上像人类一样思考、交谈和社交，这被用来从事破坏活动。在过去的十年中，恶意机器人被证明可以传播虚假信息和虚假新闻来影响公众情绪和股市[36, 37]。在COVID-19大流行期间，机器人被发现传播错误信息，例如质疑COVID-19的威胁、宣扬反疫苗阴谋论等，严重影响疫情防控[38, 49]。研究人员还发现，机器人被用来参与俄罗斯-乌克兰信息战[19]并干扰全国选举[44]，即机器人被用来扰乱选举并攻击对手，例如2017年的法国大选总统选举[11]、2018年美国中期选举[47]等。马斯克斥资440亿美元收购Twitter的计划一度被终止，因为他质疑Twitter首席执行官声称的不到5%的虚假账户的准确性[40]。社交机器人带来的这些威胁严重危害社会安全。因此，迫切需要高效、有效的社交机器人检测方法来促进社会的和平与安全。

在社交机器人检测的早期阶段，常用的机器人检测方法是基于特征的，即根据用户属性[48]、推文特征[15]、行为特征[34]等从专家知识和统计信息构建特征。然而，基于特征的方法很容易受到基于对抗策略的特征的影响，即机器人创建者可以通过伪造特征来逃避检测[7]。由于社交机器人通常通过传播虚假信息来进行恶意活动，因此研究人员基于快速发展的自然语言处理（NLP）技术提出了基于内容的方法，利用内容挖掘技术来识别真实性和意图。例如，Kudugunta 等人[24] 使用长短期记忆（LSTM）处理推文并检测社交机器人。然而，大规模语言模型（LLM）的快速发展和应用使社交机器人具有更强的内容创造能力。例如，对于由 ChatGPT 生成的文本，只有 26% 的文本可以被识别[3]，从而降低了基于内容的检测方法的性能。最近，由于图神经网络（GNN）在处理非欧几里得空间数据（如社交网络）方面的优越性，基于图的模型（如[ 9 ]、[ 4 ]等）被提出用于检测社交机器人，并有望解决复杂网络下的机器人群组攻击等问题。然而，近年来社交机器人的发展速度非常快[7]，这导致高质量的标记数据非常稀缺。这使得传统监督模型（也包括基于 GNNs 的模型）无法满足训练需求成为一大挑战。换句话说，标签稀缺问题阻碍了bot检测的发展，使得有监督模型容易受到新社交bot的影响。

为了应对上述挑战，我们提出了一种对比学习驱动的社交bot检测框架（CBD），该框架由离线训练和在线检测两部分组成，支持少量学习。具体来说，它在预训练阶段采用图对比学习（只需使用未标记数据来学习包含语义信息的节点表征）来学习有价值的知识，并在微调阶段采用一致性损失来提高模型在标记数据极少的情况下的性能。

对于 CBD 的系统架构，我们提出了一种智能反馈策略，以进一步提高检测性能。因此，通过采用 CBD，只需要少量的标签数据（少量学习）就可以学习到足够的知识，并建立一个具有良好准确性的bot检测平台。而当遇到未知类型的bot时，我们的模型可以通过比较它们与已知类型社交账号的差异来增强效果，从而获得有效的检测结果。当然，预训练的特征提取器还可以与其他模型相结合，以提高其性能。我们将主要贡献总结如下：

我们提出了对比学习驱动的社交机器人检测框架--CBD，该框架支持少量学习，由两部分数据交互组成：离线训练和在线检测。

对于 CBD 的检测模型，我们在预训练阶段采用对比学习，从未标明的数据中提取有价值的知识；在微调阶段采用一致性损失，在标注数据极度缺乏的情况下提高检测性能。

在一个全面的社交bot检测数据集上进行的广泛实验证明了对比学习方法和一致性损失在社交bot检测中的有效性，以及 CBD 与最先进的基线模型相比的优越性。

3 问题定义

社交网络可以自然地表示为有向图 G = (V, E)，其中 V = {v1, v2, ..., vN} 是社交网络中用户帐户组成的节点集，E ⊂ V × V 是描述用户之间关注关系的有向边集。节点的邻居集合表示为 $N(v_i) = \{u:(v_i,u)\nsubseteq \varepsilon \}$ 。令 X = [x1, x2, . , xN ]⊤∈RN ×d 表示节点特征矩阵，G的第i个节点的特征向量可以表示为 $x_i\in R^d$ ，d表示特征维度。我们用 A∈R N×N 表示邻接矩阵，每个元素 A_ij = 1 表示节点之间存在一条边，否则 A_ij = 0。D∈R N×N 是 A 的对角度矩阵，其中 D_ii = $\sum_{j}A_{ij}$

在本文中，社交bot检测可被视为一项二元分类任务，其目标是预测给定的社交账号v_i∈ V 是否是社交bot。更正式地说，节点的标签向量表示为 Y∈{0, 1} ，其中 Y∈{0, 1} 表示基本事实。这里，Y = 1 表示是社交bot，否则 Y = 0。因此，bot检测模型的工作是学习一个函数：（G，X）-→ Y。

4 CBD

4.1 框架概述

图 1 显示了 CBD 的架构，包括离线训练和在线检测。该框架通过离线训练和在线检测之间的持续数据交互，实现了实时bot检测和智能反馈。框架的工作流程介绍如下

离线训练。这部分主要负责数据预处理和模型训练两大功能。数据预处理包括数据采集、整合和存储，数据源涵盖 Twitter、微博等几大社交网络。具体来说，它提供了数据采集工具、信息处理方法和数据持久化组件，所有这些组件都可以分布式部署。模型训练包括预训练和微调，可采用不同的训练策略.

在线检测。这部分提供对社交机器人的在线实时检测，并处理用户提交的反馈。具体来说，注册用户可以针对可疑的检测结果向系统提交反馈。如果反馈通过，则会在检测结果数据库中更新，从而为模型的微调提供基于反馈的注释数据。 $\widetilde{D}_m$

在线检测模型会定期从离线端更新，以确保模型学到的最新知识能及时应用到实时检测中。除了网页端检测，它还提供bot检测应用程序接口（API），开发人员可以利用这些应用程序接口为自己的应用程序提供bot检测功能。

4.2 Model Learning

模型学习在我们的框架中扮演着核心角色，其目的是从收集到的数据中挖掘潜在的模式来检测社交机器人。如图 1 右上方所示（深色背景突出显示），模型训练包括两个阶段（如图 2 所示）：模型预训练和模型微调。前者是基于历史非标注数据的对比学习过程；后者则采用半监督式微调过程，利用基于标注数据的在线反馈注释信息。这种两阶段模型训练设计使我们的框架能够同时受益于大规模未标注数据和动态增量标注数据，从而使其具有良好的性能。下面我们将详细介绍这两个学习阶段。

4.2.1 通过 GCL 进行模型预训练

CBD 的预训练阶段遵循 GCL 的通用范式，即通过最大化来自同一输入图的两个不同视图之间的表征 MI 来实现自我监督。具体来说，两个图视图是通过对输入图随机执行数据增强而生成的。然后，优化对比目标，强制同一节点的增强表示相互一致，但与其他节点的表示不同 .

图增强对于输入的社交图 G = (X，A)，通过从 G 中删除边，生成两个视图，其中表示第m个视图的相邻矩阵。然后将两个视图输入 GNN 编码器，生成它们的表示。具体来说，对于 $\widetilde{G}_m$ ，第l个 GNN 层的过程可以简化为，其中表示 ReLU 激活； $\widetilde{P}_m$ 是采用重正化技巧的卷积信号矩阵[22]， $\widetilde{D}_m$ 是 $\widetilde{A}_m$ 的对角度矩阵。代表 $\widetilde{G}_m$ 的第 l 层节点表示，特别是 .通过迭代执行 L次，我们获得编码表示:

对比目标。通过两个视图表示法 H(1)和 H(2)，对比目标用于区分同一节点的表示法和其他节点的表示法。具体来说，对于节点来说，它在两个视图 H(1)和 H(2)中的表示构成一对正样本，而其他节点在两个视图中的表示被视为负样本。那么正样本对的 InfoNCE 损失[29]计算公式为

其中，S (-, -) 表示两个代表之间的相似性， $\tau$ 是温度超参数。 Neg代表负对影响，其定义为

其中，第一项和第二项分别惩罚视图内和视图间负对之间的相似性。由于两个视图是对称的，因此另一个视图的损失函数也类似。需要最小化的总体对比度目标定义为

4.2.2 通过一致性损失进行模型微调

在对未标记的社交图进行预训练后，根据在线检测和反馈结果（将在第 4.3 节中详细介绍），通过对社交图进行微调，进一步增强了预训练的 GNN 模型。为此，CBD 采用了半监督一致性学习策略，旨在通过增强模型对随机性的鲁棒性来学习更有把握的表征。如图 2 下部所示，给定一个带有部分注释的社交图 G = (X，A)，通过将 G 送入预先训练好的模型并随机丢弃M次，生成 G 的M种不同表示 [39]。然后，M种不同的表征被发送到 MLP，以产生相应的输出：。然后，我们对进行优化，对已注释节点 Ω_a 和未注释节点 Ω_u 分别采用监督损失和置信度感知一致性损失进行优化。

监督损失。监督损失被形式化为带注释的节点在M次表征上的平均交叉熵：其中 H (·,·) 表示交叉熵函数，Y ∈ R 是节点的 one-hot ground-truth 标签。

置信感知一致性损失。为了以半监督的方式进一步利用未注释数据背后的信息模式，我们设计了一种置信感知一致性损失，它将表示的预测与锐化的平均预测对齐。具体来说，我们计算平均预测并使用以下公式对其进行锐化： $\widetilde{Y} = Normalize(\overline{Y}^\frac{1}{\beta })$ 其中，Normalize(-) 将非负矩阵的每一行归一化为合法分布，并代表锐化系数，即系数越小，分布越锐利。有了锐化后的平均预测值 $\widetilde{Y}$ ，置信度感知一致性损失会将所有预测值与置信度阈值 $\gamma$ ∈ [0, 1] 以上的 $\widetilde{Y}$ 保持一致：

其中 D (-, -) 可以是任何距离度量，如 KL 散度和 L2 准则。指示函数 $\delta (\overline{Y}_i)$ 会过滤掉所有置信度较低的 $\overline{Y}_i$ ，以降低误差风险。

因此，结合会产生最终的微调损失：，其中 $\lambda$ 是权衡超参数。算法2总结了模型微调的过程。

4.3 在线检测

在线检测模块提供实时社交僵尸检测和智能反馈两大功能，由在线管理器和在线检测模型两大部分管理。其工作流程和实现原理介绍如下

实时社交机器人检测。当用户在社交活动中遇到可疑账号时，可以在检测网页的文本框中输入该账号，然后提交检测。在线管理器收到并识别该账号检测请求后，首先从检测结果数据库中查询该账号的检测结果。如果找不到结果，它将重新向数据提供者查询账户数据，并向在线检测模型进行在线检测。具体来说，构建包含目标账户的社交图谱 G，并将其输入在线检测模型进行检测。在线检测模型利用社交图 G 检测目标账户及其邻居，并返回检测结果.

智能反馈。除了实时检测，在线模块还提供智能反馈，以进一步提高检测性能，图 1 中的蓝线就是智能反馈的标志。当注册用户对检测结果有疑问时，可以就某个账号是否为社交僵尸的概率提出反馈意见。然后，在线管理员会收到这些反馈，并由系统和人工进行审核。如果审核通过，反馈结果将被更新到检测结果数据库中。同时，反馈结果将用于离线微调，以便更新检测模型，获得更准确的结果。

5 实验

5.1 实验设置

数据集。我们的模型在 TwiBot-22 [ 10] 上进行了评估，在该数据集中，我们随机选取了 81,433 个人类作为正例，81,432 个机器人作为负例，以保持它们的比例相对平衡，从而得到了 162,865 个社交账号。我们随机将训练集、验证集和测试集按 7:2:1 的比例进行划分，以确保比较实验的公平性。

基线。为了构建 CBD 模型，我们选择了两个具有代表性的基于 GNNs 的模型 GCN [ 22] 和 GIN [ 45 ] 作为编码器，并在实验中将它们与十个基线模型进行比较。这些基线模型包括五个通用 GNN： GCN [ 22]、GAT [42]、JKNet (GCNJK) [46]、APPNP [23]、R-GCN [35]；四种最新方法： LINKX[28]、MixHop[1 ]、GPR-GNN[6 ]、H2GCN[50]；一种具有异质性的僵尸检测方法： Feng等人[ 9 ]。所有实验都使用了相同的输入特征，包括用户的 1) 用户属性：用户名、描述、位置、注册时间、验证状态、关注数、粉丝数、列表数、推文数；2) 内容信息：推文内容、评论；3) 社交关系信息：关注者和粉丝的好友列表；4) 社交关系信息：关注者和粉丝的好友列表；5) 社交关系信息：关注者和粉丝的好友列表；6) 社交关系信息：关注者和粉丝的好友列表；7) 社交关系信息：关注者和粉丝的好友列表。

实施细节。基于社交网络的交互特性，我们将社交数据构建为有向图。实验采用 AdamW 优化器 [ 21 ] 进行训练和优化。预训练阶段的学习率和权重衰减分别为 10-3 和 10-5。在微调阶段，我们采用权重衰减为 3 × 10-5 的分层学习率策略，其中预训练 GNN 层的学习率设置为 10-4，其他层的学习率设置为 10-3。为了避免过拟合，我们在训练时使用了 dropout [39] 和早期停止技术。

网格搜索用于找到 CBD 预测的最佳超参数。具体来说，该模型在三个编码通道上采用了两个隐藏层，隐藏层大小为 512.锐化参数、可信阈值和一致性损失的距离函数分别设为 0.3、0.6 和 L2 准则。其他基线方法的模型配置沿用了之前的研究[9, 28 , 35]。F1 分数、准确率和 ROC-AUC 用于评估我们的模型和基线模型。我们使用 PyTorch Geometric（MIT 许可）[12] 和 PyTorch（BSD 许可）[30]来实现实验，所有实验均在 Tesla A100 GPU（80GB 内存）上进行。

5.2 性能比较

在比较实验中，我们对每个实验进行 5 次随机权重初始化，并报告测试集上的平均值和标准偏差，其中 CBD 与 10 个基线模型进行了比较。实验结果如表 1 所示。从测试结果来看，我们的模型达到了最先进的僵尸检测性能，此外，使用 GIN 作为编码器的模型的性能优于使用 GCN 作为编码器的模型，达到了前 2 名的性能。

5.5 少量检测研究

对于新的社交机器人，只能获得很少的标签。有鉴于此，我们进一步探讨了 CBD 的少量检测能力。具体来说，我们只从训练集中随机抽取每个类别的标签来微调模型，然后在测试集中进行测试。表 3 显示了实验结果。不出所料，当取值减小到 1 时，即单次检测时，性能下降，方差增大。然而，随着k增加，其性能呈上升趋势，并且可以超越所有每个类别只有五个标签的基线模型（五次检测），这归功于预训练阶段从未标记数据中学到的宝贵知识以及一致性损失进一步减少了依赖在微调阶段的标签上。

6 结论

本文研究了社交机器人检测任务，该任务面临着标签数据缺乏和 LLM 导致机器人内容创作能力不断增强的挑战。为了解决这些难题，我们提出了 CBD，它在预训练中采用对比学习，从无标签数据中提取有价值的知识；在微调中采用一致性损失，进一步减少对标签的依赖，从而在标签数据极度匮乏的情况下，在算法层面提高模型性能。此外，在系统架构层面，还采用了智能反馈策略来进一步提高检测性能。广泛的实验表明，在一个全面的僵尸检测基准上，CBD 始终优于最先进的基准模型。其他研究进一步证明了我们模型的有效性。到目前为止，我们已经在线部署了 CBD，并得到了广泛关注和使用。据我们所知，CBD 目前在谷歌和百度搜索中排名第一。我们希望我们的框架能帮助人们免受社交机器人及其传播的错误信息的影响，从而创建一个更安全的社交网络。

【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
YOLOv11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS目标检测论文精读（逐段解析）昵称是6硬币 (持续更新)YOLO 深度学习计算机视觉人工智能目标检测图像处理
YOLOv11:ANOVERVIEWOFTHEKEYARCHITECTURALENHANCEMENTS目标检测论文精读（逐段解析）论文地址：https://www.arxiv.org/abs/2410.17725RahimaKhanamandMuhammadHussainUltralytics公司发布CVPR2024论文写的比较简单，比较核心的改进包括：C3K2高效特征提取机制。对C2f模块的改进
RAG系统的“聪明药”：如何用反馈回路让你的AI越用越聪明？许泽宇的技术分享人工智能
大家好，我是你们的AI技术侃侃而谈小能手。今天我们来聊聊RAG（Retrieval-AugmentedGeneration，检索增强生成）系统的进化之路——如何让它像喝了聪明药一样，越用越聪明，越聊越懂你。你是不是也有这样的体验？用ChatGPT、文档问答机器人，刚开始觉得还行，但用久了发现它总是“死脑筋”，问同样的问题，答得千篇一律，甚至一错再错。你想：“要是它能记住我的吐槽和建议，下次别再犯同
EasyFeature软件特性四：星云空天大模型智绘中勘人工智能深度学习信息可视化
随着智能遥感进入新纪元，数据处理与模型效率的挑战日益成为应用落地的关键瓶颈。EasyFeature软件以星云空天大模型为核心，构建了基于人机智能提示学习的多模态系统。通过海量高质量数据预训练，集成了包括遥感场景分类、快速目标检测、地物分类、变化检测等在内的丰富模型库，提供端到端的智能解译能力。EasyFeature完全实现国产化自主可控，涵盖全栈软硬件支撑与训推一体化流程，确保高效安全。其极简安装
Android app架构经验总结（转载）
架构因人而异，不同的架构师大多会有不同的看法；架构也因项目而异，不同的项目需求不同，相应的架构也会不同。然而，有些东西还是通用的，是所有架构师都需要考虑的，也是所有项目都会有的需求，比如API如何设计？架构如何分层？开发环境和生产环境如何分离？这几年，我负责研发过的App，有餐饮类的、社交类的、智能家居类的、电商类的、新闻媒体类的等等。当有了一定的经验之后，你总会有一些自己的心得体会。而以下内容就
es7-8特性 \光辉岁月/ ecmascript javascript 开发语言 ecmascript
es7新特性Array.prototype.includesIncludes方法用来检测数组中是否包含某个元素，返回布尔类型值。//includesindexof这两个方法都可以实现检查数组是否包含某个元素constmingzhu=["西游记","红楼梦","三国演义","水浒传"];//判断console.log(mingzhu.includes("西游记"));//trueconsole.lo
python + selenium通过滑块验证 weixin_51144854 python selenium 爬虫 opencv
1、介绍使用python进行自动化操作或者爬虫过程中，可能会遇到需要进行验证的情况。本文介绍了两种通过滑块验证的方法：轮廓检测通过OpenCV进行轮廓检测，找到滑块背景中缺口的位置，计算缺口到滑块的距离。模板匹配通过OpenCV分析滑块背景图与滑块的相似度，找到滑块背景图中与滑块最相似的区域就是缺口的位置，然后计算缺口到滑块的距离。2、轮廓检测测试地址：https://accounts.douba
Python爬虫实战：研究sanitize库相关技术 ylfhpy 爬虫项目实战 python 爬虫网络开发语言安全 sanitize
1.引言1.1研究背景与意义在当今数字化时代，互联网已成为人们获取信息、交流互动的重要平台。随着Web2.0技术的发展，用户生成内容(UGC)、社交媒体嵌入、第三方插件等功能极大丰富了网页的内容和交互性，但也带来了严峻的安全挑战。根据Web应用安全联盟(WAS)的统计数据，2025年全球范围内因网页安全漏洞导致的数据泄露事件超过15万起，造成的经济损失高达250亿美元。其中，跨站脚本攻击(XSS)
Python爬虫实战：研究difflib库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui 开发语言前端 difflib
1.引言1.1研究背景与意义在信息爆炸的数字时代，互联网每天产生海量文本内容。据统计，全球新闻网站日均发布文章超过300万篇，社交媒体平台产生的文本信息量更以亿级单位增长。这种信息过载带来了内容同质化、抄袭剽窃等问题，给新闻媒体行业、学术研究领域和搜索引擎优化等带来了挑战。文本相似度分析作为自然语言处理的重要分支，能够有效识别内容间的相似程度，具有重要的应用价值：新闻媒体行业：通过检测新闻抄袭和重
人工智能-基础篇-10-什么是卷积神经网络CNN（网格状数据处理：输入层，卷积层，激活函数，池化层，全连接层，输出层等） weisian151 人工智能人工智能 cnn 神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专为处理网格状数据（如图像、视频、音频）设计的深度学习模型。它通过模拟生物视觉机制，从原始数据中自动提取多层次的特征，最终实现高效的分类、检测或生成任务。1、核心概念与原理1、生物视觉启发局部感受野：模仿人类视觉皮层神经元仅响应局部区域刺激的特性，每个神经元关注输入数据的局部区域（如图像的一小块区域）。权值共享：同一
Autosar 下电过程-基于ETAS工具赞哥哥s Autosar进阶 autosar etas EcuM
文章目录前言下电流程图POST_RUNPreShutDownShutdown总结前言本文介绍基于ETAS工具对应的BIP包的下电过程，仅供参考。下电流程图目前下电都是走的网络管理的下电流程。POST_RUN上层检测到下电请求后（如Nm状态由ReadySleep到PreBusSleep）先将模式切换到APP_MODE_REQUEST_POST_RUN示例如下：FUNC(void,NM_CODE)Nm
多模态融合相机L3CAM moonsims 人工智能
多模态融合相机L3CAML3CAM是Beamagine公司推出的多模态传感器融合技术，结合了激光雷达（LiDAR）和可见光摄像头，旨在为自动驾驶、工业机器人和其他需要精确环境感知的应用场景提供高效、安全的解决方案。L3CAM技术参数L3CAM结合了LiDAR和可见光摄像头，使其能够提供三维空间感知及图像级别的环境识别能力激光雷达部分（LiDAR）探测范围：大约200米（具体范围根据不同环境和反射面
记录一个异常检测库 STO检测王深度学习
https://github.com/openvinotoolkit/anomalib/tree/main关于一个异常检测库，包括最先进的算法和功能，如实验管理，超参数优化和边缘推理。
MQ135在STM32中的使用 Ricardo.lucky STM32中的模块使用 stm32 嵌入式硬件单片机
一、简介MQ135气体传感器所使用的气敏材料是在清洁空气中电导率较低的二氧化锡(SnO2)。当传感器所处环境中存在污染气体时，传感器的电导率随空气中污染气体浓度的增加而增大。使用简单的电路即可将电导率的变化转换为与该气体浓度相对应的输出信号。MQ135传感器对氨气、硫化物、苯系蒸汽的灵敏度高，对烟雾和其它有害的监测也很理想。这种传感器可检测多种有害气体，是一款适合多种应用的低成本传感器。特点：在较
高效主机发现与端口枚举：fscan工具实战指南 Bruce_xiaowei 笔记总结经验网络安全 fscan 信息搜集
高效主机发现与端口枚举：fscan工具实战指南在网络安全领域，主机发现与端口枚举是渗透测试和信息收集的基础环节。本文将深入探讨fscan这一高效工具的核心技术原理与实战应用，帮助你快速掌握网络扫描的核心技能。一、fscan与Nmap工具对比特性fscanNmap开发语言Python3C++主要功能主机探测、端口扫描、漏洞检测主机发现、服务识别、OS检测爆破能力内置弱口令检测需配合其他工具扫描速度极
Linux【7】------Linux系统编程（进程间通信IPC） Invinciblenuonuo linux 多进程进程间通信
文章目录1信号1.1信号类型1.2信号含义1.3信号产生按键硬件异常调用接口发送指令内核检测1.4信号处理默认捕捉忽略1.5信号阻塞1.6信号挂起2消息队列2.1概念2.2创建消息队列2.3访问消息队列2.4控制消息队列3共享内存3.1申请共享内存3.2共享内存映射3.3控制共享内存3.4信号量3.5操作信号量1信号信号是一种异步通信方式同步通信同步指的是当进程发起一个请求，但是该请求并未马上响应
半导体器件仿真：光电器件仿真_（6）.光电二极管仿真 kkchenkx 信号仿真2 信号处理信息可视化
光电二极管仿真1.引言光电二极管是一种能够将光能转换为电能的半导体器件。在光通信、图像传感器、光检测器和太阳能电池等领域有广泛的应用。光电二极管的仿真可以帮助设计者了解器件的工作原理、性能参数以及优化设计。本节将详细介绍光电二极管的仿真原理和步骤，包括器件结构、物理模型、仿真软件的使用方法以及具体的仿真案例。2.光电二极管的基本结构和工作原理2.1器件结构光电二极管通常由一个PN结或PIN结组成。
YOLOv13：开启目标检测新时代，手把手教你实操奔跑吧邓邓子必备核心技能 YOLO 目标检测目标跟踪人工智能实操
目录一、YOLOv13初印象1.1YOLO系列发展脉络1.2YOLOv13独特之处二、前期准备工作2.1环境搭建2.2依赖安装三、深入使用指南3.1模型验证3.2模型训练3.3模型推理四、应用案例与拓展4.1实际场景应用展示4.2与其他技术结合思路五、总结与展望一、YOLOv13初印象1.1YOLO系列发展脉络YOLO（YouOnlyLookOnce）系列算法在目标检测领域中，就如同一位不断进化的
从入门到实战：YOLOv13 安装与使用全攻略奔跑吧邓邓子必备核心技能 YOLO 目标跟踪人工智能安装使用全攻略
目录一、YOLOv13简介1.1目标检测与YOLO系列1.2YOLOv13核心技术亮点1.3性能优势展现二、前期准备2.1系统环境要求2.2软件依赖安装三、安装流程3.1获取源码3.2环境搭建3.3安装验证四、使用指南4.1模型验证4.2模型训练4.3模型推理4.4模型导出五、应用案例与技巧5.1实际应用场景展示5.2常见问题与解决方法5.3优化技巧分享六、总结与展望6.1YOLOv13回顾6.2
N-P准则下的多传感器融合(python) 不会打架的锤子机器学习自动化算法算法 python vscode
本文设计了一个主程序：main_sensor_fusion，和一个函数程序：cal_fuse。主程序里面包含主干部分和绘图部分，函数程序包含数据生成函数gen，检测概率计算函数cal，非0逻辑矩阵函数No_zero_value，单传感器判决函数fus_seq，多传感融合函数fusion。需要的点赞私聊if__name__=="__main__":begin_time=time()#Measurep
道可云人工智能每日资讯｜江苏首个机器人训练中心在苏州吴江启动道可云道可云人工智能人工智能机器人 ar DeepSeek xr 百度
道可云人工智能&元宇宙每日简报（2025年6月26日）讯，今日人工智能&元宇宙新鲜事有：江苏首个机器人训练中心在苏州吴江启动近日，长三角一体化示范区智能机器人训练中心在东太湖度假区（太湖新城）正式启用，成为江苏省首个机器人智能训练中心。该中心占地1500平方米，设有8个训练场景和30个生产工位，涵盖智能制造、商业服务、特种应用三大领域，年产数据可超200万条，旨在加速机器人从实验室走向真实产业场景
YOLOv13：目标检测的全面攻略与实战指南奔跑吧邓邓子必备核心技能 YOLO 目标检测目标跟踪人工智能全攻略实战
目录一、YOLOv13简介1.1YOLO系列发展回顾1.2YOLOv13的特点与优势二、YOLOv13原理剖析2.1HyperACE技术详解2.2FullPAD技术详解2.3轻量级卷积替换技术详解三、YOLOv13性能对比3.1与其他YOLO版本对比3.2实际应用场景对比四、YOLOv13项目结构与使用方式4.1仓库文件结构介绍4.2快速上手步骤五、YOLOv13优化技巧5.1数据增强技巧5.2锚
加快Dlib人脸检测速度 weixin_46019223 opencv 人脸识别视频处理机器学习
加快Dlib人脸检测速度前言一、让电脑以最大运行效率运行二、开启Dlib自带的加速三、彩色图像转灰度图像四、其它的坑总结前言使用dlib人脸检测接口detector()速度过慢,导致视频只有1帧所以找了一些方法,并解决了一些问题将视频帧数提升到了十几帧。一、让电脑以最大运行效率运行之前笔记本电脑,都是没插电源运行得,插了之后视频变成了两帧(-_-||),但是可以查看电脑电源设置,查看cup是否全速
Python dlib（HOG+SVM）人脸识别总结程序媛一枚~ 人脸识别 python 支持向量机开发语言读书笔记人脸检测识别
Pythondlib（HOG+SVM）人脸识别总结面部标志检测dlib68点（HOG+SVM），194点人脸识别模型，包括口（外嘴唇，内嘴唇），鼻，眉毛（左右眉），眼睛（左右眼），下鄂5点面部标志检测器（左眼2点，右眼2点，鼻子1点）面部对齐更高效眨眼检测ear眨眼瞬间达到0疲劳驾驶检测—连续帧ear面部对齐眼睛连线反正切获取旋转角度，期望图像眼睛横长度计算比率左眼计算右眼相对坐标眼睛横中心点作为
【HarmonyOS NEXT】实现电话拨打功能奔跑的露西鸿蒙 HarmonyOS harmonyos
一、背景在现代移动应用中，直接拨打电话是一个常见且重要的功能。无论是电商应用的客服热线、社交应用的联系人拨打，还是企业应用的快速联系功能，都需要便捷的电话拨打能力。二、实现思路API调用：使用@ohos.telephony.call模块的makeCall方法三、具体实现importcallfrom'@ohos.telephony.call';import{BusinessError}from'@k
deepseek：2025年Java面试必刷高频LeetCode题目 Alexon Xu java 面试 leetcode
以下是2025年Java面试中高频LeetCode题目分类及对应链接，结合大厂实际考察频率整理：一、链表类反转链表（Easy）迭代法与递归实现双解，掌握三指针操作环形链表检测（Easy）快慢指针经典应用，延伸考察环入口点计算合并K个排序链表（Hard）优先队列解法时间复杂度O(NlogK)相交链表（Easy）双指针数学技巧：a+c+b=b+c+a删除链表的倒数第N个节点（Medium）快慢指针+虚
网安知识“大乱炖“ Lovely_18 网安知识积累
网安知识"大乱炖"Windows安全事件日志常用EventID：EventID含义说明4624登录成功表示用户成功登录系统4625登录失败✅表示登录尝试失败，是暴力破解最关键的日志标志4672特权登录表示具有管理员权限的账户登录（用于检测高权限账户活动）4648显式凭证登录用户在使用runas或远程方式提供用户名/密码登录暴力破解相关日志特征：连续触发大量4625登录失败来自同一个IP或多个IP的
Flutter基础（UI监听） aaiier flutter 前端
文本按钮（TextButton）文本按钮是没有边框的按钮，当点击时会有涟漪效果。TextButton(onPressed:(){//点击按钮后要执行的代码print('文本按钮被点击了');},child:Text('点击我'),)手势检测器（GestureDetector）GestureDetector能够检测多种手势，不只是点击，还包括滑动、长按等。GestureDetector(onTap:
基于级联深度学习算法在双参数MRI中检测前列腺病变的评估| 文献速递-AI辅助的放射影像疾病诊断有Li 人工智能深度学习算法
Title题目EvaluationofaCascadedDeepLearning–basedAlgorithmforProstateLesionDetectionatBiparametricMRI基于级联深度学习算法在双参数MRI中检测前列腺病变的评估Background背景MultiparametricMRI(mpMRI)improvesprostatecancer(PCa)detectionc
【Python】PyRoboPath：Python机器人路径规划的终极指南宅男很神经 python 开发语言
PyRoboPath：Python机器人路径规划的终极指南第1部分：PyRoboPath与路径规划基础第1章：PyRoboPath概览与核心理念1.1什么是PyRoboPath？PyRoboPath是一个先进的、开源的Python库，致力于为学术研究人员、行业工程师以及机器人爱好者提供一套完整、高效、易用且可扩展的机器人路径规划解决方案。它不仅仅是一个算法的集合，更是一个集成了机器人建模、环境表示
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

论文阅读 - Detecting Social Bot on the Fly using Contrastive Learning

摘要：

引言

3 问题定义

4 CBD

4.1 框架概述

4.2 Model Learning

4.2.1 通过 GCL 进行模型预训练

4.2.2 通过一致性损失进行模型微调

4.3 在线检测

5 实验

5.1 实验设置

5.2 性能比较

5.5 少量检测研究

6 结论

你可能感兴趣的:(社交机器人检测,论文阅读)