江_小_白

谣言检测文献阅读五—Leveraging the Implicit Structure within Social Media for Emergent Rumor Detection

系列文章目录

谣言检测文献阅读一—A Review on Rumour Prediction and Veracity Assessment in Online Social Network
谣言检测文献阅读二—Earlier detection of rumors in online social networks using certainty‑factor‑based convolutional neural networks
谣言检测文献阅读三—The Future of False Information Detection on Social Media:New Perspectives and Trends
谣言检测文献阅读四—Reply-Aided Detection of Misinformation via Bayesian Deep Learning
谣言检测文献阅读五—Leveraging the Implicit Structure within Social Media for Emergent Rumor Detection
谣言检测文献阅读六—Tracing Fake-News Footprints: Characterizing Social Media Messages by How They Propagate
谣言检测文献阅读七—EANN: Event Adversarial Neural Networks for Multi-Modal Fake News Detection
谣言检测文献阅读八—Detecting breaking news rumors of emerging topics in social media

文章目录

系列文章目录
前言
1 介绍
2. 数据集和数据收集
- 数据集
3.发现突发谣言
- 3.1 隐式链接
- - 3.1.1 标签链接（Twitter中为“ #H7N9” , 在新浪微博中为“ #H7N9#”）
  - 3.1.2 网络链接
4. 结果
- 4.1 零修剪分类
- 4.2 早期检测和检测截止时间
- 4.3 剪枝分类
5.相关工作
- 5.1 流行病模型
- 5.2 基于用户和消息的分类
- 5.3 传播增强分类
6.结论和今后的工作

前言

文章：Leveraging the Implicit Structure within Social Media for Emergent Rumor Detection
发表会议：2016 CIKM (International Conference on Information and Knowledge Management）
时间：2016年10月

1 介绍

对话M，M具有 $m_i$ 相关对话（message），其中 $i ∈\{1, ..., |M|\}$
$F (M_t) = α$ ，其中 $t$ 是检测时限（ $F(M_1) < F(M_t) < F(M_{|M|}$ )。），α是检测准确率
假设我们可以找到一些具有相同性质的相关会话(conversation)N，并且 $N_iNi<M1$
很重要的一点是要知道 $F(M_{| M |})>F(N_i+M_t)$ 在哪一点（如果有的话），因为从直觉上看，近似值 $N_i+M_t$ 的表现可能不如 $M_{| M |}$
根据显式链接的定义，即那些显式创建为会话响应函数的链接，我们将隐式链接定义为基于某种相似性连接会话结构，但不是社交媒体结构固有的链接。隐式链接可以通过使用相关对话中的额外信息来减少紧急对话结构固有的噪音，这可以显著提高新谣言对话的检测率。相关的对话统计数据也可以用来改善已有谣言中的鉴别特征，以提高分类准确性。然而，这也是一个具有挑战性的命题，因为决定应该连接哪些数据、应该应用哪些增强数据源、应该采取哪些步骤来减少类之间的交叉污染，以及哪些类型的链接提供了最佳的区分功能，这并不是一件小事。本文的主要贡献有：
我们设计了一种以对话为中心的方法来收集谣言数据以及策划的基本事实；
我们识别和分析隐含的链接、它们的分布以及它们在发现谣言出现阶段的影响；
我们提出了两种发现隐式链接的方法，包括：Hashtag Linkage 和 Web Linkage。

2. 数据集和数据收集

数据集

Castillo 等人创建，该数据集由 280 个独立的推文组组成，是基于关键词进行收集的，即给每个事件一组关键词，然后根据关键词收集该事件的数据，我们将与特定标签关联的所有推文组称为对话（conversation）。该基于关键词进行数据收集特征：

无法包含回复推文中对话结构或重要上下文信息
平均对话生命周期长达29.57小时
推文中的内容可变性较低。
研究对话结构、回复内容和用户参与度的影响对于早期发现谣言是必要的，因为新闻报道固有的滞后时间会降低发现速度。为了解决这个问题，我们通过Snopes构建了一个新的数据集，可以自动捕获与谣言相关的对话树。

注：Snopes是一个谣言识别网站（谣言指的应该是虚假的消息），作者通过这个网站收集虚假新闻和真实新闻

注：Avg Duplication 应该是所有对话的平均复制率，有些对话中可能存在大量复制的对话

3.发现突发谣言

于会话（conversation）中的每条给定推文，我们使用Ma等人提出的一组特征提取一个特征向量 $\hat{t}$ 。然后，用于分类的会话（Conversation）特征向量可以使用给定会话（Conversation）中带有链接的推文特征的 z-score 归一化平均值来构建。

z分数（z-score），也叫标准分数（standard score）是一个数与平均数的差再除以标准差的过程
处理后的数据均值为0，方差为1，符合标准正态分布，且无量纲。其主要目的是将不同量级的数据统一化为同一个量级，统一用计算出的Z-Score值衡量，保证了数据间具有可比性。

其中 $θ_i$ 是聚合会话特征集 $θ$ 中的第 $i$ 个特征， $t_i$ 是所有会话（conversation）的第 $i$ 个特征的平均值(average)， $µ_{t_i}$ 是平均值（mean）， $σ_{t_i}$ 是标准偏差。（非要解释的话，只能解释为每个conversation一个特征向量，但是这样解释同样存在一些问题 $t_i$ 是所有会话（conversation）的第 $i$ 个特征的平均值，这样算出来的实际上就应该是所有对话的特征值的第i个特征的 z-score 归一化平均值，即280个会话的第i个特征的分数，那么这个如果是共有20个特征，这个算的就是20个值，整个数据集20个值，但是这么看还是有问题 $µ_{t_i}$ 还是不能解释的很清晰，按照这个推测，那么 $µ_{t_i}$ 应该写作 $µ_{t}$ ）因此，我们可以将所有对话向量分组到集合R中（怎么分组，以什么标准分组，也没说）。

这个是被引用文献【9】的公式：

为了提高辨别质量，我们创建了几种类型的隐式链接，我们将其定义为其他不相关对话之间的潜在上下文线索或相似性。例如，如果对话A正在讨论事件C，我们可以确定对话B也在讨论事件C，那么我们可以声称这些对话之间存在隐含的联系。这是有益的，因为额外的用户和内容信息有助于减少由连接响应太少的异常讨论引起的噪音。为了实现这一点，我们需要一个适当的转换，可以容纳各种类型的隐式链接。我们的表述如下：

其中 $I$ 是任何定义的隐式链路发现公式， $N$ 是发现链路的数量（根据是否大于评定是否在 ${R}'$ 中 $N$ 没有存在的必要）， $\mathbb{I}_θ$ 是定义隐式链路 $I$ 是否存在于 $θ$ 中的指示函数(同样没说指示函数是什么)。对集合的附加约束提供了过滤，可以在没有任何倾斜特征值的情况下减少这些对话(conversations)(减少对话，不明白，要判断的就是对话的真假，为什么要减少对话，而不是减少推特或者message )。实际上这种转换会丢弃任何不会随时间变化并且也无法链接到其他收集到的对话的对话。 （感觉公式中的不应该用 $θ$ ，应该用 $θ_i$ ）

3.1 隐式链接

隐式链接是在没有链接的对话之间可以发现的任何形式的相似性。

3.1.1 标签链接（Twitter中为“ #H7N9” , 在新浪微博中为“ #H7N9#”）

标签的使用在社交媒体交流中变得非常普遍。由于主题标签（hashtag）是一种通用抽象，因此很容易在推文中找到链接。因此，很难确定使用主题标签（hashtag）形成的隐式链接能在多大程度上影响提取的对话特征。

3.1.2 网络链接

虽然网络链接形成的隐性链接很少，但有更强的相似性证据。在这种情况下，当两个没有链接的会话使用相同的web链接时，就形成了一个会话链接。这是一个非常严格的要求，它强制相似性下降到一个web域的单个页面级别。直观地说，可以放宽这一要求，允许在提供相同域或类似web内容类型链接的对话之间形成链接。然而，为了量化其对于准确率的影响，我们坚持一个严格的网站链接政策，哪怕以牺牲额外的常规链接发现为代价。

推测是推特中的相关链接，如果推特A和推特B的含有同一个链接，则将A、B同时作为某个对话中的推特

4. 结果

为了验证隐式链接技术的有效性，我们通过三个不同的实验来检查这个问题。第一个实验涉及在两个数据集上使用建议的链接方法执行分类而不执行修剪。这使我们能够研究链接方法与标准分类方法的关系。第二个实验涉及使用检测期限来确定添加外部数据的影响，以及在什么时候（如果有的话）算法将获得最佳性能。第三个实验涉及使用多个分类器对修剪后的数据集进行分类，以了解链接方法、可分离性和分类性能之间的关系。

4.1 零修剪分类

与标准谣言检测相比，隐式链接谣言检测的一个主要优势是能够对数据集进行分类，而不会删除那些会产生过多噪音的数据。为了证明这一点，我们使用线性支持向量机（SVM）和10重交叉验证进行分类。对每种方法进行十次实验，并对结果进行平均。首先，所有280个对话都在Castillo数据集中进行了分类。如图1所示，当未采用修剪策略时，标准分类无法捕获区分模式。然而，随着隐式链接的增加，我们使用这三种方法进行的分类测量都有所增加。特别是，与未链接的性能相比，标签链接显示所有指标平均提高30%。网络链接也能在辨别能力上取得微小的提高。然而，这是可以接受的，因为Castillo新闻数据集的极度重复性在对话中包含非常低的可变性，导致很少有web链接匹配。对 Snopes 数据集中的所有 19,397 个对话重复相同的过程。遵循与 Castillo 数据相同的模式，当不使用隐式链接来缓解问题时，未修剪的分类再次失败。此外，较大的数据集会导致召回率严重下降。幸运的是，这两种链接方法都极大地提高了分类性能。

图 1：对 Castillo 数据集进行分类而不删除小对话会导致近乎随机的分类性能。 Hashtag 链接表现良好，而 Web 链接提高了性能，但由于难以在数据集中找到链接而受到阻碍。
图 2：与 Castillo 数据集类似，Snopes 数据集上的分类表现不佳。由于真实对话数据的广泛可变性，所有链接方法都表现良好。

4.2 早期检测和检测截止时间

通过 1.1 节给出的问题公式，之前的实验能够表明，将会话 N 中的会话数据添加到 M 中能够显着提高性能。为了确定随着时间的推移改进的程度，我们通过添加检测期限进行分类。在初始状态下，检测截止日期 $t$ 从第 0 小时开始，第一条推文被公开以进行分类。因此，在时间 $t = 0$ 时，使用 $F (N_t + M_1)$ 执行分类，其中 $N$ 是任何隐式可链接对话，如果使用隐式链接，则具有推文时间戳 $t ≤ M_1$ ，否则为 $M_1$ 。在每个连续的小时期限，即时间戳小于t的时间内的 $M_t$ 和 $N_t$ 中的所有推文都可以用于分类。
按照这个过程，在最初的检测截止日期，未链接的Snopes数据集能够正确地对大约350条推文进行分类，而隐式链接的分类正确数目是未链接的数据的两倍，即七百条推文进行分类。同样，Castillo隐式链接的数据优于未链接的分类，但差距较小。然而，随着检测截止日期的增加，更多的数据能够被合并到N中，对于两个隐式链接的数据集，在最初的六个小时内，可正确分类的实例数量显著增加。此外，与直觉相反，虽然随着时间的增加，改善增益变得微不足道，但由于合并估计的对话数据而导致的性能下降不会在前十个小时内发生。这表明，随着会话的增长，从估计数据中获得的性能增益并没有完全消除，而引入的错误变得可以忽略不计。虽然这与直觉相反，但这个结果可以通过使用平均聚合统计数据的分类过程来解释。这也表明，使用原则性的匹配过程，来自外部对话的数据可以改善一般情况下的分类结果。

4.3 剪枝分类

最佳情况下，应在不执行修剪的情况下应用隐式链接。然而，有必要使用当前最先进的方法进行分类，以便与以前的工作进行比较。使用几种最先进的谣言分类方法进行分类，包括决策树（DT）、动态序列时间结构（DSTS）、带SVM分类器的混合DSTS和RBF核方法。在之前的工作之后，只使用了10条或更多推文的对话，并使用10倍交叉验证进行分类。首先，这两个数据集在没有应用任何形式的隐式链接的情况下进行了分类。对于Castillo和Snopes数据集，使用RBF核，我们的分类准确率分别为66.2%和84.3%，如表2所示。对于这两个数据集，RBF核能够通过将特征向量投影到高维空间来提供改进的类间区分。与较简单的模型相比，很明显，未链接数据的性能差距可归因于无法线性分离的特征。

随着隐式标签链接发现的应用，Castillo 和 Snopes 数据集的分类准确率分别提高了 13.5% 和 9.9%。使用剪枝标签链接的分类结果如表 3 所示。同时，两个数据集的可分类对话量都有所提高。最大的收获是在经过显着修剪的 Snopes 数据集内——可分类实例的数量提高了三倍以上。此外，在未链接数据上看到的由可分离性困难引起的分类性能差距消失了。
在这两个数据集中，特征的鉴别质量都得到了提高，使用更简单、耗时更少的分类器，不依赖于将特征投影到更高维空间，可以获得更高的准确度。网络链接是在Snopes数据集上执行的，然而，Castillo数据集的可分类实例和高度冗余的数据数量较少，不允许发现适当数量的链接。网页链接的分类结果见表4。网络链接将几种表现不佳的方法的分类准确率提高了2-3%，同时也对召回率产生了积极影响。

5.相关工作

5.1 流行病模型

社交媒体中的信息和谣言传播与流行病有许多共同特点。有几项研究在网络和信息流上使用了流行病模型

5.2 基于用户和消息的分类

提到了之前的一些基于机器学习的研究，但是这些研究没有实用性，并且所有这些先前的工作都执行某种形式的数据修剪方法，以减少数据中的噪声并提高分类准确性。虽然当早期发现谣言不是一个因素时，这通常是一个合理的权衡，但这种做法已经在专门设计用于提供早期结果的作品中变得普遍。这会导致没有实际适用性的误导性结果。幸运的是，我们的工作为谣言检测方法提供了一个重要的基石，这将使最新的工作能够正常运行，而无需通过利用相关数据来修剪数据。

5.3 传播增强分类

最近，对话传播统计数据被证明是检测谣言的有效信息来源。Wu等人[16]采用随机游走核来衡量底层对话网络中的相似性。结果表明，这种形式的结构信息几乎与所有其他分类特征的组合一样有效。与其他方法相比，这种形式的检测加上其他特征，准确率提高了6%。虽然这种对网络结构的依赖可以取得特别好的结果，但只有在允许对话结构发展超过24小时后，才能看到最高水平的准确性。其他工作[18,9]提出了一种基于时间序列的方法，该方法可以捕捉谈话过程中标准统计数据的变化。虽然我们的贡献主要集中在早期检测上，但我们确实提出了对这些方法的修改，使谣言能够准确分类，而不管统计数据的初始数量如何，从而克服了时间序列建模固有的少数几个重大问题之一。

6.结论和今后的工作

通过利用相关对话中的信息，隐性联系可以显著提高在谣言形成阶段对谣言进行分类的能力。通过使用隐式链接，研究表明，谣言分类可以通过历史数据进行扩充，以便通过计算成本低廉的分类模型获得最先进的结果。这一发现为谣言检测方法的发展铺平了道路，使其超越了删减方法，同时在仅一条推文上保持高度的准确性。
我们发现，通过添加隐式结构，不仅可以显着改善对单个推文的谣言检测，而且通过添加估计数据获得的性能增益不会随着对话的增长而削弱性能。我们发现，基于标签的链接提供了最强的改进，与未修剪数据集上的未链接分类相比，增益高达 30%。此外，我们发现表现不佳的分类方法从剩余的隐式链接类型中得到了改进。进一步的分析表明，必须谨慎使用隐式链接，因为过多的外部对话统计数据可能会损害检测准确性。我们的实验结果表明，通过将形成的链接数量限制在 5 到 10 之间，可以获得一致的精度增益。这项工作有许多可能的扩展。虽然主题标签对于发现类似对话非常有益，但对话之间的主题标签图结构揭示了可能为早期谣言检测提供额外线索的使用模式。同样，可以将在每种类型的对话中找到的某些类型的隐式链接的亲和力用作检测特征。最后，还有许多其他形式的潜在隐含链接，例如通过文档嵌入的内容相似性，这可以为信息真实性问题提供新的见解。虽然在这项工作中没有明确探索，但多标签数据集的创建允许许多令人兴奋的探索途径。例如，隐式链接分布可能会因谣言类型而异，就像非谣言一样。这可以允许发现与谣言的真实性相关的其他特征，这些特征可以用于隐式链接创建以及改进的真实性推断。

人工智能革命：技术演进图谱与人类文明重构路径 A达峰绮人工智能重构经验分享图形绘制数据处理 AI
当GPT-4在2023年3月通过注册会计师考试时，其财务分析模块展现的推理能力已超越85%的人类考生。这个标志性事件背后，折射出人工智能正在突破认知型工作的最后防线。我们正在见证的，不仅是技术迭代，更是人类文明范式的根本性转变。一、算力奇点降临：AI基础设施的指数级进化量子计算与神经形态芯片的融合正在重塑算力边界。IBM最新数据显示，其量子体积（QuantumVolume）从2020年的64跃升至
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
对MCP工作流的一些个人认知持续学习的老赵人工智能
最近在学习MCP系统，虽尚未深入掌握，但已对其工作原理有了初步认识，在此分享下学习收获。MCP是一套能实现客户端、多种服务与大模型协同工作的系统，能处理任务请求并及时反馈。其工作流程如下：一、获取并更新服务使用方法（一）收集整理使用方法MCP正常运行依赖于对各类服务使用方法的了解，这要靠已在系统注册且可识别的功能模块。一旦有新模块注册或旧模块更新，系统会自动检测并获取其使用方法信息。MCP订阅服务
比较分析：Windsurf、Cody、Cline、Roo Cline、Copilot 和通义灵码张3蜂开源编程语言与开发技术选型与架构设计 copilot c#AI编程
随着人工智能技术的快速发展，开发者工具变得越来越智能化，特别是在代码生成、辅助编程等领域，市面上涌现了多种AI驱动的工具。本文将从开源性、集成能力、功能覆盖范围、支持的编程语言、生态兼容性、成本、学习曲线、响应速度、离线支持以及与.NETCore的适配性等十个维度对以下几种产品进行比较：Windsurf、Cody、Cline、RooCline、Copilot和通义灵码。1.开源性Windsurf:
深度学习模型性能全景评估与优化指南 niuTaylor 深度学习人工智能
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型推理NVIDIAJetsonNano仅支持FP16/FP32TFLOPS(TeraFLoating-pointOPerationsperSecond)TFLOPS=Cores×FLOPs/Cycle×Frequen
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
使用Aim追踪LangChain执行 bavDHAUO langchain python
在现代人工智能应用中，调试和可视化自动化工作流变得越来越重要，Aim正是为此而生。通过Aim，你可以轻松地追踪LangChain中语言模型(LLM)和工具的输入输出，以及代理的动作，从而在执行过程中快速定位和解决问题。此外，Aim还支持并排比较多个执行流程，使之成为调试中的得力助手。Aim是一个完全开源的项目，你可以在GitHub上找到更多关于Aim的信息。在本文中，我们将展示如何启用和配置Aim
从零开始：使用原生JS打造简易飞机大战游戏西域情歌
本文还有配套的精品资源，点击获取简介：在本教程中，我们将探讨如何利用原生JavaScript的特性，包括事件处理、DOM操作、定时器和音频处理，来构建一个基础的“飞机大战”游戏。该游戏的核心元素包括玩家飞机、敌机、子弹和碰撞检测，它们通过HTML和CSS展现在页面上。通过编写JavaScript脚本，我们实现游戏对象的创建与状态管理，响应用户的键盘和点击事件，更新游戏内容，并通过定时器维护游戏循环
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
深度优先搜索（DFS）完全解析：从原理到 Java 实战 my_realmy Java基础知识深度优先 java 算法
深度优先搜索（DFS）完全解析：从原理到Java实战@TOC作为一名程序员，你是否遇到过需要在复杂的图结构中寻找路径、检测环，或者进行树遍历的问题？深度优先搜索（Depth-FirstSearch,DFS）作为一种经典的图遍历算法，能够轻松应对这些场景。在CSDN社区中，技术文章的受欢迎程度往往取决于内容的实用性、代码的可读性以及图文结合的讲解方式。因此，本文将为你带来一篇深入浅出、图文并茂、代码
储能EMS dongzengwu 网络运维服务器
储能EMS5.1系统网络结构储能EMS应用层通过与PCS的交互实现有功功率控制、无功功率控制、黑启动控制、调峰调频等储能特色功能，可以满足绝大多数储能项目的功能需求，实现储能经济利用提供了完善的、可实话的技术手段。系统结构示意图如下图所示：功能参数储能EMS系统包含运行监测、故障告警、参数设置、数据报表、曲线显示以及应用工具主要检测信息包含：储能电池信息、电量信息、功率曲线、PCS总充电量放电量和
分享12个国内AI对话聊天的免费网站（含DeepSeek大模型）码上飞扬人工智能语言模型 DeepSeek
在人工智能领域，基于对话的语言模型已成为当前研究的热点，其中以ChatGPT为代表的模型凭借其卓越的语言理解与交互能力备受瞩目。为帮助用户更好地选择和使用这类AI工具，本文将介绍12个国内可直接体验对话聊天功能的平台，为用户提供实用参考。1、腾讯元宝地址：https://hunyuan.tencent.com/bot/chat腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预
《今日AI-人工智能-编程日报》-源自2025年3月21日小亦编辑部人工智能
一、AI编程领域最新动态AI编程工具崛起，程序员职业面临挑战Anthropic首席执行官DarioAmodei预言，未来一年内，90%的代码将由AI生成，传统程序员的工作可能被大幅替代。最新发布的AI编程模型（如Claude3.7、Sonnet3.7）在初级开发评估中表现优异，得分率超过60%，部分模型甚至在全球程序员排名中位列前0.1%。字节跳动的Trae海外版接入Claude3.7和GPT-4
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
普通人学习AI应该如何入手？2025年最新AI大模型学习路线+全套学习资料，适合新手小白！小城哇哇人工智能学习大数据语言模型 AI大模型 agi ai
引言随着人工智能（AI）技术的飞速发展，越来越多的人开始意识到掌握这项技能的重要性。然而，对于许多没有编程背景或数学基础的人来说，进入AI领域似乎是一个遥不可及的梦想。但实际上，通过合理的规划和适当的学习资源，任何人都可以逐步掌握AI的核心知识，并应用到实际工作中去。本文将为普通读者提供一份详细的2025年最新AI大模型学习路线图，并附带一套完整的自学资料，帮助您从零基础起步，顺利开启AI学习之旅
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（二）5.跨模态检索系统应用场景5.1图文匹配系统的实际应用应用领域具体场景优势电子商务商品图像搜索、视觉购物用户可以上传图片查找相似商品或使用文本描述查找商品智能媒体内容推荐、图片库搜索通过内容的语义理解提供更精准的推荐和搜索社交网络基于内容的帖子推荐理解用户兴趣，提供更相关的内容推荐教育技术多模态教学资源检索教师和学生可以更
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
知识蒸馏：让大模型“瘦身“而不失智慧的魔术一休哥助手人工智能人工智能
引言：当AI模型需要"减肥"在人工智能领域，一个有趣的悖论正在上演：大模型的参数规模每年以10倍速度增长，而移动设备的算力却始终受限。GPT-4的1750亿参数需要价值500万美元的GPU集群运行，但现实中的智能设备可能只有指甲盖大小。这种矛盾催生了一项神奇的技术——知识蒸馏（KnowledgeDistillation），它就像给AI模型进行"脑外科手术"，将庞然大物的智慧浓缩到轻量模型中。第一章
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
CVPR2025 | 对抗样本&智能安全方向论文汇总 | 持续更新中~ 四口鲸鱼爱吃盐文献阅读安全 transformer 深度学习对抗样本神经网络视觉语言模型后门攻击
汇总结果来源：CVPR2025AcceptedPapers若文中出现的论文链接和GitHub链接点不开，则说明还未公布，在公布后笔者会及时添加.若笔者未及时添加，欢迎读者告知.文章根据题目关键词搜索，可能会有遗漏.若笔者出现遗漏，欢迎告知.部分文章还未公布正文，只有名称.MindtheGap：通过查询更新分析检测正在进行中的黑盒对抗攻击MindtheGap:DetectingBlack-boxAd
使用大语言模型API在AI应用中的实现 qq_37836323 人工智能语言模型自然语言处理 python
随着人工智能技术的迅速发展，大语言模型（LLM）在自然语言处理（NLP）领域的应用越来越广泛。本文将介绍如何使用大语言模型API来实现一些基础的AI应用，并提供一个简单的demo代码，帮助大家更好地理解和使用这些技术。大语言模型API简介大语言模型（如GPT-4）能够理解和生成类似人类的文本。这些模型可以应用于各种任务，包括文本生成、语言翻译、情感分析、对话系统等。为了方便国内用户访问这些强大的模
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
【深度学习】DeepSeek模型介绍与部署 Nerous_ 深度学习深度学习人工智能
原文链接：DeepSeek-V31.介绍DeepSeek-V3，一个强大的混合专家(MoE)语言模型，拥有671B总参数，其中每个token激活37B参数。为了实现高效推理和成本效益的训练，DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了充分验证。此外，DeepSeek-V3首次提出了无辅助损失的负载平衡策略，并设置了多to
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
stm32完全学习——NRF24L01模块小A159 STM32完全学习 stm32 学习嵌入式硬件
对于这个模块的移植，无论是标准库还是HAL库，无论是软件模拟SPI还是，硬件SPI通信，网上都有很多的例子，这里关于移植的事情就不再赘述了。一、调试中遇到的一些问题我是用的别人的代码进行移植的，使用的是软件模拟SPI时序，在进行通信的时候，可以正确检测到NRF24L01的存在，但是发送数据和接收数据都不能成功的运行，本来以为是发送的时候数据包设置的不正确，后来发现他的代码里面使用软件SPI里面的延
【DNN量化工具】QKeras 工具简介 kanhao100 笔记 dnn 人工智能神经网络
QKeras工具简介QKeras是一个用于量化深度学习模型的Keras扩展库，旨在使深度学习模型的量化（即将模型的浮点权重转换为低精度格式）变得简单而高效。QKeras主要目标是优化模型的存储和推理速度，特别适用于需要在资源受限的设备（如移动设备和嵌入式系统）上运行深度学习模型的场景。QKeras的主要特点量化支持：QKeras提供了对不同类型量化的支持，包括权重量化和激活量化。用户可以根据需求选
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option