CS_木成河

【论文阅读】Graph Fusion Network for Text Classification

基于图融合网络的文本分类

原论文链接地址：https://www.sciencedirect.com/science/article/abs/pii/S0950705121009217
论文作者：Yong Dai, Linjun Shou, Ming Gong, Xiaolin Xia, Zhao Kang, Zenglin Xu, Daxin Jiang

GFN

GNN方法存在两个主要局限性：（1）这些方法无法轻松适应新文档；（2）其中大多数忽略了文本图的质量。这些阻碍了其在实际场景中的广泛应用。GFN由图构造阶段和图推理阶段组成。在图构建阶段，GFN设法克服了上述两个限制。具体来说，对于第一个限制，GFN没有将所有文档预先定义为文本图中的节点，而是放弃文档级节点，构建纯单词级文本图。为了生成文档嵌入，GFN根据文档级别的结构信息实时融合单词嵌入。这样，当面对新文档时，系统不需要重建文本图和重新训练学习系统。对于第二个限制，众所周知，构建一个能够准确捕获所有结构知识的理想文本图是一项重要的任务，而用不同的方法构建文本图可能包含不同的信息视图。因此，GFN通过将外部知识（即预先计算的共现统计和预先训练的嵌入）转换为结构信息来构建不同的语料库级别的图，并将它们集成以相互补偿。
在图推理过程中，GFN采用三个步骤（即图学习、图卷积和图融合）来提高系统性能。首先，GFN添加了一个图学习步骤来调整初始化的边权重，以更好地服务于任务。然后，GFN采用消息传递机制进行图卷积计算。最后，GFN应用了一种晚期融合范式（即融合逻辑或最终决策结果），它由一个精心设计的基于多头的融合模块组成，以在图融合步骤中整合来自每个图的结果。重要的是，与早期融合范式（即特征级融合）不同，晚期融合带来了许多优势。首先，它避免了由于噪声和每个图中包含的无关信息而造成的早期交叉污染。其次，它继承了集成学习的鲁棒性和良好的经验性能。第三，晚期融合范式保留了多样性表征能力。GFN的算法流程图如图1所示。

图1 算法流程图。首先为每个文档 $d_k$ 构建文本图{ $G_{s,d_k}(V_{d_k}，E_{s,d_k})$ } $_{s=1}^{4}$ ，然后调整文档级文本图以更好地服务于分类任务，实现图卷积，最后整合所有逻辑以获得更好的决策边界。

1.文本图的构造

(1)符号标记

文本图表示为{ $G_s=(V，E_s)$ } $_{s=1}^{n_G}$ ，其中V（|V|=n）和E_s是相应文本图的节点集和边集。s∈ [1，n_G]是文本图索引，n_G=4，这意味着在该文中构建了四种语料库级文本图。V由语料库中的所有单词组成。e_s,ij（E_s的元素）表示单词w_i和w_j之间的关系，这是通过指标计算的。此外，将节点特征矩阵表示为 $X∈ R^{n×d}$ 和节点特征向量 $x_i∈ R^{d}$ （即嵌入单词w_i），其中d是特征维度。存在邻接矩阵 $A_s∈ R^{n×n}$ 对应于每个E_s，其中包括所有字对字关系。E_s可以视为A_s的子集，在某些条件下会被过滤和保留。例如，如果元素a_s,ij在A_s中的值（按某个度量计算）等于零，这意味着单词i和单词j之间的关系很弱，不会包含在E_s中。系统的学习过程为：

更新每个边集E_s，其中的元素由公式初始化和计算；
更新节点特征矩阵X；
更新其他网络参数。

实际上，为每个文档 $d_k$ 构建子图{ $G_{s, d_k}=（V_{d_k}，E_{s,d_k}）$ } $_{s=1}^{4}$ ，并逐步迭代地更新系统，其中 $V_{d_k}$ 中的节点是文档中的单词，边集 $E_{s,d_k}$ 是 $E_s$ 的子集。

(2)图构造

基于以下知识和四个不同的度量构造每个文本图 $G_s(V，E_s)$

1. 基于共现统计的图构造
共现统计使从业者能够在较高的水平上理解给定文本文档中所说的内容，这已通过许多预训练模型进行了验证，例如word2vec、GloVe等。单词-单词共现矩阵的每个条目都是以单词w_i的出现为条件，单词对（w_i，w_j）出现概率的最大似然估计值（MLE），其公式如下：
$P_{ML}(w_i|w_j)=\frac{\#(w_i,w_j)}{\#(w_i)}$
它表示两个单词（w₁、w₂）的全局关系。在这个公式中， $w_i)$ 是单词w_i的出现次数， $w_i,w_j)$ 是两个单词在预定义和固定大小的窗口L中一起出现的次数。如前所述，单词共现分析发现单词对之间的意思相似，因此我们让 $e_{ij}=P_{ML}（w_j | w_i）$ ，其中值越大，关系越密切。

2. 基于正逐点互信息的图构造
逐点互信息（PMI）被广泛用于单词相似性任务。通过考虑语料库中的实际观察次数，可以根据经验对其进行估计：
$PMI(w_i,w_j)=log\frac{\#(w_i,w_j)·|D|}{\#(w_i)·\#(w_j)}$
其中D是单词对的集合，|D|是单词对计数。 $PMI(w_i,w_j)$ 通过计算它们的联合概率及其边际概率之比的对数来衡量单词对 $w_i,w_j)$ 之间的关系。负PMI通常意味着单词之间的弱关联，因此采用了正PMI（PPMI）度量：
$PPMI(w_i,w_j)=max(PMI(w_i,w_j),0)$
PPMI度量可以被视为共现度量的重加权变体。在某些场景中，PPMI表现得更好，比如语义相似性任务。因此，可以设置 $e_{ij}=PPMI（w_i,w_j）$ 。

3. 基于预处理嵌入余弦相似性的图构造
良好的表达可以捕获隐藏在文本数据中的隐含语言规则和常识知识，例如词汇意义、句法结构、语义角色，甚至语用。因此，衡量单词之间关系的另一个合理方法是利用预先训练的单词嵌入。为了从单词嵌入中提取知识并测量单词对之间的关系，本文选择余弦相似性和欧氏距离作为两种度量，因为余弦相似性和欧氏距离已经被广泛用于测量句子对关系和单词对关系。欧氏距离更关注大小差异，而余弦相似性更关注方向（角度）。具体来说，单词对的余弦相似性由以下公式表示：
$cos(x_i,x_j)=\frac{x_i·x_j}{|x_i|·|x_j|}$
其中，x_i和x_j分别是单词w_i和w_j的嵌入。值越大，两个单词之间的距离越近。

4. 基于预处理嵌入欧氏距离的图构造
单词对的欧氏距离公式为： $euc(x_i,x_j)= ||x_i-x_j||_2$

5.为每个文档构建子图
基于这四个度量构建四种语料库级文本图。为了避免来自不相关关系的噪声，本文排除了由四个度量计算的负值或较小值的关系。考虑到内存消耗，本文在小批量文档上训练GFN，而不是每一步都训练整个文档。为每个文档 $d_k$ 构建子图{ $G_{s, d_k}=（V_{d_k}，E_{s,d_k}）$ } $_{s=1}^{4}$ 。节点集 $V_{d_k}$ 由 $d_k$ 中的m个单词组成，k是文档索引。边集 $E_{s,d_k}$ 是从 $E_s$ 获取的。此外，当 $w_j$ 位于 $w_i$ 的词尾时，我们将 $w_i$ 和 $w_j$ 之间的一条边添加到 $G_{s, d_k}$ 中，因为这类信息有利于中心词 $w_i$ 的表示。总体而言，文档级子图包括两种关系：语料库级关系和邻域关系。

2.图推理

本节展示了GFN的推理过程。GFN通过以下三个步骤对文档级子图进行推理：图学习、图卷积和图融合。

(1)图学习

假设预先计算的 $E_s$ 可能不是最优的，需要根据下游任务进行调整。对于 $w_i$ 和 $w_j$ 之间的边 $e_{s,ij}$ ，学习过程可以表述为： $\tilde{e} _{s,ij}=ReLU(a_{s,ij} · e_{s,ij})$ ，其中ReLU(·)=max(0，·)， $a_{s,ij}$ 是一个可学习参数。ReLU保证了 $\tilde{e} _{s,ij}$ 的非负性。通过公式，可以导出文档 $d_k$ 的自适应文本子图 $\tilde{G}_{s, d_k}(V_{d_k},\tilde{E}_{s,d_k})$ 。

(2)图卷积

在图学习之后，采用消息传递机制来聚合来自邻居的信息，并通过吸收聚合的信息来更新节点特征。如果消息传递阶段为T个时间步长，则中间时间步长的聚合函数可以表示为：
$m_{s,i}^{t+1}=\frac{1}{|Nei(w_i)|} \sum_{j=1}^{|Nei(w_i)|}(\tilde{e} _{s,ij}·h_{s,j}^{t+1})$
其中 $Nei(w_i)|$ 是 $w_i$ 的邻居数， $h_{s,j}^{t+1}∈ R^{1×d_h}$ 是 $w_i$ 邻居的中间隐藏状态，j是 $w_i$ 邻域词的索引和 $d_h$ 是隐藏状态的维度。
每个节点 $w_i$ 的隐藏状态 $h_{s,i}^{t+1}∈ R^{1×d_h}$ 通过吸收邻域消息来更新，根据公式： $h_{s,i}^{t+1}=h_{s,i}^{t}+m_{s,i}^{t+1}$
$h_{s,i}^{t+1}$ （ $w_i$ 的隐藏状态）由上次的隐藏状态及其邻居的消息组成。在单词级特征更新后，我们可以通过以下方式获得每个文档的表示和最后logits（即Softmax之前的非正规概率）：
$d_{s,k}=\frac{1}{|d_k|}\sum_{i=1}^{|d_k|}(h_{s,i}^{T}|\forall w_i \in d_k),$
$logits_{s,k}=ReLU(d_{s,k})W_s$
其中 $d_{s,k}∈ R^{1×d_h}$ ， $W_s∈ R^{d_h×c}$ ， $logits_{s,k}∈ R^{1×c}$ ，c表示类别数。 $d_{s,k}$ （文档的嵌入）是通过平均文档 $d_k$ 中所有单词的最后隐藏状态得到的。将 $d_{s,k}$ 投影到标签空间，以获得最终的logits $logits_{s,k}$ 。

(3)图融合

下标s（s∈ [1，4]）表示每个文档有4种视图。为了集成不同的视图并搜索一致的决策边界，该论文设计了一个融合模块。具体来说，首先连接 $logits_{s,k}$ ：
$logits_k=||_{s=1}^{4}logits_{s,k}$
其中，||是连接运算符和 $logits_k∈ R^{1×c×4}$ 。受其他论文的启发，该论文开发了一种多头部变体作为融合算子，以充分利用模型的容量，其公式如下：
$head_i=Γ_{φ_i}(logits_k)$
其中 $Γ_{φ_i}$ 是由 $φ_i$ 参数化的融合算子， $head_i∈ R^{1×c}$ 是第i个 $(i \in [1 ， ∣ h ∣])$ 融合意见的头。融合算子 $Γ_{φ_i}$ 的目的是将4种不同的意见融合为一致的意见，这是整个系统性能的关键。实际上，本文使用核大小为 $[4 ， ∣ h ∣ ， 1]$ 的卷积层来聚合不同的观点。卷积的行为就像一个加权池，将多视图意见简化为单个决策。
然后，|h|决策头部被平均化，以生成文档 $d_k$ 的最终决策：
$\hat{logits_k}=\frac{1}{|h|}\sum_{i=1}^{|h|}head_i$
$\hat{y_k}=Softmax(\hat{logits_k})$
其中，|h|是头数， $\hat{logits_k}∈ R^{1×c}和\hat{y_k}∈ R^{1×c}$ 。融合过程如图2所示。

图2 图融合过程。每个头接受四个logit，代表属于每个类别的非正规概率的不同view，并输出综合决策。多个头获得不同的决策，这些决策将通过softmax函数进一步平均和规范化。

最后，最小化了模型优化中基本真值标签 $y_k$ 和预测标签 $\hat{y}_k$ 之间的交叉熵损失：
$−\sum_{k}y_klog\hat{y}_k$

实验结果

GFN在五个基准数据集上使用两组基线的性能。表2给出了精度测试结果。总体而言，GFN的性能始终优于其他基线。具体来说，GFN在20NG、Oh和MR上分别获得0.8701、0.7020和0.7804，这与之前的工作相比是明显的提升。
R8和R52的改进并不明显，作者认为这是因为：
（1）这些数据集的任务比其他数据集的简单，所以它们对复杂的功能编码器没有强烈的要求。
（2）这两个数据集的精度太高，无法提高。

Micro-F1和Macro-F1的结果如表3所示，从中可以观察到与基线相比有明显的提高。

探讨每个文本图的有效性。为此轮流将GFN与每个单个文本图（即PMI、余弦相似性、欧氏距离和共现）相适应，并在没有融合模块的情况下测试系统性能。通过采用不同的图（表示为“mi”、“cos.”、”uc.“和”co.“），给出了系统性能，如表4所示。
可以得出结论，每个文本图捕获的结构信息都是不同的，这导致了不同的性能。PMI诱导文本图和欧氏距离诱导文本图支持的GFN表现良好，而具有共现诱导图的GFN则表现较差。

评估有多少头足够系统。作者用GFN做了不同头部的实验。结果如表5所示，从中可以看出，GFN采用三个头时表现最好。

结论

在该论文中，作者提出了一种图融合网络（GFN），它支持对新文档的有效推理，而无需对系统进行再训练，并且可以通过整合文本图的不同视图更好地捕获结构信息。实验结果表明了该方法的优越性。特别是，不同的图视图是互补的，精心设计的多头部融合模块可以进一步提高系统性能。GFN将两种知识转换为结构化信息，以捕获信息的不同方面，但构建理想文本图的问题也未得到解决。可以继续探索其他方法来构建包含更多信息的文本图或自动构建文本图。另一方面，预先训练的模型（如BERT）由于其出色的性能，已经主导了包括文本分类在内的许多领域，而基于GNN的模型也有其优势。因此，对BERT风格模型和基于GNN的模型进行全面的比较分析是有价值的。

原论文链接地址：https://www.sciencedirect.com/science/article/abs/pii/S0950705121009217

从零开始：Python实现语音识别的完整教程_副本 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别开发语言 ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、语音转文本、音频处理、机器学习、深度学习、自然语言处理摘要：本文将带你从零开始学习如何使用Python实现语音识别功能。我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。背景介绍
面向大语言模型幻觉的关键数据集：系统性综述与分类法致Great 语言模型人工智能自然语言处理
面向大语言模型幻觉的关键数据集：系统性综述与分类法摘要大语言模型（LargeLanguageModels,LLMs）在自然语言处理的多个领域取得了革命性进展，但其固有的“幻觉”问题——即生成看似合理但与事实不符或与上下文无关的内容——严重制约了其在关键应用中的可靠性与安全性。为了系统性地评估、理解并缓解LLM的幻觉现象，学术界和工业界开发了大量多样化的数据集与基准。本文对大模型幻觉领域的关键数据集
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
推荐几本人工智能方面的书（入门级）人邮异步社区人工智能深度学习神经网络
以下推荐几本适合入门人工智能的书籍，帮助你逐步建立基础知识和理解：一、数学基础类《数学之美》推荐理由：深入浅出地讲解了自然语言处理与搜索方向的数学原理，对于理解算法背后的数学逻辑非常有帮助。本书的章节名称，有“统计语言模型”“谈谈中文分词”“贾里尼克和现代语言处理”“布尔代数和搜索引擎”“信息指纹及其应用”等，似乎太过专业，实际上高中和大学低年级的同学们都能看得懂，当然本书因此也可以称得上是“高级
自然语言处理(NLP)中的文本生成控制技术 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据自然语言处理 easyui 人工智能 ai
自然语言处理(NLP)中的文本生成控制技术关键词：文本生成、可控生成、语言模型、Prompt工程、解码策略、条件控制、评估指标摘要：本文深入探讨自然语言处理中文本生成控制技术的最新进展。我们将从基础概念出发，系统分析各种控制方法的原理和实现，包括Prompt设计、解码策略优化、条件控制机制等核心内容。文章将结合数学模型、算法实现和实际案例，全面展示如何实现高质量、可控的文本生成，并探讨该领域面临的
Python爬虫实战：研究difflib库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui 开发语言前端 difflib
1.引言1.1研究背景与意义在信息爆炸的数字时代，互联网每天产生海量文本内容。据统计，全球新闻网站日均发布文章超过300万篇，社交媒体平台产生的文本信息量更以亿级单位增长。这种信息过载带来了内容同质化、抄袭剽窃等问题，给新闻媒体行业、学术研究领域和搜索引擎优化等带来了挑战。文本相似度分析作为自然语言处理的重要分支，能够有效识别内容间的相似程度，具有重要的应用价值：新闻媒体行业：通过检测新闻抄袭和重
DeepSeek：AI驱动的效率革命与实战案例解 weixin_45788582 人工智能 ai DeepSeek
在人工智能技术的浪潮中，DeepSeek作为一款专注实现AGI（通用人工智能）的先锋工具，正通过其强大的自然语言处理（NLP）与分布式计算能力，重新定义高效办公的边界。以下通过技术解析与实战案例，展现DeepSeek如何赋能个人与企业，开启职场效率革命。一、技术革新：DeepSeek的核心竞争力深度学习赋能DeepSeek的技术架构基于BERT、Transformer等先进深度学习模型，通过构建复
AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
Java AI 新纪元：Spring AI 与 Spring AI Alibaba 的崛起小沛9 Spring AI Alibaba Spring AI java 人工智能 spring spring ai SAA
此章节没什么营养，只是一个描述，同时也能看到AI的能力（文章基本都是AI进行生成的），小沛觉得开始不写点引言好像差了点什么东西，好像鱼离开了自行车。引言：AI时代对Java开发者的机遇与挑战，Java在AI领域的现状在当今技术飞速发展的时代，人工智能（AI）已不再是遥不可及的未来概念，而是深刻地融入到我们生活的方方面面，从智能推荐系统到自动驾驶，从自然语言处理到计算机视觉，AI正以前所未有的速度改
大模型本地部署，拥有属于自己的ChatGpt 小妖同学学AI chatgpt
ChatGpt以其强大的信息整合和对话能力惊艳了全球，在自然语言处理上面表现出了惊人的能力。不管用于文案撰写还是程序辅助开发都大大提高了我们的工作效率，但是其使用有一定的门槛，让我们大多数人都望而却步，今天我们利用ollama实现本地大模型的步骤，让我们轻松拥有自己的人工智能。Ollama作为一个轻量级的工具，可以帮助用户在本地运行这些大型语言模型，无需持续依赖云服务，既保护了数据隐私，又能减少网
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
信息抽取领域关键Benchmark方法：分类体系
信息抽取领域关键Benchmark方法：分类体系摘要信息抽取（InformationExtraction,IE）作为自然语言处理的核心任务之一，旨在从非结构化文本中识别并结构化关键信息（如实体、关系、事件等），广泛应用于知识图谱构建、智能问答和数据分析等领域。近年来，随着深度学习技术的快速发展，信息抽取方法在性能和应用范围上取得了显著进步，但同时也面临着任务多样性、跨领域泛化性以及低资源场景下的适
TensorFlow：开启智能时代的引擎科技林总 DeepSeek学AI 人工智能
想象一下，计算机能看懂病历、汽车能自动驾驶、机器能创作艺术——这一切的核心，正是深度学习的力量。而推动这场革命的引擎之一，就是今天的主角：**TensorFlow**。---###**一、背景：为什么需要TensorFlow？1.**深度学习的爆发**-传统编程无法解决图像识别、自然语言处理等复杂问题。-神经网络需要高效工具处理海量数据和计算。2.**Google的答案**-2015年开源Tens
浅谈卷积神经网络(CNN) cyc&阿灿 cnn 人工智能神经网络
卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习领域最具影响力的架构之一，已在计算机视觉、自然语言处理、医学影像分析等领域取得了革命性突破。本文将系统全面地剖析CNN的核心原理、关键组件、经典模型、数学基础、训练技巧以及最新进展，通过理论解析与代码实践相结合的方式，帮助读者深入掌握这一重要技术。一、CNN基础与核心思想1.1传统神经网络的局限性在处理图像等
[论文阅读] 软件工程 | 需求工程中领域知识研究：系统映射与创新突破张较瘦_ 前沿技术论文阅读软件工程
需求工程中领域知识研究：系统映射与创新突破论文信息DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyarXiv:2506.20754DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyMarinaAraújo,JúliaAraújo,RomeuO
卷积神经网络亿只小灿灿 Python 算法与数据结构人工智能 cnn 人工智能神经网络
一、引言在当今人工智能的浪潮中，卷积神经网络（ConvolutionalNeuralNetwork，CNN）无疑是一颗璀璨的明星。它在图像识别、语音处理、自然语言处理等众多领域取得了巨大的成功，极大地推动了人工智能技术的发展。那么，什么是卷积神经网络？它的算法原理是什么？本文将深入探讨这些问题，并通过Python代码实现一个简单的卷积神经网络，以帮助读者更好地理解和掌握这一强大的技术。二、卷积神经
理解不同层的表示（layer representations）科学禅道高维表示人工智能深度学习
在机器学习和深度学习领域，特别是在处理音频和自然语言处理（NLP）任务时，"层的表示"（layerrepresentations）通常是指神经网络不同层在处理输入数据时生成的特征或嵌入。这些表示捕获了输入数据的不同层次的信息。1.层的表示（layerrepresentations）为了更好地理解这一概念，我们可以从以下几个方面进行解释：1.深度神经网络结构深度神经网络（DNN）通常由多个层组成，每
微软人工智能证书AI-102 | 如何快速通过？全球认证考试中心人工智能微软
微软AI-102考试，全称“DesigningandImplementingaMicrosoftAzureAISolution”，是微软推出的用于验证考生在Azure平台上设计和实施AI解决方案核心能力的认证考试。以下是具体介绍：考试描述：考试主要衡量考生实施计划和管理Azure认知服务解决方案、计算机视觉解决方案、自然语言处理解决方案、知识挖掘解决方案、对话式AI解决方案的能力。考试题型通常包括
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
embedding模型有哪些？如何选择合适的embedding模型？行云流水AI笔记 embedding
embedding模型是一种将数据映射到低维空间的模型，常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型：Word2Vec：CBOW（ContinuousBag-of-Words）：通过上下文预测中心词。Skip-Gram：通过中心词预测上下文。GloVe（GlobalVectorsforWordRepresentation）：结合了词频统计和Word2Vec的
Transformer底层原理解析及基于pytorch的代码实现 LiRuiJie 人工智能 transformer pytorch 深度学习
1.Transformer底层原理解析1.1核心架构突破Transformer是自然语言处理领域的革命性架构，其核心设计思想完全摒弃了循环结构，通过自注意力机制实现全局依赖建模。整体架构图如下：以下是其核心组件：1）自注意力机制（Self-Attention）-输入序列的每个位置都能直接关注所有位置-数学公式（缩放点积注意力）：-Q：查询矩阵（当前关注点）-K：键矩阵（被比较项）-V：值矩阵（实际
Python爬虫实战：研究TextBlob相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 html TextBlob
1.引言1.1研究背景与意义随着互联网技术的飞速发展，社交媒体已成为人们获取信息和表达观点的重要平台。每天在社交媒体上产生的海量文本数据蕴含着丰富的情感信息和社会舆情，分析这些文本情感倾向，有助于企业了解消费者对产品和服务的评价，政府部门监测社会舆论动态，研究机构探索公众对热点事件的态度。情感分析（SentimentAnalysis）作为自然语言处理的重要分支，旨在通过计算方法识别和提取文本中的主
对话云蝠智能：大模型如何让企业呼叫系统从 “成本中心” 变身 “价值枢纽”？ MARS_AI_ 人工智能自然语言处理信息与通信交互
在人工智能重塑企业服务的浪潮中，云蝠智能（南京星蝠科技有限公司旗下品牌）以深厚的技术积累和行业实践，逐步成长为国内智能外呼领域的标杆企业。其发展路径揭示了技术自主创新与场景深度结合的必然性。一、技术架构：全栈自研奠定领先基础云蝠智能的核心竞争力源于其全链路自研技术体系。该架构覆盖语音识别（ASR）、自然语言处理（NLP）、语音合成（TTS）及软交换六大层级，实现从基础设施到操作层的闭环设计。这一分
入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15% hyperai
在人工智能技术突飞猛进的当下，大型视觉-语言模型（LVLMs）正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域，这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持，已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域，LVLMs通过对TB级文本语料的学习，在机器翻译、文本摘要、情感分析等任务上达到专业级水准，其生成的学术摘要甚至能精准提炼医学文献的核心结论。然而当
合规视角下银行智能客服风险防控 AI 智能服务智能客服人工智能 AIGC 数据库 chatgpt
1.AI驱动金融变革的政策与技术背景政策导向：我国《新一代人工智能发展规划》明确提出发展智能金融，要求：构建金融大数据平台，提升多媒体数据处理能力；创新智能金融产品与服务形态；推广智能客服、监控等技术应用；建立智能风控预警体系。技术支撑：云计算、大数据技术成熟为AI发展奠定了基础。深度学习算法的突破则引爆了本轮AI浪潮，显著提升了复杂任务处理精度，进而推动了计算机视觉、机器学习、自然语言处理（NL
GRU与Transformer结合：新一代序列模型 AI大模型应用工坊 gru transformer 深度学习 ai
GRU与Transformer结合：新一代序列模型关键词：GRU、Transformer、序列模型、结合、深度学习摘要：本文深入探讨了GRU与Transformer结合所形成的新一代序列模型。先介绍了GRU和Transformer各自的核心概念及工作原理，然后阐述了二者结合的原因、方式和优势。通过代码实际案例展示了如何搭建结合的模型，还探讨了其在自然语言处理、语音识别等领域的实际应用场景。最后对未
《AI办公类工具PPT系列之七——智谱清言》再见孙悟空_ 【2025 AI工具合集】人工智能 iSlide AI AI智能PPT powerpoint AI PPT PPT
一.简介官网地址为chatglm.cn智谱清言（也被称为ChatGLM）是一款基于大模型技术的人工智能产品，旨在通过其强大的自然语言处理能力，为用户提供高效、智能的交互体验。该产品不仅具备广泛的应用场景，还能够在多个领域内实现深度学习和自我优化。二.功能介绍内容创作：创意写作：帮助用户进行故事、诗歌等文学作品的创作。媒体写作：辅助撰写新闻稿、社交媒体帖子等内容。写作辅助：提供写作建议、结构安排和编
[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin