图学习小组

GraphGPT： Graph Instruction Tuning for Large Language Models

GraphGPT：Graph Instruction Tuning for Large Language Models

基本信息

博客贡献人

猪八戒

作者

Jiabin Tang , Yuhao Yang , Wei Wei

[单位]

香港大学数据智能实验室

摘要

图神经网络（GNN）通过图节点之间的递归信息交换和聚合来实现高级图结构理解。为了提高模型的稳健性，自监督学习（SSL）已成为一种有前途的数据增强方法。然而，现有的得到预训练图嵌入的方法通常要依赖特定下游任务的标签进行微调，这限制了它们在标记数据稀缺或不可用的场景中的可用性。为了解决这个问题，我们的研究重点是提高图模型在具有挑战性的零样本学习场景中的泛化能力。受大语言模型（LLM）的启发，我们的目标是开发一种面向图的 LLM，即使没有下游图数据中的任何可用信息，也可以在不同的下游数据集和任务中实现高度泛化。在这项工作中，我们提出了 GraphGPT 框架，该框架使用设计的图指令微调范式，将LLMs与图结构知识进行对齐。我们的框架包含一个Text-Graph组件，以在文本信息和图结构之间建立联系。此外，我们提出了一种双阶段指令微调范式，并配有轻量级Text-Graph对齐映射器。该范例探索了自监督图结构信号和特定任务的图指令，以指导LLMs理解复杂的图结构并提高其在不同下游任务中的适应性。我们的框架在有监督和零样本图学习任务上进行了评估，展示了卓越的泛化能力并超越了最先进的baseline。

现有挑战&动机

总的来说，将大语言模型与图学习结合是一项具有挑战性的任务：

结构信息与语言空间的对齐: 图数据具有自身的结构和特性，而大语言模型主要在语言空间中进行训练和表示学习。如何有效地将图结构信息与语言空间进行对齐，使得模型能够同时理解图的结构和语义信息，是一个重要的问题。
引导大语言模型理解图的结构信息: 为了使大型语言模型能够有效地理解图的结构信息，需要设计适当的指令目标来要求模型理解图数据中的结构信息。
赋予大语言模型图学习下游任务的逐步推理能力: 在图学习的下游任务中，逐步推理是一个重要的能力。这意味着模型需要根据图的结构信息和语义信息，逐步推断出更复杂的关系和属性。

LLM建模图结构的困难

为了更深入地理解使用纯基于文本的提示语直接提示LLM来进行图结构建模的限制，图1提供了说明性示例。这些例子有助于对GraphGPT框架和ChatGPT方法之间的比较分析。我们关注于一个具有代表性的节点分类任务，其目标是预测给定论文的类别。在图1 (a)和图1 (b)中，我们展示了使用ChatGPT的两个场景的预测结果： (1)只使用输入节点的文本数据，以及(2)使用基于文本的图结构感知提示，这些提示的灵感来自于最近研究中的提示设计。这些图突出了仅依赖基于文本的提示进行图结构建模时出现的潜在限制，这可以从给出的不正确的论文节点分类结果中得到证明。相比之下，我们的GraphGPT框架通过保存和利用图结构信息，有效地解决了这些限制，如图1 ©.所示它能够准确地识别论文的类别，以理解底层的图结构。

图1 LLM在理解图结构上下文时的局限性

此外，使用基于文本的结构性提示会导致token大小的增加，这在实际场景中带来了挑战。较长的token序列会导致更高的计算和内存成本，这使得它在现实应用中不太可行。此外，现有的LLM有token限制，这进一步限制了更长的基于文本的提示在大规模图结构建模中的适用性。这些限制强调了更有效和可扩展的方法的必要性。

方法

方法架构图

图2 GraphGPT总体架构

方法描述

用Text-Graph对齐编码结构信息

为了更有效地将大语言模型与图结构对齐，本节探索了与大语言模型良好协作的图结构编码方式。受之前的研究启发，本文在预训练中使用对比学习将文本信息融入图结构的编码过程中。然后将预训练后的图编码器集成到 GraphGPT 模型框架中，从而无缝地整合图编码器的功能。在 GraphGPT 中，图结构编码器的选择是非常灵活的，它可以利用各种基础 GNN 架构从多种图预训练范式中获得。

具体来说，让一个图 $\mathbf{G}(\nu,\varepsilon,\mathbf{A}, \mathbf{X} )$ 与这个图的原始结点文本内容 $\mathbf{C}= \left \{ c_{i}\subseteq \mathbb{R}^{l_{i}\times d}, 1\leq i\leq N \right \}$ 对应，其中 $\nu$ 代表节点集， $\varepsilon$ 表示边集， $\mathbf{A}$ 表示邻接矩阵， $\mathbf{X}$ 表示特征矩阵， $N$ 代表节点数， $l_{i}$ 表示第 $i$ 个结点的文本长度。可以通过任意图编码器 $f_{\mathbf{G}}$ （例如 graph transformer）和任意文本编码器 $f_{\mathbf{T}}$ （例如原始 transformer）得到编码后的图表示 $\mathbf{H}=f_{\mathbf{G}}(\mathbf{X}), \mathbf{T}=f_{\mathbf{T}}(\mathbf{C})$ ，其中 $\mathbf{H}\in \mathbb{R}^{N\times d}$ ， $\mathbf{T}\in \mathbb{R}^{N\times d}$ ，最后进行归一化得到最终的表示 $\hat{\mathbf{H}}$ 和 $\hat{\mathbf{T}}$ 。

然后，通过对比学习进行不同维度的 Text-Graph 对齐：

其中 $\mathbf{Γ}_{i}$ 为相似度矩阵，包含了一个图中所有结点间的相似度； $L$ 为损失函数。 $g_{i}^{\left (1 \right )}，$ $g_{i}^{\left (2 \right )}$ 为不同对比策略的转换函数，将不同维度的两种模态的表示映射到同一个子空间中；CE()为交叉熵损失函数（Cross Entropy Loss)； $\mathbf{y}=\left ( 0,1,\cdots ,n-1 \right )^{\textup{T}}$ 为对比标签。

双阶段图指令微调

本研究中提出的双阶段图指令微调范式是建立在指令微调的概念之上。

1.自监督指令微调

指令微调(instruct-tuning)和提示微调(prompt-tuning)的区别:

提示微调：“我在重庆上学” 的英文翻译是，输出：____
指令微调：翻译这句话：输入：我在重庆上学，输出：____

提示微调是针对某特定任务而言，不同的任务需要给出不同的表达形式；指令微调则是激发语言模型的理解能力，是针对多种任务而形成的指令，在未可见任务上泛化能力更强。

在双阶段图指令微调范式的第一阶段，引入了自监督指令微调机制，具体来说，本文设计了一个结构感知的图匹配任务。

指令设计如下：

将图中的每个节点视为中心节点，并执行h跳的随机邻居采样，从而得到每个结点的子图结构，从而建立了一个自监督图匹配任务。图匹配任务的目标是将某个子图所有结点的token与其相应的节点文本信息匹配。这需要根据图结点token的顺序重新排序节点文本信息列表，从而将每个图结点token与其相关的文本描述关联起来，这由大语言模型来完成，而子图所有结点的token产生于下面介绍的映射器。

大语言模型的自然语言输入是人类的问题。

在图匹配任务的上下文中，指令包括指令符token和一个被打乱的节点文本信息列表。例如，在一个论文引用图中，节点文本信息对应于论文标题和摘要。

文章通过引入一个映射器，将人类问题中的token替换为子图所有结点token的序列{, 1, …, n, }，其中n为图的结点数，从而得到了一个图token序列。以此来建立图结点token和自然语言token之间的对应关系，这个映射器可以简单到用一个单一的线性层实现。

微调策略如下：

为了高效地优化微调过程，本文提出了一种轻量级对齐映射策略，在训练过程中，固定大语言模型和图编码器的参数，仅优化映射器的参数。训练完成后，映射器学会了将编码后的图表示映射为图结点token，而大语言模型则擅长将这些图结点token与这些节点文本信息对齐。

考虑到图匹配过程是无监督的，这将有机会利用来自不同领域的大量未标记的图数据，以增强学习到的映射器的泛化能力。

2.特定任务指令微调

在第二阶段，本文提出了特定任务指令微调，旨在定制模型的推理行为，以满足不同图学习任务的特定约束和要求，如节点分类或链路预测。通过使用任务特定的图指令模板对大语言模型进行微调，引导模型生成更适合当前图学习任务的响应，进一步提高了模型在处理各种图学习任务时的适应性和性能，如图3所示。

图3 图匹配任务（上）、节点分类（中）和链路预测（下）的指令设计

指令设计如下：

为了为每个节点生成图信息，采用第一阶段相同的邻居采样方法。对于节点分类任务，人类问题指令包含指令符token和关于中心节点的特定文本信息。
这个指令提示语言模型基于图结构数据和伴随的文本信息来预测中心节点的类别。在图3中可以看到不同任务的指令数据的模版。

微调策略如下：

训练的第二阶段使用第一阶段训练得到的结构感知映射器的参数作为初始状态，在训练过程中，保持大语言模型和图编码器的参数不变，仅专注于优化映射器的参数，确保大语言模型进一步与下游任务对齐，增强其理解和解释图结构的能力。

完成上述的两个训练阶段后，GraphGPT已经获得了理解给定图结构并在提供的图上执行各种下游任务的能力。

实验

数据集

使用三个数据集来评估GraphGPT的性能： OGB-arxiv、PubMed和Cora，它们都是论文引文数据集，这里用于结点分类任务。

OGB-arxiv数据集代表了一个有向图，它捕获了由MAG索引的计算机科学arXiv论文之间的引文网络。数据集中的每一篇论文都与一个研究类别相关联，由作者和arXiv主持人手动标记这些研究类别是从40个学科领域中选择出来的。

PubMed数据集包括从PubMed数据库中获得的19,717篇关于糖尿病的科学出版物。这些出版物被分为实验性诱发糖尿病、1型糖尿病和2型糖尿病。此外，该数据集还包括一个包含44,338个链接的引文网络。

Cora数据集包含25120篇通过被引用连接的研究论文。我们使用了Cora数据集的扩展版本，与以前的版本[17]相比，它更大，有更多的类（总共70个）。

Baseline

MLP，它使用多层感知器进行节点表示
具有代表性的图神经网络编码器，包括GraphSAGE、GCN、GAT和RevGNN
用于图学习的自监督方法DGI
探索知识蒸馏-增强的GNN，主要是GKD和GLNN
最近提出的强Graph Transformer网络，NodeFormer和DIFFormer
开源的LLM，如Baichuan-7b、vicuna-7B-v1.1和vicuna-7B-v1.5

实验结果

表1 在有监督和zero-shot情况下，各种节点分类方法的性能比较。其中 “Arxiv-Arxiv” 表示在Arxiv上训练，在Arxiv上测试；“Arxiv-PubMed”表示在Arxiv上训练，在PubMed上测试；“(Arxiv + PubMed) - Cora” 表示在 Arxiv 和 PubMed 上训练，在Cora上测试。“-7B”表示参数量表，“-v1.1”和“-v1.5”表示模型的不同版本，“-stage2”表示只采用了第二阶段的调优，“-std”和“-cot”表示标准的和加入思维链提示的方法的使用。

表2 有监督和zero-shot情况下的消融实验结果。其中w/o GS为只使用LLM而不加入结构信息，w/o LR为只使用图编码器而不使用LLM。

实验分析

根据表1和表2的结果，较有意义的结论有以下三点：

图结构信息的有效性：GraphGPT明显优于缺乏图结构信息的基本LLM模型。这表明，我们的图形指令调优范式使LLM能够更有效地理解图的结构信息。重要的是，这种性能上的改进是在没有改变LLM的原始参数的情况下实现的，仅仅是通过轻量级对齐映射器来完成的，它通过1层线性映射操作来对齐图token和自然语言token。
更多的数据但不遗忘：如表 1 的 “(Arxiv + PubMed) - Arxiv” 列所示，大部分传统的基于 GNN 的方法在 Arxiv 和 PubMed 上经过迭代训练后性能大幅下降。但 GraphGPT 的表现却更为出色。这种情况被认为是由于基于 GNN 的模型在较小的 PubMed 数据集上训练后出现的灾难性遗忘，导致模型的结构建模能力受损。但通过两步的图结构指令微调，此问题得到了有效缓解。这使 GraphGPT 在保持或增强其性能时，能够继续保留通用的图结构模式。
使用LLM增强语义推理的有效性：我们进行了进一步的调查，以评估LLM在GraphGPT中的推理能力的影响，通过仅使用默认的图编码器执行监督和零镜头预测。结果表明，GraphGPT集成了LLM后，显著提高了图编码器的性能，特别是在zero-shot设置下。这表明，LLM注入的丰富的语义信息在性能上提供了实质性的提高

此外，使用图token来表示图结构作为LLM的输入的方法比自然语言的解决方案更有效。在包含103个节点的子图的情况下，GraphGPT只需要750个token来输入LLM，而基于文本的方法需要4649个token，token消耗的显著减少意味着训练和推理资源需求的大幅减少。

总结

本文提出了一种有效的、可扩展的图大语言模型，旨在提高图模型的泛化能力。所提出的框架GraphGPT通过双阶段图指令调优范式将特定图的领域结构知识注入LLM。通过利用一个简单而有效的Text-Graph对齐映射器，使得LLM能够理解和解释图结构信息。

亮点

使用了一个映射器将图结构信息与文本信息在LLM中对齐；
提出了双阶段图指令微调范式，可以进行零样本学习，大大提升泛化能力，同时可以输入特定图的领域的(结构)知识；
无需过长的token就可以使LLM能够读取图结构；
仅需调整映射器的参数，这比调整LLM参数减少50倍。

不足

预印版文章部分内容不清晰或有错误。

启发

将具体图结构领域知识加入其中;
在图结点数较少的数据集里面可以尝试不使用子图采样而直接使用整个图，从而表示更完整的图信息。

BibTex

@misc{tang2023graphgpt,
      title={GraphGPT: Graph Instruction Tuning for Large Language Models}, 
      author={Jiabin Tang and Yuhao Yang and Wei Wei and Lei Shi and Lixin Su and Suqi Cheng and Dawei Yin and Chao Huang},
      year={2023},
      eprint={2310.13023},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

Spring AI ETL Pipeline使用指南超级小忍 SpringAI spring 人工智能
前言（Introduction）版本声明：本文基于SpringAI1.0.0版本编写。由于SpringAI目前仍处于活跃开发阶段，API和组件可能在后续版本中发生变化，请注意及时关注官方文档更新以保持兼容性。在当今大数据和人工智能快速发展的背景下，ETL（Extract,Transform,Load）系统已经不再只是简单的数据搬运工。ETL是数据仓库和数据分析流程中的核心环节，它负责将分散的数据从
机器学习笔记：MATLAB实践 techDM 机器学习笔记 matlab Matlab
在机器学习领域，MATLAB是一种功能强大且广泛使用的工具，它提供了许多内置函数和工具箱，方便开发者进行各种机器学习任务。本文将介绍一些常见的机器学习任务，并提供相应的MATLAB源代码示例。数据预处理在进行机器学习之前，通常需要对原始数据进行预处理。这包括数据清洗、特征选择、特征缩放和数据划分等步骤。%导入数据data=readmatrix('data.csv');%数据清洗cleaned_da
LoRA微调详解：如何为AIGC模型节省90%显存 SuperAGI2025 AI大模型应用开发宝典 AIGC ai
LoRA微调详解：如何为AIGC模型节省90%显存关键词：LoRA、低秩适应、AIGC模型、参数高效微调、显存优化摘要：在AIGC（人工智能生成内容）领域，大模型（如GPT-3、LLaMA、StableDiffusion）的微调需要消耗海量显存，普通用户或企业难以负担。本文将深入解析LoRA（Low-RankAdaptation，低秩适应）这一参数高效微调技术，通过生活类比、数学原理、代码实战和应
借助 KubeMQ 简化多 LLM 集成强哥之神智能路由器 transformer 深度学习语言模型架构 deepseek
将多个大语言模型（LLM），如OpenAI和Anthropic的Claude集成到应用程序中是一项具有挑战性的任务。处理不同API和通信协议的复杂性，以及确保请求高效路由，都会带来诸多难题。然而，使用消息代理和路由器可以成为解决这些问题的优雅方案，能处理这些痛点并提供多项关键优势。在本文中，我们将探讨如何实现这一点，并提供代码示例，指导大家如何使用KubeMQ构建一个与OpenAI和Anthrop
西南交通大学【机器学习实验1】
实验目的理解和掌握回归问题和分类问题模型评估方法，学会使用均方误差、最大绝对误差、均方根误差指标评估回归模型，学会使用错误率、精度、查全率、查准率、F1指标评价分类模型。实验内容给定回归问题的真实标签和多个算法的预测结果，编程实现MSE、MAE、RMSE三种评测指标，对模型进行对比分析。给定二分类问题真实标签和多个算法的预测结果，编程实现混淆矩阵评测，采用错误率、精度、查全率、查准率、F1指标对结
科普语音交互所需开源技术方案
以下是ASR（自动语音识别）、LLM（大语言模型）和TTS（文本转语音）三者结合的应用场景及开源方案：一、应用场景智能语音助手如百聆（Bailing），支持语音输入、意图理解、任务管理及语音输出，端到端延迟仅800ms，支持打断和记忆功能。车载语音交互系统（如蔚来、小鹏），结合ASR识别指令、LLM处理复杂查询（如"找有充电桩的高评分餐厅"）和TTS提供语音反馈。语音到语音翻译（S2ST）阿里Fu
结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践大模型之路 RAG rag
一、引言：混合RAG技术的发展与挑战在人工智能领域，检索增强生成（RAG）技术正成为构建智能问答系统的核心方案。传统RAG通过向量数据库存储文档嵌入并检索相关内容，结合大语言模型（LLM）生成回答，有效缓解了LLM的“幻觉”问题。然而，单一的稠密向量检索（如基于Transformer的嵌入模型）在处理关键词匹配和多义词歧义时存在局限性，而稀疏向量检索（如BM25）虽擅长精确关键词匹配，却缺乏语义理
学习笔记(28):随机噪声的原理、作用及代码实现详解宁儿数据安全 #机器学习学习笔记 python
学习笔记(28):随机噪声的原理、作用及代码实现详解一、什么是随机噪声？为什么需要添加？在机器学习中，随机噪声是指数据中无法用特征解释的随机波动，通常符合某种概率分布（如正态分布）。在房价模拟中添加噪声的核心原因如下：1.模拟真实世界的不确定性真实房价除了受面积、房龄影响，还受装修情况、学区、交通、政策等未被建模的特征影响，这些因素的综合效应可抽象为“噪声”。示例：两套面积和房龄相同的房子，房价可
学习笔记(29):训练集与测试集划分详解：train_test_split 函数深度解析宁儿数据安全 #机器学习学习笔记深度学习
学习笔记(29):训练集与测试集划分详解：train_test_split函数深度解析一、为什么需要划分训练集和测试集？在机器学习中，模型需要经历两个核心阶段：训练阶段：用训练集数据学习特征与目标值的映射关系（如线性回归的权重）。测试阶段：用测试集评估模型在未见过的数据上的表现，避免“过拟合”（模型只记住训练数据的噪声，无法泛化到新数据）。类比场景：学生通过“练习题”（训练集）学习知识，再通过“考
军事，本身就是智能人机与认知实验室人工智能大数据
军事智能后面两个字不重要，军事本身就是智能。军事活动中的许多决策和操作本质上都离不开“智能”，不论是指人类的智慧，还是现代技术和人工智能的应用。军事行动本质上是一种复杂的决策过程，涉及到战略、战术、资源配置、情报分析等多个方面。每一个决策都需要充分的智慧和智能的支持，考虑的因素包括敌我态势、地理环境、气候、技术优势等。人类指挥官的战略智慧和经验在军事行动中至关重要，但随着现代技术的发展，智能化技术
图像分类：从基础原理到前沿技术随机森林404 计算机视觉分类数据挖掘人工智能
引言在当今数字化时代，图像数据正以惊人的速度增长。从社交媒体上的照片分享到医疗影像诊断，从自动驾驶到工业质检，图像分类技术已经成为人工智能领域最基础也最重要的应用之一。本文将全面介绍图像分类的基础概念、发展历程、关键技术、应用场景以及未来趋势，帮助读者系统性地理解这一领域。第一章图像分类概述1.1什么是图像分类图像分类（ImageClassification）是计算机视觉中的一项核心任务，其目标是
《dlib库中的聚类》算法详解：从原理到实践 A小庞算法算法聚类数据挖掘机器学习 c++
一、dlib库与聚类算法的关联1.1dlib库的核心功能dlib是一个基于C++的机器学习和计算机视觉工具库，其聚类算法模块提供了多种高效的无监督学习工具。聚类算法在dlib中主要用于：数据分组：将相似的数据点划分为同一簇。特征分析：通过聚类结果发现数据潜在的结构。降维辅助：结合聚类结果进行特征选择或数据压缩。dlib支持的经典聚类算法包括K-Means和ChineseWhispers，适用于图像
通义灵码+DeepSeek：国产代码生成王炸组合，带你飞！
引言在人工智能飞速发展的当下，AI代码生成工具如雨后春笋般涌现，为开发者们带来了前所未有的编程体验。其中，国产的通义灵码结合DeepSeek模型异军突起，成为众多开发者关注的焦点。它们凭借强大的功能和出色的表现，在代码生成领域崭露头角，不仅提升了开发效率，还为编程工作流注入了新的活力。然而，如同任何新兴技术一样，在使用过程中也会遇到各种问题和挑战。本文将通过实测，深入剖析通义灵码与DeepSeek
机器学习：集成算法的装袋法（Bagging）：随机森林（Random Forest） rubyw #概念及理论机器学习算法随机森林
随机森林（RandomForest）是一种集成学习方法，通过构建多个决策树并结合其预测结果来提升模型的性能和稳定性。它由LeoBreiman于2001年提出，广泛应用于分类和回归任务。以下是随机森林的详细介绍，包括其基本概念、构建过程、优缺点及应用场景。基本概念随机森林是一种基于决策树的集成算法，通过生成多棵决策树，并将这些树的预测结果结合起来，以提高整体模型的预测准确性和稳定性。每棵决策树都是在
uni-app 多端开发中 AI 的集成与适配：一次开发，智能多端运行欧阳天羲大前端与 AI 的深度融合 #AI 与大前端框架结合篇 uni-app 人工智能前端
一、引言：uni-app与AI多端集成的背景在当今跨平台开发趋势下，uni-app凭借"一次编写，多端运行"的特性成为企业级应用开发的首选框架之一。随着人工智能技术的普及，将AI能力集成到多端应用中已成为提升用户体验的关键需求。然而，小程序、APP、Web等不同端的运行环境差异显著，如何实现AI功能的统一集成与高效适配成为开发难点。本文将系统讲解在uni-app框架中集成AI能力的完整方案，涵盖跨
大语言模型技术系列讲解：大模型应用了哪些技术知世不是芝士语言模型人工智能自然语言处理 chatgpt 大模型
为了弄懂大语言模型原理和技术细节，笔者计划展开系列学习，并将所学内容从简单到复杂的过程给大家做分享，希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲，先列出大模型使用到了哪些技术，目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
森林的智慧：随机森林与集成学习的民主之道田园Coder 人工智能科普人工智能科普
当约阿夫·弗罗因德和罗伯特·沙皮尔提出的AdaBoost算法在90年代末期以其强大的预测精度震惊机器学习界，展示了“团结弱者为强者”的集成魅力时，另一种集成思想也在悄然孕育。这种思想同样信奉“众人拾柴火焰高”，但走的是一条与AdaBoost截然不同的路径：它不执着于反复调整数据权重去“关注”被前序模型分错的困难样本，而是致力于创造尽可能多样化的模型，然后让这些模型平等地投票。它的核心哲学是：如果每
机器学习：集成学习方法之随机森林(Random Forest) 慕婉0307 机器学习集成学习机器学习随机森林
一、集成学习与随机森林概述1.1什么是集成学习集成学习(EnsembleLearning)是机器学习中一种强大的范式，它通过构建并结合多个基学习器(baselearner)来完成学习任务。集成学习的主要思想是"三个臭皮匠，顶个诸葛亮"，即通过组合多个弱学习器来获得一个强学习器。集成学习方法主要分为两大类：Bagging(BootstrapAggregating)：并行训练多个基学习器，然后通过投票
机器学习在智能金融风险评估中的应用：信用评分与欺诈检测 Blossom.118 机器学习与人工智能机器人机器学习人工智能 python 深度学习 sklearn 计算机视觉
在金融行业，风险评估是确保金融机构稳健运营的关键环节。随着大数据和机器学习技术的快速发展，金融机构开始探索如何利用机器学习算法来提高风险评估的准确性和效率。本文将探讨机器学习在智能金融风险评估中的应用，特别是信用评分和欺诈检测方面的最新进展，并分析其带来的机遇和挑战。一、智能金融风险评估中的信用评分（一）传统信用评分方法的局限性传统的信用评分主要依赖于人工规则和简单的统计模型，如逻辑回归。这些方法
LLM---大语言模型技术研究报告
摘要大语言模型（LLMs）已从技术突破走向产业规模化落地。2025年，全球LLMs进入“模型即服务”（MaaS）时代，参数量级突破万亿级，多模态能力、智能体协作、专业化细分成为主流趋势。中国大模型领域在DeepSeek、通义千问、讯飞星火等头部模型推动下，实现技术突破与场景创新。本报告基于截至2025年7月的最新数据，系统梳理LLMs的技术演进、应用场景、挑战与未来方向。一、大语言模型的演进与突破
解释LLM怎么预测下一个词语的 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 语言模型 python 深度学习人工智能机器学习
解释LLM怎么预测下一个词语的通过上文词的向量进行映射在Transformer架构的大语言模型（如GPT系列、BERT等）中，词语会先被转化为词向量。在预测下一个词时，模型会基于之前所有词的向量表示（并非仅仅上一个词，但上一个词的向量是重要信息来源之一）进行计算。以GPT-2为例，在生成文本时，它会将输入文本中每个词对应的词向量依次输入到模型的多层Transformer编码器-解码器结构中。每一层
机器学习在智能制造业中的应用：质量检测与设备故障预测 Blossom.118 机器学习与人工智能机器学习人工智能深度学习神经网络机器人 sklearn tensorflow
随着工业4.0和智能制造的推进，制造业正经历着一场深刻的数字化转型。智能制造业通过整合物联网（IoT）、大数据和机器学习等先进技术，实现从生产计划到质量控制的全流程优化。机器学习技术在智能制造业中的应用尤为突出，尤其是在质量检测和设备故障预测方面。本文将探讨机器学习在智能制造业中的应用，并分析其带来的机遇和挑战。一、智能制造业中的质量检测（一）传统质量检测方法的局限性传统的质量检测主要依赖于人工检
大语言模型：是逐字生成还是一次多词？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 算法 prompt 人工智能自然语言处理均值算法
大语言模型（LLM）既可以按顺序逐个生成单词（token），也能实现一次生成多个token核心差异源于解码策略与模型架构设计一、常规“逐个生成”模式（基础逻辑）多数入门级演示或简单文本生成中，LLM会默认按“生成一个token→拼接回输入→再生成下一个”的流程，本质是自回归（Auto-Regressive）机制的基础应用。比如用小语言模型续写“今天天气____”：模型先基于“今天天气”预测第一个t
面了字节跳动的数据挖掘岗，感觉真的很难。。。大模型爱好者社区机器学习深度学习面试宝典数据挖掘人工智能数据分析算法面试
节前，我们社群组织了一场技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对新手如何入门机器学习算法、该如何备战、面试常考点分享等热门话题进行了深入的讨论。基于社群的讨论，今天我整理了一个同学的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以文末加入我们交流群。一面40min【编程题】有两种数据，分别是被转发的用户和转发的
免费学中医，这些优质资源不容错过少林659 零基础学中医免费学中医
零基础学中医，学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts想入门中医却担心成本太高？其实有不少免费又优质的学习资源，问止中医的系列免费课程就是其中的佼佼者，涵盖理论与实操，满足不同学习者的需求。问止中医旗下的精一书院，是免费学中医的绝佳平台。由问止中医联合创始人林大栋博士主讲，课程聚焦中医结构分析、人工智能中医大脑技术
微软：LLM训练数据组织框架DELT 大模型任我行大模型-模型训练人工智能自然语言处理语言模型论文笔记
标题：DataEfficacyforLanguageModelTraining来源：arXiv,2506.21545摘要数据是语言模型（LM）训练的基础。最近的研究一直致力于数据效率，其目的是通过选择训练数据的最小或最优子集来最大限度地提高性能。数据过滤、采样和选择等技术在这一领域起着至关重要的作用。为了补充这一点，我们定义了数据效能，它侧重于通过优化训练数据的组织来最大限度地提高性能，目前尚未得
思维树(Tree of Thoughts): 超越链式思维的AI推理新范式司南锤 LLM 人工智能
引言在人工智能快速发展的今天，大语言模型(LLM)的推理能力一直是研究的热点。从最初的直接问答，到链式思维(ChainofThoughts,CoT)的出现，再到如今的思维树(TreeofThoughts,TOT)，AI的推理方式正在变得越来越接近人类的思维过程。思维树作为一种全新的推理框架，不仅继承了链式思维的优势，更通过树状结构的探索和回溯机制，实现了更加复杂和深入的推理过程。本文将深入探讨TO
云原生环境下部署大语言模型服务：以 DeepSeek 为例的实战教程一ge科研小菜菜人工智能 Python 编程语言语言模型人工智能自然语言处理
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、引言随着DeepSeek、Qwen、ChatGLM等大语言模型（LLM）的开放与普及，企业将其私有化部署并服务化的需求愈发迫切。然而，从HuggingFace下载模型，到提供一个结构化、稳定、可调用的API，并不是一个简单过程。它涉及：模型推理框架（如vLLM）的集成；WebAPI封装（FastAPI等）；容器化部署与资源调度；可扩展性设计与
【学习】《算法图解》第十二章学习笔记：K近邻算法程序员
前言《算法图解》第十二章介绍了一种简单而强大的机器学习算法——K近邻算法（K-NearestNeighbors，简称KNN）。这是一种基于实例的学习方法，也是机器学习领域中最基础、最直观的算法之一。本章不仅讲解了KNN的基本原理和实现方式，还探讨了特征提取、归一化等重要概念，为读者打开了机器学习的大门。本笔记将梳理KNN算法的核心思想、实现步骤以及应用场景。一、K近邻算法概述（一）基本思想K近邻算
AttributeError: module ‘openai‘ has no attribute ‘ChatCompletion‘解决方案爱编程的喵喵 Python基础课程 python AttributeError openai ChatCompletion 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了AttributeError:mod
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源