谢桥光

2.1 Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

1、基本信息

作者：Yan Ling, Jianfei Yu, Rui Xia
会议：ACL 2022
单位：南京理工大学

2、主要框架

任务：Multimodal Aspect-Based Sentiment Analysis(MABSA)
1. Multimodal Aspect Term Extraction(MATE)
  - input: text-image pair
  - output: aspect terms(mentioned in the text)
2. Multimodal Aspect-oriented Sentiment Classification(MASC)
  - input: extracted aspect term
  - output: sentiment class
3. Joint Multimodal Aspect-Sentiment Analysis(JMASA)【如下图1所示】
  - input: text-image pair
  - output: aspect-sentiment pairs

问题
1. 现有方法要么分别使用预训练的视觉、文本模型，忽略了模态间的对齐关系。
2. 要么使用经通用预训练任务的视觉-语言模型，不足以识别细粒度的aspect、opinion和模态间的对齐关系。
方法
- A task-specific Vision-Language Pre-training framework for MABSA(VLP-MABSA)
  - BART-based generative multimodal architecture
  - 所有预训练任务和下游任务都可以通用的（unified）多模态encoder-decoder 架构
- 3类task-specific 预训练任务
  1. Language
    - Masked Language Modeling(MLM)
    - Textual Aspect-Opinion Extraction(AOE)
  2. Vision
    - Masked Region Modeling(MRM)
    - Visual Aspect-Opinion Generation(AOG)
  3. Multimodal
    - Multimodal Sentiment Prediction(MSP)
实验结果：超过SOTA

3. VLP-MABSA

模型骨干是BART，a denoising autoencoder for sequence-to-sequence models。将其扩展为同时编码文本和视觉输入，可解码不同模态的预训练任务或下游任务。

3.1. Feature Extractor

Image Representation：用Faster R-CNN抽取的mean-pooled convolutional features作为视觉特征。
1. 抽取并取置信度前36个regions，即 $R=\{r_1, ..., r_{36}\}$ ，并保留其semantic class distribution，记为 $q (v)$ （用于MRM）。
2. 每个region的视觉特征向量的维度本来是2048，即 $r_i \in \mathbb R^{2048}$ ，为了和文本特征一致，再用linear transformation layer投影成d维向量，即 $\in \mathbb R^{d \times 36}$ 。
Text Representation：Embedding Matrix
1. 句子分词成tokens， $E=\{e_1, ..., e_T \}$ 记录其下标序列， $T$ 是文本长度。
2. 从Embedding Matrix中取相应tokens的embeddings，即 $W=\{ w_1, ..., w_T\}$ 。

3.2. BART-based Generative Framework

Encoder：多层双向Transformer
1. 在编码器的输入端，分别用和，和标识visual features，textual input的起始和结束。
3. $X$ 表示concatenated的多模态输入。
Decoder：多层单向Transformer
1. 在解码端的输入端，因为所有预训练任务共享同样的解码器，为标识不同预训练任务，分别都用两个special tokens作为解码器输入的开始。
  - , , , 和分别是5个预训练任务的special tokens。

3.3. Pre-training Tasks

Original dataset: MVSA-Multi
- input: image-text pairs
- output: coarse-grained sentiments

3.3.1 Textual Pre-training

Masked Language Modeling(MLM)：对齐文本和视觉特征
- mask的策略和BERT一样；
- 损失函数如下， $\widetilde {X}$ 指的是masked的拼接后的多模态输入 $X$ 。
  $L_{MLM}=-\mathbb E_{X \sim D} \sum_{i=1}^{T} log P(e_i|e_{LMLM=−EX∼Di=1∑TlogP(ei∣e<i,X )$
Textual Aspect-Opinion Extraction(AOE)：生成文本中的aspects和opinions
1. 数据集中不提供aspect和opinion的标注，需用其他的方法构造监督信号。
  1. Aspect：一个Named Entity Recognition（NER）工具中的预训练模型(2011)
  2. Opinion：a sentiment lexicon(SentiWordNet)(2006)
2. an index generation task：生成所有aspects和opinions的起止下标。
  1. target标注 $Y=[a_1^s, a_1^e, ..., a_M^s, a_M^e, , o_1^s, o_1^e, ..., o_N^s, o_N^s, ]$ ，其中 $M ， N$ 指aspect terms 和opinion terms的数量， $a^s, a^e$ 和 $o^s, o^e$ 分别是每个的起止下标。、标识分割、结束。
  2. 例子如图所示：
  3. 公式流程：得到token的概率分布。
    1. $h_t^d = Decoder(H^e;Y_{htd=Decoder(He;Y<t)$
    2. $\overline{H}_T^e=(W+H_T^e)/2$ 。一个文本一个固定的值。 $H_T^e$ 指 $H_T$ 对应的文本部分。
    3. $P(y_t)=Softmax([\overline{H}_T^e;C^d]h_t^d)$ 。 $C_d$ 指 $C = [< s e p >, < e o s >]$ 的d维embeddings。
  4. 损失函数如下， $O = 2 M + 2 N + 2$ 指target标注 $Y$ 的长度。
  $L_{AOE}=-\mathbb E_{X \sim D} \sum_{t=1}^OlogP(y_t|Y_{LAOE=−EX∼Dt=1∑OlogP(yt∣Y<t,X)$

3.3.2 Visual Pre-training

用以下两个任务捕获图像中的主体和客体信息

Masked Region Modeling(MRM)：预测masked region的semantic class distribution
1. 在编码器输入端，regions以15%的概率随机被mask，相应的特征会改为零向量。
2. 在解码器输入端，masked region的提示词为，其余为。
3. 在解码器输出后，所有的会追加一个MLP分类器，用以预测其semantic class distribution，记为 $p (v)$ 。
4. 损失函数：减少预测分布和target分布的KL散度。Z指masked regions的数量。
  $L_{MRM}= \mathbb E_{X\sim D}\sum_{z=1}^ZD_{KL}(q(v_z)||p(v_z))$
5. 例子如图所示
Visual Aspect-Opinion Generation(AOG)：生成图像中的aspect-opinion对
1. 监督信号
  1. Adjective-Noun Pair(ANP)（2013）：如smiling man and beautiful landscape，分别能捕获细粒度的aspects 和opinions，因此将其作为图像中的aspect-opinion对。
  2. 用一个预训练ANP检测器DeepSentiBank（2014），预测2089个预先定义的ANPs的类分布，概率最高的ANP作为监督信号。
2. a sequence generation task
  1. $G=\{g_1,...,g_{|G|}\}$ 指target ANP的tokens， $∣ G ∣$ 指ANP tokens的数量
  2. 公式流程：
    1. $h_i^d=Decoder(H^e;G_{hid=Decoder(He;G<i)$
    2. $P(g_i)=Softmax(E^Th_i^d)$ ；E指词汇中所有tokens的embedding matrix。【跟之前E的定义不一样？词汇中是所有词典还是输入文本的词？】
  3. 损失函数：
    $L_{AOG}=-\mathbb E_{X\sim D}\sum_{i=1}^{|G|}logP(g_i|g_{LAOG=−EX∼Di=1∑∣G∣logP(gi∣g<i,X)$
  4. 例图[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7W2DprLy-1668692099370)(C:/Users/26282/AppData/Roaming/Typora/typora-user-images/image-20221112163228101.png)]

3.3.3 Multimodal Pre-training

不像前两类预训练任务，MSP的监督信号是多模态的。识别文本和视觉的客观信息，以及他们之间的对齐关系。

Multimodal Sentiment Prediction(MSP)
1. MVSA-Multi数据集提供粗粒度的情感标签，将其作为监督信号。
2. a classification task
  1. 公式流程：
    1. $h_{msp}^d=Decoder(H^e;E_{msp})$ ； $E_{msp}$ 指两个special tokens相应的embeddings
    2. $P(s)=Softmax(MLP(h_{msp}^d))$ ；s指相应的情感标签
  2. 损失函数：
    $L_{MSP}=-\mathbb E_{X\sim D}logP(s|X)$
  3. 例图

3.3.4 Full Pre-training Loss

目标函数
$L=\lambda_1L_{MLM}+\lambda_2L_{AOE}+\lambda_3L_{MRM}+\lambda_4L_{AOG}+\lambda_5L_{MSP}$

3.4 Downstream Tasks

下游任务：MABSA的3个子任务，即Joint Multimodal Aspect-Sentiment Analysis(JMASA)，Multimodal Aspect Term Extraction(MATE)，和Multimodal Aspect-oriented Sentiment Classification(MASC)。
模型：和预训练任务一样
模型输出
- JMASA： $Y=[a_1^s,a_1^e,...,a_i^s,a_i^e,s_i,...]$ ， $a_1^s, a_i^e,s_i$ 分别指文本中某aspect的起止下标和情感。
- MATE： $Y=[a_1^s,a_1^e,...,a_i^s, a_i^e]$ 。
- MASC： $Y=[\underline {a_1^s},\underline {a_1^e},s_1,...,\underline {a_i^s},\underline {a_i^e},s_i,...]$ ，下划线表示推理时是已知的。
index generation tasks
- 与AOE一样的公式流程，除了special token集合 $C = [< P O S >, < N E U >, < N E G >, < E O S >]$ 改成了感情类别。
- JMASA图例

4. 实验

4.1 Experimental Settings

Dataset

下游数据集使用TWITTER-2015和TWITTWE-2017评估VLP-MABSA模型

4.2 对比实验

JMASA

从text-based methods的对比可以看出VLP-MABSA中基础模型BART的优越性
Multimodal methods中JML采用了辅助任务来检测图像与文本的关系，超越了此前所有方法；而VLP-MABSA的F1得分比它分别高了2.5和2.0，这可以归功于3类task-specifc 预训练任务识别了aspects、opinion和模态间的对齐关系。

MATE

MASC

要注意JML只评估了正确预测的aspect的结果，而其他都是评估了所有的golden aspects。

4.3 消融实验

以weak supervision为例具体分析每个预训练任务的效果，只加入MLM、MRM提效甚微，AOE、AOG提高很明显，特别是MSP。

下游训练时的样本数量少时，预训练带来的提效比没有预训练来的高。数量多时，效果是一样的。
- 这表明预训练方法的鲁棒性和有效性，特别在数据集少的领域。

4.4 实例展示

MM是没有预训练的多模态输入的框架，VLP是预训练后的。

5.思考

预训练任务里加入图像与文本的关系

你可能感兴趣的:(NLP)

Vision Transformer（ViT）：用 Transformer 颠覆图像识别金外飞176 论文精读 transformer 深度学习人工智能
VisionTransformer（ViT）：用Transformer颠覆图像识别在计算机视觉领域，卷积神经网络（CNN）长期以来一直是图像识别任务的主流架构。然而，近年来，自然语言处理（NLP）领域中大放异彩的Transformer架构也开始在图像识别中崭露头角。今天，我们将深入探讨一种创新的架构——VisionTransformer（ViT），它将Transformer的强大能力直接应用于图像
34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。小宇爱深度学习-自学之路深度学习自然语言处理 rnn
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
AI编剧系统深度解析：从算法架构到影视工业化应用实战 Coderabo DeepSeek R1模型企业级应用人工智能算法
媒体娱乐行业革命：AI编剧创意辅助系统架构解析与实战应用一、行业背景与技术架构在流媒体内容需求激增的当下，传统编剧模式面临产能瓶颈。AI编剧创意辅助系统通过自然语言处理（NLP）、生成对抗网络（GAN）和知识图谱技术，构建了包含剧本生成、情节优化、角色塑造等模块的智能创作平台。核心架构分为：知识图谱层：整合影视剧本数据库（IMSDb）、维基百科等结构化数据NLP处理层：基于Transformer的
【拥抱AI】如何实现AI外呼通话，并与客户达成确认奔跑草- 人工智能人工智能
实现AI外呼通话并与客户达成确认涉及多个技术组件和步骤。以下是一个基本的流程和技术方案，仅供参考。1.技术选型与准备主要技术组件语音识别（ASR）：将客户的语音转换为文本。自然语言处理（NLP）：理解和生成自然语言对话。语音合成（TTS）：将文本转换为客户可以听到的语音。呼叫平台/API：用于发起和管理电话呼叫。数据库：存储客户信息、通话记录等数据。业务逻辑层：处理对话管理和决策逻辑。2.系统架构
【深度学习pytorch-93】Transformer 相比 RNN 的优势华东算法王 DL-pytorch 深度学习 pytorch transformer
Transformer相比RNN的优势Transformer和RNN（循环神经网络）都是自然语言处理（NLP）领域的重要架构，但它们的工作原理和应用方式有很大不同。Transformer由于其独特的结构和机制，在多个方面优于RNN。以下是Transformer相比RNN的主要优势：1.并行计算能力RNN的局限性RNN是按顺序处理输入的，即每个时间步的输出都依赖于前一个时间步的输出。这意味着，在训练
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
自然语言处理NLP 01语言转换&语言模型伊一大数据&人工智能学习日志自然语言处理自然语言处理人工智能语言模型 nlp 机器学习深度学习
目录语言转化方式1.数据预处理（DataPreprocessing）(1)文本清理(2)分词(3)语言特殊处理2.特征提取（FeatureExtraction）(1)词袋模型（BagofWords,BoW）(2)TF-IDF(3)词嵌入（WordEmbedding）3.模型输入（ModelInput）(1)序列编码(2)预训练模型输入4.模型推理（ModelInference）(1)使用传统模型(
DeepSeek底层揭秘——多跳推理 9命怪猫 AI 人工智能大模型深度学习 ai 神经网络
1.多跳推理(1)定义多跳推理（Multi-hopReasoning）是一种复杂的推理技术，指模型在回答问题或解决任务时，需要跨越多个信息片段或知识点，逐步推导出最终答案，而不是直接从单一信息源中获取结果。每一次跨越称为一个“跳跃”（hop），多跳推理通常需要模型具备逻辑推理能力、上下文理解能力以及信息整合能力。例如，在自然语言处理（NLP）中，多跳推理任务可能需要模型从多个段落中提取相关信息，并
基于 HanLP 的句子结构分析与关系抽取梦落青云知识图谱 java HanLP
一、引言自然语言处理（NLP）是人工智能领域的重要分支，旨在让计算机理解和处理人类语言。句子结构分析和关系抽取是NLP中的关键任务，它们可以帮助我们理解句子的语法结构和语义关系。HanLP是一款功能强大的中文自然语言处理工具包，提供了丰富的功能，包括分词、词性标注、依存句法分析等。本文将介绍如何使用HanLP进行句子结构分析与关系抽取。二、HanLP简介HanLP是由汉语言技术实验室开发的开源中文
AI人工智能代理工作流AI Agent WorkFlow：自然语言处理在工作流中的应用 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：自然语言处理在工作流中的应用关键词：AI代理工作流管理自然语言处理业务流程自动化交互式AI助手1.背景介绍1.1问题的由来随着数字化转型的深入，企业对提高运营效率的需求日益迫切。传统的业务流程处理方式，如手工操作、邮件交流等，既耗费时间又容易出错。为了解决这些问题，企业开始探索利用自动化技术来提高业务流程的效率和准确性。自然语言处理（NLP）技
《大模型应用开发极简入门》随记 hoypte 人工智能
术语：自然语言处理（NLP)人工智能（AI）大预言模型（LLM）机器学习（ML)深度学习（DL)内容LLM概述ML算法被称为人工神经网络DL是ML的一个分支最先开始简单语言模型吗，例如：n-gram模型（通过词频来根据前面的词预测句子里下一个词---可能生成不连贯的词），为了提升性能引入循环神经网络（RNN）和长短期记忆（LSTM）网络---处理大量数据效率还是不行。Transformer架构架构
Python库 - transformers 司南锤 PYTHON库 python机器学习 python 开发语言
transformers库是由HuggingFace开发的一个非常流行的Python库，用于自然语言处理（NLP）任务。它提供了大量的预训练模型，这些模型可以用于各种NLP任务，如文本分类、问答、翻译、摘要生成等。以下是关于transformers库的详细介绍：1.主要特点预训练模型：transformers库包含了多种预训练的语言模型，如BERT、GPT、T5、XLNet等。这些模型在大规模文本
【NLP-04】tranformers库保姆级使用教程---以BERT模型为例云天徽上 NLP bert 人工智能深度学习自然语言处理机器学习 numpy 信息可视化
安装要安装一个非常轻量级的Transformers库，您可以执行以下步骤：1、打开终端或命令提示符。2、运行以下命令来安装Transformers库：pipinstalltransformers这将使用pip工具从PythonPackageIndex（PyPI）下载并安装Transformers库。请确保您的计算机上已经安装了pip。然后，您可以在Python代码中导入Transformers库：
【Python】成功解决NameError: name ‘XXX’ is not defined 云天徽上 python运行报错解决记录 python 开发语言 pandas 机器学习 numpy
【Python】成功解决NameError:name‘XXX’isnotdefined欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是云天徽上，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够
DeepSeek-R1驱动下一代AIGC安全：全面解析智能内容合规审查技术体系与实战案例 Coderabo DeepSeek R1模型企业级应用 AIGC 安全
DeepSeek-R1赋能AIGC内容合规审查：技术实践与案例解析一、AIGC内容合规审查技术架构（此处展开约1500字的技术原理说明，涵盖深度学习模型、规则引擎、多模态检测等核心组件）二、核心实施步骤与代码实现1.文本内容预处理模块importrefromdeepseek_nlpimportTextCleanerdeftext_preprocessing(text):#特殊字符过滤cleaner
【DeepSeek】DeepSeek 如何应用于政务系统？深度求索者政务
DeepSeek作为一款高性能、低成本的AI大模型，近期在政务系统中得到了广泛应用，其技术能力和场景适配性正在推动数字政府的智能化转型。以下从应用场景、技术支撑、实际成效及未来方向等方面进行深度解析：一、核心应用场景智能公文处理政策解读与文件起草：DeepSeek基于自然语言处理（NLP）技术，可自动生成公文初稿，结合政务语境提取关键信息，生成拟办意见。例如，深圳市龙岗区的公文校对时间从人工5分钟
Decoder-Only、Encoder-Only、Encoder-Decoder 区别会喘气的粽子丶 nlp 人工智能
Decoder-Only、Encoder-Only和Encoder-Decoder是三种常见的神经网络架构，主要用于自然语言处理（NLP）任务。它们在结构和应用上有显著的区别。1.Decoder-Only架构描述：仅包含解码器部分，没有编码器。应用：通常用于生成任务，如语言模型和对话系统。代表模型：GPT（GenerativePre-trainedTransformer）特点：自回归生成：模型通过
【AI引领潮流|未来智慧生活】国内机器聊天软件推荐（超全！）and人工智能&智能学习熔光人工智能 AI软件智能学习生活
1.AI聊天软件概述1.1AI聊天软件的关键技术1.2AI聊天软件的应用1.3AI聊天软件的挑战1.4总结2.智普清言3.文心一言4.讯飞星火5.知元AI6.白马AI7.ChatGPT8.一览AI应用链接9.人工智能10.机器学习↓个人主页：C_GUIQU↑1.AI聊天软件概述AI聊天软件是一种利用自然语言处理（NLP）、自然语言理解（NLU）和机器学习（ML）技术构建的软件，它能够理解用户的自然
使用OpenAI LLM与Neo4j数据库进行自然语言交互 bBADAS neo4j 数据库交互 python
技术背景介绍在现代数据分析和应用开发中，图数据库以其独特的强大功能越来越受到重视。其中，Neo4j是最受欢迎的图数据库之一。结合自然语言处理（NLP），可以使数据查询变得更加直观和便捷。本篇文章将介绍如何使用OpenAI的语言模型将自然语言问题转换成Cypher查询，并通过Neo4j数据库执行该查询，并给出自然语言的响应。核心原理解析我们的目标是实现一个系统，该系统能够接受自然语言输入，将其转换为
【AI日记】24.10.30 做项目的一些前期准备工作 AI完全体 AI日记人工智能机器学习自然语言处理 langchain 日记读书学习资源
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】工作工作1内容：看AI大佬访谈B站地址：SamAltman最新5月播客长篇访谈|@All-In播客2024.5.11时间：1.5小时评估：继续工作2内容：思考如何开始自己的RAG项目时间：0.5小时决定：采用搭积木的方法来做自己的RAG项目。从最基础的开始，不断学习各种RAG和NLP相关的技术，然后不断加入到自己的项目中，而不
transformer概述沉墨的夜 transformer 深度学习人工智能
Transformer架构的提出，不仅在自然语言处理（NLP）领域掀起了革命，也在多个深度学习任务中获得了广泛应用。自2017年由Vaswani等人提出以来，Transformer经历了多次优化和扩展，成为深度学习领域的基石。以下是Transformer架构的演进历程、作用和意义、架构详情以及未来发展趋势的详细阐述。Transformer架构的演进历程(1)Transformer的起源（2017年
【开源向量数据库】Milvus简介 IT古董开源数据库 milvus
Milvus是一个开源、高性能、可扩展的向量数据库，专门用于存储和检索高维向量数据。它支持近似最近邻搜索（ANN），适用于图像检索、自然语言处理（NLP）、推荐系统、异常检测等AI应用场景。官网：https://milvus.io/1.Milvus的特点（1）高性能支持数十亿级向量数据，查询速度快。使用近似最近邻（ANN）索引算法，如HNSW、IVF-FLAT、IVF-PQ、SCANN等。（2）分
【深度学习基础】什么是注意力机制我的青春不太冷深度学习人工智能注意力机制
文章目录一、注意力机制的核心地位：从补充到主导二、技术突破：从Transformer到多模态融合三、跨领域应用：从NLP到通用人工智能四、未来挑战与趋势结语参考链接注意力机制：深度学习的核心革命与未来基石在深度学习的发展历程中，注意力机制（AttentionMechanism）的引入堪称一场革命。它不仅解决了传统模型的根本性缺陷，更通过动态聚焦关键信息的能力，重塑了人工智能处理复杂任务的范式。本文
语音与自然语言处理（NLP）：智能交互的核心技术给生活加糖！热门知识自然语言处理交互人工智能
随着人工智能（AI）技术的飞速发展，语音识别与自然语言处理（NaturalLanguageProcessing,NLP）成为了智能交互系统的核心技术。它们不仅改变了人们与计算机、设备的交互方式，也推动了众多行业的革新。从智能助手（如苹果的Siri、亚马逊的Alexa）到机器翻译、自动客服系统，语音和NLP技术正逐步融入日常生活，改善我们与数字世界的沟通方式。一、什么是语音识别与自然语言处理（NLP
《深入浅出LLM基础篇》（三）：大模型结构分类 GoAI 深入浅出LLM 深入浅出AI 自然语言处理NLP 大模型 LLM 人工智能 transformer chatgpt
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介
nlp技术 tqs_12345 人工智能自然语言处理
自然语言处理（NaturalLanguageProcessing,NLP）技术是一种计算机科学与人工智能的交叉领域，涉及机器对人类语言进行处理和理解的能力。以下是一些常见的NLP技术的示例：1.机器翻译：NLP技术可以帮助机器将一种语言翻译成另一种语言。例如，谷歌翻译使用NLP技术实现自动翻译，用户可以输入一段文本，然后谷歌翻译会自动将其翻译成其他语言。2.文本分类：NLP技术可以将文本分类到不同
《深入浅出多模态》（五）：多模态经典模型ALBEF GoAI 深入浅出多模态多模态大模型 LLM 深度学习人工智能
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介绍：</
《一文吃透！NLTK与SpaCy，自然语言处理的神兵利器》人工智能深度学习
在人工智能的璀璨星空中，自然语言处理（NLP）无疑是最为耀眼的领域之一。它让机器能够理解、处理和生成人类语言，极大地推动了智能交互的发展。而在Python的NLP工具库中，NLTK和SpaCy就像两把锋利的宝剑，各自散发着独特的光芒。今天，就让我们深入探究这两款工具的使用技巧与优势，为你的NLP之旅增添强大助力。一、NLTK：自然语言处理的瑞士军刀NLTK（NaturalLanguageToolk
AI —— 文字生成图片的逻辑鱼不知海 AI写作 AI作画
事情的起因是我在做一个自用软件时，需要测试文字生成图像的功能。于是就对现在能使用的ai大模型去做了一些尝试。输入几组我的描述性文字其中的一张图片令我大为震撼。（师妹师兄温酒毛驴）问题大家应该可以发现，一位图像人物的下半身时有问题的。同时从人的逻辑上，这种图缺少内核逻辑。在NLP的成熟度如此高的情况下，对描述性文字进行逻辑上的重构并不是太麻烦的事情。豆包扩充文字（在一个宁静的日子里，师兄与师妹并辔而
Deepseek详细的自我介绍 welcome_123_ 人工智能
###**DeepSeek：中国自研AGI大模型的深度解析**---####**1.技术背景与研发理念**DeepSeek由国内顶尖AI科学家团队领衔，核心技术成员来自清华大学、北京大学及国际顶级AI实验室，团队在NLP、分布式训练、模型压缩等领域发表顶会论文超200篇。研发理念聚焦三个核心：-**高效性**：通过模型架构创新（如MoE）实现“小参数量，大性能”。-**可控性**：内置可解释性模块
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他