nlp

NLP高频面试题（二十七）——SFT有哪几种参数微调方法？有什么优缺点？

随着大语言模型的普及，高效微调方法逐渐成为研究热点。尤其在监督微调过程中，如何选择合适的参数高效微调（Parameter-EfficientFine-Tuning，PEFT）方法成为关注重点。本文将梳理SFT中常用的几种参数微调方法及各自的优缺点。一、SFT中的参数微调方法常见的参数微调方法主要分为两类：全参微调和PEFT方法。全参微调：所有模型参数都参与微调，能够取得最佳性能，但参数量巨大、计算

Chaos_Wang_·2025-04-02 05:22

常见的人工智能学习框架以及特点、应用场景

应用场景：图像识别、自然语言处理（NLP）、生成模型等

2020314·2025-04-02 03:31

深入解析AI技术：从深度学习到GPT大模型的全面探索

本文旨在通过扩展和深化对深度学习、机器学习分类、强化学习原理、神经网络基础、GPT大模型训练过程及其在自然语言处理（NLP）中的应用等

初眸࿐·2025-04-01 23:32

自然语言处理｜如何用少样本技术提升低资源语言处理？

一、引言在全球化的背景下，自然语言处理（NLP）技术取得了显著进展，为人们的生活和工作提供了便利。然而，大多数NLP研究和应用集中在少数高资源语言上，如英语和中文。

紫雾凌寒·2025-04-01 19:34

NLP 45、【Attention is all you need】模型代码实现及应用

目录一、【Attentionisallyouneed】代码实现1.Modules.pyⅠ、类的定义Ⅱ、初始化方法Ⅲ、前向传播代码运行流程Ⅳ、完整代码2.SubLayers.pyⅠ、多头注意力机制MultiHeadAttention①类的定义②初始化方法③前向传播代码运行流程③完整代码Ⅱ、位置前馈网络PositionwiseFeedForward①类的定义②初始化方法③前向传播代码运行流程④完整代码

L_cl·2025-04-01 18:56

DeepSeek技术全景解析：DeepSeek多头隐式注意力（MLA）解析

特别是在自然语言处理（NLP）领域，注意力机制已经成为了不可或缺的技术之一。今天，我们将详细解析一种极具创新性的注意力机制——DeepSeek的多头隐式注意力（MLA）。

AGI大模型资料分享员·2025-04-01 17:20

JobFit AI-帮你找到合适的工作

核心功能简历解析与评估：利用先进的自然语言处理（NLP）和机器学习技术，JobFitAI能够快速解析简历内容，提取关键信息，如工作经历、教育背景、技能等，并对简历的整体质量进行评估。

数据分析能量站·2025-04-01 15:39

设计模式——设计模式理念

//mp.weixin.qq.com/s/7tKIPtjvDxDJm4uFnqGsgQ)参考：[设计模式——抽象工厂模式](https://mp.weixin.qq.com/s/QRpn41l4RIJnLPr

ShareBeHappy_Qin·2025-04-01 02:00

PaddleNLP UIE 通过OCR识别银行回执信息

为了方便大家使用UIE的强大能力，PaddleNLP借鉴该论文的方法，基于ERNIE3.0知识增强预训练模型，训练并开源了首个中文通用信息抽

冲上云霄的Jayden·2025-03-31 20:17

【NLP】14. NLP推理方法详解 --- beam search 束搜索以及 graph search 图搜索

BeamSearch在自然语言处理（NLP）任务中，BeamSearch（束搜索是一种比贪心搜索（GreedySearch）更强大的解码方法。

pen-ai·2025-03-31 17:27

DeepSeek：揭秘支持的AI模型与算法全览

以下是一些常见的AI模型和算法类型，DeepSeek可能支持的内容：1.自然语言处理（NLP）文本分类：用于情感分析、垃圾邮件检测等。命名实体识别（NER）：从文本中提取人名、地点、组织等信息。

鸭鸭鸭进京赶烤·2025-03-31 16:52

人工智能在自然语言处理中的应用：从理论到实践的探索

自然语言处理（NaturalLanguageProcessing，NLP）一直是人工智能领域的重要研究方向。

Blossom.118·2025-03-31 16:18

一文读懂「Transformer」算法模型

Transformer是Google的团队在2017年提出的一种NLP经典模型，现在比较火热的Bert也是基于Transformer。Transformer模型使用了Self-Atten

朱晓霞AI·2025-03-31 08:51

RAG 技术探秘：原理、架构与多领域应用实践全解析

一、引言1.1研究背景与动机随着自然语言处理（NLP）技术的飞速发展，大语言模型（LLM）在众多任务中展现出了强大的能力，如文本生成、问答系统和机器翻译等。

hy098543·2025-03-30 22:47

NLP高频面试题（二十一）——deepseek V1-V3 分别有哪些改进，这些改进是如何对模型产生影响的

DeepSeek从V1到V3不断迭代升级，在模型架构、训练方法和推理能力等方面取得了显著进步。对于关注前沿大模型技术的研究者而言，深入理解DeepSeek各版本的改进要点及其对模型性能的影响，具有重要的参考价值。本文将按照时间线梳理DeepSeekV1、V2、V3的核心技术演变，包括架构调整（如混合专家MoE、注意力机制优化）、训练数据规模变化、训练目标改进、推理效率优化（如并行化、KV缓存优化）

Chaos_Wang_·2025-03-30 21:42

LLM中的分块技术：原理、应用与展望

深入探究LLMs中的分块技术，对于推动自然语言处理（NLP）领域的发展具有重要意义。一、分块技术的基本概念分块，简单来说，就是将连续的文本流分解为更小的、连贯的单元，这

大模型之路·2025-03-30 21:11

深入详解自然语言处理（NLP）中的语言模型：BERT、GPT及其他预训练模型的原理与应用

【自然语言处理】——深入详解自然语言处理（NLP）中的语言模型：BERT、GPT及其他预训练模型的原理与应用自然语言处理（NLP）是人工智能（AI）领域中的重要分支，旨在通过计算机处理和分析自然语言数据

猿享天开·2025-03-30 19:54

AI 对话艺术：Prompt 设计技巧与案例解析

1.1.1Prompt的定义1.1.2Prompt编程与传统编程的区别1.2Prompt的作用与应用场景1.2.1自然语言处理（NLP）1.2.2AI对话系统（ChatGPT、Claude）1.2.3代码生成与优化

码事漫谈·2025-03-30 18:22

LangChain教程 - RAG - PDF解析

系列文章索引LangChain教程-系列文章在现代人工智能和自然语言处理（NLP）应用中，处理PDF文档是一项常见且重要的任务。

花千树-010·2025-03-30 13:11

Java 与 AI 结合的实际操作规程案例

小徐博客·2025-03-30 12:36

【揭秘】什么是AI写作？AI写作是助手还是威胁？

AI写作是指利用人工智能技术，特别是自然语言处理（NLP）和机器学习（ML）技术，结合深度学习算法，通过大规模语料库和预训练模型来模仿和生成人类语言文本内容的过程。

ychenhub·2025-03-30 06:55

人工智能入门（1）

系统中不确定推理的现代方法基础研究方法机器学习计算机利用已经有的数据样本，得出某种规律模型，并利用模型预测未来的一种方法==回归算法==线性回归和逻辑回归神经网络ANN人工神经网络模型支持向量机SVM聚类计算机视觉自然语言处理NLP

反方向的钟儿·2025-03-30 01:29

DeepSeek集成IT技术开发方向全景解读：重构智能开发新范式

在软件开发场景中展现出显著优势：代码生成场景：激活Java/Python/C++等语言专家模块，单元测试覆盖率提升至85%硬件资源优化：FP16量化下推理显存需求低至12GB，支持边缘设备部署2.多模态融合引擎突破传统NLP

量子纠缠BUG·2025-03-29 00:33

人工智能与网络安全结合的思考

人工智能时代的网络安全网络攻击越来越多样化、智能化、隐蔽性越来越高、危害性越来越大二、人工智能与网络安全结合的可能性1.信息检索：面对大量日志数据处理，AI的算力能够提前发现潜在威胁，进行漏洞自动挖掘；NLP

黑客Jack·2025-03-28 21:10

视觉Transformer架构的前沿优化技术与高效部署

引言近年来，Transformer架构在自然语言处理（NLP）领域取得了巨大成功，逐渐成为深度学习的主流模型之一。

点我头像干啥·2025-03-28 11:00

大语言模型原理基础与前沿基于相似性搜索的多模态对齐

大语言模型原理基础与前沿基于相似性搜索的多模态对齐1.背景介绍近年来，大语言模型(LargeLanguageModels,LLMs)在自然语言处理(NaturalLanguageProcessing,NLP

AI天才研究院·2025-03-28 11:27

基于Python的自然语言处理系列（60）：使用 LangChain 构建 Multi-Vector Retriever 进行文档检索

在NLP和AI领域，基于嵌入（Embeddings）进行文档检索已成为一种高效的解决方案。

会飞的Anthony·2025-03-27 22:27

什么是 Embedding？——从直觉到应用的全面解读

它是深度学习中最核心的概念之一，尤其在自然语言处理（NLP）和推荐系统中应用广泛。但很多初学者对Embedding的理解可能只是：“它是把一个东西转换成数字的方式。”

忍者算法·2025-03-27 21:52

自然语言处理NLP星空智能对话机器人系列：Facebook StarSpace框架案例数据加载

自然语言处理NLP星空智能对话机器人系列：FacebookStarSpace框架案例数据加载目录FacebookStarSpace案例脚本FacebookStarSpace案例数据AG新闻主题分类数据集简介标签类别文件训练数据文件测试数据文件星空智能对话机器人系列博客

段智华·2025-03-27 14:57

NLP：词向量

这种表示方法使得模型能够理解并捕捉单词的语义相似性，从而在许多自然语言处理（NLP）任务中大幅提高了性能。

00&00·2025-03-27 14:19

论文翻译：EMNLP-2023 CCF-B Multi-step Jailbreaking Privacy Attacks on ChatGPT

Multi-stepJailbreakingPrivacyAttacksonChatGPThttps://arxiv.org/pdf/2304.05197多步骤越狱隐私攻击对ChatGPT的影响https://openreview.net/forum?id=ls4Pfsl2jZ文章目录多步骤越狱隐私攻击对ChatGPT的影响摘要1引言2相关工作3对ChatGPT的数据提取攻击3.1数据收集3.2攻

CSPhD-winston-杨帆·2025-03-27 08:34

EMNLP2023 | 长篇论文接受列表

来源:AINLPer公众号（每日干货分享！！）编辑:ShuYini校稿:ShuYini时间:2023-10-03引言EMNLP2023于12月10日在新加坡落下帷幕，此次会议顺利举行。

AINLPer·2025-03-27 05:15

EMNLP2023 | 短篇论文接受列表，含全部论文下载

来源:AINLPer公众号（每日干货分享！！）编辑:ShuYini校稿:ShuYini时间:2023-12-12引言EMNLP2023于12月10日在新加坡落下帷幕，此次会议顺利举行。

AINLPer·2025-03-27 05:15

今日arXiv精选 | 15篇EMNLP 2021最新论文

BeyondPreservedAccuracy:EvaluatingLoyaltyandRobustnessofBERTCompressionComment:AcceptedtoEMNLP2021(mainconference

PaperWeekly·2025-03-27 04:11

今日arXiv精选 | 12篇EMNLP 2021最新论文

YoushouldevaluateyourlanguagemodelonmarginallikelihoodovertokenisationsComment:acceptedatEMNLP2021Link

PaperWeekly·2025-03-27 04:10

论文翻译：EMNLP-2023.CCF-A.Alon Jacovi.Stop Uploading Test Data in Plain Text: Practical Strategies for

StopUploadingTestDatainPlainText:PracticalStrategiesforMitigatingDataContaminationbyEvaluationBenchmarkshttps://arxiv.org/pdf/2305.10160停止上传明文测试数据：实用的策略以减轻评估基准造成的数据污染文章目录停止上传明文测试数据：实用的策略以减轻评估基准造成的数据污染

CSPhD-winston-杨帆·2025-03-27 04:40

论文阅读：2024 EMNLP Findings Authorship Obfuscation in Multilingual Machine-Generated Text Detection

CSPhD-winston-杨帆·2025-03-27 04:10

论文阅读：2023 EMNLP Hidding the Ghostwriters: An Adversarial Evaluation of AI-Generated Student Essay De

CSPhD-winston-杨帆·2025-03-27 04:10

《深度剖析：BERT与GPT——自然语言处理架构的璀璨双星》

在自然语言处理（NLP）的广袤星空中，BERT（BidirectionalEncoderRepresentationsfromTransformers）与GPT（GenerativePretrainedTransformer

程序猿阿伟·2025-03-27 04:06

初识TensorFlow：机器学习与深度学习的探索

从计算机视觉到自然语言处理（NLP），这些模型成为了合成的，或者说人造的智能。本篇博客将基于第一章的内容，探讨什么是机器学习，以及如何使用T

韩锋裂变营销·2025-03-26 20:38

利用人工智能AI进行机器加工编程语言之间的翻译

这种方法结合了自然语言处理（NLP）、机器翻译（MT）和领域特定规则的技术。1.问题分析目标：将标准G代码翻译成特定厂家的加工语言。挑战：G代码和厂家加工语言的语法和语义差异。

CoderIsArt·2025-03-26 11:37

AI 大模型的技术架构与应用解析

1.引言人工智能（AI）大模型正在重塑全球科技生态，以ChatGPT、DeepSeek、Grok为代表的AI语言模型在自然语言处理（NLP）、智能对话、内容生成等领域展现了卓越的能力。

慌ZHANG·2025-03-26 09:52

DeepSeek R1后，AI应用、职业与行业！

就业其实DeepSeek（或者ChatGPT）爆火后，最着急的应该是一线的NLP、L

·2025-03-26 08:52

解读目前AI就业岗位——大语言模型（LLM）应用工程师学习路线、就业前景及岗位全解析

行业分布：岗位薪资：未来发展学习路线及所需技能1.基础技能学习2.深入AI技术3.专攻自然语言处理（NLP）4.掌握大语言模型（LLM）开发5.项目部署与性能优化适合本科/研究生什么专业的学生？

AI敲代码的手套·2025-03-26 04:38

具身系列——NLP工程师切入机器人和具身智能方向

职位高频词汇：VLM调优经验、核心算法（Diffusion、RL、VIT）、pytorch、仿真环境（IsaacGym、Mujoco、webots）基于当前具身智能行业发展趋势和岗位需求，以下是为NLP

music&movie·2025-03-25 21:47

NLP高频面试题（十三）——什么是大模型幻觉，如何解决大模型幻觉

深入理解大模型幻觉及其解决方案所谓大模型幻觉，是指LLM在生成文本时出现看似流畅合理但实际上却偏离事实甚至无中生有的内容。这不仅严重影响了模型输出的可靠性，在某些敏感领域（如医疗、法律）可能造成严重后果。本文将深入分析大模型幻觉产生的原因、分类与检测方法，并提出有效的解决策略，帮助更好地理解并应对这一挑战。一、什么是大模型幻觉？大模型幻觉（Hallucination）是指大型语言模型在生成文本时，

Chaos_Wang_·2025-03-25 17:47

《深入浅出LLM基础篇》（四）：主流大模型介绍

GoAI·2025-03-25 17:14

Elasticsearch 入门到精通-Ansj分词器的安装和使用

pluginelasticsearch7.6.27.6.27.7.07.7.07.7.17.7.17.8.07.8.07.8.17.8.17.9.07.9.07.9.17.9.17.9.27.9.27.9.37.9.3二、安装步骤1、下载安装ES对应PluginRelease版本a.GitHub-NLPchina

王stone·2025-03-25 11:01

Python机器人简单问答系统

Flask应用3.读取学习数据4.处理用户请求4.1首页路由4.2问答路由5.根据问题生成回答6.运行Flask应用全部代码HTML结构学习总结项目背景与目的项目背景随着人工智能技术的快速发展，自然语言处理（NLP

chang_xiaoyi·2025-03-25 04:12

SFT和RLHF是什么意思？

它们通常应用于自然语言处理（NLP）领域，特别是对于那些需要对特定任务进行优化的语言模型。SFT（监督微调）

玩人工智能的辣条哥·2025-03-25 00:15

推荐频道

nlp