E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
nlp
NLP
高频面试题(二十七)——SFT有哪几种参数微调方法?有什么优缺点?
随着大语言模型的普及,高效微调方法逐渐成为研究热点。尤其在监督微调过程中,如何选择合适的参数高效微调(Parameter-EfficientFine-Tuning,PEFT)方法成为关注重点。本文将梳理SFT中常用的几种参数微调方法及各自的优缺点。一、SFT中的参数微调方法常见的参数微调方法主要分为两类:全参微调和PEFT方法。全参微调:所有模型参数都参与微调,能够取得最佳性能,但参数量巨大、计算
Chaos_Wang_
·
2025-04-02 05:22
NLP常见面试题
自然语言处理
人工智能
常见的人工智能学习框架以及特点、应用场景
应用场景:图像识别、自然语言处理(
NLP
)、生成模型等
2020314
·
2025-04-02 03:31
人工智能
学习
深入解析AI技术:从深度学习到GPT大模型的全面探索
本文旨在通过扩展和深化对深度学习、机器学习分类、强化学习原理、神经网络基础、GPT大模型训练过程及其在自然语言处理(
NLP
)中的应用等
初眸࿐
·
2025-04-01 23:32
测试开发
小小博客_大大知识
人工智能
深度学习
gpt
git
python
自然语言处理|如何用少样本技术提升低资源语言处理?
一、引言在全球化的背景下,自然语言处理(
NLP
)技术取得了显著进展,为人们的生活和工作提供了便利。然而,大多数
NLP
研究和应用集中在少数高资源语言上,如英语和中文。
紫雾凌寒
·
2025-04-01 19:34
AI
炼金厂
#
自然语言处理(NPL)
#
深度学习
自然语言处理
人工智能
长文本处理
深度学习
低资源语言处理
少样本技术
NLP
45、【Attention is all you need】模型代码实现及应用
目录一、【Attentionisallyouneed】代码实现1.Modules.pyⅠ、类的定义Ⅱ、初始化方法Ⅲ、前向传播代码运行流程Ⅳ、完整代码2.SubLayers.pyⅠ、多头注意力机制MultiHeadAttention①类的定义②初始化方法③前向传播代码运行流程③完整代码Ⅱ、位置前馈网络PositionwiseFeedForward①类的定义②初始化方法③前向传播代码运行流程④完整代码
L_cl
·
2025-04-01 18:56
自然语言处理
深度学习
人工智能
DeepSeek技术全景解析:DeepSeek多头隐式注意力(MLA)解析
特别是在自然语言处理(
NLP
)领域,注意力机制已经成为了不可或缺的技术之一。今天,我们将详细解析一种极具创新性的注意力机制——DeepSeek的多头隐式注意力(MLA)。
AGI大模型资料分享员
·
2025-04-01 17:20
语言模型
人工智能
自然语言处理
agi
wps
大模型
deepseek
JobFit AI-帮你找到合适的工作
核心功能简历解析与评估:利用先进的自然语言处理(
NLP
)和机器学习技术,JobFitAI能够快速解析简历内容,提取关键信息,如工作经历、教育背景、技能等,并对简历的整体质量进行评估。
数据分析能量站
·
2025-04-01 15:39
机器学习
人工智能
设计模式——设计模式理念
//mp.weixin.qq.com/s/7tKIPtjvDxDJm4uFnqGsgQ)参考:[设计模式——抽象工厂模式](https://mp.weixin.qq.com/s/QRpn41l4RIJ
nLP
r
ShareBeHappy_Qin
·
2025-04-01 02:00
设计模式
设计模式
java
Paddle
NLP
UIE 通过OCR识别银行回执信息
为了方便大家使用UIE的强大能力,Paddle
NLP
借鉴该论文的方法,基于ERNIE3.0知识增强预训练模型,训练并开源了首个中文通用信息抽
冲上云霄的Jayden
·
2025-03-31 20:17
AI
ocr
银行回执
PaddleNLP
Paddle
UIE
信息提取
NLP
【
NLP
】14.
NLP
推理方法详解 --- beam search 束搜索 以及 graph search 图搜索
BeamSearch在自然语言处理(
NLP
)任务中,BeamSearch(束搜索是一种比贪心搜索(GreedySearch)更强大的解码方法。
pen-ai
·
2025-03-31 17:27
NLP
机器学习
自然语言处理
人工智能
DeepSeek:揭秘支持的AI模型与算法全览
以下是一些常见的AI模型和算法类型,DeepSeek可能支持的内容:1.自然语言处理(
NLP
)文本分类:用于情感分析、垃圾邮件检测等。命名实体识别(NER):从文本中提取人名、地点、组织等信息。
鸭鸭鸭进京赶烤
·
2025-03-31 16:52
人工智能
机器人
agi
ai
opencv
算法
计算机网络
人工智能在自然语言处理中的应用:从理论到实践的探索
自然语言处理(NaturalLanguageProcessing,
NLP
)一直是人工智能领域的重要研究方向。
Blossom.118
·
2025-03-31 16:18
分布式系统与高性能计算领域
人工智能
自然语言处理
样本学习
学习
Transformer架构
系统架构
硬件架构
一文读懂「Transformer」算法模型
Transformer是Google的团队在2017年提出的一种
NLP
经典模型,现在比较火热的Bert也是基于Transformer。Transformer模型使用了Self-Atten
朱晓霞AI
·
2025-03-31 08:51
transformer
深度学习
人工智能
RAG 技术探秘:原理、架构与多领域应用实践全解析
一、引言1.1研究背景与动机随着自然语言处理(
NLP
)技术的飞速发展,大语言模型(LLM)在众多任务中展现出了强大的能力,如文本生成、问答系统和机器翻译等。
hy098543
·
2025-03-30 22:47
架构
NLP
高频面试题(二十一)——deepseek V1-V3 分别有哪些改进,这些改进是如何对模型产生影响的
DeepSeek从V1到V3不断迭代升级,在模型架构、训练方法和推理能力等方面取得了显著进步。对于关注前沿大模型技术的研究者而言,深入理解DeepSeek各版本的改进要点及其对模型性能的影响,具有重要的参考价值。本文将按照时间线梳理DeepSeekV1、V2、V3的核心技术演变,包括架构调整(如混合专家MoE、注意力机制优化)、训练数据规模变化、训练目标改进、推理效率优化(如并行化、KV缓存优化)
Chaos_Wang_
·
2025-03-30 21:42
NLP常见面试题
自然语言处理
人工智能
deepseek
LLM中的分块技术:原理、应用与展望
深入探究LLMs中的分块技术,对于推动自然语言处理(
NLP
)领域的发展具有重要意义。一、分块技术的基本概念分块,简单来说,就是将连续的文本流分解为更小的、连贯的单元,这
大模型之路
·
2025-03-30 21:11
大模型(LLM)
人工智能
LLM
chunk
深入详解自然语言处理(
NLP
)中的语言模型:BERT、GPT及其他预训练模型的原理与应用
【自然语言处理】——深入详解自然语言处理(
NLP
)中的语言模型:BERT、GPT及其他预训练模型的原理与应用自然语言处理(
NLP
)是人工智能(AI)领域中的重要分支,旨在通过计算机处理和分析自然语言数据
猿享天开
·
2025-03-30 19:54
人工智能数学基础专讲
人工智能
自然语言处理
AI 对话艺术:Prompt 设计技巧与案例解析
1.1.1Prompt的定义1.1.2Prompt编程与传统编程的区别1.2Prompt的作用与应用场景1.2.1自然语言处理(
NLP
)1.2.2AI对话系统(ChatGPT、Claude)1.2.3代码生成与优化
码事漫谈
·
2025-03-30 18:22
AI
人工智能
prompt
LangChain教程 - RAG - PDF解析
系列文章索引LangChain教程-系列文章在现代人工智能和自然语言处理(
NLP
)应用中,处理PDF文档是一项常见且重要的任务。
花千树-010
·
2025-03-30 13:11
LangChain
langchain
pdf
python
AIGC
Java 与 AI 结合的实际操作规程案例
以下是基于最新实践的几个典型场景及操作规范:一、自然语言处理(
NLP
)与文本分类案例:使用ApacheOpen
NLP
实现新闻分类操作流程:数据准备:收集新闻文本数据并标注类别(如科技、体育等)。
小徐博客
·
2025-03-30 12:36
java
【揭秘】什么是AI写作?AI写作是助手还是威胁?
AI写作是指利用人工智能技术,特别是自然语言处理(
NLP
)和机器学习(ML)技术,结合深度学习算法,通过大规模语料库和预训练模型来模仿和生成人类语言文本内容的过程。
ychenhub
·
2025-03-30 06:55
AIGC
AI写作
AIGC
AI写作
ai写作
人工智能入门(1)
系统中不确定推理的现代方法基础研究方法机器学习计算机利用已经有的数据样本,得出某种规律模型,并利用模型预测未来的一种方法==回归算法==线性回归和逻辑回归神经网络ANN人工神经网络模型支持向量机SVM聚类计算机视觉自然语言处理
NLP
反方向的钟儿
·
2025-03-30 01:29
人工智能
人工智能
nlp
大数据
云计算
计算机视觉
深度学习
机器学习
DeepSeek集成IT技术开发方向全景解读:重构智能开发新范式
在软件开发场景中展现出显著优势:代码生成场景:激活Java/Python/C++等语言专家模块,单元测试覆盖率提升至85%硬件资源优化:FP16量化下推理显存需求低至12GB,支持边缘设备部署2.多模态融合引擎突破传统
NLP
量子纠缠BUG
·
2025-03-29 00:33
DeepSeek部署
DeepSeek
AI
重构
人工智能
机器学习
人工智能与网络安全结合的思考
人工智能时代的网络安全网络攻击越来越多样化、智能化、隐蔽性越来越高、危害性越来越大二、人工智能与网络安全结合的可能性1.信息检索:面对大量日志数据处理,AI的算力能够提前发现潜在威胁,进行漏洞自动挖掘;
NLP
黑客Jack
·
2025-03-28 21:10
人工智能
web安全
安全
视觉Transformer架构的前沿优化技术与高效部署
引言近年来,Transformer架构在自然语言处理(
NLP
)领域取得了巨大成功,逐渐成为深度学习的主流模型之一。
点我头像干啥
·
2025-03-28 11:00
Ai
深度学习
神经网络
计算机视觉
大语言模型原理基础与前沿 基于相似性搜索的多模态对齐
大语言模型原理基础与前沿基于相似性搜索的多模态对齐1.背景介绍近年来,大语言模型(LargeLanguageModels,LLMs)在自然语言处理(NaturalLanguageProcessing,
NLP
AI天才研究院
·
2025-03-28 11:27
计算
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于Python的自然语言处理系列(60):使用 LangChain 构建 Multi-Vector Retriever 进行文档检索
在
NLP
和AI领域,基于嵌入(Embeddings)进行文档检索已成为一种高效的解决方案。
会飞的Anthony
·
2025-03-27 22:27
人工智能
信息系统
自然语言处理
人工智能
深度学习
机器学习
什么是 Embedding?——从直觉到应用的全面解读
它是深度学习中最核心的概念之一,尤其在自然语言处理(
NLP
)和推荐系统中应用广泛。但很多初学者对Embedding的理解可能只是:“它是把一个东西转换成数字的方式。”
忍者算法
·
2025-03-27 21:52
人工智能
深度学习
神经网络
机器学习
自然语言处理
NLP
星空智能对话机器人系列:Facebook StarSpace框架案例数据加载
自然语言处理
NLP
星空智能对话机器人系列:FacebookStarSpace框架案例数据加载目录FacebookStarSpace案例脚本FacebookStarSpace案例数据AG新闻主题分类数据集简介标签类别文件训练数据文件测试数据文件星空智能对话机器人系列博客
段智华
·
2025-03-27 14:57
NLP星空智能对话机器人
NLP
:词向量
这种表示方法使得模型能够理解并捕捉单词的语义相似性,从而在许多自然语言处理(
NLP
)任务中大幅提高了性能。
00&00
·
2025-03-27 14:19
深度学习
自然语言处理
人工智能
自然语言处理
人工智能
深度学习
论文翻译:EM
NLP
-2023 CCF-B Multi-step Jailbreaking Privacy Attacks on ChatGPT
Multi-stepJailbreakingPrivacyAttacksonChatGPThttps://arxiv.org/pdf/2304.05197多步骤越狱隐私攻击对ChatGPT的影响https://openreview.net/forum?id=ls4Pfsl2jZ文章目录多步骤越狱隐私攻击对ChatGPT的影响摘要1引言2相关工作3对ChatGPT的数据提取攻击3.1数据收集3.2攻
CSPhD-winston-杨帆
·
2025-03-27 08:34
LLMs-安全
论文翻译
chatgpt
EM
NLP
2023 | 长篇论文接受列表
来源:AI
NLP
er公众号(每日干货分享!!)编辑:ShuYini校稿:ShuYini时间:2023-10-03引言EM
NLP
2023于12月10日在新加坡落下帷幕,此次会议顺利举行。
AINLPer
·
2025-03-27 05:15
国际会议
EMNLP2023
EM
NLP
2023 | 短篇论文接受列表,含全部论文下载
来源:AI
NLP
er公众号(每日干货分享!!)编辑:ShuYini校稿:ShuYini时间:2023-12-12引言EM
NLP
2023于12月10日在新加坡落下帷幕,此次会议顺利举行。
AINLPer
·
2025-03-27 05:15
国际会议
EMNLP2023
今日arXiv精选 | 15篇EM
NLP
2021最新论文
BeyondPreservedAccuracy:EvaluatingLoyaltyandRobustnessofBERTCompressionComment:AcceptedtoEM
NLP
2021(mainconference
PaperWeekly
·
2025-03-27 04:11
sms
animation
firebug
3d
nagios
今日arXiv精选 | 12篇EM
NLP
2021最新论文
YoushouldevaluateyourlanguagemodelonmarginallikelihoodovertokenisationsComment:acceptedatEM
NLP
2021Link
PaperWeekly
·
2025-03-27 04:10
人工智能
firebug
nagios
3d
animation
论文翻译:EM
NLP
-2023.CCF-A.Alon Jacovi.Stop Uploading Test Data in Plain Text: Practical Strategies for
StopUploadingTestDatainPlainText:PracticalStrategiesforMitigatingDataContaminationbyEvaluationBenchmarkshttps://arxiv.org/pdf/2305.10160停止上传明文测试数据:实用的策略以减轻评估基准造成的数据污染文章目录停止上传明文测试数据:实用的策略以减轻评估基准造成的数据污染
CSPhD-winston-杨帆
·
2025-03-27 04:40
论文翻译
LLMs-数据污染
人工智能
论文阅读:2024 EM
NLP
Findings Authorship Obfuscation in Multilingual Machine-Generated Text Detection
总目录大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328文章目录Abstract(摘要)1Introduction(引言)2RelatedWork(相关工作)2.1MGTDetection(MGT检测)2.2MGTObfuscation(MGT混淆)6Conclusion(结论)Limitations(局限性)Aut
CSPhD-winston-杨帆
·
2025-03-27 04:10
论文阅读
论文阅读
论文阅读:2023 EM
NLP
Hidding the Ghostwriters: An Adversarial Evaluation of AI-Generated Student Essay De
总目录大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328文章目录Abstract(摘要)1Introduction(引言)5RelatedWork(相关工作)6Conclusion(结论)HiddingtheGhostwriters:AnAdversarialEvaluationofAI-GeneratedStude
CSPhD-winston-杨帆
·
2025-03-27 04:10
论文阅读
论文阅读
人工智能
《深度剖析:BERT与GPT——自然语言处理架构的璀璨双星》
在自然语言处理(
NLP
)的广袤星空中,BERT(BidirectionalEncoderRepresentationsfromTransformers)与GPT(GenerativePretrainedTransformer
程序猿阿伟
·
2025-03-27 04:06
自然语言处理
bert
gpt
初识TensorFlow:机器学习与深度学习的探索
从计算机视觉到自然语言处理(
NLP
),这些模型成为了合成的,或者说人造的智能。本篇博客将基于第一章的内容,探讨什么是机器学习,以及如何使用T
韩锋裂变营销
·
2025-03-26 20:38
TensorFlow
机器学习
深度学习
传统编程
数据标记
利用人工智能AI进行机器加工编程语言之间的翻译
这种方法结合了自然语言处理(
NLP
)、机器翻译(MT)和领域特定规则的技术。1.问题分析目标:将标准G代码翻译成特定厂家的加工语言。挑战:G代码和厂家加工语言的语法和语义差异。
CoderIsArt
·
2025-03-26 11:37
机器学习与深度学习
人工智能
机器语言翻译
AI 大模型的技术架构与应用解析
1.引言人工智能(AI)大模型正在重塑全球科技生态,以ChatGPT、DeepSeek、Grok为代表的AI语言模型在自然语言处理(
NLP
)、智能对话、内容生成等领域展现了卓越的能力。
慌ZHANG
·
2025-03-26 09:52
AI模型
人工智能
DeepSeek R1后,AI应用、职业与行业!
就业其实DeepSeek(或者ChatGPT)爆火后,最着急的应该是一线的
NLP
、L
·
2025-03-26 08:52
datawhale
解读目前AI就业岗位——大语言模型(LLM)应用工程师学习路线、就业前景及岗位全解析
行业分布:岗位薪资:未来发展学习路线及所需技能1.基础技能学习2.深入AI技术3.专攻自然语言处理(
NLP
)4.掌握大语言模型(LLM)开发5.项目部署与性能优化适合本科/研究生什么专业的学生?
AI敲代码的手套
·
2025-03-26 04:38
AI岗位介绍
人工智能
语言模型
学习
具身系列——
NLP
工程师切入机器人和具身智能方向
职位高频词汇:VLM调优经验、核心算法(Diffusion、RL、VIT)、pytorch、仿真环境(IsaacGym、Mujoco、webots)基于当前具身智能行业发展趋势和岗位需求,以下是为
NLP
music&movie
·
2025-03-25 21:47
多模态
Agent
自然语言处理
机器人
人工智能
NLP
高频面试题(十三)——什么是大模型幻觉,如何解决大模型幻觉
深入理解大模型幻觉及其解决方案所谓大模型幻觉,是指LLM在生成文本时出现看似流畅合理但实际上却偏离事实甚至无中生有的内容。这不仅严重影响了模型输出的可靠性,在某些敏感领域(如医疗、法律)可能造成严重后果。本文将深入分析大模型幻觉产生的原因、分类与检测方法,并提出有效的解决策略,帮助更好地理解并应对这一挑战。一、什么是大模型幻觉?大模型幻觉(Hallucination)是指大型语言模型在生成文本时,
Chaos_Wang_
·
2025-03-25 17:47
NLP常见面试题
自然语言处理
人工智能
《深入浅出LLM基础篇》(四):主流大模型介绍
AI学习星球推荐:GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|
NLP
|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于前沿论文解读
GoAI
·
2025-03-25 17:14
深入浅出AI
深入浅出LLM
自然语言处理NLP
大模型
LLM
人工智能
llama
chatglm
Elasticsearch 入门到精通-Ansj分词器的安装和使用
pluginelasticsearch7.6.27.6.27.7.07.7.07.7.17.7.17.8.07.8.07.8.17.8.17.9.07.9.07.9.17.9.17.9.27.9.27.9.37.9.3二、安装步骤1、下载安装ES对应PluginRelease版本a.GitHub-
NLP
china
王stone
·
2025-03-25 11:01
elasticsearch
elasticsearch
大数据
big
data
Python机器人简单问答系统
Flask应用3.读取学习数据4.处理用户请求4.1首页路由4.2问答路由5.根据问题生成回答6.运行Flask应用全部代码HTML结构学习总结项目背景与目的项目背景随着人工智能技术的快速发展,自然语言处理(
NLP
chang_xiaoyi
·
2025-03-25 04:12
python
开发语言
SFT和RLHF是什么意思?
它们通常应用于自然语言处理(
NLP
)领域,特别是对于那些需要对特定任务进行优化的语言模型。SFT(监督微调)
玩人工智能的辣条哥
·
2025-03-25 00:15
人工智能
人工智能
深度学习
机器学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他