E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
NLP文本处理
自然语言处理入门:使用Python和NLTK进行文本预处理
文章标题:自然语言处理入门:使用Python和NLTK进行文本预处理简介自然语言处理(
NLP
)是人工智能领域的一个重要分支,它致力于使计算机能够理解、分析和生成人类语言。
Evaporator Core
·
2024-02-19 19:29
深度学习
深度学习
python
tensorflow
NLP
-词袋模型
词袋模型是自然语言处理中常用的一种文本表示方法,用于将文本转换为数值型向量,以便于计算机进行处理和分析。在词袋模型中,文本被看作是一个由词语组成的集合,而每个词语都是独立的,不考虑它们在文本中的顺序和语境关系。因此,词袋模型将文本表示为一个固定长度的向量,其中每个维度对应一个词语,该维度的值表示该词语在文本中出现的频次或者其他统计量。具体来说,词袋模型包括以下步骤:分词:将文本按照一定的规则或算法
草明
·
2024-02-19 19:58
数据结构与算法
自然语言处理
人工智能
NLP
_自然语言处理项目(2):seq2seq_attention_机器翻译(基于PyTorch)
1、seq2seq_attention_机器翻译seq2seq_attention是一种基于神经网络的机器翻译模型,它通过编码器和解码器两个部分实现翻译功能。编码器将源语言句子转换为一个固定长度的向量表示,解码器则将这个向量作为输入,生成目标语言句子的翻译结果。在seq2seq_attention中,编码器和解码器都是由循环神经网络(RNN)组成的。编码器将源语言句子中的每个单词依次输入RNN,每
@硬train一发
·
2024-02-19 18:56
NLP
自然语言处理
机器翻译
pytorch
如何使用 MongoDB 构建采用 AI 技术的应用程序
这可以包括机器学习(ML)、深度学习(DL)、自然语言处理(
NLP
)等。确定您需要收集和处理的数据类型以及这些数据如何支持AI模型。设计数据模型:根据AI模型的需求设计MongoDB的数据模型。
数字化信息化智能化解决方案
·
2024-02-19 16:03
mongodb
人工智能
数据库
深度学习的应用实例
自然语言处理(
NLP
)情感分析:深度学习模型如循环神经网络(RNN)和Transformer等已被广泛用于情感分析任务,例如识别文本中的情感倾向或情感类别。
数字化信息化智能化解决方案
·
2024-02-19 16:27
深度学习
人工智能
今日arXiv最热
NLP
大模型论文:上海AI Lab联合清华发布十项全能数学大模型InternLM-Math
数学推理能力是大语言模型(LLMs)抽象推理能力的一个重要体现。近年来,随着深度学习技术的不断进步,LLMs在数学推理任务上取得了显著的进展。从小学级别到高中级别的数学问题,通过链式推理(chain-of-thoughtreasoning)或程序式推理(program-of-thoughtreasoning),LLMs展现出了解决数学问题的潜力。这些模型的构建需要在数学语料上进行预训练,并在数学问
夕小瑶
·
2024-02-19 16:56
人工智能
自然语言处理
今日Arxiv最热大模型论文:大语言模型真的理解上下文了吗?新研究揭示惊人发现
探索大型语言模型的上下文理解能力在自然语言处理(NaturalLanguageProcessing,
NLP
)领域,理解上下文是把握人类语言的关键。
夕小瑶
·
2024-02-19 16:55
语言模型
人工智能
自然语言处理
上海
NLP
执行师课程(第四天)学习收获
今天是学习的第四天了。每天都有很多收获,今天也不例外。上午应老师讲的信念形成的三个阶段,对我很有触动。0一7岁是印记期,这个阶段的孩子全然开放,对外来的信息全然接受。基于这一点家长和幼儿园的老师对孩子的教育就有太多的地方值得反思。8一13岁是模伤期,14一21岁是社交期。通过应老师的讲解,我知道了在这三个阶段教育孩子的方法和注意事项。更懂得了作为中学教师要怎样去理解孩子和对待孩子。下午,危娜老师带
那兰提花1
·
2024-02-19 16:39
#pragma用法详解
1什么是预处理预处理是将源文件的文本作为翻译的第一阶段操作的
文本处理
步骤。预处理不会分析源文本,但会为了查找宏调用而将源文本细分为标记。
Yang_Winston
·
2024-02-19 15:54
#
C语言
visual
studio
c++
ide
神经网络算法 —— Embedding(嵌入)!!
文章目录前言1、Embedding的本质(1)机器学习中的Embedding(2)
NLP
中的Embedding2、Embedding的原理(1)ImageEmbedding(图像嵌入)(2)WordEmbedding
JOYCE_Leo16
·
2024-02-19 15:15
Transformer
神经网络
embedding
深度学习
自然语言处理
NLP
课程学习017
今天2021年4月27日【学习内容】42,舒缓情绪的技巧43,保险箱技术【我的收获】情绪是我们的本能,也是能量。1.舒缓情绪的技巧:觉察-舒缓-表达-转化-运用。舒缓情绪的方法:深呼吸(我们忘了呼吸就会失去智慧);混合法(集中注意力);生理平衡法(放松,抚平情绪)运用身体的能量,用身体接触,调和身体能量,让情绪平和下来,多做一些身体能量,多拥抱自己。【我可以这样用】在孩子哭闹时我们经常会产生情绪,
贝字旁的赚
·
2024-02-19 14:53
【自然语言处理】:实验4布置,预训练语言模型实现与应用
清华大学驭风计划因为篇幅原因实验答案分开上传,自然语言处理专栏持续更新中,期待的小伙伴敬请关注有任何疑问或者问题,也欢迎私信博主,大家可以相互讨论交流哟~~案例简介2018年,Google提出了预训练语言模型BERT,该模型在各种
NLP
X.AI666
·
2024-02-19 13:38
自然语言处理
自然语言处理
人工智能
NLP
_GPT生成式自回归模型
文章目录介绍完整代码小结介绍自回归(Autoregressive)是自然语言处理模型的一种训练方法,其核心思想是基于已有的序列(词或字符)来预测下一个元素。在GPT中,这意味着模型会根据给定的上文来生成下一个词,如图所示。在GPT模型的训练和推理这两个相互独立的过程中,“自回归”的含义是不同的。训练过程中的“自回归”:在训练阶段,GPT通过大量文本数据进行学习。模型会接收一个词序列作为输入,然后预
you_are_my_sunshine*
·
2024-02-19 12:32
大模型
NLP
自然语言处理
gpt
关于VIT(Vision Transformer)的架构记录
这种刻意简化的设置的一个优势是,可扩展的
NLP
Transformer架构及其高效的实现几乎可以即插即用。图:模型概述。
一条小小yu
·
2024-02-19 12:53
transformer
深度学习
人工智能
NLP
_BERT与GPT争锋
文章目录介绍小结介绍在开始训练GPT之前,我们先比较一下BERT和GPT这两种基于Transformer的预训练模型结构,找出它们的异同。Transformer架构被提出后不久,一大批基于这个架构的预训练模型就如雨后春笋般地出现了。其中最重要、影响最深远的两个预训练模型当然就是GPT和BERT这两个模型。在ChatGPT震惊世界之前,在自然语言处理领域影响最大的预训练模型是BERT,很多科研工作都
you_are_my_sunshine*
·
2024-02-19 12:13
NLP
大模型
自然语言处理
bert
gpt
如何使用Python进行自然语言处理
自然语言处理(
NLP
)是人工智能领域中一个非常重要的技术,它涉及到计算机对人类语言的理解和处理。
程序员~小强
·
2024-02-15 10:57
python
自然语言处理
easyui
Day276 父母是孩子最好的催眠师
【温柔能量妈】
NLP
三阶第一天学习,潜意识是宝藏,里面有无穷的潜能未激发。潜意识有什么,我们的世界有什么,潜意识不分辨正面负面语言,它是照单全收。
李春华_7db6
·
2024-02-15 10:35
NLP
_ChatGPT的RLHF实战
文章目录介绍小结介绍ChatGPT之所以成为ChatGPT,基于人类反馈的强化学习是其中重要的一环。而ChatGPT的训练工程称得上是复杂而又神秘的,迄今为止,OpenAl也没有开源它的训练及调优的细节。从OpenAl已经公开的一部分信息推知,ChatGPT的训练主要由三个步骤组成,如下图所示。原文:译文:第1步,先使用大量数据(从Prompt数据库中抽样)通过监督学习在预训练的GPT-3.5基础
you_are_my_sunshine*
·
2024-02-15 09:41
NLP
大模型
chatgpt
自然语言处理
人工智能
NLP
快速入门
NLP
入门课程链接:https://www.bilibili.com/video/BV17K4y1W7yb/?
Knoka705
·
2024-02-15 09:10
NLP
自然语言处理
人工智能
NLP
_GPT到ChatGPT
GPT在多种
NLP
任务上取得了显著进步。GPT-2:2019年,OpenAI推出了GPT的升级版,拥有更多参数[15亿
you_are_my_sunshine*
·
2024-02-15 09:39
NLP
大模型
自然语言处理
gpt
chatgpt
【AI视野·今日
NLP
自然语言处理论文速览 第七十八期】Wed, 17 Jan 2024
AI视野·今日CS.
NLP
自然语言处理论文速览Wed,17Jan2024(showingfirst100of163entries)Totally100papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersDeductiveClosureTrainingofLanguageModelsforCoherence
hitrjj
·
2024-02-15 09:57
NLP
LLM
Papers
NLP
LLM
大语言模型
文本处理
生成模型
Prompt Tuning:深度解读一种新的微调范式
面向不同种类
NLP
任务,prompt如何选择和设计?面向超大规模模型,如何借助prompt进行参数有效性训练?面向GPT3,什么是In-ContextLearning?什么是Chain-Of-
lichunericli
·
2024-02-15 09:55
LLM
人工智能
语言模型
prompt
时间是画面
图片发自App上海
NLP
专业执行师第三天,时间即是画面,每分每秒呈现不同的画面,说一说今天印象最深的几幅。
感恩生命中有你
·
2024-02-15 09:57
word embedding是什么,word embedding之前需要做什么?
从自然语言的角度看,
NLP
可以大致分为自然语言处理和自然语言生成这两部分,就是理解文本和文本生成。
liaolaa
·
2024-02-15 08:43
深度学习
自然语言处理
pytorch
语言模型
java实现beamsearch_beam search原理以及在
NLP
中应用
BeamSearch简介一、概要传统的广度优先策略能够找到最优的路径,但是在搜索空间非常大的情况下,内存占用是指数级增长,很容易造成内存溢出,因此提出了beamsearch的算法。beamsearch尝试在广度优先基础上进行进行搜索空间的优化(类似于剪枝)达到减少内存消耗的目的。二、BeamSearch算法新的概念为了达到搜索的目的,beamsearch引入了启发函数的概念(h)来估计从当前节点到
知乎汽车
·
2024-02-15 08:13
【AI视野·今日
NLP
自然语言处理论文速览 第七十九期】Thu, 18 Jan 2024
AI视野·今日CS.
NLP
自然语言处理论文速览Thu,18Jan2024Totally35papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersDecipheringTextualAuthenticity
hitrjj
·
2024-02-15 06:17
LLM
NLP
Papers
自然语言处理
LLM
大语言模型
对话系统
NLP
NLP
人生三件事
人生里的很多困扰并不是因为事件,而是我们没有区分清楚事情里面的边界,我们把很多事件揉在一起,就会变得乱,纠缠,从而让自己活得很累。人生三件事:1.自己的事:只能自己去做,对自己的人生负责任,自己的事情全力以赴,不把自己人生的钥匙交给他人。2.别人的事:一个人不能改变另一个人,尊重他人的选择,放下对他人的期待3.老天的事:臣服,尊重,顺势而为例:你开心了我就开心你关心我我心情就好这是一种托付心态,把
YOKI陶
·
2024-02-15 05:30
NLP
4
限制性信念潜意识我的收获:我有很多时候会感到无助,无望,无资格或者叫无价值感,比如曾经有一次自己想卖东西,结果没人买,被拒绝,当时只觉得好没面子,原来以为别人也会像我一样热衷,结果没有人捧场,被拒绝了一次,我就再也没骨气第二次的勇气,可能是我小时候被这样拒绝了太多次,那种身体里的感觉太深刻,所以再一次体验,就陷在里面出不来了,全是羞耻,恐惧,就更不会去想一想,也许有人需要呢?也许有人跟我一样看好这
素月分辉
·
2024-02-15 05:44
闲聊自然语言处理
NLP
原文链接无论在工程界还是学术界自然语言处理(
NLP
)一直是一个比较热的话题,尤其随着近些年深度学习的发展给
NLP
也带来一些新思路。对于这个话题随便聊聊,想到哪写到哪。
热血沸腾
·
2024-02-15 04:25
Paddle
NLP
自然语言处理 知识图谱 uie-x-base,uie-m-large,uie-m-base模型使用时,报错Out of memory error on GPU 0 gpu内存不够
Hi,I’m@货又星I’minterestedin…I’mcurrentlylearning…️I’mlookingtocollaborateon…Howtoreachme…README目录(持续更新中)各种错误处理、爬虫实战及模板、百度智能云人脸识别、计算机视觉深度学习CNN图像识别与分类、PaddlePaddle自然语言处理知识图谱、GitHub、运维…WeChat:1297767084Git
货又星
·
2024-02-15 04:42
自然语言处理
语言模型
人工智能
运维
知识图谱
nlp
gpt-3
对话系统 | (6) 医疗健康领域的短文本理解
主要内容包括:丁香园主要的业务和所服务的对象,以及在垂直领域下
NLP
工作可能需要面对的挑战在医疗健康领域短文本理解上的尝试结合工
CoreJT
·
2024-02-15 04:08
对话系统
nlp
成长
这次写不出东西了,但是我知道我一直在坚持,我学会了坚持,坚持快乐,坚持
nlp
的核心理念我的人生是成功快乐的
宁静致远2009
·
2024-02-15 02:15
今日arXiv最热
NLP
大模型论文:清华提出LongAlign,打破长上下文对齐瓶颈,数据、训练策略、评估基准一网打尽
随着LLMs的发展,其支持的上下文长度越来越长。仅一年时间,GPT-4就从一开始的4K、8K拓展到了128k。128k什么概念?相当于一本300页厚的书。这是当初只支持512个tokens的BERT时代不敢想象的事情。随着上下文窗口长度的增加,可以提供更丰富的语义信息,从而减少LLM的出错率和“幻觉”发生的可能性,提升用户体验。但现有的构建长上下文LLMs的工作主要集中在上下文扩展方面,即位置编码
夕小瑶
·
2024-02-15 02:27
人工智能
chatgpt
今日arXiv最热
NLP
大模型论文:智能谈判Agent综述,一文读懂谈判桌上的人工智能
谈判,就是大家坐下来聊聊,看怎么能达成共识,共同解决问题。可以是朋友间的闲聊,也可以是国与国之间的外交场合。但谈判这事儿,说简单也不简单。人们往往会带着偏见和情绪,忽略了别人的好建议,导致结果不尽如人意。而且,谈判也是门技术活,不是谁都能轻易搞定的。为了促进人类谈判过程,研究者们提出了智能谈判Agent,能够在多轮互动中辅助人类甚至直接与人类进行谈判。一个典型的谈判对话涉及到Agent和人类之间的
夕小瑶
·
2024-02-15 02:27
人工智能
今日arXiv最热
NLP
大模型论文:基于语言模型模拟的经济学研究
引言:经济选择预测的新视角在经济决策的预测领域,传统方法通常受限于获取人类选择数据的难度。实验经济学研究大多集中在简单的选择设置上,而这些设置往往无法捕捉复杂的人类行为。近年来,人工智能社区通过两种方式为这一领域做出了贡献:一是探讨大型语言模型(LLMs)是否能在简单的选择预测设置中替代人类;二是通过机器学习(ML)的视角研究更复杂的实验经济学设置,这些设置涉及不完全信息、重复游戏和自然语言交流,
夕小瑶
·
2024-02-15 02:26
人工智能
深度学习
大数据
自然语言处理
今日arXiv最热
NLP
大模型论文:大语言模型为什么始终会产生幻觉
随着LLMs的广泛应用,幻觉问题引起了越来越多的安全和道德关注,各种各样的幻觉缓解方法也层出不穷,比如各类知识增强方法、对模型答案进行验证、新的评估基准等。相信大家会和我一样有一个疑问:幻觉问题有望被彻底解决吗?今天介绍的这篇文章很特别,它没有具体讨论缓解幻觉的方法,而是通过对幻觉问题进行明确定义和形式化分析,对幻觉精确讨论与验证实验,最终得出了一个基本结果:即无论模型架构、学习算法、提示技术或训
夕小瑶
·
2024-02-15 02:56
大数据
人工智能
今日arXiv最热
NLP
大模型论文:无需数据集,大模型可通过强化学习与实体环境高效对齐 | ICLR2024
引言:将大型语言模型与环境对齐的挑战虽然大语言模型(LLMs)在自然语言生成、理解等多项任务中取得了显著成就,但是在面对看起来简单的决策任务时,却常常表现不佳。这个问题的主要原因是大语言模型内嵌的知识与实际环境之间存在不对齐的问题。相比之下,强化学习(RL)能够通过试错的方法从零开始学习策略,从而确保内部嵌入知识与环境的对齐。但是,怎样将先验知识高效地融入这样的学习过程是一大挑战,为了解决这一差距
夕小瑶
·
2024-02-15 02:56
自然语言处理
人工智能
深度学习
AllenAI 开源了关于大模型的所有细节!数据、代码、参数、训练过程,完全复现
开篇:OLMo的诞生与开放模型的重要性在人工智能领域,语言模型(LMs)的发展一直是推动自然语言处理(
NLP
)技术进步的核心力量。
夕小瑶
·
2024-02-15 02:56
自然语言处理
人工智能
深度学习
大数据
NLP
学习-05.问答系统基础-文本表示(word representation)-距离计算
上几节已经介绍了文本的分词,拼写纠错,这节介绍wordrepresentation和距离的计算都比较简单,不做详细说明.什么是wordrepresentation即将一个文本进行向量化,这样可以容易地进行距离的度量.有哪些方法进行文本向量化onehot:每个词都用onehot变化表示成稀疏向量;booleanrepresentation:即词典的长度为向量长度,有词的记为1;booleanrepr
logi
·
2024-02-15 01:35
ApacheCN 交流社区热点汇总 2019.3
出国留学-微信讨论组自然语言处理(
NLP
)学习路线【每日一问】ID3、C4.5、C5.0和CART有什么联系、区别和优劣?【每日一问】假设模型准确率接近的情况下,模型融合越多越好吗?
布客飞龙
·
2024-02-14 21:40
20201110-
NLP
的巨人肩膀-1引子
转载:https://zhuanlan.zhihu.com/p/50443871没办法,写的太好了图片.png
NLP
的巨人肩膀我们都知道,牛顿说过一句名言IfIhaveseenfurther,itisbystandingontheshouldersofgiants
野山羊骑士
·
2024-02-14 20:54
手动下载spacy的en_core_web_sm模型
https://github.com/explosion/spacy-models/releases例子代码importspacy
nlp
=spacy.load("your/base/path/en_core_web
茫茫人海一粒沙
·
2024-02-14 19:08
自然语言处理
人工智能
Shell脚本之正则表达式与
文本处理
工具详解
文章目录一.正则表达式定义二.正则表达式元字符2.1基础正则表达式元字符2.2扩展正则表达式元字符三.
文本处理
工具3.1列截取工具--cut3.2排序工具--sort3.3去重工具--uniq3.4修改工具
Sq夏颜
·
2024-02-14 17:03
运维
linux
云计算
bash
机器学习:多项式模型朴素贝叶斯分类器(原理+python实现)
简介多项式朴素贝叶斯也是多用于
文本处理
,其原理和计算的流程和伯努利朴素贝叶斯基本一致,唯一的区别在于单词的计数方式,由《伯努利朴素贝叶斯》一文可知,在
文本处理
的环节中,我们将单词是否出现在词组作为特征,
DocPark
·
2024-02-14 13:03
机器学习
python
自然语言处理N天-Allen
NLP
学习(实现简单的词性标注)
有一篇帖子总结了一下学习处理
NLP
问题中间的坑。
NLP
数据预处理要比CV的麻烦很多。去除停用词,建立词典,加载各种预训练词向量,Sentence->Wo
我的昵称违规了
·
2024-02-14 12:54
使用模型Helsinki-
NLP
/opus-mt-en-zh实现英译中
googlecodlab运行需要5秒fromtransformersimportAutoModel,AutoTokenizer,MarianMTModelfromhuggingface_hub.hf_apiimportHfFolderHfFolder.save_token('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')text="Memphisisaserieso
hehui0921
·
2024-02-14 11:18
huggingface
自然语言处理
机器翻译
人工智能
断舍离(3)
22017年的夏日的洛阳,凯旋路上高大的梧桐树依稀可见,参加
NLP
专业执行师的学习,遇见应童老师,收到小树宝宝的礼物。回来
波光粼粼_
·
2024-02-14 10:30
Day30
3月
nlp
经验层次时,我有个心愿是未来12个月带领12场工作坊。
Vidya程莹
·
2024-02-14 09:14
随感
这次的讲师居然是我16年学习
NLP
时的同学,当叶老师讲述她自己的故事时,我有一种心有戚戚然的感觉。
10f4aa464b14
·
2024-02-14 06:13
使用word2vec+tensorflow自然语言处理
NLP
目录介绍:搭建上下文或预测目标词来学习词向量建模1:建模2:预测:介绍:Word2Vec是一种用于将文本转换为向量表示的技术。它是由谷歌团队于2013年提出的一种神经网络模型。Word2Vec可以将单词表示为高维空间中的向量,使得具有相似含义的单词在向量空间中距离较近。这种向量表示可以用于各种自然语言处理任务,如语义相似度计算、文本分类和命名实体识别等。Word2Vec的核心思想是通过预测上下文或
取名真难.
·
2024-02-14 05:18
机器学习
自然语言处理
word2vec
tensorflow
机器学习
深度学习
神经网络
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他