E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语料
词向量模型之CBOW
CBOW是通过中心词来预测上下文,然后用这个预测过程中的参数权重来形成一个词向量,具体的操作如下:首先需要找一个
语料
库,比如百科,微博等等。然后对这个
语料
进行分词处理。一般用jieba,比较快。
爬行程序猿
·
2022-12-16 21:46
NLP自然语言处理
自然语言处理
算法
人工智能
图神经网络Core数据集介绍
这些论文分为以下七个类别之一:基于案例遗传算法神经网络概率方法强化学习规则学习理论这些论文的选择方式是,在最终
语料
库中,每篇论文引用或被至少一篇其他论文引用。整个
语料
库中有2708篇论文。
yihanyifan
·
2022-12-16 10:08
论文研读
神经网络
深度学习
人工智能
基于Bert的文本情感分类
推理的过程,即分析说话人的态度,推断其所包含的情感类别.传统机器学习在处理情感分类问题的时候通常是基于SVM、CRF、信息熵等传统算法,其优势在于具有对多种特征建模的能力,但要用人工标注的单个词作为特征,而
语料
的不足往往就是性能的瓶颈
Mr.Gu
·
2022-12-15 20:25
人工智能
python
shell
2.文本预处理(分词,命名实体识别和词性标注,one-hot,word2vec,word embedding,文本数据分析,文本特征处理,文本数据增强)
文章目录1.1认识文本预处理文本预处理及其作用文本预处理中包含的主要环节文本处理的基本方法文本张量表示方法文本
语料
的数据分析文本特征处理数据增强方法重要说明1.2文本处理的基本方法学习目标什么是分词分词的作用流行中文分词工具
GCTTTTTT
·
2022-12-15 18:43
nlp
word2vec
人工智能
python
nlp
自然语言处理
自然语言处理预训练模型综述
在现代自然语言处理任务中,用大规模
语料
库进行无监督训练得到的词的分布式表示被广泛使用,其中Word2Vec实现了在低维条件下用稠密向量对词进行表示,但是这种方式只能提取浅层文本表征,忽略了上下文,无法在不同语境下对词的句法和语义进行有效表
石头ape
·
2022-12-15 12:27
自然语言处理
自然语言处理
简要总结一篇关于知识图谱嵌入的综述
可以看出,从大规模
语料
中学习得到的词向量可以建模单词之间的相
xhsun1997
·
2022-12-15 12:54
KGQA
知识图谱
人工智能
机器学习
第五章语言模型:n-gram
_1w_2...w_ms=w1w2...wm的先验概率历史基元*问题解决方法如何划分等价类*题型十二:根据n-gram划分句子*n-gram的应用音字转换问题汉语分词问题*参数估计*题型十三:给定训练
语料
根据
右边是我女神
·
2022-12-15 07:15
自然语言处理
语言模型
人工智能
自然语言处理
python
语料
库的n元模型构建_学习笔记CB006:依存句法、LTP、n元语法模型、N-最短路径分词法、由字构词分词法、图论、概率论...
依存句法分析,法国语言学家L.Tesniere1959年提出。句法,句子规则,句子成分组织规则。依存句法,成分间依赖关系。依赖,没有A,B存在错误。语义,句子含义。依存句法强调介词、助词划分作用,语义依存注重实词间逻辑关系。依存句法随字面词语变化不同,语义依存不同字面词语可同一意思,句法结构不同句子语义关系可相同。依存句法分析和语义分析结合,计算机理解句子含义,匹配到最合适回答,通过置信度匹配实现
weixin_39845241
·
2022-12-15 07:44
语言模型--n-gram解读
各个词的概率可以通过
语料
中统计计算得到。假设句子T是有词序列w1,w2,w3…wn组成,用公式表示N-Gram语言模型如下:P(T)=P(w1)*p(w2)*p(w3)***p(wn)
醒了的追梦人
·
2022-12-15 07:43
语音识别
语言模型
n-gram
别再双塔了!谷歌提出DSI索引,检索效果吊打双塔,零样本超BM25!
卖萌屋今日学术精选这篇论文展示了信息检索可以用一个Transformer来完成,其中,关于
语料
库的所有信息都被编码在Transformer模型的参数中。
夕小瑶
·
2022-12-15 06:03
机器学习
人工智能
深度学习
java
大数据
Transformer Memory as a Differentiable Search Index论文阅读
TransformerMemoryasaDifferentiableSearchIndex:Transformer存储器作为可区分搜索索引本文证明了信息检索可以通过一个Transformer来完成,其中关于
语料
库的所有信息都被编码在模型的参数中
若年封尘
·
2022-12-15 06:53
深度学习
transformer
论文阅读
深度学习
信息检索
DSI
爆火Chatgpt注册完全指南
它还使用了大量的
语料
库来训练模型,这些
语料
库包含了真实世界中的对话,以便模型能够更好地理解人类语言。2chatgpt使用介绍http
order by
·
2022-12-14 15:51
chatgpt
深度学习
人工智能
a neural probabilistic language model 论文笔记
统计语言模型首先统计语言模型的学习目标本质上都是一种语言的单词序列的联合概率函数:p(w1,w2,w3…,wt)=p(w1)p(w2|w1)p(w3|w1w2)…p(wn|w1w2…wt-1)上式可以理解为,给定前面的t-1个词,后面第t个词出现的概率,假设
语料
库有
码源
·
2022-12-14 10:36
机器学习
自然语言处理
深度学习
神经网络
使用 Docker 和 HuggingFace 实现 NLP 文本情感分析应用
在这篇文章里,我们不需要准备显卡和
语料
,也不需要耐心等待“炼丹”就绪,只要会“搭积木”,就能够实现这样一个有趣的小工具。写在前面本篇内容,作为后续内容的前置内容(工具),我们来聊聊如何将Hugging
soulteary
·
2022-12-14 09:31
为了不折腾而去折腾的那些事
自然语言处理
docker
人工智能
情感识别
中文情感分析
python古诗词生成_唐诗生成器
使用唐诗
语料
库,经过去噪预处理、分词、生成搭配、生成主题等过程,生成唐诗。
weixin_39596720
·
2022-12-14 05:22
python古诗词生成
宋词自动生成
利用宋词
语料
库,通过单双词的组合与模板的匹配,实现指定词牌宋词的生成importrandomimporttkinterastkimportrefromtkinterimportmessageboxlist
bug_maker_sun
·
2022-12-14 05:52
python
人工智能
自然语言处理
语言模型
TF-IDF详解
TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个
语料
库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着
bugmaker.
·
2022-12-13 22:34
NLP
tf-idf
人工智能
python
CV-掩码学习-模型-2021:MAE【在NLP和CV两大领域之间架起了一座更简便的桥梁】
直观点讲,就是事先遮住一些文本片段,让AI模型通过自监督学习,通过海量
语料
库的预训练,逐步掌握上下文语境,把这些被遮住的片段,用尽可能合乎逻辑的方式填回去。这和我们做「完形填空」的方式有些类似。
u013250861
·
2022-12-13 21:14
#
CV/掩码学习
人工智能
python 聊天机器人 中文_GitHub - 24python/chatbot: 一个可以自己进行训练的中文聊天机器人, 根据自己的
语料
训练出自己想要的聊天机器人,可以用于智能客服、在线问答、智能.
chatbot一个可以使用自己
语料
进行训练的中文聊天机器人,欢迎大家实践交流。
李轶林
·
2022-12-13 17:28
python
聊天机器人
中文
如何5分钟快速搭建智能问答系统
传统的问答机器人大都是基于规则的知识图谱方式实现,这种方式需要对大量的
语料
进行分类整
小马过河R
·
2022-12-13 16:24
火爆出圈的OpenAI模型ChatGPT体验
ChatGPT使用transformer模型进行训练,可以从大量的
语料
中学习语言之间的关系,并使用多层循环神经网
solihawk
·
2022-12-13 11:02
人工智能
技术前沿
chatgpt
人工智能
深度学习
seq2seq
选择这个任务主要是因为“文章-标题”这样的
语料
对比较好找,能快速实验一下。seq2seq简介#所谓seq2s
野营者007
·
2022-12-13 09:10
Neural
Network
NLP
Seq2Seq
TF-IDF算法提取文本关键词
TF-IDF是用以评估一字词对于一个文件集或一个
语料
库中的其中一份文件的重要程度。
bullnfresh
·
2022-12-13 01:29
学生作业
算法
sklearn
人工智能
自然语言处理NLP程序包(NLTK/spaCy)使用总结
NLTKNaturalLanguageToolkit(NLTK)由宾夕法尼亚大学开发,提供了超过50种
语料
库,以及一些常用的文本处理函数,例如分词(Tokenization)、词干(Stemming)、
cnblogs.com/qizhou/
·
2022-12-12 20:36
自然语言处理
python
人工智能
开发语言
自己的思路-套Bert-Chinese-Text-Classification-Pytorch-master
语料
处理流程
自己的思路-套Bert-Chinese-Text-Classification-Pytorch-master
语料
处理流程把数据集按比例划分train(0.7),test(0.15)和dev(0.15)在
代码小学渣
·
2022-12-12 14:29
毕设
pytorch
深度学习
自然语言处理
文本分类--普通分类
文本分类在机器学习中属于监督学习,其流程是:人工标注文档类别、利用
语料
训练模型、利用模型训练文档的类别。2问题总结文本分类的一般流程;3解决思路3.1文本的特征提取特征选择是特征工程中的重要一
FibonacciCode
·
2022-12-12 09:13
自然语言处理
文本分类
demo_text_classification.pyfrompyhanlpimport*fromtests.test_utilityimportensure_datasogou_corpus_path=ensure_data('搜狗文本分类
语料
库迷你版
Nlper_Zhao
·
2022-12-12 09:09
自然语言处理
自然语言处理
-文本分类
目录第11章文本分类11.1文本分类的概念11.2文本分类
语料
库11.3文本分类的特征提取11.4朴素贝叶斯分类器11.5支持向量机分类器11.6标准化评测11.7情感分析11.8总结第11章文本分类上一章我们学习了文本聚类
ASS-ASH
·
2022-12-12 09:37
情感分析
自然语言处理
机器学习
深度学习
python
HanLP-朴素贝叶斯分类预测缺陷
可能出现的badcase就是明明训练
语料
X类目下没有词语t,而系统就将文本预测为X类目。解决方法就时改相乘为取对数相加。HanLP的
adnb34g
·
2022-12-12 09:03
自然语言处理
hanlp
朴素贝叶斯分类
基于 EasyOCR + HanLp 实现图片文字实体(中文姓名、机构名、地域名)识别
HanLP具备功能完善、性能高效、架构清晰、
语料
时新、可自定义的特点
小毕超
·
2022-12-12 08:57
机器学习
python
人工智能
基于深度学习的FAQ检索式问答系统
问答系统是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索
语料
库、知识图谱或问答知识库返回简洁、准确的匹配答案。
草尖上的舞动
·
2022-12-11 21:08
LDA模型原理学习及应用
•LDA是一种非监督机器学习技术,可以用来识别大规模文档集或
语料
库中潜藏的主题信息。它采用了词袋(bagofwords)的
咕噜oo
·
2022-12-11 20:33
算法
算法
主题模型
LDA
文本建模
爆火Chatgpt注册 chatgpt使用 完全指南
它还使用了大量的
语料
库来训练模型,这些
语料
库包含了真实世界中的对话,以便模型能够更好地理解人类语言。2chatgpt使用介绍http
爱编程的研究生小王
·
2022-12-11 12:12
python
程序人生
论文浅尝 - EMNLP2020 | 通过词重排序跨语言解析
EMNLP2020链接:https://www.aclweb.org/anthology/2020.findings-emnlp.265.pdf动机依赖解析研究快速发展,然而依赖解析的性能在很大程度上依赖于
语料
库的大小
开放知识图谱
·
2022-12-11 10:12
算法
机器学习
人工智能
深度学习
编程语言
【自然语言处理】对评论进行处理的推荐系统的论文总结
【自然语言处理】对评论进行处理的推荐系统的论文总结NLP
语料
库介绍的以及连接腾讯
语料
库github上40个nlp中文
语料
库推荐系统中常见的文本处理方法词袋模型BOW推荐系统中的应用存在的问题解决思路词袋模型升级版
ciecus_csdn
·
2022-12-10 11:22
推荐系统
自然语言处理
自然语言处理
推荐系统
GPT2-Chinese:中文的GPT2训练代码
支持大
语料
训练。以下来在该项目主页描述。GPT2-ChineseDescriptionChineseversionofGPT2t
just do it now
·
2022-12-10 06:59
深度学习
自然语言处理
UNIMO:通过跨模态对比学习实现统一模态的理解和生成
UNIMO利用大规模自由文本
语料
库和图像集来提高视觉文本理解能力,利用跨模态对比学习(CMCL)将文本和视觉信息整合到统一语义空间中,形成一个由图像和文本组成的“图像-文本对”
语料
库。UNIMO借助
Civisky
·
2022-12-10 04:02
人工智能
计算机视觉
机器学习
数据开源 | 跨境电商场景中日平行
语料
1000
如果问近两年最热的概念,相信不少人会回答:元宇宙。但元宇宙到底是什么,目前还尚未有明确定义。广义来说,元宇宙是一个视觉图像丰富的虚拟空间,在这个空间中人们可以工作、娱乐、购物、社交等。你可以想像自己真的“存在”于一个虚拟的世界中,不仅可以订制自己的化身(Avatar),还能够拥有数位资产,从而可以与来自全世界不同地区、不同肤色、不同语种的伙伴进行互动交流。跨境电商中的虚拟人如今元宇宙已经渗透到各行
Magic Data
·
2022-12-09 09:45
人工智能
开源
nlp
句向量表示--BERT-FLOW,BERT-whitening, ConSERT, coSENT
向量值受句子中词在所有训练
语料
里的词频影响,导致高频词编码的句向量距离更近,更集中在原点附近,导致即使一
zhurui_xiaozhuzaizai
·
2022-12-09 07:47
自然语言处理
自然语言处理
深度学习
知识图谱
PaperWeekly 第53期 | 更别致的词向量模型:Simpler GloVe - Part 2
本期我们将带来该系列的后半部分,包括对该词向量模型的详细求解、结果展示,以及代码和
语料
分享。模型的求解损失函数现在,我们来定义loss,以便把各个词向量求解出来。
weixin_34122604
·
2022-12-09 07:17
数据结构与算法
python
人工智能
语料
分析环境配置过程
GitHub-tanloong/neosca:NeoSCAisasyntacticcomplexityanalyzerofwrittenEnglishlanguagesamples.本文是在win10环境下成功配置环境的注意事项首先电脑已安装python,pip,或者有python和anaconda(使用虚拟环境也可以)一、win+r,cmd打开按第一步输入pipinstallneosca二、按第
hollq
·
2022-12-08 21:56
python
开发语言
代码调试全指南-自然语言处理-基于预训练模型的方法,车万翔
文章目录introductionchp2:fmm分词&svgchp3:维基百科
语料
库处理chp4:情感分类chp5:cbow,skipgram...chp6:动态词向量,ELMochp7:预训练语言模型
半杯知识
·
2022-12-08 20:13
自然语言处理
pytorch
python
一种获取NLP
语料
的基本方法
上次送书我选择了这四位:左小孙、正、慎读、孙湛林,请看到后联系我,若三天内未与我取得联系名额自动让给其他留言者。在此非常感谢参与留言活动的其他小伙伴,分别是天籁之音、王者灵魂、Hellboycc、山猫、小炮先生、三根葱、Pluto、林卫明、影子、小杨同学、Analyzestatisticsthendie、沈杰、平凡、若水、胡健、沐雨、云梦泽、遗贤对酒、你是不是、Iam、追风少年、HuaBro、哈弗
算法channel
·
2022-12-08 14:04
python
java
json
linux
大数据
语料
库python_NLP&Python笔记——
语料
库
什么是
语料
库?文本
语料
库是一个大型结构化文本的集合。
weixin_39858245
·
2022-12-08 14:03
语料库python
nlp自己制作一个
语料
库_第119天的nlp论文总结了一个论点注释的科学出版物的
语料
库...
nlp自己制作一个
语料
库内置AINLP365(INSIDEAINLP365)Project#NLP365(+1)iswhereIdocumentmyNLPlearningjourneyeverysingledayin2020
weixin_26729763
·
2022-12-08 14:32
java
2 NLP之
语料
库
语料
库:存放语言材料的仓库。现代的
语料
库是指存放在计算机里的原始
语料
文本或经过加工后带有语言学信息标注的
语料
文本。
流动的风与雪
·
2022-12-08 14:02
NLP
nlp
NLP
自然语言处理
语料库
NLP-
语料
库:英文
语料
库【Brown Corpus(有词性标注)、LOB(Lancaster-Oslo/Bergen,英国英文)...】
链接:https://pan.baidu.com/s/1Xb4JZxMq1ugD0zj7hOPnng密码:ri9i
u013250861
·
2022-12-08 14:02
#
NLP基础/句法语义分析
自然语言处理
语料库
NLP
语料
库索引
中央研究院现代汉语标记
语料
库(现代汉语平衡
语料
库):http://www.sinica.edu.tw/SinicaCorpus/这是首页。
weixi6
·
2022-12-08 14:02
NLP
语言
dictionary
全文检索
工具
数据库
flash
NLP-
语料
库:
语料
库资源介绍
国内可用免费
语料
库(凡没有标注不可用的链接均可用)(一)国家语委1.国家语委现代汉语
语料
库http://www.cncorpus.org/现代汉语通用平衡
语料
库现在重新开放网络查询了。
u013250861
·
2022-12-08 14:32
#
NLP基础/句法语义分析
人工智能
自然语言处理
语料库
【收集】NLP
语料
库数据集+持续更新
来源:大数据文摘本文共4270字,建议阅读7分钟。本文为你奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表。奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表(原始未结构化的文本数据),快去按图索骥下载数据自己研究吧!数据集Apache软件基金会公开邮件档案:截止到2011年7月11日全部公开可用的Apache软件基金会邮件档案。(200GB)http://aws.amazo
PrincessLin
·
2022-12-08 14:01
收集资料
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他