E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
corpus
百度语音识别初探
上传时间比较慢而且识别错误得离谱,我也是醉了RequestsDependencyWarning){'
corpus
_no':'7195578172116769121','err_msg':'success
好好学习啊天天向上
·
2023-02-04 10:52
语音识别
python
人工智能
Gensim
1基本概念语料(
Corpus
):一组原始文本的集合,用于无监督地训练文本主题的隐层结构。语料中不需要人工标注的附加信息。在Gensim中,
Corpus
通常是一个可迭代的对象(比如列表)。
amyhy
·
2023-02-03 21:05
中文自然语言处理医疗、法律等公开数据集整理分享
资源整理自网络,源地址:https://github.com/OYE93/Chinese-NLP-
Corpus
分词、词性标注实体识别法律文本分类情感分析医疗领域分词、实体识别、问答数据集往期精品内容分享深度学习基础系列之
Necther
·
2023-02-02 16:22
聚类
机器学习
算法
数据集
10
Corpus
tools
10.1Toolset:ThetoolssubsetofPepper,AtomicandAnnisformsacompletecorpusworkflowtoolchaininitself,whichisbasedonSalt:Notethatalthoughalltoolsinthesetcanbeusedindependently,theirinteroperabilityletstheuse
shashaslife
·
2023-02-02 14:32
python里的nltk库_Python 自然语言处理——nltk库入门之词性标注
下面列出了nltk库中的一些重要的模块——nltk.
corpus
————获取语料库。
我来看看就好1123
·
2023-02-01 08:05
python里的nltk库
autogloun自然语言处理
#准备,url:http://www.cs.cornell.edu/~cristian/data/cornell_movie_dialogs_
corpus
.zip#首先,请在此处下载数据ZIP文件,并将其放在当前目录下的目录中
老七在路上
·
2023-01-28 08:37
autogloun
自然语言处理
深度学习
pytorch
【Eye-tracking】DIDEC: The Dutch Image Description and Eye-tracking
Corpus
DIDEC:TheDutchImageDescriptionandEye-trackingCorpusAbstract本文提供了一个荷兰语口语图像描述的语料库,结合两组眼球追踪数据:freeviewing,参与者没有任何特定目的地观看图像,以及descriptionviewing,我们跟踪眼球运动,同时参与者对他们正在观看的图像进行口头描述。本文描述了数据收集过程和语料库本身,并对图像描述中的自校
Vincy_King
·
2023-01-28 07:44
NLP
Paper
Gaze
自然语言处理
眼动信号
期刊阅读
NLP-HanLP基础
frompyhanlpimport*defload_dictionary():"""加载HanLP中的mini词库:return:一个set形式的词库"""IOUtil=JClass('com.hankcs.hanlp.
corpus
.io.IOUtil
qq_40488951
·
2023-01-18 18:40
LDA详解
向量中的第一个,第二个等,也就是不同文章的不同单词的主题,固定其他,分别重新从计算的概率分布再次抽取主题】LDA是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或语料库(
corpus
Ona_Soton
·
2023-01-17 17:08
机器学习
机器学习
人工智能
【自然语言处理】专业术语汇总(持续更新...)
EmotionRecognition)纠错(Correction)问答系统(QASystem)正则化(normalization)标准化(scale)标记化(tokenization)标记(token)语料库
corpus
浪里摸鱼
·
2023-01-16 06:41
深度学习
自然语言处理
nlp
深度学习
机器学习
The ATIS Spoken Language Systems Pilot
Corpus
摘要语音研究有巨大的进步在过去使用以下的模式:定义研究问题收集语料针对性的衡量进展解决这个研究问题自然语言研究,另一方面,取得了典型的进步在没有任何数据语料的情况下,这能够测试研究的假设。我们描述了ATISATISATIS试点语料库,设计的语料可以测量进展,在口语语言系统中,包括:aspeechandnaturallanguagecompoment.这个尝点标注着全面收集语料和提供指导为未来的努力
big_matster
·
2023-01-15 06:18
论文创新及观点
语音识别
人工智能
【自然语言处理】Gensim核心概念
2.
Corpus
:语料库语料库是文档对象的集合。语料库在Gensim中主要有两个作用:作为训练模型的输入。在训练期间,模型使用这个训练语料库来寻找共同的主题,初始化它们的内部模型参数。组织文件。训
皮皮要HAPPY
·
2023-01-14 08:28
自然语言处理
人工智能
自然语言处理
人工智能
Gensim
主题建模
AISHELL-3: A MULTI-SPEAKER MANDARIN TTS
CORPUS
AND THE BASELINES 论文理解
0.说明很好的中文多说话人TTS语料,谢谢各位老师们~0.摘要在本文中,我们提出了AISHELL-3,一个大规模和高保真的多说话人普通话语音语料库,可用于训练多说话人文本到语音(TTS)系统。该语料库包含了大约85小时的由218名母语为汉语的人所说的不带感情色彩的录音。他们的辅助属性如性别、年龄组和母语口音在语料库中被明确标记和提供。相应地,汉字级和拼音级的抄本与录音一起提供。我们提出了一个基线系
ruclion
·
2023-01-12 13:15
研三-语音合成论文
自然语言处理
Word2Vec之CBOW详解
举个例子,一个
corpus
(语料库)为“Idrinkcoffeeeveryday”。假设将单词放入数组str,则该数组str长度
Feather_74
·
2023-01-09 03:42
NLP自然语言处理
word2vec
人工智能
nlp
1024程序员节
NLP语料库构建(
corpus
)
1文本加载文本处理函数学习:re.sub():正则表达式替换函数,对于输入的一个字符串,利用正则表达式(的强大的字符串处理功能),去实现(相对复杂的)字符串替换处理,然后返回被替换后的字符串,实现比普通字符串的replace更加强大的替换功能。importres="大家好,我是一个小白。I'msogladtointroducemyself,andI’m18yearsold.Todayis2020/
自在犹仙
·
2023-01-07 21:26
深度学习集训
自然语言处理
人工智能
python
论文阅读课11-TEMPROB:Improving Temporal Relation Extraction with a Globally Acquired Statistical Resource
3TEMPROB:AProbabilisticResourceforTempRels3.1事件抽取3.2TempRel提取3.2.1features3.2.2learning3.3Interence3.4
corpus
3.5
叶落叶子
·
2023-01-06 09:26
论文学习
知识图谱
事件的时间关系
彻底搞懂BPE(Byte Pair Encode)原理(附代码实现)
例子1.准备一个语料库(
corpus
),并统计这个语料库中每个词语的词频,通过“[词频]词语_”的形式存储,这里的“_”表示词语结尾。
无名草鸟
·
2023-01-03 22:49
ai
自然语言处理
nlp知识点总结(上)
壹:语料库一、什么是语料库1.定义语料库(
corpus
)一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。2.种类共时语料库与历时语料库。通用语料库与专用语料库。
m0_59989429
·
2023-01-03 17:01
课程复习
自然语言处理
人工智能
A Hierarchical Reinforced Sequence Operation Method for Unsupervised Text Style Transfer
pdf/1906.01833.pdf一、APaperListforStyleTransferinTextDatasetDearSirorMadam,MayIintroducetheYAFCCorpus:
Corpus
蹦跶的小羊羔
·
2023-01-02 15:14
Deep
Learning
下载Wikidata并转成TXT文档
2.将bz2文件转码成TXT文件此处,我先尝试了下使用gensim下的
Corpus
工具转码,但是失败了,报了如下错误,也没尝试去修改,先记录下来吧。有空子阿来看看。
五彩神石
·
2023-01-02 13:51
ubuntu
python
linux
自然语言处理
自然语言处理:有关单词含义理解、word2vec单词分布式表示的总结
目录一、单词含义理解方法:二、分布式假设(相关概念):三、word2vec一、单词含义理解方法:1基于同义词词典:单词含义相近的归为同一类,最著名的有WordNet2基于计数的方法:使用
corpus
语料库
菜鸟爱学习@chong
·
2022-12-27 21:22
笔记
自然语言处理
word2vec
自然语言处理实验代码
实验一,基于规则的分词算法frompyhanlpimport*defload_dictionary():IOUtil=JClass('com.hankcs.hanlp.
corpus
.io.IOUtil'
山上有强强
·
2022-12-26 07:57
自然语言处理
nlp
中文自然语言处理的完整流程
我们把一个文本集合称为语料库(
Corpus
),当有几个这样的文本集合的时候,我们称之为语料库集合(Corpora)。
cc_moe
·
2022-12-26 07:56
深度学习
自然语言处理之文本预处理
1.1定义语料库(
Corpus
):一个文档(documents)的集合(collection)例如:维基百科中全部的英文文章文档(Document):一个或者多个句子(sentence)通常,这些句子是经过理解性组织过的
Wilson_Hank
·
2022-12-23 07:38
自然语言处理
自然语言处理
文献阅读笔记-CSC-数据集-A Hybrid Approach to Automatic
Corpus
Generation for Chinese Spelling Check
“作者:汪鼎民已经开源本文内容-https://github.com/wdimmy/Automatic-
Corpus
-Generation”一、做了什么和怎么做
Flying Warrior
·
2022-12-15 14:03
文献阅读
CSC-中文拼写错误检查
nlp
百度_音频转文字
手机49kbps转换比特率256Kpbs{‘
corpus
_no’:‘7045177033217452815’,‘err_msg’:‘success.’,‘err_no’:0,‘result’:[‘今天下午去开会今天下午去开会
风雨飘摇中的石头
·
2022-12-13 22:15
python
音视频
百度
语音识别
知识图谱构建流程原型、工具、数据、表示、推理以及可视化
知识图谱开源数据:开源图谱评测数据MSRA-NER实体数据集https://github.com/GuocaiL/nlp_
corpus
/tree/main/open_ner_data/MSRA人民日报实体数据集
wwlsm_zql
·
2022-12-12 22:43
知识图谱
知识图谱
人工智能
自然语言处理
文本分类
朴素贝叶斯分类器demo_text_classification.pyfrompyhanlpimport*fromtests.test_utilityimportensure_datasogou_
corpus
_path
Nlper_Zhao
·
2022-12-12 09:09
自然语言处理
自然语言处理
HanLP 基于SVM支持向量机 进行 ChnSentiCorp 情感分析
一、ChnSentiCorp情感分析酒店评论数据集ChnSentiCorp情感分析酒店评论数据集是一个标注了情感的数据集,分了负面和正面两类,下载地址:http://file.hankcs.com/
corpus
小毕超
·
2022-12-12 09:30
机器学习
hanlp
LDA主题模型实现
五、inference进行主题推断代码实现:第二步和第三步dictionary=corpora.Dictionary(texts)
corpus
=[dicti
ren.yz
·
2022-12-11 20:04
文本分类
数据挖掘
自然语言处理
sklearn
语料库python_NLP&Python笔记——语料库
NLTK包含了许多语料库:(1)古滕堡语料库(2)网络和聊天文本(3)布朗语料库(4)路透社语料库(5)就职演讲语料库(6)标注文本语料库词汇列表语料库(1)词汇列表:nltk.
corpus
.words.words
weixin_39858245
·
2022-12-08 14:03
语料库python
NLP-语料库:英文语料库【Brown
Corpus
(有词性标注)、LOB(Lancaster-Oslo/Bergen,英国英文)...】
链接:https://pan.baidu.com/s/1Xb4JZxMq1ugD0zj7hOPnng密码:ri9i
u013250861
·
2022-12-08 14:02
#
NLP基础/句法语义分析
自然语言处理
语料库
4 NLP语料库
文本语料库是一个大型结构化文本的集合NLTK包含了许多语料库:(1)古滕堡语料库(2)网络和聊天文本(3)布朗语料库(4)路透社语料库(5)就职演讲语料库(6)标注文本语料库词汇列表语料库(1)词汇列表:nltk.
corpus
.words.words
dili8870
·
2022-12-08 14:31
人工智能
【NLP】语料库和词汇知识库
语料库(
corpus
)语料库(
corpus
)就是存放语言材料的仓库(语言数据库),基于语料库进行语言学研究–语料库语言学(corpuslinguistics)。
拟禾
·
2022-12-08 14:30
自然语言处理
自然语言处理
《论文阅读》Building a Dialogue
Corpus
Annotated with Expressed and Experienced Emotions
《论文阅读》BuildingaDialogueCorpusAnnotatedwithExpressedandExperiencedEmotions简介idea来源数据集结果表明创新点代码未来应用期刊:ACL2022类型:构建两种情感的数据集特点:创建一种带有两种情感的对话语料本文带来TatsuyaIde和DaisukeKawahara共同创作的文章简介在交流中,人类会识别对话者的情绪,并以适当的情
365JHWZGo
·
2022-12-08 13:46
情感对话
论文阅读
bert
深度学习
python
情感对话
NLP学习笔记-Seq2Seq实现聊天机器人(六)
实现闲聊机器人1.准备训练数据单轮次的聊天数据非常不好获取,所以这里我们从github上使用一些开放的数据集来训练我们的闲聊模型数据地址:https://github.com/codemayq/chaotbot_
corpus
_Chinese
吃一口桃酥
·
2022-12-07 21:27
笔记
自然语言处理
聊天机器人
神经网络
深度学习
python数据挖掘与分析心得体会_Python数据挖掘——文本分析
一、语料库(
Corpus
)语料库是我们要分析的所有文档的集合。二、中文分词2.1概念:中文分词(ChineseWordSegmentation):将一个汉字序列切分成一个一个单独的词。
weixin_39793576
·
2022-12-07 01:48
关于gensim库中lda主题模型困惑度和一致性python图像绘制
关于gensim库中lda主题模型困惑度和一致性python图像绘制第三方库使用:matplotlib前期准备函数参数解释num_topics:主题数量
corpus
:处理过的文档语料texts:二维列表
WUNNAN
·
2022-12-04 20:56
Python
python
lda
matplotlib
数据挖掘
python 自然语言处理NLP(Chapter 1)
Chapter1语言处理与python用的自然语言工具包是nltk,语言处理任务与相应NLTK模块以及功能描述如下:语言处理任务NLTK模块功能描述获取语料库nltk.
corpus
语料库和词典的标准化接口字符串处理
王山而RR
·
2022-12-04 12:19
自然语言处理
python
自然语言处理
python
解决ValueError: You must specify either total_examples or total_words, for proper alpha and....问题
Youmustspecifyeithertotal_examplesortotal_words,forproperalphaandprogresscalculations.Theusualvalueistotal_examples=model.
corpus
_count
PIG_RABBIT
·
2022-12-03 18:49
python
解决TypeError: __init__() got an unexpected keyword argument ‘iter‘的问题
TypeError:init()gotanunexpectedkeywordargument‘size’2.查找资料再word2vec源码里面def__init__(self,sentences=None,
corpus
_file
PIG_RABBIT
·
2022-12-03 18:48
python
深度学习
batch
【PyTorch】11 聊天机器人实战——Cornell Movie-Dialogs
Corpus
电影剧本数据集处理、利用Global attention实现Seq2Seq模型
聊天机器人教程1.下载数据文件2.加载和预处理数据2.1创建格式化数据文件2.2加载和清洗数据3.为模型准备数据4.定义模型4.1Seq2Seq模型4.2编码器4.3解码器5.定义训练步骤5.1Masked损失5.2单次训练迭代5.3训练迭代6.评估定义6.1贪婪解码6.2评估我们的文本7.全部代码小结此为官方PyTorch之文本篇的最后一个教程在本教程中,我们探索一个好玩有趣的循环的序列到序列(
Yang SiCheng
·
2022-12-03 07:04
【深度学习】
人工智能
深度学习
机器学习
自然语言处理
神经网络
序列模型之循环神经网络(二)
术语:
corpus
语料库语料库是自然语言处理的一个专有名词,就是很长的或者说数量众多的英文句子组
深海鱼肝油ya
·
2022-11-30 15:17
#
深度学习
深度学习
循环神经网络
GRU单元
RNN梯度消失
生成序列
tensorflow聊天机器人python实现_GitHub - Jaleel-zhu/tensorflow-chatbot: 使用Tensorflow实现了一个简易的中文聊天机器人...
本项目使用TensorFlow实现了一个简易的聊天机器人项目结构
corpus
:存放语料数据data:存放经过预处理的训练数据doc:存放资料文档hparams:存放预定义的超参数json文件models
weixin_39613208
·
2022-11-28 10:42
Mind the GAP: A Balanced
Corpus
of Gendered Ambiguous Pronouns--论文笔记
MindtheGAP:ABalancedCorpusofGenderedAmbiguousPronouns注意差距:性别歧义代词的平衡语料库AbstractCoreferenceresolutionisanimportanttaskfornaturallanguageunderstanding,andtheresolutionofambiguouspronounsalongstandingchal
JasonSera
·
2022-11-26 13:07
偏见研究
人工智能
自然语言处理
sklearn中train_test_split()函数详解(转载)
corpus
总数为10001条的数据,train_X,test_X为文本数据,train_Y,test_Y为标签数据test_s
修心简道
·
2022-11-24 09:50
图像识别
BERT学习笔记
BERT学习笔记word2vecBERTword2vec预训练word2vec模型官方API介绍如下:classgensim.models.word2vec.Word2Vec(sentences=None,
corpus
_file
AGroundhog
·
2022-11-23 19:13
NLP
自然语言处理
神经网络
深度学习
论文阅读Unsupervised
Corpus
Aware Language Model Pre-training for Dense Passage Retrieval
密集文本检索的无监督语料库感知语言模型预训练ACL2022论文链接摘要最近的研究证明了使用微调语言模型(LM)进行密集检索的有效性。然而,密集检索器很难训练,通常需要经过精心设计的微调管道才能充分发挥其潜力。在本文中,我们识别并解决了密集检索器的两个潜在问题:i)对训练数据噪声的脆弱性,ii)需要大批量来鲁棒地学习嵌入空间。我们使用最近提出的冷凝器预训练架构,该架构通过LM预训练学习将信息浓缩到密
张
·
2022-11-23 13:30
OpenQA论文阅读
学习笔记
论文阅读
语言模型
人工智能
机器学习——LDA主题模型
LDA主题模型LDA是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或语料库(
corpus
)中潜藏的主题信息。
weixin_46064807
·
2022-11-22 23:08
LDA建模
python
机器学习
自然语言处理
词典构造方法之LDA主题模型
词典构造方法之LDA主题模型主题模型LDA原理理解LDA是一种非监督学习技术,可以用来识别大规模文档集(documentcollection)或语料库(
corpus
)中潜藏的主题信息。
笑傲NLP江湖
·
2022-11-21 03:03
自然语言处理
爬虫
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他