E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
199801语料库
attention-seq2seq:实现中英翻译
中文与其他语言不同,不能简单使用空格分割单词建立
语料库
。
Hilbob
·
2023-01-26 03:40
NLP
nlp
gru
机器翻译
pytorch
基于机器学习的古代汉语切分标注算法及
语料库
研究(毕业设计包含完整代码+论文+资料ppt)
数据来源及预处理实验所用的数据集为从网络的开放数据库下载的不同年代的古籍。根据古籍所处具体时期的不同,我们从各个时期中选择了部分书籍进行实验。将其分为成了不连续的几个时间段:春秋战国时期、后汉时期、南北朝时期、宋朝时期及明清时期五个时间段并分别使用T1、T2、T3、T4以及T5表示,对应关系如下表所示。表3-1时间标签与年代对应表时间标签年份
甜辣uu
·
2023-01-26 03:09
计算机毕设项目大全
python
汉语切分
计算机毕设
2019-06-17雅思备考week2-一周学习总结
王陆《
语料库
(剑14版)》:建议购买,现在的版本是在手机上听的,比以往用CD方便,同时增加了剑14的新内容,可以购买。
你演
·
2023-01-25 21:51
【NLP Tool -- NLTK】NLTK进行英文情感分析、分词、分句、词性标注(附代码)
中文文本--关键词提取、自定义词典、分词、词性标注NLP--NLTK英文文本--情感分析、分词、分句、词性标注工具介绍NLTK,NaturalLanguageToolkit是一个Python模块,提供了多种
语料库
北村南
·
2023-01-25 07:39
NLP
Tool
自然语言处理
人工智能
nlp
snownlp 原理_使用snownlp进行情感分析
主要可以进行中文分词(算法是Character-BasedGenerativeModel)、词性标注(原理是TnT、3-gram隐马)、情感分析(官网木有介绍原理,但是指明购物类的评论的准确率较高,其实是因为它的
语料库
主要是购物方面的
学历小助手王老师
·
2023-01-24 10:31
snownlp
原理
被GPT带飞的In-Context Learning发展现状如何?这篇综述梳理明白了
随着语言模型和
语料库
规模的逐渐扩大,大型语言模型(LLM)展现出更多的潜力。近来一些研究表明,LLM可以使用in-contextlearning(ICL)执行一系列复杂任务,例如解决数学推理问题。
夕小瑶
·
2023-01-24 07:25
python爬虫知识图谱_知识图谱
不过这篇文章在微博、AINLP微信公众号、知乎专栏推送后,还是有很多同学强烈建议丰富
语料库
。
weixin_39770311
·
2023-01-22 18:29
python爬虫知识图谱
自然语言处理-注意点
一阶逻辑是计算语义的一个不错的选择语料分析指的是技术层面的分析,并不关注
语料库
的语言学分析。在句法分析中,文法规则被用于确定哪些句子是合法的。
__BC__
·
2023-01-22 07:56
自然语言处理
自然语言处理
机器学习
人工智能
【自然语言处理】文本表示(一):One-Hot、BOW、TF-IDF、N-Gram
One-Hot在特征提取上属于词袋模型(Bag-of-Words),假设
语料库
中有三句话:我爱中国爸爸妈妈爱我
皮皮要HAPPY
·
2023-01-22 07:49
自然语言处理
自然语言处理
文本表示
文本向量化
BOW
TF-IDF
Python自然语言处理第二章 - 获得文本语料与词汇
一,获取文本
语料库
1,古腾堡
语料库
古腾堡
语料库
主要存储的是免费的电子图书。
潜心修行的研究者
·
2023-01-21 19:57
自然语言处理
python
自然语言处理
特开一贴,用来记录我踩过的坑
1、NLTK
语料库
nltk.download()安装失败及下载很慢的解决方法_深度学习菜鸟的博客-CSDN博客_nltk.download失败解决nltkdownload(‘punkt‘)连接尝试失败_
致力于成为卷王
·
2023-01-19 18:08
nlp
自然语言处理
python
NER--《人民日报》
语料库
预处理
NER--《人民日报》
语料库
预处理转成标准BIEO格式转成标准BIEO格式#-*-coding:utf-8-*-"""CreatedonFriJul3116:16:582020将《人民日报》中的标签转成标准的
chengjinpei
·
2023-01-19 09:37
数据预处理
自然语言处理资源
自然语言处理
谷歌BERT模型--调试MRPC任务--使用pycharm集成环境
MRPC调试心得唐宇迪BERT课程使用Pycharm实现MRPC唐宇迪BERT课程使用Pycharm实现MRPC1.任务介绍MPRC(MicrosoftResearchParaphraseCorpus)
语料库
中包含一些句子对
chengjinpei
·
2023-01-19 09:36
项目实战
自然语言处理
tensorflow
RuntimeError:CUDA error:unknown error
考虑原因:A程序在
语料库
ATIS中运行过,没有发生问题,但是之后运行了另一个程序B时,修改过gpu,如下所示:os.environ["CUDA_VISIBLE_DEVICES"]="0"如今在
语料库
Snips
想念@思恋
·
2023-01-18 08:29
python编程
一起来学自然语言处理----分类和标注词汇
分类和标注词汇使用词性标注器标注
语料库
1.表示已标注的标识符2.读取已标注的
语料库
3.简化的词性标记集使用字典映射词及其属性1.默认字典2.递增的更新字典3.颠倒字典自动标注1.默认标注器2.正则表达式标注器
小陈步吃人
·
2023-01-17 22:01
自然语言学习笔记
python
django
自然语言处理
LDA详解
向量中的第一个,第二个等,也就是不同文章的不同单词的主题,固定其他,分别重新从计算的概率分布再次抽取主题】LDA是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或
语料库
Ona_Soton
·
2023-01-17 17:08
机器学习
机器学习
人工智能
读书笔记:深度学习进阶-自然语言处理(俗称鱼书二)
文章目录前言一、神经网络的复习二、自然语言和单词的分布式表示2.1什么是自然语言处理2.2同义词词典2.3基于计数的方法2.3.1基于python的
语料库
的预处理2.3.2单词的分布式表示2.3.3分布式假设
时光轻浅,半夏挽歌
·
2023-01-17 08:50
深度学习
自然语言处理
python
【自然语言处理】专业术语汇总(持续更新...)
EmotionRecognition)纠错(Correction)问答系统(QASystem)正则化(normalization)标准化(scale)标记化(tokenization)标记(token)
语料库
浪里摸鱼
·
2023-01-16 06:41
深度学习
自然语言处理
nlp
深度学习
机器学习
《实战》基于情感词典的文本情感分析与LDA主题分析
review_long_clean中1.4修正情感倾向1.5计算每条评论的情感值1.6查看情感分析效果二、情感分析效果2.1将数据合并2.2结果对比2.3情感词云三、基于LDA模型的主题分析3.1建立词典、
语料库
驭风少年君
·
2023-01-15 13:14
实战
python
机器学习
numpy
NLTK
语料库
nltk.download()安装失败及下载很慢的解决方法
一.解决nltk.download()安装失败importnltknltk.download()下载nltk
语料库
出现getaddrinfofailed如下错误:这里只需将ServerIndex路径改成
sky2line
·
2023-01-15 12:36
Python学习
深度学习
python
开发语言
The ATIS Spoken Language Systems Pilot Corpus
我们描述了ATISATISATIS试点
语料库
,设计的语料可以测量进展,在口语语言系统中,包括:aspeechandnaturallanguagecompoment.这个尝点标注着全面收集语料和提供指导为未来的努力
big_matster
·
2023-01-15 06:18
论文创新及观点
语音识别
人工智能
【自然语言处理】Gensim核心概念
2.Corpus:
语料库
语料库
是文档对象的集合。
语料库
在Gensim中主要有两个作用:作为训练模型的输入。在训练期间,模型使用这个训练
语料库
来寻找共同的主题,初始化它们的内部模型参数。组织文件。训
皮皮要HAPPY
·
2023-01-14 08:28
自然语言处理
人工智能
自然语言处理
人工智能
Gensim
主题建模
清华刘知远、黄民烈团队力作:一个「PPT」框架,让超大模型调参变简单
通过微调PLM的全部参数,从大规模无标签
语料库
中获得的多方面知识可以用于处理各种NLP任务
PaperWeekly
·
2023-01-13 01:49
机器学习
人工智能
深度学习
大数据
算法
[调研]一些公开NLP库的效果
2.功能矩阵对比3.性能测试(1)分词数据集选用sighan2005PKU
语料库
测试集中的1930个样本。结论:整体效果上看,若对精度要求高,对时间要求低,可以采用foolnltk;若对时间有一
女青年学习日记
·
2023-01-12 17:22
模型调研
算法
nlp
tf-idf的原理及计算
termfrequencyidf;inversedocumentfrequencyTF=某个词在文章中出现的次数/文章的总次数或TF=某个词在文章中出现的次数/该问出现次数最多的词出现的次数IDF=log(
语料库
的文档总数
会发paper的学渣
·
2023-01-12 16:24
NLP
推荐
搜索
tf-idf
AISHELL-3: A MULTI-SPEAKER MANDARIN TTS CORPUS AND THE BASELINES 论文理解
0.说明很好的中文多说话人TTS语料,谢谢各位老师们~0.摘要在本文中,我们提出了AISHELL-3,一个大规模和高保真的多说话人普通话语音
语料库
,可用于训练多说话人文本到语音(TTS)系统。
ruclion
·
2023-01-12 13:15
研三-语音合成论文
自然语言处理
机器学习:TF-IDF算法【词频-逆文本频率=TF×IDF】【用以评估一个词对于一个文档集中的其中一份文档的重要】【词频:词或短语在一篇文章中出现的概率】【逆文本频率:总文档数量/该词出现的文档数量】
一、什么是TF-IDFTF-IDF是一种统计方法,用以评估一个词对于一个文件集或一个
语料库
中的其中一份文件的重要程度。可用于关键词提取。
u013250861
·
2023-01-12 08:44
机器学习/ML
机器学习
算法
人工智能
TF-IDF
来,带你从TF-IDF说起搞懂BM25
这篇文章中有一点理解,我么先搬过来:IDF表征的是区分度、稀缺性,用以评估一个单词在
语料库
中的重要程度,一个词在少数几篇文档中出现的次数越多,它的IDF值越高,如果这个词在大多数文档中都出现了,这个值就不大了
知了爱啃代码
·
2023-01-12 08:44
NLP-自然语言处理笔记
nlp
自然语言处理
算法
人工智能
TF-IDF与BM25算法原理
1.TF-IDF原理TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个
语料库
中的一份文件的重要程度。
orangerfun
·
2023-01-12 08:13
自然语言处理
算法
【NLP工具】hanLP2.1的使用(未完)
借助世界上最大的多语种
语料库
,HanLP2.1支持包括简繁中英日俄法德在内的1
尊新必威
·
2023-01-11 18:56
自然语言处理
HanLP的分词
importhanlphanlp.pretrained.tok.ALL#语种见名称最后一个字段或相应
语料库
调用hanlp.load进行加载,模型会自动下载到本地缓存。
Sonhhxg_柒
·
2023-01-11 18:54
自然语言处理(NLP)
自然语言处理
人工智能
一文看懂 NLP 中的情感分析任务
情感倾向分析的方法主要分为两类:基于情感词典的方法;基于机器学习的方法,如基于大规模
语料库
的机器学习。前者需要用到标注好的情
深度学习技术前沿
·
2023-01-09 12:33
人工智能
自然语言处理
机器学习
nlp
编程语言
想要学习NLP情感分析,你竟然没看过这篇文章!
情感倾向分析的方法主要分为两类:基于情感词典的方法;基于机器学习的方法,如基于大规模
语料库
的机器学习。前者需要用到标注好的情
csdn人工智能头条
·
2023-01-09 12:57
人工智能
机器学习
自然语言处理
编程语言
nlp
Word2Vec之CBOW详解
举个例子,一个corpus(
语料库
)为“Idrinkcoffeeeveryday”。假设将单词放入数组str,则该数组str长度
Feather_74
·
2023-01-09 03:42
NLP自然语言处理
word2vec
人工智能
nlp
1024程序员节
Quora Question Pairs整理 - 文本相似度计算(unfinished)
具体地,根据
语料库
获得一个单词集合,集合中保存着语
weixin_30399055
·
2023-01-08 06:01
人工智能
数据结构与算法
基于Python+JavaScript的面向文本分析的交互式主题建模可视化分析系统
本课题的研究背景和意义21.1.1主题模型的发展及研究现状21.1.2目前存在的问题31.1.3本课题的研究意义31.2研究内容和主要工作31.3本文的组织结构3二、核心算法32.1文本预处理42.2大型
语料库
的内存优化
biyezuopin
·
2023-01-08 06:00
python
javascript
数据挖掘
面向文本分析
交互式主题建模可视化
文本相似度和距离度量
具体地,根据
语料库
获得一个单
a flying bird
·
2023-01-08 06:28
NLP
bert生成句向量(python)
第一步:安装库pipinstallbert-serving-serverpipinstallbert-serving-client第二步:下载
语料库
bert中文模型链接:https://storage.googleapis.com
江湖夜雨十年灯丶
·
2023-01-08 00:40
python
bert
自然语言处理
NLP
语料库
构建(corpus)
1文本加载文本处理函数学习:re.sub():正则表达式替换函数,对于输入的一个字符串,利用正则表达式(的强大的字符串处理功能),去实现(相对复杂的)字符串替换处理,然后返回被替换后的字符串,实现比普通字符串的replace更加强大的替换功能。importres="大家好,我是一个小白。I'msogladtointroducemyself,andI’m18yearsold.Todayis2020/
自在犹仙
·
2023-01-07 21:26
深度学习集训
自然语言处理
人工智能
python
python 文本挖掘 TF-IDF 的jieba与sklearn实现
TF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文件频率).TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个
语料库
中的其中一份文件的重要程度
English Chan
·
2023-01-07 15:10
机器学习
python
自然语言处理
tf-idf
关键词提取-基于python实现tf-idf
关键词提取代码实现:#encoding:utf-8importjiebaimportreimportosimportnumpyasnpclassMyTfIdf:def__init__(self):#
语料库
中所有文档的每个词的词频的统计
Jason_Honey2
·
2023-01-07 15:03
python
自然语言处理
tf-idf
文本相似度算法:文本向量化+距离公式
1.1.1词袋模型的步骤第一步:构造词典根据
语料库
,把所有的词都提取出来,编上序号第二步:独热编码,D维向量记词典大小为D,那么每个文章就是一个D维向量:每个位置上的数字表示对应编号的词在该文章中出现的次数
==樛木==
·
2023-01-07 07:34
深度学习之个人总结
文本相似度
文本向量化
余弦相似度
词袋模型
TD-IDF
Python分析国家领导人新春贺词建立主题模型
主题建模可以帮助开发人员直观地理解和探索数据,以便更好地挖掘
语料库
中的主题。成功的主题建模需要多次迭代:清洗数据、读取结果、相应地调整预处理并重试。
今天喝奶茶了嗎
·
2023-01-06 10:10
自然语言处理
python
机器学习
自然语言处理
解决nltk download(‘brown’)连接尝试失败问题
连接尝试失败1、去下载官方包(http://www.nltk.org/nltk_data/)2、选择其中一个路径,将解压后的文件按照该路径放好再运行一下代码#nltk库提供了直接生成N-gram的方法#以布朗
语料库
的单词
小白*进阶ing
·
2023-01-05 21:33
python
开发语言
python nltk 安装失败以及download()出错
1、什么是nltk一个完整的⾃然语⾔处理框架⾃带
语料库
,词性分类库⾃带分类,分词,等等功能有强⼤的社区⽀持框架设计上没有考虑中文使用安装语句pipinstallnltknltk.download()#下载
是鱼儿啊~
·
2023-01-05 21:33
机器学习
python
开发语言
数据挖掘
NLTK
语料库
nltk.download()安装失败及下载很慢的解决方法
一.解决nltk.download()安装失败importnltknltk.download()下载nltk
语料库
出现getaddrinfofailed如下错误:这里只需将ServerIndex路径改成
深度学习菜鸟
·
2023-01-05 21:32
python
自然语言处理
我用 Python 自制成语接龙小游戏,刺激
在https://github.com/pwxcoo/chinese-xinhua项目中可以下载到中华成语的
语料库
,该项目收录包括14032条歇后语,16142个汉字,264434个词语,31648个成语
程序员婷崽
·
2023-01-05 20:31
python
开发语言
用 Python 自制成语接龙小游戏!
作者:小小明来源:杰哥的IT之旅在https://github.com/pwxcoo/chinese-xinhua项目中可以下载到中华成语的
语料库
,该项目收录包括14032条歇后语,16142个汉字,264434
Python数据之道
·
2023-01-05 20:31
数据挖掘
python
人工智能
数据分析
大数据
用Python 做成语接龙,超简单,有语音,过年和孩子玩
过年和孩子玩成语需要准备的资料:idiom.json文件python3.6安装pyttsx3pandasnumpy在https://github.com/pwxcoo/chinese-xinhua项目中可以下载到中华成语的
语料库
搬码工琪老师
·
2023-01-05 20:29
python制作生活小工具
python
开发语言
基于mrpc的文本分类任务Bert源码分析(一):特征提取
他们主要的工作是预训练出了一个模型,即对一个很大的
语料库
进行训练,得到相应的词向量。这一步,主要用到mask,transformer等机制。
丹妮与铁王座
·
2023-01-05 19:10
BERT源码学习记录
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他