E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语料
python文本分类框架_Python 实现小型文本分类系统
查了很多资料,找到一篇适合新手的一篇博文:https://blog.csdn.net/github_36326955/article/details/54891204,本人提供了人工分好类的文章训练集
语料
库
weixin_39884323
·
2022-09-08 04:16
python文本分类框架
乐府 ——预训练语言模型在诗词对联生成中的应用
押韵方面具有严格的要求常规的诗歌对联生成模型加入规则对格式进行限制GPTGPT(包括GPT-2、GPT-3)是由OpenAI推出的大规模预训练语言模型,其具备强大的文本生成能力乐府作诗机训练流程第一步:在大规模中文
语料
上预训练中文
Necther
·
2022-09-05 07:39
语言模型
自然语言处理
深度学习
自然语言处理——使用Transformer构建语言模型
#语言模型的训练
语料
一般来自于文章,对应的源文本和目标文本形如:src1="Icando"tgt1="candoit"src2="candoit",tgt2="doit"语言模型能解决的问题:根据语言模型的定义
Lanciberrr
·
2022-09-05 07:02
NLP
自然语言处理
transformer
语言模型
BERT模型解析
BidirectionalEncoderRepresentationfromTransformers(BERT)[1],即双向Transformer的Encoder表示,是2018年提出的一种基于上下文的预训练模型,通过大量
语料
学习到每个词的一般性
zhiyong_will
·
2022-09-02 10:04
深度学习Deep
Learning
bert
深度学习
自然语言处理
NLP学习笔记-FastText文本分类(四)
例如,如果希望聊天机器人能够播报当前的时间,那么我们就需要准备关于询问时间的
语料
,同时其目标值就是一个新的类别。在训练后
吃一口桃酥
·
2022-09-02 07:28
笔记
nlp
python
深度学习
机器学习
霍夫曼树
文本特征提取之TF-IDF算法(原理+Python代码)
零基础入门数据分析-学术前沿趋势分析目录一、原理介绍二、代码实现2.1数据预处理2.2使用TF-IDF提取特征2.3建立分类模型三、结果解释一、原理介绍TF-IDF方法常用来评估一字词对于一个文件集或一个
语料
库中的其中一份文件的重要程度
data learning
·
2022-08-30 07:31
python
机器学习
人工智能
深度学习
自然语言处理
word2vec详解
关键字
语料
向量模型文本分词词向量化向量距离一、word2vec的概念解释word2vec是一种将单词转换为向量形式的工具。
欧菲斯集团
·
2022-08-30 02:13
深度学习
word2vec
人工智能
nlp
自然语言处理NLP 2022年最新综述:An introduction to Deep Learning in Natural Language Processing
AnintroductiontoDeepLearninginNaturalLanguageProcessing:Models,techniques,andtools摘要深度学习技术在NLP中的应用;NLP研究中的主要资源,包括软件,硬件和受欢迎的
语料
库
Momahe
·
2022-08-26 21:41
自然语言处理
深度学习
自然语言处理
【一文讲解深度学习】语言自然语言处理(NLP)第一篇
文本分类语言生成问答(QA)系统机器翻译(MT)NLP的发展历程快速发展期(1957~1970)低速发展期(1971~1993)复苏融合期(1994年至今)NLP的困难与挑战语言歧义NLP相关知识构成
语料
库常用
语料
库介绍传统
苏州程序大白
·
2022-08-24 07:17
深度学习
深度学习
NLP
shell脚本批量将文件复制到指定的文件夹下
由于线上文件比较多,选择特定的文件拿下线下进行
语料
标注,如果指定的文件数量太多,一个个复制就很麻烦。所以写一个shell脚本进行批量操作。
·
2022-08-22 18:10
机器学习服务文本翻译能力升级,中文直译模型让译文表达更地道!
中文直译模型让文本翻译能力升级当前主流的翻译模式大都以
语料
资源较为丰富的英文作为中间语言进行“桥接”翻译,但是经英文转移后翻译精度有所损失,且计算资源加倍执行效果降低。为了响应“一
·
2022-08-22 09:35
利用机器学习进行房价预测
这些操作不仅仅包括获取数据,还能够添加数据,比如:投票管理多个平台的多个账户(如各个电商平台的账号)微信聊天机器人实际的应用远不止上面这些,但是上面的应用只是除开数据本身的应用而已,数据本身的应用也是很广的:机器学习
语料
库垂直领域的服务
__Miracle__
·
2022-08-20 19:32
随笔
机器学习
爬虫
python
发现新词 | NLP之无监督方式构建词库(二)
文章目录一、数据介绍二、实验代码三、分析一、数据介绍 本文针对一万多条商品名称
语料
来进行实验,数据格式如下:二、实验代码 代码部分参考:基于切词的新词发现。
跟乌龟赛跑
·
2022-08-18 20:19
#
自然语言处理(NLP)
自然语言处理
python
无监督发现新词
BERT详解(4)---fine-tuning
第一个阶段叫做:Pre-training,跟WordEmbedding类似,利用现有无标记的
语料
训
orangerfun
·
2022-08-18 07:23
自然语言处理
python
深度学习
机器学习
人工智能
自然语言处理
一起来学自然语言处理----
语料
库和词汇资源
语料
库和词汇资源1、自然语言工具包(NLTK)2、获取文本
语料
1.
语料
库古腾堡
语料
库网络和聊天文本布朗
语料
库路透社
语料
库就职演说
语料
库标注文本
语料
库在其他语言的
语料
库
语料
库结构载入自己的
语料
库2.条件频率分布理解条件频率分布使用双连词生成随机文本
小陈步吃人
·
2022-08-16 17:58
自然语言学习笔记
django
数据库
python
文本聚类(一)—— LDA 主题模型
目录文本聚类一、LDA主题模型1.1加载数据集1.2数据清洗、分词1.3构建词典、
语料
向量化表示1.4构建LDA模型1.5模型的保存、加载以及预测1.6小结Updatelog2021.07.08:主要上传停用词表
dfsj66011
·
2022-08-14 20:22
NLP
机器学习
自然语言处理
python
SciFive: a text-to-text transformer model for biomedical literature
Abstract:Motivation:基于C4(ColossalCleanCrawledCorpus)
语料
的T5(Text-to-TextTransferTransformer)模型在一系列相关的NLP
hithithithithit
·
2022-08-14 11:19
论文
算法
深度学习
机器学习
【20220412】文献翻译4:交互中的手势和语言概述
3.1交际环境中的手势3.2传递意义3.3制作手势和语言4.时间协调的重要性4.1手势和语言的时间互动4.2手势和声音的相似性、差异性、互动性4.3测量时间上的协调性5.应用、注释、工具和
语料
库5.1手势注解
Yang SiCheng
·
2022-08-10 07:46
小白学习
机器学习
深度学习
自然语言处理
人工智能
交互
Python 中文文本分词(包含标点的移除)
背景信息本文为构建中文词向量的前期准备,主要实现中文文本的分词工作,并且在分词过程中移除了标点符号、英文字符、数字等干扰项,从而可以得到较为纯净的分词后的中文
语料
。
汀桦坞
·
2022-08-08 21:19
机器学习
如何在jieba分词中加自定义词典_Pyspark Word2Vec + jieba 训练词向量流程
摘要:用商品描述为
语料
库训练商品词向量为例,分享一下用pyspark自带word2vec+jieba分词训练词向量的流程.工具:python,pyspark,jieba,pandas,numpy数据格式
weixin_39779537
·
2022-08-08 21:18
记录AttributeError: module ‘tensorflow‘ has no attribute ‘XXX‘问题方案
前言最近做一个人工智能方面的项目,本着假期也无聊的想法,就在自己的陈年电脑上调试运行,最后一切OK,似乎只差大规模的
语料
训练了。
Nuspen
·
2022-08-04 07:01
tensorflow
基于tensorflow2+textCNN的中文垃圾邮件分类
目录一、邮件数据集二、文本分类三、Text-CNN四、搭建Text-CNN模型五、实验结果一、邮件数据集本文进行文本分类任务的中文邮件数据来源于由国际文本检索会议提供一个公开的垃圾邮件
语料
库,点我下载。
唯余木叶下弦声
·
2022-08-03 19:08
深度学习
python
数据分析
tensorflow
深度学习
cnn
人工智能框架实战精讲:Keras项目-英文
语料
的文本分类实战与调参优化
Keras项目-英文
语料
的文本分类实战一、机器学习模型1.1数据简介1.2数据读取与预处理1.3数据切分与逻辑回归模型构建二、全连接神经网络模型2.1模型训练2.2模型结果展示三、WordEmebeding
驭风少年君
·
2022-08-03 19:37
自然语言处理
Tensorflow-深度学习
深度学习
人工智能
keras
分类
基于Keras搭建LSTM网络实现文本情感分类
基于Keras搭建LSTM网络实现文本情感分类一、
语料
概况1.1数据统计1.1.1查看样本均衡情况,对label进行统计1.1.2计句子长度及长度出现的频数1.1.3绘制句子长度累积分布函数(CDF)二
驭风少年君
·
2022-08-03 19:37
实战
Tensorflow-深度学习
深度学习
keras
lstm
分类
tensorflow2.0 基于LSTM模型的文本生成
模型分析实验过程文本预处理编解码模型LSTM模型设置实验代码实验结果总结致谢实验基本要求tensorflow2.0及以上版本实验背景 在自然语言处理(NLP)领域,大多对话机器人的对话形成都会采用基于
语料
库和深度神经网络生成模型进行回答和交流
CW96
·
2022-07-28 17:35
自然语言处理
神经网络
python
nlp
tensorflow
python文本分析与挖掘(三)-词频统计
实现功能:前一篇文章我介绍了文本分析与挖掘的第一步和第二步(具体可参加前两篇文章),即构建
语料
库和中文分词,这篇文章将在此基础上进行词频统计。
不再依然07
·
2022-07-27 07:48
文本分析
python
中文分词
数据挖掘
Sentence-BERT+Milvus实现智能问答系统
该系统与普通的问答系统不同,本系统根据用户所选择的
语料
库的不用切换应用领域,极大的方便了用户的使用。
CityD
·
2022-07-21 13:33
杂项
bert
人工智能
深度学习
mysql
Word2Vec 使用总结
简单的说,它在给定的
语料
库上训练一个模型,然后会输出所有出现在
语料
库上的单词的向量表示,这个向量称为"wordembedding"。
javastart
·
2022-07-21 07:16
自然语言
Word2Vec可视化展示
这个概念相对简单:通过一个句子一个句子地在
语料
库中循环去拟合一个模型,根据预先定义的窗口中的相邻单词预测当前单词。为此,它使用了一个神经网络,但实际上最后我们并不使用预测的结果。
Eureka丶
·
2022-07-21 07:09
大数据算法
机器学习
sklearn
深度学习
word2vec
自然语言处理
论文写作必备
https://www.home-for-researchers.com/static/index.html#/AI写作助手:可以自建
语料
库搜索全文内容场景写作工具:有很多转接词和句子可以参考句型https
Reyuwei
·
2022-07-20 11:43
Go1.18新特性工作区模糊测试及泛型的使用详解
现实的情况多仓库同时开发多个新仓库开始开发工作区模式是什么推荐的使用方法使用时的注意点Go模糊测试(GoFuzzingTest)为什么Golang要支持模糊测试模糊测试是什么Golang的模糊测试如何使用最简单的实践例子提供自定义
语料
使用时的注意点
·
2022-07-19 17:51
做AI手语数字人,是让聋人用熟悉的方式去理解健听人的表达方式
这些志愿者把电视新闻栏目的内容转换成手语顺序的文本,为冬奥会转播中需要的AI(人工智能)手语数字人提供大规模的
语料
支持。
互联网志
·
2022-07-19 16:45
人工智能
【NLP】文本情感分析
昨晚太晚代码还没有跑完,恰巧又遇到PSO-LSTM的准确率没办法复原,惨兮兮/(ㄒoㄒ)/,具体内容今天来补上文本情感分析一、情感分析简介二、文本介绍及
语料
分析三、数据集分析四、LSTM模型五、重点函数讲解
Vincy_King
·
2022-07-19 13:15
NLP
自然语言处理
情感分析
Python
python文本统计_Python文本挖掘: 词频统计,词云图
结巴分词中自带了一个叫做dict.txt的词典,里面包含词,词条出现次数(基于人民日报等
语料
库)
weixin_39562998
·
2022-07-18 11:19
python文本统计
python词云图的制作(用户评论分析)
python进行数据爬取,获得评论数据并存入本地2.机械压缩去词(1)机械压缩去词的思想例如“非常好非常好非常好非常好非常好非常好非常好非常好”以及“好呀好呀好呀好呀好呀好呀好呀好呀”这一类是存在连续重复的
语料
樱花的浪漫
·
2022-07-18 07:34
其他
python
ACL 2022 | 基于Prompt的自动去偏:有效减轻预训练语言模型中的偏见
Background去除偏见问题一直在真实对话系统中一直收到广泛的关注,在大型人类产生的
语料
库上训练的预训练语言模型,很多模型继承了类似人类的偏见和不想要的社会定型,例如,在maskfilling任务中
PaperWeekly
·
2022-07-18 07:20
机器学习
人工智能
深度学习
自然语言处理
python
领域命名实体NER实现:Bert+BiLSTM+CRF
使用Bert的好处是能够学习到
语料
的语义特征,BiLSTM能学习到词之间较长的上下文关系,CRF能纠正BiLSTM预测的顺序错误
Jacky qs
·
2022-07-12 07:24
深度学习
kashgari
NER
自然语言处理
深度学习
tensorflow
关键字提取算法TF-IDF和TextRank(python3)————实现TF-IDF并jieba中的TF-IDF对比,使用jieba中的实现TextRank...
关键词:TF-IDF实现、TextRank、jieba、关键词提取数据来源:
语料
数据来自搜狐新闻2012年6月—7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据数据处理参考前一篇文章介绍:介绍了文本关键词提取的原理
weixin_30896825
·
2022-07-11 17:38
人工智能
python
TF-IDF算法介绍和实现
TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个
语料
库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会
淼仔爱学习
·
2022-07-11 17:33
机器学习
人工智能
机器学习
自然语言处理(NLP)[文本挖掘算法]:TF-IDF分析
下面我给大家简单介绍一下TF-IDF算法:定义在信息检索中,TF-IDF(词频-逆文档频率)是一种统计方法,用以评估一个单词在一个文档集合或
语料
库中的重要程度。经常被用作信
丈哥SEO
·
2022-07-11 17:33
自然语言处理
自然语言处理
算法
tf-idf
文本挖掘算法
文本挖掘基本流程概述 & 分词和TF-IDF值计算方法介绍
文本挖掘基本流程概述,详细介绍分词及TF-IDF值计算目录获取
语料
文本预处理构造文本特征3.1词袋表示3.2词向量表示特征选择处理4.1特征选择4.2特征降维学习模型训练&适用5.1模型训练学习5.2模型评估参考资料图源
ZFour_X
·
2022-07-11 17:59
文本挖掘学习
机器学习
自然语言处理
词性标注-隐马尔可夫模型
流程很简单,先利用现有的
语料
库训练HMM模型,这是学习问题,然后利用v
孤独腹地
·
2022-07-10 07:06
机器学习
hmm
隐马尔可夫模型
机器学习
viterbi
algorithm
维特比算法
论文阅读【Open-book Video Captioning with Retrieve-Copy-Generate Network】
作者想到通过video-to-text检索任务,从
语料
库中检索句子作为caption的指
hei_hei_hei_
·
2022-07-08 07:52
论文阅读
计算机视觉
自然语言处理
深度学习
垃圾邮件分类任务中多种机器学习(贝叶斯、支持向量机和随机森林)和深度学习(GloVe和LSTM)方法的应用和对比
例如\垃圾邮件分类任务
语料
\train\Data\001\路径下的067邮件:萬泰商銀特
Monkey typist
·
2022-07-05 07:47
AI
机器学习
深度学习
svm
随机森林
lstm
OPPO小布推出预训练大模型OBERT,晋升KgCLUE榜首
近期,OPPO小布助手团队和机器学习部联合完成了十亿参数模型“OBERT”的预训练,该模型通过5种mask机制从TB级
语料
中学习语言知识,在
·
2022-07-04 17:55
人工智能算法自然语言处理
深入理解PyTorch中的nn.Embedding的使用
目录一、前置知识1.1
语料
库(Corpus)1.2词元(Token)1.3词表(Vocabulary)二、nn.Embedding基础2.1为什么要embedding?
·
2022-07-04 13:01
深入理解PyTorch中的nn.Embedding
目录一、前置知识1.1
语料
库(Corpus)1.2词元(Token)1.3词表(Vocabulary)二、nn.Embedding基础2.1为什么要embedding?
raelum
·
2022-06-28 07:22
PyTorch
pytorch
人工智能
python
NER实体识别工具(中文)
感觉这些NER工具都是面向的是通用领域,训练
语料
质量残差不齐,不要抱太大希望可以直接用在specificfield。我实验的这几个中,感觉是spacy还算是好用一些的,剩下的一般吧。
追光女孩儿
·
2022-06-27 23:46
python
knowledge
语言模型
nlp
语料
库数据处理个案实例(读取多个文本文件、读取一个文件夹下面指定的多个文件、解码错误、读取多个子文件夹文本、多个文件批量改名)
在
语料
库语言学研究中,
语料
库往往存储在多个文本中。本小节中,我们首先介绍如何读取文件夹中多个文本的文件名;然后介绍如何读取多个文件,并将它们合并成一个文本;最后介绍如何读取多个子文件夹中的文本。
Triumph19
·
2022-06-27 20:29
利用Python进行数据分析
python文本分析
python
os
读取文件
语音识别-基于CTC-BiLSTM联合模型的英语语音识别系统
1概要本博客偏向实践,以LibriSpeech公开英语
语料
数据集作为训练
语料
,搭建了基于CTC(Connectionisttemporalclassification)-BiLSTM的联合模型的语音识别系统
The_帅
·
2022-06-27 07:17
语音识别
语音识别
深度学习
神经网络
python
上一页
28
29
30
31
32
33
34
35
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他