E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语料库
可怕!微软AI:一张面部照片一段音频,完美生成头像演讲视频
越来越多的研究表明,只要
语料库
足够大,几乎任何人的面部动作都可以与语音片段同步。今年6月,来自三星的应用科学
我爱计算机视觉
·
2022-05-20 08:20
LDA主题模型绘制困惑度(perplexity)-主题数曲线——python
LDA作为一种无监督机器学习技术,利用词袋方法识别隐藏在大规模文档集或
语料库
中的主题信息。LDA模型可挖掘出文档集或
语料库
中的潜在
阿丢是丢心心
·
2022-05-12 10:26
python
数据分析
自然语言处理入门——新手上路
目录一、自然与语言与编程语言二、自然语言处理的层次三、自然语言处理的流派五、
语料库
六、开源工具七总结自然语言处理(NLP)是一门融合了计算机科学、人工智能以及语言学的交叉学科。
海伦•
·
2022-05-08 07:57
人工智能相关书籍阅读笔记
自然语言处理
机器学习
深度学习
智能客服闲聊模块三种方案对比
目前业界针对于闲聊模块的方案一般以下三个方案基于固定模板我们都知道业务问答通用方案是基于模板式问答,同理模板式问答也适用于闲聊系统,这种方式的优势在于易于控制,用少量的模板满足多种问题需求,劣势在于出现答非所问的概率比较大基于
语料库
这种做法是先收集
·
2022-05-07 00:15
算法人工智能
nltk自然语言处理
一些知识点concordanceconcordance查找
语料库
中特定的单词的上下文,检索词指定窗口大小的上下文。
Suzerk
·
2022-04-15 07:54
杂七杂八
nltk
nlp
机器学习笔记(二)1
早期又叫模式识别PR(偏向具体任务,eg:光学字符识别、语音识别、人脸识别等)2.基本概念特征/属性:标签::=>样本/示例数据集/
语料库
训练集/测试样本测试集/训练样本特征向量学习算法A又叫学习器3.
foxxxx
·
2022-03-29 19:00
5分钟NLP:快速实现NER的3个预训练库总结
NER模型的作用是识别文本
语料库
中的命名实体例如人名、组织、位置、语言等。NER模型可以用来理解一个文本句子/短语的意思。
·
2022-03-24 14:59
关于使用[MASK]做完形填空时需要注意的点
文章目录题目关键点Q1:选取谁做[MASK]Q2:如何实现[MASK]Q3:为什么自己训练的模型loss不会下降题目关于使用[MASK]做完形填空时需要注意的点关键点Q1:选取谁做[MASK]A:关于这个问题取决于
语料库
中的每句话的平均长度比如我在
365JHWZGo
·
2022-03-16 07:49
自然语言处理NLP
深度学习
机器学习
自然语言处理
Raki的读paper小记:GloVe: Global Vectors for Word Representation
大名鼎鼎来自StanfordChrisManning组的GloVe词向量摘要本方法提出的初衷是,基于shallow-window的方法的缺点是它们不能直接对
语料库
的共现统计数据进行操作,而只是用一个滑动窗口滑过整个
语料库
爱睡觉的Raki
·
2022-03-14 07:40
读paper
NLP
机器学习
深度学习
nlp
人工智能
自然语言处理
python nlp 句子提取_python nlp 句子提取_《用Python进行自然语言处理》第7章 从文本提取信息...
3.哪些
语料库
适合这项工作,我们如何使用它们来训练和评估我们的模型?7.1信息提取#一个重要的形式是结构化数据:实体和关系的可预测的规范的结构。
weixin_39538847
·
2022-03-02 07:49
python
nlp
句子提取
python nlp 句子提取_《用Python进行自然语言处理》第7章 从文本提取信息
3.哪些
语料库
适合这项工作,我们如何使用它们来训练和评估我们的模型?7.1信息提取#一个重要的形式是结构化数据:实体和关系的可预测的规范的结构。
抓到大根就是宝
·
2022-03-02 07:19
python
nlp
句子提取
python_NLP实战之关键词提取
无监督的方法包括TF-IDF算法、TextRank算法(不依赖
语料库
)和主题模型算法(LSA,LSI,LDA等)1、LSA步骤step1:使用BOW模型将每个文档表示为向量step2:将所有的文档词向量拼接起来构成词
TtingZh
·
2022-03-02 07:48
python自然语言处理实战
Python库之自然语言处理和文本挖掘
目前已经有超过50种
语料库
和词汇资
缘如风
·
2022-03-02 07:03
Python
python根据词向量计算相似度_Python 利用Word2Vec计算词语相似度(gensim实现)
输入:
语料库
,txt文件。输出:余弦相似度。
weixin_39578457
·
2022-03-01 07:34
中科大、MSRA提出视觉Transformer BERT预训练新方式,优于MAE、BEiT
基于大型
语料库
训练的Transformer模型在自然语言处理中取得了巨大的成功,作为Transformer构建块,self-attention极大地改变了计算机视觉任务。
PaperWeekly
·
2022-02-24 07:55
计算机视觉
神经网络
机器学习
人工智能
深度学习
5分钟NLP:快速实现NER的3个预训练库总结
NER模型的作用是识别文本
语料库
中的命名实体例如人名、组织、位置、语言等。NER模型可以用来理解一个文本句子/短语的意思。
·
2022-02-21 09:57
25个值得收藏的Python文本处理案例
TextBlob更正拼写9使用NLTK和TextBlob的词标记化10使用NLTK提取句子单词或短语的词干列表11使用NLTK进行句子或短语词形还原12使用NLTK从文本文件中查找每个单词的频率13从
语料库
中创建词云
·
2022-02-20 17:51
11. HanLP实现朴素贝叶斯/SVM--文本分类
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP11.文本分类上一章我们学习了文本聚类,体验了无须标注
语料库
的便利性。
mantch
·
2022-02-20 08:09
短文本分类 (一): 构建词向量
得到原始标题数据后,我需要对其进行分词构建
语料库
,分词我使用jieba这个第三方库。之后要通过
语料库
用Word2vec算法对分词进行训练,这里我使用gensim的word2vec。
_张旭
·
2022-02-19 22:50
基于文本挖掘的情人节微信聊天记录情感分析
这里就用和大学本科好基友的聊天记录作为
语料库
啦。整个分析流程分为以下几个部分:目录1.微信聊天记录获取2.数据清洗2.1分词、去停、去重2.2外部词典调用3.数据分析3.1词频分析与词云展示3
#温室里的土豆
·
2022-02-14 07:57
微信
python
nlp
Arxiv网络科学论文摘要11篇(2020-09-03)
VeRNAl:用于挖掘RNA中模糊网络模体的工具;在网络中查找信息源:带预算的查询;异构图神经网络推荐;社会等级促进合作主导;将属性网络嵌入扩展至大型图;感性的LIAR:伪造索赔分类的扩展
语料库
和深度学习模型
ComplexLY
·
2022-02-13 04:03
我的忏悔
但是一直打哈欠完全集中不了注意力也不是回事,我的
语料库
数据都
李想想
·
2022-02-12 07:46
TextRank——关键词提取
TextRank算法可以脱离
语料库
的背景,仅对单篇文档进行分析就可以提取该文档的关键词。PageRank算法TextRank算法基于PageRank算法的。
dreampai
·
2022-02-12 00:03
2019年的小目标
19年考过四门CPA,同时准备雅思口语和写作><口语用书:王陆
语料库
1、看视频学习,练五个音标,每个音标四遍。
顾自律
·
2022-02-09 02:11
Arxiv网络科学论文摘要22篇(2020-06-08)
SEIR模型的分析和元胞自动机方法用于在拥挤的开放空间中传播的感染;在大学环境中模拟COVID-19;跨语言迁移学习,以应对COVID-19疫情;考虑分类的神经网络主题模型及其在新型COVID-19虚假
语料库
中的应用
ComplexLY
·
2022-02-08 17:36
es实战-使用IK分词器进行词频统计
词频统计服务具体模块如下:数据输入:文本信息数据输出:词-词频(TF-IDF等)-词性等内容使用的组件:分词器、
语料库
、词云展示组件等功能点:白名单,黑名单,同义
·
2022-01-30 14:41
NLTK工具集
目录简介NLTK常用
语料库
和词典资源停用词常用
语料库
常用词典常用自然语言处理工具集分句标记解析Tokenization词性标注POSTagging其他工具补充1:中文的处理工具LTP简介NLTK,NaturalLanguageToolkit
tzc_fly
·
2021-12-03 20:03
生物计算工具
自然语言处理
python
人工智能
Shopee 末端物流智能提效之路
摘要东南亚因语种多样、
语料库
缺失、GIS地理信息薄弱等多种原因,其末端物流发展还处于依靠人工的初级阶段,导致效率低下、准确受限、拓展速度受限。
·
2021-11-22 15:32
人工智能算法后端物流系统供应链
《NLP with Python》学习笔记(一)
文章目录绘制带条件的频率分布表评估词汇多样性分词自定义函数实现分词使用模拟退火算法的非确定搜索常用的基础函数绘制带条件的频率分布表#布朗
语料库
importnltkfromnltk.corpusimportbrownbrown.categories
白炎灵
·
2021-11-18 21:20
NLP
python学习
python
gensim教程翻译学习记录(四)
相似性查询(SimilarityQueries)展示一个
语料库
中相似文档的查询。
qqqh777
·
2021-11-06 22:54
python机器学习创建基于规则聊天机器人过程示例详解
目录聊天机器人基于规则的聊天机器人创建
语料库
创建一个聊天机器人总结还记得这个价值一个亿的AI核心代码?
·
2021-11-02 14:18
使用 Python 创建一个基于规则的聊天机器人
目录1、聊天机器人2、基于规则的聊天机器人3、创建
语料库
4、创建一个聊天机器人5、总结前言:还记得这个价值一个亿的AI核心代码?
·
2021-10-29 10:36
CVPR2021 用更好的目标检测器提取视觉特征!微软提出VinVL,基于更好的视觉特征,达到更强的多模态性能...
与最广泛使用的bottom-upandtop-down模型相比,新模型更大,更适用于VL任务,并在结合多个公共目标检测数据集的更大训练
语料库
上进行预训练。
我爱计算机视觉
·
2021-10-16 11:00
大数据
计算机视觉
机器学习
人工智能
深度学习
关键词提取-TFIDF(一)
深度学习模型及常用任务说明✗RNN的时间复杂度✗neo4j图数据库分词、词向量TfidfVectorizer基本介绍TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个
语料库
·
2021-08-28 21:56
nlptfidfpython
基于朴素贝叶斯/逻辑回归的垃圾邮件文本分类
jieba分词5、计算词频TF6、计算逆文本词频IDF7、混淆矩阵8、使用贝叶斯分类器9、逻辑回归六、总结一、邮件数据集本文进行文本分类任务的中文邮件数据来源于由国际文本检索会议提供一个公开的垃圾邮件
语料库
唯余木叶下弦声
·
2021-08-08 19:01
机器学习
机器学习
人工智能
python
自然语言处理
NLP随笔(四)
nlp技术包括基础技术和应用技术70年代以后随着互联网的高速发展,
语料库
越来越丰富以及硬件更新完善,自然语言处理思潮由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。
·
2021-08-05 00:30
写给雅思小白
雅思王听力真题
语料库
(机考笔试综合版)+真题里的听力雅思王听力真题
语料库
先背下来,听写倒不用做那么多遍。阅读先看雅思阅读真经总纲(机考笔试综合版)。
濠镜先生
·
2021-06-27 18:57
从头设计一个聊天机器人(进化史)
简单
语料库
第一列是我们问的问题,第二列是答案。当我们输入第一列,
魔法猫31
·
2021-06-25 08:01
【挖掘篇】:文本分析
#词频统计(某一个给定的词在该文档中出现次数)#
语料库
分析的所有文档的集合#中文分词一个汉字序列切分成一个个单词#停用词数据处理的时候,自动过滤掉的某些字或词,包括泛滥的词,如:web,网站,语气助词,
dataheart
·
2021-06-13 19:54
词向量 - 实际动手使用word2vec
这对后续的文本分类,文本聚类等等算法提供良好的数据样本,本文将详细介绍如何使用word2vec构建中文词向量这里所需要用到的包,这些包需要首先使用pip或者conda安装jiabagensimsklearn一、中文
语料库
本文采用的
贾磊_cd
·
2021-06-13 08:36
英语语法教学 - 草稿
程晓棠教授不恰当的举例例句最好从词典中去找或查
语料库
。主语不明,乱,表示鸡蛋里面的物质时,不可数名词规则是死的,场景是活的。听了感觉更不知如何教,老师需要博览群书。语法教学,创设的情境真实性
翟玉莲
·
2021-06-10 18:30
图灵机器人 qq接入
简介QQ机器人套件是一款轻巧强大的QQ机器人,搭载有图灵强大的知识库可实现自动群聊、自动聊天,不仅能起到活跃QQ群气氛的作用,更重要的是,图灵机器人为用户提供的私有
语料库
,方便独家数据导入,可快速实现智能客服服务
你要快乐_ae30
·
2021-06-10 01:43
Arxiv网络科学论文摘要20篇(2020-06-23)
EPIC30M:超过3000万条相关推文的流行病
语料库
;FakeCovid-用于COVID-19的多语言跨域事实检查新闻数据集;寻找零号患者:使用图神经网络学习传染源;封锁是否抑制了印度的COVID-19
ComplexLY
·
2021-06-09 17:45
2018-07-19
起床:6:40瘦腿第三天:6:50-7:10早上:(7:23-8:209:00-11:30)1.背单词2.独立题
语料库
下午:(14:30-1.独立
语料库
2.作文素材3.听力精练今日听力练习情况说明让人痛心
斐然Xxx
·
2021-06-07 10:26
用python处理movie数据集
我的实验是实现一个主题驱动的自动聊天机器人,CornellMovieDialogsCorpus是一个从电影数据中生成的电影对白
语料库
,包含大概600部电影对白,并且语料中含有电影名、角色、IMDB评分等许多信息
茶多多多多多
·
2021-06-07 07:48
图神经网络15-Text-Level-GNN:基于文本级GNN的文本分类模型
arxiv.org/pdf/1910.02356.pdf论文代码:https://github.com/yenhao/text-level-gnn发表时间:2019论文简介与动机1)TextGCN为整个数据集/
语料库
构建一个异构图
致Great
·
2021-06-06 22:56
TF-IDF
词频TFTF=某个词在文章中的出现次数TF=某个词在文章中的出现次数/文章总词数TF=某个词在文章中的出现次数/拥有最高词频的词的次数逆文档频率IDF
语料库
(corpus)模拟语言的使用环境。
reeuq
·
2021-06-06 22:56
这样开题
昨日立冬,今日2020年11月8日,接到沙中副校长赵登明老师电话:明日他的市级课题《基于作文
语料库
的农村初中生书面表达常见病句及校正策略研究》,请我作为专家为他们开题。
张巧金沙
·
2021-06-05 02:24
Spark MLib Word2Vec Error: The vocabulary size should be > 0
语料库
,去除停用词valmodel=word2vec.fit(v)一执行就报错如题目错误,经过google发现,sparkmlword2vec有一个参数minCount:表示输入词在输入语料中至少出现多少次
邵红晓
·
2021-06-04 06:12
英语基础差,怎样做才能拿到7?
听力从基础说起吧,听力词汇方面,我有一种不得不背的感觉,我当时刷了至少5遍的
语料库
,什么叫真正记住一个单词?那就是听到这单词的发音,
皇皇Y
·
2021-05-21 04:15
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他