E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语料
知识图谱与明朝那些事儿
《明朝那些事儿》用现代语言描绘了明朝大部分史实,人物关系也比较明确与详细,正好可用作
语料
。后期会将构建过程展示出来。
qq_22244821
·
2023-01-10 14:47
知识图谱
【机器学习】贝叶斯算法详解 + 公式推导 + 垃圾邮件过滤实战 + Python代码实现
文章目录一、贝叶斯简介二、贝叶斯公式推导三、拼写纠正案例四、垃圾邮件过滤案例4.1问题描述4.2朴素贝叶斯引入五、基于朴素贝叶斯的垃圾邮件过滤实战5.1导入相关库5.2邮件数据读取5.3构建
语料
表(字典
WSKH0929
·
2023-01-09 14:13
#
机器学习
人工智能
python
算法
贝叶斯算法
一文看懂 NLP 中的情感分析任务
情感倾向分析的方法主要分为两类:基于情感词典的方法;基于机器学习的方法,如基于大规模
语料
库的机器学习。前者需要用到标注好的情
深度学习技术前沿
·
2023-01-09 12:33
人工智能
自然语言处理
机器学习
nlp
编程语言
想要学习NLP情感分析,你竟然没看过这篇文章!
情感倾向分析的方法主要分为两类:基于情感词典的方法;基于机器学习的方法,如基于大规模
语料
库的机器学习。前者需要用到标注好的情
csdn人工智能头条
·
2023-01-09 12:57
人工智能
机器学习
自然语言处理
编程语言
nlp
一、中文自然语言处理的完整机器处理流程 nlp笔记
中文自然语言处理的完整机器处理流程1.获取
语料
,读取原始数据:语言材料,文本集合。
酒窝写代码
·
2023-01-09 12:27
nlp
nlp
自然语言处理
中文自然语言处理
自带
语料
和实验报告。功能完整。 Develop 261万源代码下载- www.pudn.com...
自带分类
语料
和实验报告。功能完整。
李印乾
·
2023-01-09 11:02
bayes
java
【自然语言处理与文本分析】文本特征提取方法总结。关键词提取方法。公认效果较好的IDF,RCF。
关键词提取方法关键词是文章想表达的主要画图,能反映文本
语料
主题的词语或者短语。
晴天qt01
·
2023-01-09 10:33
数据分析师
大数据
自然语言处理
数据挖掘
数据分析
算法
自然语言处理(四):文本预处理之文本数据分析
自然语言处理笔记总目录文本数据分析能够有效帮助我们理解数据
语料
,快速检查出
语料
可能存在的问题,并指导之后模型训练过程中一些超参数的选择常用的几种文本数据分析方法:标签数量分布句子长度分布词频统计与关键词词云标签数量分布
GeniusAng丶
·
2023-01-09 10:33
自然语言处理
人工智能
pytorch
自然语言处理
python
神经网络
Bert实战之文本分类(附代码)
2.2featureextract(特征抽取)3、coding3.1基于fine-tune的文本分类3.2基于featureextract的文本分类1、概要Bert是Google在2018年10月提出的一种利用大规模
语料
进行训练的语言模型
明子哥哥
·
2023-01-09 09:04
keep
learning
实战总结
NLP
tensorflow
自然语言处理
深度学习
【笔记】GPT
这种将结构带入下游任务中的模式,不一定对每个任务都适用,GPT主要还是针对分类任务和标注性任务,对于生成任务,比如机器翻译,则它的结构也没办法进行很好的迁移;介绍GPT在2018年由OpenAI提出,通过在大量的
语料
上预训
Finks_chen
·
2023-01-09 09:27
10.基于ML的中文短文本分类
整个过程分为以下几个步骤:
语料
加载分词去停用词抽取词向量特征分别进行算法建模和模型训练评估、计算AUC值模型对比基本流程:2.加载数据importrandomimportjiebaimportpandasaspdch_path
Tony Einstein
·
2023-01-09 06:23
自然语言处理总结-学习记录
自然语言处理
深度学习
人工智能
python
Word2Vec之CBOW详解
举个例子,一个corpus(
语料
库)为“Idrinkcoffeeeveryday”。假设将单词放入数组str,则该数组str长度
Feather_74
·
2023-01-09 03:42
NLP自然语言处理
word2vec
人工智能
nlp
1024程序员节
【技术博客】文本挖掘之LDA主题模型
在文本挖掘领域,大量的数据都是非结构化的,很难从信息中直接获取相关和期望的信息,一种文本挖掘的方法:主题模型(TopicModel)能够识别在文档里的主题,并且挖掘
语料
里隐藏信息,并且在主题聚合、从非结构化文本中提取信息
MoModel
·
2023-01-08 06:02
人工智能
算法
Quora Question Pairs整理 - 文本相似度计算(unfinished)
具体地,根据
语料
库获得一个单词集合,集合中保存着语
weixin_30399055
·
2023-01-08 06:01
人工智能
数据结构与算法
基于Python+JavaScript的面向文本分析的交互式主题建模可视化分析系统
本课题的研究背景和意义21.1.1主题模型的发展及研究现状21.1.2目前存在的问题31.1.3本课题的研究意义31.2研究内容和主要工作31.3本文的组织结构3二、核心算法32.1文本预处理42.2大型
语料
库的内存优化
biyezuopin
·
2023-01-08 06:00
python
javascript
数据挖掘
面向文本分析
交互式主题建模可视化
文本相似度和距离度量
具体地,根据
语料
库获得一个单
a flying bird
·
2023-01-08 06:28
NLP
bert生成句向量(python)
第一步:安装库pipinstallbert-serving-serverpipinstallbert-serving-client第二步:下载
语料
库bert中文模型链接:https://storage.googleapis.com
江湖夜雨十年灯丶
·
2023-01-08 00:40
python
bert
自然语言处理
NLP
语料
库构建(corpus)
1文本加载文本处理函数学习:re.sub():正则表达式替换函数,对于输入的一个字符串,利用正则表达式(的强大的字符串处理功能),去实现(相对复杂的)字符串替换处理,然后返回被替换后的字符串,实现比普通字符串的replace更加强大的替换功能。importres="大家好,我是一个小白。I'msogladtointroducemyself,andI’m18yearsold.Todayis2020/
自在犹仙
·
2023-01-07 21:26
深度学习集训
自然语言处理
人工智能
python
python 文本挖掘 TF-IDF 的jieba与sklearn实现
TF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文件频率).TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个
语料
库中的其中一份文件的重要程度
English Chan
·
2023-01-07 15:10
机器学习
python
自然语言处理
tf-idf
关键词提取-基于python实现tf-idf
关键词提取代码实现:#encoding:utf-8importjiebaimportreimportosimportnumpyasnpclassMyTfIdf:def__init__(self):#
语料
库中所有文档的每个词的词频的统计
Jason_Honey2
·
2023-01-07 15:03
python
自然语言处理
tf-idf
文本相似度算法:文本向量化+距离公式
1.1.1词袋模型的步骤第一步:构造词典根据
语料
库,把所有的词都提取出来,编上序号第二步:独热编码,D维向量记词典大小为D,那么每个文章就是一个D维向量:每个位置上的数字表示对应编号的词在该文章中出现的次数
==樛木==
·
2023-01-07 07:34
深度学习之个人总结
文本相似度
文本向量化
余弦相似度
词袋模型
TD-IDF
One_hot和Word2Vec两种词向量方法的原理及比较
再众多词向量表示方法中,尤其以One_hot和word2vec两种方法最常用,下面也针对这俩方法进行阐述One_hot方法One_hot方法是最简单的一种方法,也是出现最早的一种方法,其原理就比如一个
语料
有
阴天了
·
2023-01-07 07:01
自然语言处理
词向量
word2vec
simhash的py实现
初始化首先我们要明确我们需要的是什么,给定了一个大
语料
,我们希望得到的是每个词的编码以及对应的权重,那么我们可以将目标拆分为以下几
IGV丶明非
·
2023-01-06 15:37
NLP
NLP
句子相似度
hash
idf
Python分析国家领导人新春贺词建立主题模型
主题建模可以帮助开发人员直观地理解和探索数据,以便更好地挖掘
语料
库中的主题。成功的主题建模需要多次迭代:清洗数据、读取结果、相应地调整预处理并重试。
今天喝奶茶了嗎
·
2023-01-06 10:10
自然语言处理
python
机器学习
自然语言处理
基于顺承关系的事理图谱的构建
一.数据获取通过从旅游网站爬取博主的旅游经验及心得作为原始
语料
。该爬虫基于scrapy实现,爬取数据存储在mongo数据库中。
cuguanren
·
2023-01-05 22:17
数据库
java
开发语言
python
知识图谱
解决nltk download(‘brown’)连接尝试失败问题
连接尝试失败1、去下载官方包(http://www.nltk.org/nltk_data/)2、选择其中一个路径,将解压后的文件按照该路径放好再运行一下代码#nltk库提供了直接生成N-gram的方法#以布朗
语料
库的单词
小白*进阶ing
·
2023-01-05 21:33
python
开发语言
python nltk 安装失败以及download()出错
1、什么是nltk一个完整的⾃然语⾔处理框架⾃带
语料
库,词性分类库⾃带分类,分词,等等功能有强⼤的社区⽀持框架设计上没有考虑中文使用安装语句pipinstallnltknltk.download()#下载
是鱼儿啊~
·
2023-01-05 21:33
机器学习
python
开发语言
数据挖掘
NLTK
语料
库nltk.download()安装失败及下载很慢的解决方法
一.解决nltk.download()安装失败importnltknltk.download()下载nltk
语料
库出现getaddrinfofailed如下错误:这里只需将ServerIndex路径改成
深度学习菜鸟
·
2023-01-05 21:32
python
自然语言处理
python成语接龙代码_实现成语接龙(Python)
字相同拼音也要相同模式2:字相同拼音不要求相同模式3:字不要相同拼音要求相同,即谐音就可以接龙的成语必须是四字成语已使用过的成语双方均不得再次使用一方不按照规则接龙或接不下去时判定失败数据获取和清洗本文
语料
来自于
weixin_39756273
·
2023-01-05 20:34
python成语接龙代码
我用 Python 自制成语接龙小游戏,刺激
在https://github.com/pwxcoo/chinese-xinhua项目中可以下载到中华成语的
语料
库,该项目收录包括14032条歇后语,16142个汉字,264434个词语,31648个成语
程序员婷崽
·
2023-01-05 20:31
python
开发语言
用 Python 自制成语接龙小游戏!
作者:小小明来源:杰哥的IT之旅在https://github.com/pwxcoo/chinese-xinhua项目中可以下载到中华成语的
语料
库,该项目收录包括14032条歇后语,16142个汉字,264434
Python数据之道
·
2023-01-05 20:31
数据挖掘
python
人工智能
数据分析
大数据
用Python 做成语接龙,超简单,有语音,过年和孩子玩
过年和孩子玩成语需要准备的资料:idiom.json文件python3.6安装pyttsx3pandasnumpy在https://github.com/pwxcoo/chinese-xinhua项目中可以下载到中华成语的
语料
库
搬码工琪老师
·
2023-01-05 20:29
python制作生活小工具
python
开发语言
基于mrpc的文本分类任务Bert源码分析(一):特征提取
他们主要的工作是预训练出了一个模型,即对一个很大的
语料
库进行训练,得到相应的词向量。这一步,主要用到mask,transformer等机制。
丹妮与铁王座
·
2023-01-05 19:10
BERT源码学习记录
wiki维基百科各种
语料
数据下载
wiki维基百科常用
语料
下载路径英文
语料
路径:https://dumps.wikimedia.org/enwiki/中文
语料
路径:https://dumps.wikimedia.org/zhwiki/西班牙
语料
路径
mtj66
·
2023-01-05 16:50
机器学习
python
论文阅读笔记---《TransferNet: An Effective and Transparent Framework for Multi-hop Question Answering over》
这些关系可以用知识图谱中的标签(例如,配偶)或文本
语料
库中的文本(例如,他们已经结婚26年)来表示。现有模型通常通过预测顺序关系路径或聚合隐藏图特征来推断答案。前者难以优化,后者缺乏可解释性。
Ray.1998
·
2023-01-05 14:13
论文笔记
自然语言处理
人工智能
nlp
transformer
神经网络
语音识别入门第一节:语音识别概述
目录语音识别的定义语音识别的重要性语音交互语音识别的挑战性语音识别的发展历史语音识别的深度学习时代现代语音识别框架
语料
库与工具包语音识别的定义语音识别:AutomaticSpeechRecognition
安静_xju
·
2023-01-05 11:49
语音识别入门
语音识别
人工智能
【Gensim + TSNE使用】word2vec词向量处理中文小说 (词嵌入、高维数据降维)
调用gensim.models.word2vec对
语料
建立词向量。词嵌入,使用TSNE进行数据降维,使用plt可视化词嵌入结果。
FUTUREEEEEE
·
2023-01-05 10:51
word2vec
自然语言处理
机器学习
自然语言处理之使用gensim.Word2Vec训练词向量进行词义消歧
不过嘛,正如我们想的那样,肯定是
语料
库越大越好,但越大呢就训练的时间越长,这也是没办法的事情。我建议大家用GPU来训练,当当当,强烈推荐AI
猫头丁
·
2023-01-05 10:51
自然语言处理
自然语言处理
nlp
词向量
gensim
aistudio
主题模型Gensim入门系列之三:主题和变换
系列目录:(1)主题模型Gensim入门系列之一:核心概念(2)主题模型Gensim入门系列之二:
语料
和向量空间(3)主题模型Gensim入门系列之三:主题和变换(4)主题模型Gensim入门系列之四:
liuzard
·
2023-01-05 10:49
自然语言处理
主题模型
gensim
nlp
自然语言处理
主题模型
gensim
主题模型Gensim入门系列之四:文本相似度查询
系列目录:(1)主题模型Gensim入门系列之一:核心概念(2)主题模型Gensim入门系列之二:
语料
和向量空间(3)主题模型Gensim入门系列之三:主题和变换(4)主题模型Gensim入门系列之四:
liuzard
·
2023-01-05 10:49
主题模型
自然语言处理
gensim
nlp
自然语言处理
主题模型
gensim
主题模型Gensim入门系列之一:核心概念
系列目录:(1)主题模型Gensim入门系列之一:核心概念(2)主题模型Gensim入门系列之二:
语料
和向量空间(3)主题模型Gensim入门系列之三:主题和变换(4)主题模型Gensim入门系列之四:
liuzard
·
2023-01-05 10:19
自然语言处理
主题模型
nlp
自然语言处理
主题模型
gensim
主题模型Gensim入门系列之二:
语料
和向量空间
系列目录:(1)主题模型Gensim入门系列之一:核心概念(2)主题模型Gensim入门系列之二:
语料
和向量空间(3)主题模型Gensim入门系列之三:主题和变换(4)主题模型Gensim入门系列之四:
liuzard
·
2023-01-05 10:19
自然语言处理
主题模型
gensim
nlp
自然语言处理
主题模型
gensim
gensim.word2vec 训练词向量
importjiebaimportnumpyasnpimportpandasaspdfromgensim.models.word2vecimportWord2Vecimportjoblibfromsklearn.svmimportSVC#读取两个类别的
语料
little fly
·
2023-01-05 10:46
自然语言处理
nlp
gensim入门
简介:gensim是挖掘文档语义结构的工具,通过
语料
库(文档集),生成表示文本的向量。
语料
库:
语料
库是数字文档的集合,是gensim的输入
攀攀的跟屁虫
·
2023-01-05 10:15
自然语言处理
应用 - gensim如何得到word2vec词向量
从三个方面去说明word2vec词向量中文
语料
处理(pythongensimword2vec总结)python训练work2vec词向量系列函数(pythongensim)python训练work2vec
lamusique
·
2023-01-05 10:45
应用型
word2vec
gensim
NLP
词向量
中文自然语言处理--词向量Word2Vec
fromgensim.modelsimportWord2Vecimportjieba#先导入Gensim中的Word2Vec和jieba分词器,再引入黄河和长江的
语料
#定义停用词、标点符号punctuation
糯米君_
·
2023-01-05 10:14
中文自然语言处理
python
中文自然语言处理
词向量
NLP:使用 gensim 中的 word2vec 训练中文词向量
1.1下载数据集 本内容使用wiki中文
语料
作为训练数据。可以在wiki官网下载中文
语料
,下载后得到一个名为zhwiki-latest-p
空杯的境界
·
2023-01-05 10:43
01_机器学习
#
01.02
NLP
word2vec
词向量
gensim
NLP
zhwiki
人工智能培训老师讲师叶梓:计算机视觉领域的自监督学习模型——MAE-2
主要方法是在大型文本
语料
库上进行预训练,然后在较小的特定于任务的数据集上进行微调。Transformer未完,下一篇继续……
大数据AI人工智能专家培训讲师叶梓团队
·
2023-01-05 09:41
人工智能讲师
人工智能
AI
人工智能
计算机视觉
自然语言处理
AI讲师
自监督学习模型
自然语言处理常用资源分享
自然语言处理常用资源分享目录博主介绍开源Python库知识图谱相关
语料
&数据集词表其他可能有帮助的研究目录博主介绍个人主页:苏州凯捷智能科技有限公司个人社区:CSDN全国各地程序猿作者介绍:苏州凯捷智能科技有限公司创始人
苏州凯捷智能科技有限公司
·
2023-01-04 15:41
凯捷
自然语言处理
人工智能
nlp
使用全局优化方法识别中文事件因果关系
使用全局优化方法识别中文事件因果关系目录使用全局优化方法识别中文事件因果关系一、
语料
库标注及基准系统1、因果
语料
库标注1.显示因果关系2.隐式因果关系3.非因果关系2、基准系统二、全局优化模型1.目标函数
懒人的理想主义
·
2023-01-04 07:05
论文总结
个人见解
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他