E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征词
Spark ML特征的提取、转换和选择
HashingTF是一个
特征词
集的转换器(Transformer),它可以将这些集合转换成固定
象在舞
·
2020-09-16 02:24
Spark
Scala
机器学习
Spark
2.0机器学习
朴素贝叶斯的三个常用模型:高斯、多项式、伯努利
article/details/800444310.朴素贝叶斯朴素贝叶斯分类(NBC,NaiveBayesClassifier)是以贝叶斯定理为基础并且假设特征条件之间相互独立的方法,先通过已给定的训练集,以
特征词
之间独立作为前提假设
琥珀彩
·
2020-09-16 02:39
机器学习与数据挖掘算法
基于svm的中文文本自动分类系统
如:1中国3.提取
特征词
,由于并不是每个词都是有用的,因此要提取出
特征词
,主要提取名
尹汪汪
·
2020-09-14 09:24
算法
机器学习 Python scikit-learn 中文文档(10)Scikit-Learn 处理文本数据
Scikit-Learn处理文本数据与官方文档完美匹配的中文文档,请访问http://studyai.com学习教程的配置项加载20newsgroups数据集从文本文件中抽取
特征词
袋(Bagsofwords
ScorpioDoctor
·
2020-08-24 05:59
scikit-learn
Node.js之深入理解特性
本文通过这几个
特征词
汇深入聊聊Node.js的特性。
C小K
·
2020-08-22 10:37
线程
事件驱动
异步
node.js
计算机视觉学习(九)--Bag of features图像
特征词
典
Bagoffeatures图像
特征词
典BagoffeaturesBagofWordsBOF算法算法过程提取图像特征;对特征进行聚类,得到一部字典(visualvocabulary);根据字典将图片表示成向量
Shar-bh
·
2020-08-22 04:23
Bag of features 图像
特征词
典原理及实现
一、(BOF)图像检索算法原理BoW(Bag-of-Features)算法是由Csurka等在2004年提出并应用于图像处理领域的,该算法广泛应用于目标识别和图像检索。算法主要思想借鉴了文本检索的思想。在检索文本的过程中,文本由一系列的基本单元组成,这个单元通常是单词;同理,一副图像也可以看成是由一系列的基本单元组成,这些图像中的基本单元称为视觉单词(visualwords)。首先,我们用surf
TANGZAIX
·
2020-08-22 03:43
图像
特征词
典原理及实现
图像
特征词
典原理及实现原理一.Bagoffeatures:基础流程特征提取2.学习“视觉词典(visualvocabulary)”3.针对输入特征集,根据视觉词典进行量化聚类是实现visualvocabulary
Suki wu
·
2020-08-22 02:31
Bag of features : 图像
特征词
典
Bagoffeatures:图像
特征词
典摘要:基础流程及原理第一部分实验(书中数据集)第二部分实验(自己的数据集)基础流程特征提取学习“视觉词典”这一步的流程是通过K-means算法找到聚类中心:K-means
eeeat_fish
·
2020-08-22 01:51
计算机视觉
Bag of features 图像
特征词
典原理及实现
1、原理首先来了解一下基本流程,根据流程介绍原理:特征提取学习“视觉词典(visualvocabulary)”针对输入特征集,根据视觉词典进行量化把输入图像,根据TF-IDF转化成视觉单词(visualwords)的频率直方图构造特征到图像的倒排表,通过倒排表快速索引相关图像根据索引结果进行直方图匹配1.特征提取特征提取就是通过我们常用的sifi方法,提取图像的特征2.学习“视觉词典”对于一个庞大
邓程维
·
2020-08-22 00:17
《Python计算机视觉》学习之图像检索
一、BOW模型实验步骤1.1用sift方法提取特征点1.2学习“
特征词
典”我们从一个训练集中提取特征描述子,利用K-Me
@lyp1997
·
2020-08-20 07:13
计算机视觉
tensorflow多层卷积网络实现CNN文本分类
2.使用TF-IDF或词频等方式,从每个类型的文本中选出100个
特征词
,3个类别,共300个
特征词
。将300个
特征词
存入一个list中。
这是一个死肥宅
·
2020-08-16 14:39
文本处理
tensorflow
CNN
卷积神经网络
文本分类
LDA之主题模型代码实现流程
:(1)先对文档切词,然后对每个词语赋ID编号0~(n-1),计算共有n个词,m个文档(2)参数,变量设置:K主题数betaβalphaαiter_times迭代次数top_words_num每个主题
特征词
个数
abq43525
·
2020-08-16 05:09
向量空间模型(VSM)算法
如果维数很多,将来计算起来很麻烦,我们需要降维处理,所谓的降维就是,选出有代表性的
特征词
,这样就降低了维数。可以人工选择。也可以自动选择,自动选择的话,可以采用开方拟和检验方法,如果有时
1313123131312
·
2020-08-15 14:13
灵玖NlpirParser智能挖掘平台文本分类过滤系统
由于文档往往采用高频的词语来强调需要表达的特征涵义,而句子中往往是单一的词语,因此在句子检索中需要进一步选择更有区分能力的
特征词
。为此引入了文本分类过滤中常用的特征选择过程。
weixin_34144450
·
2020-08-09 14:23
2020年美赛数学建模c题部分代码(也是python的简单学习代码)
将评论内容转化为对应的分数值#以前已经从评论中统计好了各个单词的出现次数和等价之间的关系,现在我们筛选出好的
特征词
汇和坏的
特征词
汇,统计评价的得分(即满意程度)#统计单词的出现个数charts=[‘star
晨风先生
·
2020-08-05 14:48
python数据分析
55分钟学会正则表达式
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的子串修改文本与文本编辑器相似,几乎所有的高级编程语言都支持正则表达式
一梦已千年
·
2020-08-04 11:51
iOS
12星座都是什么性格?(python爬虫+jieba分词+词云)
下面是利用python爬取12星座性格相关的微博,产生的12星座性格
特征词
云!白羊座为例,其他的在最后。
m0_37435073
·
2020-08-04 11:41
12星座
正则表达式
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的子串修改文本与文本编辑器相似,几乎所有的高级编程语言都支持正则表达式
椰子哥·天行者
·
2020-08-03 17:51
算法相关
Coursera 机器学习(by Andrew Ng)课程学习笔记 Week 6(二)——误差分析与数据集偏斜处理
machine-learning参考资料:http://blog.csdn.net/quiet_girl/article/details/70842146一、垃圾邮件分类1.1输入特征我们从邮件中选出若干
特征词
StarCoo
·
2020-08-01 09:43
机器学习
55分钟学会正则表达式
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的子串修改文本与文本编辑器相似,几乎所有的高级编程语言都支持正则表达式
李欣欣1981
·
2020-07-29 20:54
程序人生
机器学习算法Python实现:tfidf
特征词
提取及文本相似度分类
#coding:utf-8#本代码主要实现了对于商品名称根据tfidf提取
特征词
,然后基于已经训练好的word2vec模型,对每行商品的tfidf值大于某一阈值的
特征词
相似度匹配已经给定的商品类别。
hellozhxy
·
2020-07-29 19:45
机器学习
机器学习算法Python实现
短文本分析----基于python的TF-IDF
特征词
标签自动化提取
这一切的基础就是
特征词
提取技术了,本文主要围绕关键词提取这个主题进行介绍(英文)。
weixin_34256074
·
2020-07-29 14:42
数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上)
FAQ见newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ)本文要点如下:对newsgroup文档集进行预处理,按照DF法及SVD分解法抽取
特征词
LarryNLPIR
·
2020-07-29 01:59
JAVA
数据挖掘
算法
数据挖掘
java
string
integer
数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上)...
FAQ见newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ)本文要点如下:对newsgroup文档集进行预处理,按照DF法及SVD分解法抽取
特征词
小飞侠-2
·
2020-07-28 05:54
如何通过Google查找专业文献资料 [转]
即使需要大众化词,如password,username,但若加入一两个
特征词
,则结果将大大简化。二是具有代表性,也即这个词具有
Just do it
·
2020-07-27 13:04
如何通过Goool查找专业文献资料[转帖]
即使需要大众化词,如password,username,但若加入一两个
特征词
,则结果将大大简化。二是具有代表性,也即这个词具有
weixin_30426879
·
2020-07-27 13:47
如何通过Google查找专业文献资料
即使需要大众化词,如password,username,但若加入一两个
特征词
,则结果将大大简化。二是具有代表性,也即这个词具有
luckisok
·
2020-07-27 12:14
文献检索
特征选择
1)它没有考虑
特征词
在类间的分布。也就是说该选择的特征应该在某类出现多,而其它类出现少,即考察各类的文档频率的差异。如果一个
特征词
,在各个类间分布比较均匀,这样的词对分类
nlper
·
2020-07-16 04:09
NLP
【python 编程】文本分类KNN算法实现及结果输出
文本分类流程:1、特征选取:网页爬取-》网页预处理获取汉字-》中文分词及词性标注-》保留名词-》词频统计-》输出词-文档矩阵-》计算词的信息增益值-》选取增益大的前N个词作为
特征词
-》计算每个词在文档中的权重
Walter_Jia
·
2020-07-11 09:53
Algorithm
Instruction
Text
Classfy
SnowNLP和jieba库实现中文分词
由于当前自然语言处理库基本都是针对英文的,而中文没有空格分割
特征词
,Python做中文文本挖掘较难,后续开发了一些针对中文处理的库,例如SnowNLP、Jieba、BosonNLP等。
cwtnice
·
2020-07-11 04:04
Python
自然语言处理之 snownlp,分词、词性标注、情感分析、文本分类、提取关键词、文本相似度
由于当前自然语言处理库基本都是针对英文的,而中文没有空格分割
特征词
,
9酱汁儿
·
2020-07-10 18:20
轻松理解TF-IDF原理及应用
以计数特征文本向量化的不足 计数特征,简单来讲就是统计每个
特征词
在文档中出现的次数,把次数作为特征的权重。
AI壹号堂
·
2020-07-09 00:38
自然语言处理
Sklearn中CountVectorizer,TfidfVectorizer详解
本特征提取:将文本数据转化成特征向量的过程,比较常用的文本特征表示法为词袋法词袋法:不考虑词语出现的顺序,每个出现过的词汇单独作为一列特征,这些不重复的
特征词
汇集合为词表,每一个文本都可以在很长的词表上统计出一个很多列的特征向量
Steven灬
·
2020-07-08 19:25
机器学习
LDA模型实战常用知识点
这次我将分享在这个notebook中,将会对以下问题进行实战:提取话题的关键词gridsearch寻找最佳模型参数可视化话题模型预测新输入的文本的话题如何查看话题的
特征词
组如何获得每个话题的最重要的n个
特征词
邓旭东HIT
·
2020-07-08 18:16
机器学习之路:python 文本特征提取 CountVectorizer, TfidfVectorizer
CountVectorizer,TfidfVectorizer本特征提取:将文本数据转化成特征向量的过程比较常用的文本特征表示法为词袋法词袋法:不考虑词语出现的顺序,每个出现过的词汇单独作为一列特征这些不重复的
特征词
汇集合为词表每一个文本都可以在很长的词表上统计出一个很多列的特征向量如果每个文本都出现的词汇
qq_30868235
·
2020-07-07 21:56
自然语言
python学习-文本数据分析2(文本分类)
scikit-learn.org/stable/user_guide.htmlPYTHON自然语言处理中文翻译NLTKNaturalLanguageProcessingwithPython中文版主要步骤:1.分词2.
特征词
提取
旭旭_哥
·
2020-07-07 15:09
数据挖掘
机器学习
python编程
从词向量到Bert——简单作业题+讲解
习题1.关于Word2vec,下列哪些说法是正确的()(A)Word2vec是有监督学习(B)Word2vec利用当前
特征词
的上下文信息实现词向量编码,是语言模型的副产品(C)Word2vec不能够表示词汇之间的语义相关性
flying_1314
·
2020-07-04 15:17
NLP
[python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像
0前言本文主要讲述以下几点:1.通过scikit-learn计算文本内容的tfidf并构造N*M矩阵(N个文档M个
特征词
);2.调用scikit-learn中的K-means进行文本聚类;3.使用PAC
weixin_34037173
·
2020-07-04 03:44
信息增益提取文本分类
特征词
信息增益提取文本分类
特征词
#-*-coding:utf-8-*-#@Time:2018/11/510:26#@Author:lidra#@File:IG.py#@Software:PyCharmimportcPickleaspickleimportnumpyasnpimportpandasaspdimportnltkpath
紫陌毛毛
·
2020-07-02 11:49
机器学习
python3__零散问题处理
目录1.dataframe中可迭代元素因长度不同修改时报错的问题1.dataframe中可迭代元素因长度不同修改时报错的问题原始代码:将商品标题对应
特征词
列表转换为向量并重新赋值foriinrange(
admin_maxin
·
2020-07-01 16:07
#
Python
3.0
什么是文本分析,文本分析主要运用到了哪些关键技术?
文本分析是指:从文本中抽取
特征词
进行量化以表示文本信息。文本一般指文字。它是自然语言处理的一个小分支,自然语言处理还包括语音识别(常见的)等。
人工智能爱好者
·
2020-06-30 16:33
人工智能
R语言正则表达式
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:•检查文本中是否含有指定的
特征词
•找出文中匹配
特征词
的位置•从文本中提取信息,比如:字符串的子串•修改文本与文本编辑器相似,几乎所有的高级编程语言都支持正则表达式
给我瓶叶小白
·
2020-06-30 08:22
R语言
基于Python的情感分析案例
背景交代:爬虫京东商城某一品牌红酒下所有评论,区分好评和差评,提取
特征词
,用以区分
黑_太狼de数据
·
2020-06-30 06:13
Python
机器学习
TF-IDF提取英文文章
特征词
#-*-coding:utf-8-*-"""CreatedonWedMar2816:49:382018@author:47899"""importcodecsimportosimportnltkimportmathimportoperatorfromnltk.tokenizeimportWordPunctTokenizerdefparticiples(text):#分词函数pattern=r"""
whyoceansea
·
2020-06-29 18:29
区块链究竟有什么价值体现?
关于区块链的价值,很多文章用“去中心化、去信任、难篡改”等
特征词
汇泛泛介绍,也难怪讲不清楚。价值,是通过对比得出的。
CAM中企矩阵
·
2020-06-29 06:14
区块链价值
NLP --- 文本分类(向量空间模型(Vector Space Model)VSM)
的几个主要步骤,在宗老师的书里都有详细的讲解,这里也会进行深入的讲解,浅显易懂的是目的,深入理解是目标,下面给出这个VSM模型的方框流程图:其中分词和词袋的建立我们在前两节进行解释了,这一节将主要介绍
特征词
选择
zsffuture
·
2020-06-29 04:52
自然语言处理
基于bow的图像检索
图像检索与识别目录图像检索与识别Bag-of-words模型Bagoffeatures:基础流程K-means聚类算法Bagoffeatures:学习
特征词
典Bagoffeatures:图像检索实验过程
wenbozhu
·
2020-06-29 03:05
计算机视觉
达观数据比赛 第三天任务
CBOW模型的训练输入是某一个
特征词
的上
麦片加奶不加糖
·
2020-06-26 10:33
Python
数据挖掘-文本分类:特征选择方法总结
一、概念二、特征选择方法总结一、概念
特征词
选择和
特征词
权重1.
特征词
选择:
特征词
选择是为了降低文本表示的维度,而
特征词
权重是为了表示文本表示中每一个特征项的重要程度。
shunqs
·
2020-06-26 10:52
数据挖掘篇
算法篇
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他