E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
特征词
一个基于Python的情感分析案例
背景交代:爬虫京东商城某一品牌红酒下所有评论,区分好评和差评,提取
特征词
,用以区分
Paulzhao6518
·
2020-06-25 21:12
机器学习算法:朴素贝叶斯
极大后验概率估计或者损失函数为目标函数的最小化学习的试试函数:对数似然损失学习算法:概率计算公式,EM算法原理:朴素贝叶斯分类(NBC)是以贝叶斯定理为基础并且假设特征条件之间相互独立的方法,先通过已给定的训练集,以
特征词
之间独立作为前提假设
listarya
·
2020-06-25 20:25
TF-IDF存在的问题及其改进
IDF的简单结构并不能使提取的关键词,十分有效地反映单词的重要程度和
特征词
的分布情况,使其无法很好地完成对权值调整的功能。尤其是在同类语料库中,这一方法有很大弊端,往往一些同类文本的关键词被掩盖。
蕾姆233
·
2020-06-25 08:49
数据挖掘
【NLP】使用TF-IDF模型计算文本相似度
要注意的是,搜索文本text与被检索的文档共用一个
特征词
词典。代码主要使用gensim库完成了分词、TF-IDF模型训练、文本相似度计算。
potizo
·
2020-06-24 20:45
自然语言处理
基于词性的特征提取方法
2)经过特征提取后生成的特征向量维数太高,而且不能直接计算出特征向量中各个
特征词
的权重。特征向量维数太高对于文本分类来说是个致命的缺陷,维数过高的特征向量不仅带来了巨大的计算量,而且在这些特征
lzj0470
·
2020-06-24 11:09
数据挖掘
自行编写TF-IDF算法和Jieba中TF-IDF算法结果比较
任务:对10个战略新兴产业描述文档提取
特征词
,从而建立10个产业的特征,要求是10个产业
特征词
区分度和代表度越大越好。
liyqb
·
2020-06-24 07:50
一洋电商小卖家赚钱48招之第二招:
特征词
和工具拓展
第二招:
特征词
和工具拓展除了用爆款挖掘机直接挖宝,还有一个非常好用的方法,就是
特征词
,什么叫
特征词
呢:就是不知道是什么产品,但代表了一类产品或者人群特征的词;比如:神器,懒人,宿舍等等;神器是什么产品,
一洋电商
·
2020-06-23 00:07
NLPIR文本分析工具的功能和特色介绍
文本分析是自然语言处理的一个小分支,是指从文本中抽取
特征词
进行量化以表示文本信息,文本一般指文字。
NLPIR大数据
·
2020-06-22 18:15
python 引用 java代码
文本分类的
特征词
优化,重要的一点就是同义词合并。同义词合并的同义词词林找到一个java的调用代码,但原来其他处理的代码都是python,所以就想调一下java代码。不用自己重写使用同义词词林的代码。
北邮张博
·
2020-06-20 22:29
python
13-垃圾邮件分类2
文本特征提取:把文本数据转化成特征向量的过程,比较常用的文本特征表示法为词袋法词集:0、1词袋模型:不考虑词语出现的顺序怕,每个出现过的词汇单独作为一列特征,这些不重复的
特征词
汇集合为词表[roomdesk
v林三岁
·
2020-05-21 19:00
正则表达式
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的子串修改文本与文本编辑器相似,几乎所有的高级编程语言都支持正则表达式
PySong
·
2020-04-11 23:51
55分钟学会正则表达式(来自Github)
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串
EZLippi
·
2020-04-09 14:38
2019-01-11
在我没开启这本书之前,我自己概念中比较具有思考力的词汇有:智商、聪明、智慧、心计、情商、心态、格局、视野、眼界、认知、思维,这些都是我认为在达到一定程度后会有质的改变的
特征词
,而
哇_是我二狗哥
·
2020-04-08 21:03
码农的自我修养之必备技能 学习笔记
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的子串修改文本基础语法1.点"."
yzSY
·
2020-03-30 14:00
F73七组线上陪伴D10|DISC报告解读基础知识(Ⅱ)
【2018.11.21今日一问】组员回答之文章(吴国统老师回答之文章)七个关键词概述、追寻、追寻、回避、压力反应、态度、策略四种特质对应的
特征词
如下
飞一般的八哥
·
2020-03-26 10:16
正则表达式大全
正则表达式的作用:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的子串修改文本废话不多说,直接附上常用的正则表达式!!!
不走寻常way
·
2020-03-18 01:19
2018-11-14
01夜惊魂1、中年妇女牵着一名十几岁的小孩的影子为什么能在如此恐怖,毛骨悚然的环境下,仍能判断出“中年”和“十几岁”这些
特征词
呢?
小lulu不吃海鲜
·
2020-02-27 18:52
今天真是没想到能做出聚类
,真是情场上失意,事业上得意啊下面叙述一下流程:1.在要处理的几万条数据中取出10条做实验2.分词、提取特征值(这两步放在一块说)具体程序就不贴了,每句话做一个预处理去掉没用的信息,然后每句话提取三个
特征词
你说你要一场
·
2020-02-15 17:51
暑期论文总结
文档内容是人类所使用的自然语言,缺乏计算机可以理解的语义文本挖掘的问题:在计算机中如何合理的表示文本,使之既要包含足够的信息以反应文本的特征,又不至于过于复杂使算法无法处理文本的表示:将从文本中抽取出的
特征词
进行量化来表示文本信息
vivian_219
·
2020-02-13 11:07
美学与物理定律随笔
吴军老师在《数学之美》中:让计算机进行新闻分类时,科学家们也是另辟蹊径,利用新闻中的
特征词
出现概率来构建向量,再使用余弦定理完成了对新闻的分类。数学让我们抓住做事的规律也就是“道”。
gyl58365
·
2020-02-10 23:56
机器学习实战篇(朴素贝叶斯)
缺点对于输入数据的准备方式较为敏感适用数据类型标称型数据贝叶斯决策理论w为特征,ci为分类对于二分类:如果f(c1|w)>f(c2|w),则属于类别1如果f(c2|w)>f(c1|w),则属于类别2文本分类统计文本
特征词
汇
应君江湖不相忘
·
2020-02-09 06:45
英语词汇分类的新维度
英语词汇分类的新维度设计版.jpg文章结构关键词:分类维度音节
特征词
汇分类和知识管理的关系以音带形从音节到意义的跨越英语词汇的分类不要仅仅从分类这个维度,我们可以从知识管理的维度思考,英语的分类一般是从字母顺序这个维度
奥马哈大锤
·
2019-12-01 15:36
区块链究竟有什么价值体现?
关于区块链的价值,很多文章用“去中心化、去信任、难篡改”等
特征词
汇泛泛介绍,也难怪讲不清楚。在了解区块链之前,我们首先应该明白几个点,如下:1、区块链不是一项新技术,而是一个新的技术组合。
金色小蜜蜂
·
2019-09-29 21:00
55分钟学会正则表达式
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的
·
2019-09-22 17:30
基于树模型的lightGBM文本分类
2、根据词频将文本转化为向量3、基于树模型的重要特征选择5、完整代码实现6、分类结果1、基于TF的关键词提取使用TF词频对训练集clean_data_train进行关键词提取,选取topK个关键词作为
特征词
Asia-Lee
·
2019-08-28 21:42
文本分类
点击率预测——【2019中国高校计算机大赛大数据挑战赛】 WriteUp
中国高校计算机大赛——大数据挑战赛代码:GitHub-P01son6415/MatchModels2019中国高校计算机大赛——大数据挑战赛WriteUp传统模型query和title去重图特征普通统计
特征词
向量特征特征重要性分析
P01son
·
2019-08-28 14:13
tensorflow RNN实现文本分类(LSTM)
2.使用TF-IDF或词频等方式,从每个类型的文本中选出100个
特征词
,3个类别,共300个
特征词
。将300个
特征词
存入一个list中。
这是一个死肥宅
·
2019-07-10 17:27
文本处理
牛客网面试题
通过某个
特征词
的缺失与存在的两种情况下,语料中前后信息的增加,衡量某个
特征词
的重要性。
丽宝儿
·
2019-03-05 22:39
面试题目集合
文本的数学表达
特征选择有两种方向,第一种是通过统计或者人工方法挑出适合领域的
特征词
;另一种是通过筛选出停用词。本文针对第一个方向,介绍几种常见的特征选择方法。互
笨笨的企鹅
·
2018-12-15 09:22
自然语言处理
DBoW2加载训练好的二进制格式ORB
特征词
典及测试
为了利用ORB-SLAM2中提供的二进制格式的ORB词典,根据开源,稍作修改,这里给出自己编译后的lib文件及include文件,对于自己新建的项目,链接到上面的两个文件即可。库文件及词典下载地址:https://github.com/nxyzgf/sgg-dbow2测试代码#include"stdafx.h"#include#include#include#include"tinydir.h"#
Z5122
·
2018-12-01 16:25
DBoW2
二进制ORB词典
文本相似度之LSI
在使用VSM做文本相似度计算时,其基本步骤是:1)将文本分词,提取
特征词
s:(t1,t2,t3,t4)2)将
特征词
用权重表示,从而将文本表示成数值向量s:(w1,w2,w3,w4),权重表示的方式一般使用
孤狼18
·
2018-09-15 11:00
LSI
Keras实现CNN文本分类
步骤1:文本的预处理,分词->去除停用词->统计选择topn的词做为
特征词
步骤2:为每个
特征词
生成ID步骤3:将文本转化成ID序列,并将左侧补齐步骤4:训练集shuffle步骤5:EmbeddingLayer
vivian_ll
·
2018-07-24 19:52
机器学习
深度学习
自然语言处理之卷积神经网络应用
传统的词袋模型或者连续词袋模型(CBOW)都可以通过构建一个全连接的神经网络对句子进行情感标签的分类,但是这样存在一个问题,我们通过激活函数可以让某些结点激活(例如一个句子里”not”,”hate”这样的较强的
特征词
微笑sun
·
2018-07-19 21:00
基于概率论进行分类
2,应用文档分类,通过观察文档实例中
特征词
出现或者不出现作为一个判断特征,这样会出现很多判断特征,不适合专家系统的决策树,也不适合大量计算的KNN
东方欲晓888
·
2018-06-29 17:58
中文NLP-常用的特征选取方法
对于一个文本,词向量是一维向量,每个单元表征一个
特征词
。怎么获取这些
特征词
,简单粗暴的方法就是,对文本集(所有文本)进行分词操作,之后将不重复的词汇构成
特征词
集合,从而构建词向量。
IT_bigstone
·
2018-06-19 22:18
NLP
京东手机评论分析(二):关键词提取
开篇这边尝试使用三种方法去提取关键词,我希望能通过一些关键词提取出相应的属性,为了修正我们的评论属性,我还会人为去补充相应的
特征词
典,关于同义词的一些问题暂且放开不考虑。
Ding_xiaofei
·
2018-05-26 16:48
NLP
文本处理
文本特征提取和向量化
例如,我有728个可以词条,那么我将保存728行文本,现在我们要提取出每一行文本中的
特征词
。接下来的操作依次是:标记正负样本并下载它们的全部文本对文本进行分词通
shelley__huang
·
2018-05-21 17:47
自然语言处理
机器学习之路:python 文本特征提取 CountVectorizer, TfidfVectorizer
本特征提取:将文本数据转化成特征向量的过程比较常用的文本特征表示法为词袋法词袋法:不考虑词语出现的顺序,每个出现过的词汇单独作为一列特征这些不重复的
特征词
汇集合为词表每一个文本都可以在很长的词表上统计出一个很多列的特征向量如果每个文本都出现的词汇
qq_30868235
·
2018-05-21 10:19
文本分析
基于循环神经网络(RNN)实现影评情感分类
虽然可以提取
特征词
向量,然后交给传统机器学习模型或全连接神经网络去做,也能取得很好的效果,但只从端对端的角度来看的话,RNN无疑是最合适的。以
笔墨留年
·
2018-03-26 10:00
TensorFlow练手项目一:使用循环神经网络(RNN)实现影评情感分类
虽然可以提取
特征词
向量,然后交给传统机器学习模型或全连接神经网络去做,也能取得很好的效果,但只从端对端的角度来看的话,RNN无疑是最合适的。以
笔墨留年
·
2018-03-14 22:46
机器学习
推荐引擎性能优化小结
保留权重最大的20个
特征词
。对用户,根据浏览行为对其打标签。保留权重最大的20个标签词。(本文不涉及如何给用户打标签的策略和算法)当用户刷新信息流获取下一批推荐文章列表时,把每一篇未推荐过
hmisty
·
2018-01-12 19:05
常用的文本分类的特征选择算法
常见的六种特征选择方法:1)DF(DocumentFrequency)文档频率DF:统计
特征词
出现的文档数量,用来衡量某个
特征词
的重要性2)MI(MutualInformation)互信息法互信息法用于衡量
特征词
与文档类别直接的信息量
Arya鑫
·
2017-12-07 01:33
文本
特征词
提取算法
另外,为了提高文本分类的准确性和效率,一般先剔除决策意义不大的词语,这就是
特征词
提取的目的。本文将简单介绍几种文本
特征词
提取算法。
1313123131312
·
2017-09-27 14:04
蓬莱印象
仙人、仙气,如此种种…“八仙过海”更是与“蓬莱”密不可分的
特征词
。
婧姐2019
·
2017-07-30 14:57
正则表达式详解
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串的子
没技术的BUG开发攻城狮
·
2017-06-26 11:07
2017.06.22:LDA与困惑度代码
代码:classLDAModel(object):def__init__(self,dpre):self.dpre=dpre#获取预处理参数##模型参数#聚类个数K,迭代次数iter_times,每个类
特征词
个数
傻瓜菜的傻瓜菜地
·
2017-06-22 11:28
学习笔记
程序代码
机器学习
手机QQ怎么使用消息智能语义识别功能?
今天IOS版手机QQ更新了7.1.0版本,下面小编就来给大家介绍一下其中一个新增加的功能就是消息智能语义识别和应用匹配功能,就是在聊天过程中,用户在输入框键入歌曲名称、地点、股票等相关
特征词
,即可触发智能搜索
佚名
·
2017-06-06 12:51
Node.js之深入理解特性
本文通过这几个
特征词
汇深入聊聊Node.js的特性。
C小K
·
2017-04-06 00:00
线程
事件驱动
异步
node.js
30分钟学会正则表达式
正则表达式在文本编辑器中广泛使用,比如正则表达式被用于:检查文本中是否含有指定的
特征词
找出文中匹配
特征词
的位置从文本中提取信息,比如:字符串
杨梦鸽
·
2017-02-08 14:41
新海诚的几部经典作品
当时我不以为然,因为我个人不太喜欢用某些
特征词
来概括性地表述某个地方的人。最近《你的名字》刷了好多波朋友圈,让我回想起几部以前看过的日本影视——《好想告诉你》《我的机器人女友》,还有几部动漫。
笔芯子叶
·
2016-12-06 20:55
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他