E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
weka入门笔记
weka
StringToWordVector是如何选择词典的
最近在做基于内容的推荐,试了几种方法:向量空间模型(用lucene实现)、贝叶斯分类、聚类(用
weka
的SimpleKMeans)。
fxnfk
·
2020-09-13 05:49
数据挖掘
weka
文本聚类(2)--分词和停用词处理
weka
本身自带英文分词,没有自带中文分词,因此需要自己进行中文分词。
码弟
·
2020-09-13 05:32
文本聚类
Weka
学习之Filter(2)-StringToWordVector
为了更具体地展示Filter的用法和原理,我们分析一个名为StringToWordVector的Filter。它是我们在文本挖掘中用得比较普遍的一个类。作用是把字符串属性转换成一个个词属性,属性的值可以在参数中指定,比如0-1变量(代表这个词是否在该实例中出现),词频变量,log(1+词频)或者TF-IDF值。下面是StringToWordVector的input方法源码:123456789101
helen_PhDing
·
2020-09-13 04:36
robotframework
入门笔记
(二) Builtin 库的关键字
ride建测试用例RobotFramework与unittest(python)一致的地方RobotFrameworkunittest(Python)TestProject同左TestSuit同左TestCas同左ride建测试用例步骤:ride创建project(一般创建成目录):选择菜单栏file----->newProje,输入project名称;Type选择Director。ride创建s
happym_m
·
2020-09-12 22:01
入门系列
Python
入门笔记
(1)_ 安装、IDLE设置 及 opencv 配置
近期学习Python,计划用Python做图像处理。于是用一天时间学习了imooc中的Python入门教程。这里做个总结。安装很简单,直接进官网下载,一般为了兼容性,大多选择2.7版本。按照默认路径安装就可以了。IDLE设置安装之后,IDLE也就安装好了。从开始菜单就可以找到。然后是IDLE的设置。可以参考http://www.linuxidc.com/Linux/2012-07/66129.ht
phoenixtree7
·
2020-09-12 19:20
Python
以太坊
入门笔记
最近学习以太坊,下面是一些搭建以太坊私有链的笔记:一、安装geneche-cli(之前是叫做TestRPC)需要NodeJS,安装truffle1.使用NVM安装nodejs以及npm(NVM用来管理NodeJS的不同版本)使用sudoapt-getinstallnvm安装nvm先使用nvmls-remote查看当前可用的node版本,选择一个版本,通过nvminstallv8.11.3(一般选择
newconniukang
·
2020-09-12 19:02
以太坊
Perl语言
入门笔记
第十三章 目录操作
=pod第十三章目录操作在目录树中移动:程序运行时会以自己的工作目录作为相对路径的起点,也就是说,当我们提及fred这个文件时,其实指的是"当前工作目录下的fred"chdir'/etc'ordie"Cannotchdirto/etc:$!";如果掉用chdir时不加参数,perl会猜想你要回到自己的用户主目录并试着将工作目录设成主目录chdir后面跟路径不能是以~开头的文件名通配:文件名通配(g
dietan8353
·
2020-09-12 19:16
Tensorflow
入门笔记
(一) Anaconda3如何切换Python3.5并安装TensorFlow(包括安装Spyder 与Jupyter notebook)
一、前言:题主配置:Win10、Anaconda3(对应Python3.6.5)二、Anaconda切换Python版本【注】(Anaconda2跟3其实是一样的操作)1.创建Python的新版本环境【注】进入命令行(ctrl+R,输入cmd),输入如下:condacreate-npy35python=3.5anaconda2.创建Tensorflow虚拟环境condacreate-ntensor
奋青的那些事
·
2020-09-12 18:17
深度学习DL
Weka
-无监督属性过滤器-Interquartile[6-3]
我们继续第6篇的无监督属性过滤器的函数介绍。Interquartile,用以指示实例的值是否可以视为离群值或极端值。(具体演算,我们就不实验了)如果用户指定的极端值系数和四分位距的乘积值高于第75个四分位数之间的差,或低于第25个四分位数,该值就被标识为极端值。具体看代码,我们在代码中注释了各参数的含义:importjava.io.BufferedReader;importjava.io.File
隆猫
·
2020-09-12 14:12
Weka
1.4
weka
过滤器(删除属性和样例)的使用
删除属性方法1导入数据“weather.nominal.arff”,点击“choose”,选择无监督中的属性。配置过滤器:比如要删除3:humidity属性,可以点击“Remove”,出现配置面板点击“apply”,此时户型humidity就被删除了。通过“undo”可以撤销之前的操作,此时删除humidity属性的操作就会被撤销了。删除属性方法2选中要删除的属性,然后点击“remove”即可删除
yanyanwenmeng
·
2020-09-12 14:28
机器学习
weka软件使用
Weka
中数据挖掘与机器学习系列之
Weka
系统安装(四)
能来看我这篇博客的朋友,想必大家都知道,
Weka
采用Java编写的,因此,具有Java“一次编译,到处运行”的特性。
weixin_34292959
·
2020-09-12 14:28
Weka
中数据挖掘与机器学习系列之Exploer界面(七)
Weka
的Explorer(探索者)界面,是
Weka
的主要图形化用户界面,其全部功能都可通过菜单选择或表单填写进行访问。
weixin_33800463
·
2020-09-12 14:17
文件格式配置文件
weka
频繁模式挖掘使用方法
在本篇文章中,我们主要介绍文件格式配置文件的内容,自我感觉有个不错的建议和大家分享下文件格式:@relationtestData@attribute张三{1}@attribute李四{1}@attribute王五{1}@attribute马六{1}@attribute张磊{1}@data?,1,1,?,1?,?,?,?,??,?,?,?,1?,1,?,?,11,?,1,?,?每日一道理书籍好比一架
weixin_33859504
·
2020-09-12 14:42
weka
数据预处理
Weka
数据预处理(一)对于数据挖掘而言,我们往往仅关注实质性的挖掘算法,如分类、聚类、关联规则等,而忽视待挖掘数据的质量,但是高质量的数据才能产生高质量的挖掘结果,否则只有"Garbageingarbageout
weixin_33759269
·
2020-09-12 14:38
weka
学习(三)缺失值处理
2019独角兽企业重金招聘Python工程师标准>>>/***@authorhao.wei*/@ServicepublicclassMissingHandleBizImplimplementsMissingHandleBiz{privatestaticfinalLoggerlogger=LoggerFactory.getLogger(MissingHandleBizImpl.class);
weixin_33708432
·
2020-09-12 14:37
WEKA
-过滤器算法学习
抱怨不会让你成功,努力才会让你出色概述
Weka
中实现的过滤算法。所有的过滤器都是输入数据集进行某种程度的转换,转换为适合数据挖掘的形式。
weixin_30455661
·
2020-09-12 14:23
weka
中文论坛
weka
入门教程:http://forum.
weka
cn.org/viewtopic.php?
weixin_30410999
·
2020-09-12 14:22
weka
数据挖掘之预处理
weka
数据挖掘之预处理数据挖掘是在大量的、潜在有用的数据中挖掘出有用模式的过程,因此,源数据的质量直接影响到挖掘的效果,高质量的数据是有效挖掘的前提。但是,肯定是,不是所有的数据都是那么理想。
MYZ_my_love
·
2020-09-12 14:55
Weka
weka
中对数值型数据离散化
连续数值离散化大致可分为:1)有监督(supervised)和2)无监督(unsupervised)两类。有监督方法可通过设定类别相关目标函数如:分类错误率,熵增益等指标结合二叉树算法对特征空间进行划分。这类方法的核心思想就是是每类样本尽量分布在特征空间中的不同子划分中。无监督方法由于没有考虑类别信息,因此其核心思想是使得每个子划分空间的样本分布尽量均匀,具体可以采用等间隔、等密度或者k-mean
我是一只小兔纸咿呀咿呀呦
·
2020-09-12 14:33
weka
数据挖掘开源软件:
WEKA
基础操作
数据挖掘开源软件:
WEKA
基础教程本文档部分来自于网络,随着自己的深入学习,讲不断的修订和完善。
流水无Qing
·
2020-09-12 14:28
数据挖掘
Weka
中数据预处理的技术方法
目录1聚集2抽样3维度归约4属性选择5属性创建6离散化和二元化7变量转换1聚集聚集是将两个或者多个对象合并成单个对象。一般来说,定量数据都是通过求和或求平均值的方式进行聚集,定性数据通常通过汇总进行聚集。2抽样如果处理全部数据的开销太大,数据预处理可以使用抽样,只选择数据对象的子集进行分析。抽样方法有很多种,例如简单随机抽样和分层抽样。3维度归约维度是指数据集中属性的数目。维度归约是指创建新属性,
郭腾有一颗温暖的心
·
2020-09-12 14:41
weka
数据集预处理
1.利用有监督的离散算法对数据集的属性进行离散,并保存离散后的数据集;importjava.io.File;import
weka
.filters.SupervisedFilter;importjava.io.IOException
YornChu
·
2020-09-12 13:56
数据挖掘
Weka
之分类器(classifier)的使用
1、打开Explorer界面,选择数据集(这里以glass.arff为例)点击Classify面板,点击左上角的choose。2、打开Explorer界面,选择数据集(这里以glass.arff为例)点击Classify面板,点击左上角的choose,将显示贝叶斯分类器、函数分类器、懒惰分类器、元分类器等分类器。这里选择决策树中经典的J48分类器为例。3、点击Start,开始分类。4、得到Clas
HarperFive
·
2020-09-12 13:41
Weka
Weka
之重复训练与测试数据
训练数据和测试数据是从相同的总体中取出独立样本,结果自然存在误差。但我们可以通过设定随机种子和重复实验来估算误差。还可以通过实验计算平均值和方差。1、打开Explorer界面,选择数据集segment-challenge.arff。2、打开classify面板,选择J48分类器。3、将Percentagesplit按比划分设为90%,即数据集的90%为训练集,10%为训练集。点击“start”后,
HarperFive
·
2020-09-12 13:41
Weka
Weka
之训练与测试数据
什么是训练数据和测试数据?训练数据经过机器学习算法(MLAlgorithm)可以得到分类器,再将测试数据放入分类器,则可得到评估结果。训练集和测试集应来源于同一个数据集,但为两个不相交的集合。比如:将一个数据集的1/3作为测试集,2/3作为训练集。接下来通过一个简单的实验进一步理解训练与测试数据:1、打开Explorer界面,选择数据集segment-challenge.arff。2、打开clas
HarperFive
·
2020-09-12 13:10
Weka
Weka
的下载与安装
一、安装
Weka
1、进入官网https://www.cs.waikato.ac.nz/ml/
weka
/。2、在Gettingstarted中点击Download,再选择合适的版本下载即可。
HarperFive
·
2020-09-12 13:10
Weka
Weka
之预处理(preprocess)的使用
1、打开
Weka
。2、打开Explorer。主要面板介绍:3、点击左上方Openfile,在数据集中选择weather.nominal.arff文件,再点击Edit。
HarperFive
·
2020-09-12 13:10
Weka
Weka
使用
下载地址https://sourceforge.net/projects/
weka
/
Weka
是怀卡托智能分析环境(WaikatoEnvironmentforKnowledgeAnalysis)的英文字首缩写
柳暗花明又一村ヾ(◍°∇°◍)ノ゙
·
2020-09-12 13:50
Weka
使用
Weka
进行数据挖掘(
Weka
教程六)
Weka
采样Filter/Resample/SMOTE
数据预处理中,有一个原理很简单但是非常重要的部分:采样。良好的采样可以让数据集变得平衡,会大大的提高预测和分类的效果。采样是很复杂的一个领域,背后涉及到数据的分布/数据的性质等很多内容。常见的采样有:SimpleRandomSampling(简单随机采样),OfflineSampling(离线等可能K采样),OnlineSampling(在线等可能K采样),Ratio-basedSampling(
yang1young
·
2020-09-12 13:23
Weka+Java数据挖掘
用
WEKA
进行数据挖掘 (From IBM)
第1部分:简介和回归点击打开链接第2部分:分类和群集点击打开链接第3部分:最近邻和服务器端库点击打开链接
partynew
·
2020-09-12 13:45
数据挖掘
WEKA
数据挖掘的
weka
包和数据集
weka
链接:https://pan.baidu.com/s/1SrlaErxMqpBoya7_HAkuHQ密码:kzfb数据集链接:https://pan.baidu.com/s/1wDUGoh30pUdQ6bGkwTVhlw
nuaakola_
·
2020-09-12 13:08
Datamining
数据挖掘入门实验二
实验2:基于
Weka
的数据挖掘程序设计学号:姓名:XXXXXXX专业:计算机班级:实验目标在掌握基于
Weka
工具的数据挖掘(分类、回归、聚类、关联规则分析)应用的基础上,实现基于
Weka
API的数据挖掘程序设计
only301
·
2020-09-12 13:41
数据挖掘实验
Python使用jieba分词并用
weka
进行文本分类
一、安装pycharm二、安装Python三、在Python下安装pip,如下图所示,pip安装成功四、在python下安装jieba:如下图所示,jieba安装成功:五、在pycharm中新建Python项目,对test.txt文件中的中文进行分词,并写入testResult.txt文件中,具体代码如下:#!/usr/bin/envPython#coding=utf-8importjieba.a
一颗青春痘
·
2020-09-12 13:46
学习笔记
python
weka-jieba
Weka
使用笔记之一
前些日子基于
weka
初步做了一下文本分类,使用的是最频繁使用的矢量空间模型(VectorSpaceModel),即假设正负样本在特征空间的分布迥异,基于某种规则将它们转化为矢量,然后训练分类器来区分这些矢量
stevie
·
2020-09-12 12:38
IT
weka
文本分类(1)
一、初始化设置1jvmoutofmemory解决方案:在
weka
SimpleCLI窗口依次输入java-Xmx1024m2修改配置文件,使其支持中文:配置文件是在
Weka
安装后的目录下,比如我的是在C:
anqiu4023
·
2020-09-12 12:32
关于
weka
中Instances的属性删除
最近这些天一直在用
weka
实现一个算法,也是从这次开始接触
weka
,刚上手难免有些磕磕绊绊,这次实现也是遇到了各种各样的问题,其中的一个就和
weka
中的Instances有关,刚刚把程序跑起来了,因为数据比较多
weixin_30737363
·
2020-09-12 12:05
weka
之数据预处理
weka
在做数据预处理的时候针对attribute提供了多种方式,包括值的各种转换,常用的如下:1.缺失值处理
weka
.filters.unsupervised.attribute.ReplaceMissingValues
小网客
·
2020-09-12 12:15
DataMining
Weka
之过滤器(filter)的使用
1、打开Explorer界面,选择数据集(这里以weather.nominal.arff为例),点击左上角的choose选择一个过滤器(Filter)。值得注意的是,监督过滤器在过滤时会使用类的值,因此无监督过滤器使用的更广泛。2、首先尝试删除湿度属性。观察属性栏后,发现humidity的标号为No.3。选择unsupervised->attribute->Remove。3、左键单击选择的属性过滤
HarperFive
·
2020-09-12 12:06
Weka
数据挖掘入门实验(
weka
)
实验1:基于
Weka
的典型数据挖掘应用学号:姓名:XXXX专业:计算机系统结构班级:实验目标理解数据挖掘的基本概念,掌握基于
Weka
工具的基本数据挖掘(分类、回归、聚类、关联规则分析)过程。
only301
·
2020-09-12 12:08
数据挖掘实验
数据挖掘——
Weka
之利用过滤器(filter)删除缺省值
这里我采用的是一个叫trans_transformed.data的数据集(Download"trains-transformed.data"fromhttps://archive.ics.uci.edu/ml/datasets/Trains),通过python修改部分格式并转换成了.arff(数据集内容如下),里面的data有很多缺省值,如何通过Veka用filter删除其中的缺省值呢?用veka
Lil_Hoe
·
2020-09-12 12:13
数据挖掘
Data
Mining
arff
机器学习
深度学习
数据集
arff
weka
arff生成
Hibernate
入门笔记
一、第一个应用实例1.搭建环境:新建一个名为HibernateDemo的java工程,并导入Hibernate的jar包,特别要注意除了导入lib下的jar包还需导入hibernate3.jar核心jar包。由于涉及数据库操作,还应导入mysql驱动包。说明,如果使用最新的hibernate,hibernate开发的基本jar包(7个)来源:hibernate-distribution-3.3.2
zxcvzxcv7
·
2020-09-12 12:58
Hibernate
markdown学习笔记(快速扫盲)
markdown
入门笔记
文章目录markdown
入门笔记
0.前言1.Markdown简介2.Markdown基础语法2.1标题2.2粗体和斜体2.3段落与换行2.4列表2.5分割线2.6图片和链接2.7
站在愚昧之巅的凡人
·
2020-09-12 03:32
软件安装与使用
markdown
程序人生
经验分享
其他
面试
weka
操作实现决策树算法中打球与天气的关系
weka
是基于JAVA环境下开源的机器学习(machinelearning)以及数据挖掘(datamining)软件。今天我们首次使用
weka
操作一下决策树算法中模拟打球和天气关系。!
宇轩666
·
2020-09-12 03:53
数据挖掘与机器学习
数据挖掘
可视化
STC51
入门笔记
(郭天祥C语言)---第七节:l2C总线AT24C02芯片应用
声明:本篇文章只是个人知识盲区、知识弱点、重点部分的归纳总结,望各位大佬不喜勿喷。梳理顺序是按照书籍的实际顺序梳理,转载请注明出处。作者:sumjess一、I2c总线概述:1、I2c总线介绍l2C总线(InterICBus)由PHILIPS公司推出,是近年来微电子通信控制领域广泛采用的一种新型总线标准,它是同步通信的一种特殊形式,具有接口线少、控制简单、器件封装形式小、通信速率较高等优点。在主从通
Sumjess
·
2020-09-12 00:10
STC89C51从入门到进阶
python交互式web应用dash/plotly
dash
入门笔记
文章目录dash
入门笔记
安装dashlayoutBasicCallbacksDashState参考:官方文档小项目-数据处理篇:真·租房信息整理,应用dash整合到地图上安装dashlayout
YangJianShuai
·
2020-09-11 23:58
python
微信公众号开发
入门笔记
(一)--ngrok.exe内网转外网固定IP配置
背景本地测试微信服务用。windows环境官网下载官网地址:https://ngrok.com/download下载地址:https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-windows-amd64.zip下载后解压到D盘双击ngrok.exe,输入命令ngrok.exehttp8080ngrokby@inconshreveable(Ctrl+Ct
如何在3年拿到50K
·
2020-09-11 22:15
Web开发
SpringBoot
入门笔记
10——springboot配置文件整合mytatis
Springboot使用配置文件的方式来整合mybatis文章目录Springboot使用配置文件的方式来整合mybatisspringboot整合mytais步骤--配置篇1、添加mytatis依赖2、数据库配置3、Mapper的配置文件4、编写mapper类和映射xml文件5、添加@mapper注解或者使用@mapperScan的方式,让springboot扫描到mapper类小结:mybat
读不懂的答案
·
2020-09-11 16:37
springboot
专栏
【SpringBoot第一篇
入门笔记
】之入门1 第一次了解
文章目录1第一次了解1.1SpringBoot的优势1.2Spring微服务1.3第一个项目的搭建HelloWorld1.4@SpringBootApplication初步了解1.5IDEA:使用SpringInitializer快速创建项目1第一次了解1.1SpringBoot的优势springboot是对spring框架的再封装,用来简化Spring的开发快速创建独立运行的Spring项目以及
CstomRita
·
2020-09-11 12:57
SpringBoot
cucumber
入门笔记
参考文章:https://www.jianshu.com/p/3857f2c3a8d4Feature:Isitfridayyet?thisisadescriptionsEverybodywanttoknowwhenit'sFridayScenario:Sundayisn'tFridayGiventodayisSundayWhenIaskwhetherit'sFridayyetThenIshould
happym_m
·
2020-09-11 01:17
入门系列
activities工作流
入门笔记
-002-1-建表
1.activities工作流入门(1).建表(使用默认配置文件,简化代码)使用默认配置配置文件名称:activiti-context.xml或者activiti.cfg.xml放根目录。 编写建表代码。 /***使用默认的配置,简化代码*/@TestpublicvoidcreateActivitiTable(){ProcessEngineprocessEngine=P
木扎比
·
2020-09-10 21:41
activities
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他