农民兄弟

weka数据挖掘

基础知识:

数据挖掘:将大量数据转变为有实际意义的模式和规则，分为两种:直接的和间接的

数据挖掘的最终目标就是要创建一个模型,这个模型可改进您解读现有数据和将来数据的方式。

数据挖掘的核心就是将正确的模型应用于数据。

第一种技术是回归，用来基于其他的示例数据预测一个数值输出（比如房屋价值）。

第二种技术是分类（即分类树或决策树），用来创建一个实际的分支树来预测某个未知数据点的输出值。

第三种技术是群集，可用它来创建数据组（群集）并从中识别出趋势和其他规则

第四种技术是最近邻，最近邻（也即 Collaborative Filtering 或 Instance-based Learning）是一种非常有用的数据挖掘技术，可用来用输出值已知的以前的数据实例来预测一个新数据实例的未知输出值。

工具简介:

窗口右侧共有4个应用，分别是

Explorer：用来进行数据实验、挖掘的环境，它提供了分类，聚类，关联规则，特征选择，数据可视化的功能。示例图如下:
Experimentor：用来进行实验，对不同学习方案进行数据测试的环境。
KnowledgeFlow：功能和Explorer差不多，不过提供的接口不同，用户可以使用拖拽的方式去建立实验方案。另外，它支持增量学习。
SimpleCLI：简单的命令行界面。
Weka支持很多种文件格式，包括arff、xrff、csv，甚至有libsvm的格式。其中，arff是最常用的格式，我们在这里仅介绍这一种。
Arff全称是Attribute-Relation File Format
使用weka进行数据挖掘的流程如下图：

其中，在weka内进行的是数据预处理，训练，验证这三个步骤。
         1）数据预处理：数据预处理包括特征选择，特征值处理（比如归一化），样本选择等操作。
         2）训练：训练包括算法选择，参数调整，模型训练。
         3）验证：对模型结果进行验证。

数据预处理:

数据预处理：打开Explorer界面，点“open file”，在weka安装目录下，选择data目录里的“labor.arff”文件，将会看到如下界面。我们将整个区域分为7部分，下面将分别介绍每部分的功能。

区域1共6个选项卡，用来选择不同的数据挖掘功能面板，从左到右依次是Preprocess（预处理）、Classify（分类）、Cluster（聚类）、Associate（关联规则）、Select attribute（特征选择）和Visualize（可视化）。
区域2提供了打开、保存，编辑文件的功能。打开文件不仅仅可以直接从本地选择，还可以使用url和db来做数据源。Generate按钮提供了数据生成的功能，weka提供了几种生成数据的方法。点开Edit，将看到如下界面:

在这个界面，可以看到各行各列对应的值，右键每一列的名字(先点击列名)，可以看到一些编辑数据的功能，这些功能还是比较实用的。

        区域3名为Filter，有些人可能会联想到特征选择里面的Filter方法，事实上，Filter针对特征（attribute）和样本（instance）提供了大量的操作方法，功能十分强大。
        区域4，可以看到当前的特征、样本信息，并提供了特征选择和删除的功能。在区域4用鼠标选择单个特征后，区域5将显示该特征的信息。包括最小值、最大值、期望和标准差。
        区域6提供了可视化功能，选择特征后，该区域将显示特征值在各个区间的分布情况，不同的类别标签以不同的颜色显示。
        区域7是状态栏，没有任务时，小鸟是坐着的，任务运行时，小鸟会站起来左右摇摆。如果小鸟站着但不转动，表示任务出了问题。

Filters实例

点开Filter下面的choose按钮，可以看到如下界面：

Filters可分为两大类，supervised(监督、管理)和unsupervised。supervised下的方法需要类别标签，而unsupervised则不需要。attribute类别表示对特征做筛选，instance表示对样本做选择。

Case 1：特征值归一化
该项功能与类别无关，且是针对attribute的，我们选择unsupervised -> attribute下面的Normalize。点开Normalize所在的区域(在所选择的filter上点击即可)，将看到如下界面。左边的窗口，有几个参数可以选择。点击more，将出现右边的窗口，该窗口详细介绍了此功能。

使用默认参数，点击ok，回到主窗口。在区域4选好将要归一化的特征，可以是一个或多个，然后点击apply。在可视化区域中，我们可以看到特征值从1到3被归一到了0到1之间(看区域5的最大最小值)。

Case 2: 分类器特征筛选
该功能与类别相关，选择supervised -> attribute下面的AttributeSelection。该界面有两个选项，evaluator是评价特征集合有效性的方法，search是特征集合搜索的方法。在这里，我们使用InformationGainAttributeEval作为evaluator，使用Ranker作为search，表示我们将根据特征的信息增益值对特征做排序。Ranker中可以设置阈值，低于这个阈值的特征将被扔掉。

点击apply，可以看到在区域4里特征被重新排序，低于阈值的已被删掉。
Case 3：选择分类器错分的样本
选择unsupervised -> instance下面的RemoveMisclassified，可以看到6个参数，classIndex用来设置类别标签，classifier用来选择分类器，这里我们选择J48决策树，invert我们选择true，这样保留的是错分样本，numFolds用来设置交叉验证的参数。设置好参数之后，点击apply，可以看到样本的数量从57减少到了7。

五.分类

在Explorer中，打开classify选项卡，整个界面被分成几个区域。分别是

1）Classifier：点击choose按钮，可以选择weka提供的分类器。常用的分类器有
a）bayes下的Nave Bayes（朴素贝叶斯）和BayesNet（贝叶斯信念网络）。
b）functions下的LibLinear、LibSVM（这两个需要安装扩展包）、Logistic Regression(逻辑回归)、Linear Regression(线性回归)。
c）lazy下的IB1（1-NN）和IBK（KNN）。
d）meta下的很多boosting和bagging分类器，比如AdaBoostM1。
e）trees下的J48（weka版的C4.5）、RandomForest。
2）Test options
评价模型效果的方法，有四个选项。
a）Use training set：使用训练集，即训练集和测试集使用同一份数据，一般不使用这种方法。
b）Supplied test set：设置测试集，可以使用本地文件或者url，测试文件的格式需要跟训练文件格式一致。
c）Cross-validation：交叉验证，很常见的验证方法。N-folds cross-validation是指，将训练集分为N份，使用

N-1份做训练，使用1份做测试，如此循环N次，最后整体计算结果。
d）Percentage split：按照一定比例，将训练集分为两份，一份做训练，一份做测试。在这些验证方法的下面，有一个More options选项，可以设置一些模型输出，模型验证的参数。
3）Result list

这个区域保存分类实验的历史，右键点击记录，可以看到很多选项。常用的有保存或加载模型以及可视化的一些选项。
4）Classifier output
分类器的输出结果，默认的输出选项有Run information，该项给出了特征、样本及模型验证的一些概要信息；Classifier model，给出的是模型的一些参数，不同的分类器给出的信息不同。最下面是模型验证的结果，给出了一些常用的一些验证标准的结果，比如准确率（Precision），召回率（Recall），真阳性率（True positive rate），假阳性率（False positive rate），F值（F-Measure），Roc面积（Roc Area）等。Confusion Matrix给出了测试样本的分类情况，通过它，可以很方便地看出正确分类或错误分类的某一类样本的数量。

Case 1：使用J48对labor文件做分类
a.打开labor.arff文件，切换到classify面板。
b.选择trees->J48分类器，使用默认参数。
c.Test options选择默认的十折交叉验证，点开More options，勾选Output predictions。
d.点击start按钮，启动实验。
e.在右侧的Classifier output里面，我们看到了实验的结果

上图给出了实验用的分类器以及具体参数，实验名称，样本数量，特征数量以及所用特征，测试模式。

上图给出了生成的决策树，以及叶子节点数、树的节点数、模型训练时间。如果觉得这样不直观，可以在Result list里面右键点击刚刚进行的实验，点击Visualize Tree，可以看到图形界面的决策树，十分直观。

再往下是预测结果，可以看到每个样本的实际分类，预测分类，是否错分，预测概率这些信息。

最下面是验证结果，整体的accuracy是73.68%，bad类准确率是60.9%，召回率70.0%，good类准确率是82.4%，召回率75.7%。

5）可视化
打开Explorer的Visualize面板，可以看到最上面是一个二维的图形矩阵，该矩阵的行和列均为所有的特征（包括类别标签），第i行第j列表示特征i和特征j在二维平面上的分布情况。图形上的每个点表示一个样本，不同的类别使用不同的颜色标识。下面有几个选项，PlotSize可以调整图形的大小，PointSize可以调整样本点的大小，Jitter可以调整点之间的距离，有些时候点过于集中，可以通过调整Jitter将它们分散开。

上图是duration和class两个特征的图形，可以看出，duration并不是一个好特征，在各个特征值区间，good和bad的分布差不多。
单击某个区域的图形，会弹出另外一个窗口，这个窗口给出的也是某两个特征之间分布的图形，不同的是，在这里，通过点击样本点，可以弹出样本的详细信息。可视化还可以用来查看误分的样本，这是非常实用的一个功能。分类结束后，在Result list里右键点击分类的记录，选择Visualize classify errors，会弹出如下窗口。

这个窗口里面,十字表示分类正确的样本，方块表示分类错误的样本，X轴为实际类别，Y轴为预测类别，蓝色为实际的bad，红色为实际的good。这样，蓝色方块就表示实际为bad，但为误分为good的样本，红色方块表示实际为good，被误分为bad的样本。单击这些点，便可以看到该样本的各个特征值，分析为什么这个样本被误分了。
再介绍一个比较实用的功能，右键点击Result list里的记录，选择Visualize threshold curve，然后选好类别(bad 还是good)，可以看到如下图形。

该图给出的是分类置信度在不同阈值下，分类效果评价标准的对比情况。上图给出的是假阳性比率和真阳性比率在不同阈值下的对比，其实给出的就是ROC曲线。我们可以通过选择颜色，方便地观察不同评价标准的分布情况。如果X轴和Y轴选择的是准确率和召回率，那我们可以通过这个图，在这两个值之间做trade-off，选择一个合适的阈值。

R语言机器学习与临床预测模型77--机器学习预测常用R语言包武昌库里写JAVA 面试题汇总与解析 spring log4j java 开发语言算法
R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的R语言学习资料都在这里，快来收藏关注【科研私家菜】01预测模型常用R包常见回归分析包:rpart包含有分类回归树的方法;earth包可以实现多元自适应样条回归;mgev包含广义加性模型回归;Rweka包中的MSP函数可用于回归。pls包中的plsr函数实现偏最小二乘和主成分回归。stats包中的ppr函数实现投影寻踪分析，同时包括线性回归的方
Petitjean2016A代码运行配置 sunnyorcloudy
1.新建javaproject，名称DBA2.在projectlayout处，选择“Useprojectfolderasrootforsourcesandclassfiles”3.import-ExistingprojectsintoWorkspace-选择wekaprojectwekaproject是从weka官网下载weka-src.jar，解压后，将其中的main目录下的weka项目导入得来
11.4 看不懂就慢慢看啊反复练习的阿离很笨吧
记得组合数学正交拉丁方从0开始！突然觉得老师说得很有道理，演化计算里活得最好的，不是最优秀的但也不是最差的，是最能适应环境的，别人怎么做，他就怎么做。动态规划，运筹学贝叶斯是生成学习算法，生成一个概率模型判别学习算法高斯判别分析/**NB.java*Copyright2005LiangxiaoJiang*/packageweka.classifiers.gla;importweka.core.*;
2019-04-19 AliceGYY
线性函数Y=0.8567+0.516XX称为自变量，也就是自己会变化的量。Y称作因变量，也就是因为X变化而引起变化的量。线性回归，能够用来探索多个变量与另一个变量之间的线性关系。weka、SPSS软件实现编程。
Weka在数据挖掘中的运用 02 Getting Started with Weka jenye_
Weka的发音不是Weaker安装Weka研究“Explorer”接口研究一些数据集创建一个分类器解释输出使用filters（过滤器）可视化数据集安装Wekajava环境安装包选择适合你电脑系统的版本。Explorer界面对于这门课程指用到Exploer界面。Experimenter界面针对基于不同数据集的不同机器学习方法的大规模性能比较。KnowlegeFlow界面是Weka的图形界面和命令行界
《数据挖掘基础》实验：Weka平台实现聚类算法 lazyn 数据挖掘原理聚类数据挖掘算法机器学习 Weka
实验目的进一步理解聚类算法（K-平均、PAM、层次聚类、密度聚类），利用weka实现数据集的聚类处理，学会调整模型参数，以图或树的形式给出挖掘结果，并解释规则的含义。实验要求（1）随机选取数据集（UCI或data文件夹），需要做预处理的，单独说明处理过程。完成以下内容：（用四种方法：K-means、K-中心法、层次、密度）文件导入与编辑参数设置说明结果截图结果分析与对比（2）以AQI.xls中1-
Weka 分类树输出结果解析 Weighted.avg deer(écho) MachineLearning 分类数据挖掘人工智能
本文是对weka分类树的结果解释，集合了其它的博文我们使用的是weka自带的weather数据库先看左侧，classifier是分类方法，J48是递归分治策略；cross-validation表示交叉验证，使用了10-Foldspercentagesplit表示分割比例，用以分割训练集和测试集（猜的）再看看output，yes(9/3)(5/2)表示训练集里3个no，测试集里2个no(猜的x2)其
日撸java_day66-68 luv_x_c java 算法
文章目录主动学习ALEC代码运行结果主动学习ALEC代码packagemachineLearning.activelearning;importweka.core.Instances;importjava.io.FileReader;importjava.io.IOException;importjava.util.Arrays;/***ClassName:Alec*Package:machine
geemap学习笔记018：非监督分类静观云起 geemap 遥感 Python 学习笔记分类
前言非监督分类是遥感影像中非常常用的一种分类方式，下图是EarthEngine中常用的聚类方法，本节就以landsat8数据为例，采用ee.Clusterer.wekaKMeans()方法进行聚类分类。1导入库并显示地图importeeimportgeemapMap=geemap.Map()Map2添加数据point=ee.Geometry.Point([-87.7719,41.8799])#初始
数据挖掘课程设计——基于关联规则挖掘的美国国会议员投票行为分析（使用weka） Moonee_ 数据挖掘课程设计数据挖掘课程设计 weka 算法
基于关联规则挖掘的美国国会议员投票行为分析一、基本原理二、数据结果处理与分析1.数据预处理与分析（Weka实现/代码实现）①数据集说明②数据预处理（weka）③代码实现Apriori算法④关联规则分析⑤散点图分析⑥修改参数设置三、结论一、基本原理本项目使用了关联规则挖掘这一数据挖掘技术来分析美国国会议员投票行为，揭示出影响议员投票结果的因素和规律。关联规则挖掘是一种发现数据集中频繁项集之间关系的方
数据挖掘与机器学习——weka应用技术与实践 maggie_J 机器学习数据挖掘机器学习
第一章weka介绍1.1weka简介weka是怀卡托智分析环境（WaikatoEnvironmentforKnowledgeAnalysis）的英文缩写，官方网址为：，在该网站可以免费下载可运行软件和代码，还可以获得说明文档、常见问题解答、数据集和其他文献等资源。1.1.1Weka的历史团队宣称：我们的目标是要建立最先进的软件开发机器学习技术，并将其应用于解决现实世界的数据挖掘问题。目标：是机器学
Java矩阵运算包ujmp的基本使用余盛朋 java开发机器学习 UJMP
本人最近在用ujmp包写一些程序，ujmp包是针对于超大数据量计算的矩阵的运算包，并且有图形显示的功能且支持多种文件格式的读取和输出，还支持连接数据库，matlab数据类型和weka数据类型，总体来说非常好用，但是有一个很大的缺陷就是基本没有相关的示例和文档，官网上的示例有基本全都过时不能用了，本人总结了一下相关用法，仅供大家参考，代码并不能运行，知识给大家列出了相应的矩阵运算方式和构造方式，希望
centos7上wekan的安装；部署wekan（非docker） c921611946 linux 服务器
一、前置工作（1）端口问题1.查看端口查看已经开放的端口firewall-cmd--list-ports查看所有的端口netstat-ntlp2.开启一个端口，作为Wekan运行的端口（此端口必须是没有被使用的）打开配置文件vi/etc/sysconfig/iptables加入如下语句:-AINPUT-ptcp-mstate--stateNEW-mtcp--dport7000-jACCEPT重启防
大神都在用这5款数据挖掘工作还不速来pick一下！最牛爱码士
在大数据时代，数据意味着金钱，所以在互联网行业，数据的挖掘整理是很重要的一项工作。通过数据的整理挖掘能够很好的分析获取到有用的信息，并将其转化为可理解的和可用的形式。为了更好的帮助大家提高工作效率，巨牛汇外包小助手为大家推荐几款免费且好用的数据挖掘工具。下面不妨跟着巨牛汇外包小助手一起来看看吧！1.WekaWEKA是一个非常复杂的数据挖掘工具。它向您展示了数据集、集群、预测建模、可视化等方面的各种
Weka学习 -- StringToWordVector 源代码学习（1） aoe41606
代码整个运行流程參数设置input数据。设置数据格式batchFinished()，处理数据（Tokenzier。Stemming，Stopwords）determineDictionary();统计计算（TF。IDF）归一化output一些变量和方法的作用m_Dictionary,m_DocsCounts变量与m_OutputCounts变量意义publicTreeMapm_Dictionary
什么是ARFF文件，以.arff结尾子非Yu@Itfuture 数据分析 arff 大数据数据分析
关于arff,主要涉及三个输入类：概念、实例和属性。1.概念简单而言就是需要被处理的东西，2.实例这个词有些陌生，但是可以大致认为其为样本，3.属性就是数据表中的一列。为什么要用arff？（arff介绍）虽然Weka也支持其他一些格式的文件，但是ARFF格式是支持的最好的。是weka数据挖掘开源程序使用的一种文件模式，这是一种ASCII文本文件，因此有必要在数据处理之前把数据集的格式转换成ARFF
可视化数据挖掘开源软件的比较分析 weixin_30568591 大数据 java 人工智能
近年来，随着人脸识别、语音识别等技术的突破性进展，隐藏在它们背后的底层技术也引起工程和研究人员的高度重视，譬如机器学习。然而，机器学习是一个入门门槛相对比较高的技术领域，大部分的工程技术人员和业务人员都聚焦在业务领域的特征提取，算法选择，参数调优和模型验证上，因此一个方便高效的可视化工具，对于降低用户的机器学习学习曲线、提升工作效率显得尤为重要。本报告主要从开源和商业领域选取了WEKA、Rapid
WEKA把分类(Classification)和回归(Regression) Saudade_lh
1简介WEKA把分类(Classification)和回归(Regression)都放在“Classify”选项卡中，我们希望根据一个样本的一组特征，对目标进行预测。为了实现这一目的，我们需要有一个训练数据集，这个数据集中每个实例的输入和输出都是已知的。观察训练集中的实例，可以建立起预测的模型。有了这个模型，我们就可以新的输出未知的实例进行预测了，衡量模型的好坏就在于预测的准确程度。在WEKA中，
好用的研发管理看板工具有哪些？10款主流看板管理软件盘点开发者工具分享团队管理 PingCode更新产品经理必备工具项目管理软件
10大企业看板工具软件：1.软件开发项目看板PingCode；2.通用看板软件Worktile；3.开源看板软件Wekan；4.免费看板软件Trello；5.个人和小团队的看板软件Todoist；6.开源免费看Kanboard；7.面向个人免费的看板Teambition；8.软件开发项目看板Jira；9.开源项目看板LibreBoard；10.开源看板Jitamin。看板（KANBAN）能够很好的
51-60天谨言慎行324
第51天:kNN分类器两种距离度量.数据随机分割方式.间址的灵活使用:trainingSet和testingSet都是整数数组,表示下标.arff文件的读取.需要weka.jar包.求邻居.投票.代码如下：importjava.io.FileReader;importjava.util.Arrays;importjava.util.Random;importweka.core.*;publiccl
Weka----怀卡托智能分析环境（Waikato Environment for Knowledge Analysis） wzbclock 人工智能数据挖掘 java 产品 c
Weka的全名是怀卡托智能分析环境（WaikatoEnvironmentforKnowledgeAnalysis），是一款免费的，非商业化（与之对应的是SPSS公司商业数据挖掘产品--Clementine）的，基于JAVA环境下开源的机器学习（machinelearning）以及数据挖掘（dataminining）软件。它和它的源代码可在其官方网站下载。两个介绍weka的帖子：http://bai
Auto-WEKA(Waikato Environment for Knowledge Analysis) 卢延吉 ML &ME &GPT New Developer 数据挖掘机器学习
SimplyputAuto-WEKAisanautomatedmachinelearningtoolbasedonthepopularWEKA(WaikatoEnvironmentforKnowledgeAnalysis)software.Itstreamlinesthetasksofmodelselectionandhyperparameteroptimizationbycombiningthe
一些好的资料关于weka和数据挖掘 asa13214dsgf134sdf 数据挖掘自然语言处理搜索引擎网络图像处理数据仓库
http://space.itpub.net/7194105/viewspace-429888http://blog.csdn.net/baisung/article/details/7654437http://blog.sciencenet.cn/blog-242887-310994.htmlhttp://huzhyi21.blog.163.com/blog/static/10073962010
开源看板系统WeKan安装教程两句挽联
简介最近由于项目管理需要，找了一些开源相关的软件，有几款大体看下了，从页面、功能都还不错，比如TaigaScrumKanbanEpicsMultiprojectorangescrumorangescrumjitaminjitaminopenprojectopenprojectwekanwekan经过一些简单对比之后，包括需求、流行度、安装难易程度等，暂时选用了wekan来试一把安装过程环境Linu
Java中人工智能的框架永远的12 java 人工智能开发语言
在Java中,常用的人工智能框架有:Deeplearning4j:一个用于深度学习的开源Java框架,可以在多种平台上运行,包括CPU,GPU和ApacheHadoop。Weka:一个用于数据挖掘和机器学习的开源Java框架,包含大量的算法和工具,可以用于数据预处理,分类,回归,聚类和关联分析等。Mallet:一个用于自然语言处理的开源Java框架,包含大量的工具和算法,可以用于文本分类,语言模型
数据分享|WEKA信贷违约预测报告：用决策树、随机森林、支持向量机SVM、朴素贝叶斯、逻辑回归... 拓端研究室TRL 数据挖掘决策树随机森林支持向量机逻辑回归
完整报告链接：http://tecdat.cn/?p=28579作者：NuoLiu数据变得越来越重要，其核心应用“预测”也成为互联网行业以及产业变革的重要力量。近年来网络P2P借贷发展形势迅猛，一方面普通用户可以更加灵活、便快捷地获得中小额度的贷款，另一方面由于相当多数量用户出现违约问题而给P2P信贷平台以及借贷双方带来诸多纠纷，因此根据用户历史款情况准确预测潜在是否还会发生违约就非常有必要（点击
Wekan 的默认管理员帐号 forks1990
Wekan是开源的看板软件，实现了很多Trello的功能。下面说说如何用docker启动和使用WekanCloneRepositoryhttps://github.com/wekan/wekan.gitdocker-composer.yml文件在项目的根目录中，docker-composeup启动它如果遇到无法mount/etc/localtime和/etc/timezone目录，可以编辑dock
数据挖掘学习笔记(1) sherrymi 学习笔记数据挖掘
数据挖掘相关概念当被存储在本地时的数据称作数据，当把数据经过加工处理，它们转变成了有用的信息。如果信息经过合理的组合能够产生价值，特别是商业价值，此时就可以称其为知识。数据挖掘的过程就是数据加工处理变成信息，最后转化为知识的过程。数据挖掘的一些主要工具：商用的MATLAB、IBMIntelligentMiner、SASEnterpriseMiner、SPSSClementine和开源工具Weka。
数据挖掘学习笔记1-相关拓展学习资料 irony_202 数据挖掘数据仓库人工智能
一、数据挖掘教材：1.数据挖掘概念/技术（黑书）2.模式分类3.美丽数据（实际案例）二、国际会议：ICDMICMEICMLPCKDDACKDD三、期刊：TKDE（数据工程上的技术和知识）NNLS（神经网络和学习系统）四、公共数据集：UCI五、数据挖掘软件：weka（开源）数据挖掘前：数据预处理——数据清洗（填充、剔除无效数据）、数据类型转换、标准化数据挖掘后：数据、结论可视化：利用软件（群友推荐o
如何使用Java进行机器学习? 玥沐春风 java 机器学习开发语言
在Java中进行机器学习，可以使用各种开源机器学习库和框架来实现。以下是一些常用的Java机器学习库：Weka：Weka是一个非常流行的机器学习库，提供了大量的算法和工具，以及用于数据预处理、特征选择和可视化的功能。Deeplearning4j：Deeplearning4j是一个用于深度学习的开源库，支持多种神经网络模型和训练算法，可以用于图像分类、文本分析等任务。ApacheMahout：Apa
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 (quickselect@163.com), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

weka数据挖掘

你可能感兴趣的:(weka)