Weka 的非监督属性 filters介绍(一)

   第一篇博客,想给大家介绍下Weka的非监督属性 filters。
   Weka 的filters(过滤器)还是非常强大的哟,感觉虽然不如python的属性处理方式那么灵活,但是也是非常好用的。好了,
 开动吧!对了,不要忘了劳动不易,打赏随意哟!
 **1、Add**
      Add的作用是添加一个全部是缺失值的属性(为什么要添加一个全是缺失值的属性呢,没搞明白。)
 **2、AddCluster**
 AddCluster的作用是先对数据集进行聚类预训练,形成一个新的名义属性,包含cluster1、cluster2等聚类编号(有用哟)
 **3、AddExpression**
 AddExpression是添加各种数学公式,对属性进行变换(优秀)
 **4、AddID**
 添加个ID属性,感觉没什么用
 **5、AddNoise**
 顾名思义,添加噪声,有时候添加点噪声可以增强模型的棒鲁性哟!
 **6、AddUserFields**
 添加用户指定值的属性
 **7、CartesianProduct**
 形成一系列名义属性的笛卡尔积
 **8、Center**
 将一系列数值型属性进行中心化(0均值)
 **9、ChangeDateFormat**
 顾名思义,改变日期属性的格式
 **10、DateToNumeric**
 将日期属性变成数值型属性
 **11、Discretize**
 将数值型属性进行离散化
 **12、FirstOrder**
 将数值型属性进行一阶差分,即用一个第二个值-第一个值的新属性代替原属性
 **13、InterquartileRange**
 生成标注异常值和极端值的属性(这个好耶)
 **14、KernelFilter**
 将数据集用核矩阵代替(呜呜呜,核矩阵这么高深的东西,初中文化的我看不懂)
 **15、MakeIndicator**
 将名义属性进行独热编码,即用N个二元属性代替原来的名义属性,
 **16、MathExpression**
 多个属性进行数学公式的变换,形成新属性
 **17、MergeInfrequentNominalValues**
 将名义属性频率在指定值以下的值合并
 **18、MergeManyValues**
 将名义属性的多个值进行合并(有用哟)
 **19、Normalize**
 将数值型属性规范化,使其值在【0,1】之类,也可以对范围进行指定
 **20、NumericCleaner**
 将数值型属性太大和太小的值设置为指定值
 **21、NumericToBinary**
 将数值型属性变为二元属性
 **22、NumericToDate**
 将数值型属性转化为日期属性
 **23、NumericToNominal**
 将数值型属性转化为名义属性
 **24、OrdinalToNumeric**
 将顺序型属性转话为数值型属性
 **25、PKIDiscretize**
 使用等频分箱离散化数值型属性,并且确保分箱数等于数值型属性数据量的平方根
 **26、PrincipalComponents**
 大名鼎鼎的主成分,不多说了
 **27、RandomSubset**
 随机选择一个属性集进行训练
 **28、Remove**
 删除属性
 **29、RemoveByName**
 删除属性名满足指定的正则表达式的属性
 **30、RemoveType**
 删除某个数据类型的属性
 **31、RemoveUseless**
 删除没有用的属性
 **32、Reorder**
 将属性重新排序
 **33、ReplaceMissingValues**
 用均值和众数替代缺失值
 **34、ReplaceMissingWithUserConstant**
 用用户指定的常数替代缺失值
 **35、ReplaceWithMissingValue**
 将某些指定的值标志为缺失
 **36、Standardize**
 将数值型属性进行标准化,使其均值为0,标准差为1
 **37、SwapValues**
 交换名义属性的两个值(大哥,还能这样啊)
 **38、Transpose**
 行列互换
 **39、TimeSeriesDelta**
 时间序列的差分

下篇文章会举个具体的例子,为了鼓励原创,动动手指加关注,打赏随意哈。

你可能感兴趣的:(Weka 的非监督属性 filters介绍(一))