卡方检验 Chi-square test

卡方检验:**实际值**与**期望值**之间的**偏离度**,实际值与期望值之间的偏离程度决定卡方值的大小,卡方值越大,越偏离;卡方值越越小,越接近。若实际值与期望值完全相等,卡方值就为0。
实战代码:

package com.wp
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.stat.Statistics
import org.apache.spark.mllib.stat.test.ChiSqTestResult
import org.apache.spark.{SparkContext, SparkConf}

object ChisequreTest {
def main(args: Array[String]) {
val conf = new SparkConf().setAppName(“0616”).setMaster(“local”);
val sc = new SparkContext(conf);
val v1 = Vectors.dense(42.0,6.0);
val v2 = Vectors.dense(42.0,8.0);
//求卡方值=>实际值与期望值之间的偏离度
/*
Chi squared test summary:
method: pearson 默认使用皮尔逊相关系数方法
degrees of freedom = 1 自由度
statistic = 0.4374999999999999 卡方值
pValue = 0.5083315735521454 概率
*/
val c1: ChiSqTestResult = Statistics.chiSqTest(v1,v2);
println(c1);
}
}
运行结果截图:
卡方检验 Chi-square test_第1张图片

你可能感兴趣的:(Spark,MLlib)