数据挖掘一些问题

截断均值

F

计算{1,2,3,4,5,90}值集的均值,中位数和p=40%的截断均值.
解:均值是17.5,中位数是3.5,p=40%时的截断均值也是3.5

Q

截断均值:
指定0和100之间的百分数p,丢弃高端和低端(p/2)%的数据,然后用常规的方法计算均值,所得的结果就是截断均值.

按照公式,(p/2)%=20%,6*20%=1.2约等于1,那么应该截掉前两个数和后一个数,剩下{2,3,4,5},所以截断均值为(2+3+4+5)/2=3.5。

四分位数

https://jingyan.baidu.com/article/6d704a13540bb528db51cade.html

 

关系矩阵和协方差关系

https://zhidao.baidu.com/question/684022552075907492.html

你可能感兴趣的:(数据挖掘)