学习统计学(一)——基本概念

最近在读数学之美这本书,里面介绍了用统计学来做预测的技术。我觉得很有意思,统计学可能也会用在我的工作当中。 所以兴起了学习统计学的念头。不过大学的时候学习概率统计比较吃力,到现在感觉都有阴影在心头。所以就想找点简单的教 材和视频来学,把每次学习的内容都写到博客当中。
我找到的视频教材是网易公开课中可汗学院的统计学教程。书本教材是找的图书馆中的比较薄的入门教材。结合这两者再 加上网上的资料。争取这次能够把统计学学清楚。
首先我们需要了解的概念是均值、中位数和众数。这三者都属于表示频数分配位置的量值。所谓频数分配位置是指两个或者 两个以上频数分配各变量集中的中心点的不同。
1)平均数(mean)
计算平均数的方式有很多种,在这里我们所指的是算数平均数。它的计算方法是计算一组数据的和sum,然后用sum除以这组 数据的数量,得到的结果就是算数平均数。
算数平均数的意义在于指明一组数据的集中位置。
2)中位数(median)
中位数是指将一组数据从小到大排列,处在数列中间位置的值就是中位数,如果数据数量为奇数n,则中位数为第(n+1)/2个 值,如果数据数量为偶数,则中位数为中间两个数的平均值。
中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性
3)众数(mode)
众数是指在一组数据中出现次数最多的数,可以用它来表示现象的一般水平。
众数可以有一个、多个或者一个都没有。
如果一组数据中所有数的出现次数都一样,则没有众数。
如果一组数据中只有一个数出现次数最多,则这个数为众数。
如果一组数据中有多个数出现次数一样且次数最多,则这些数都是众数。

我在C#中写了简单的控制台程序来计算这些数据,具体的可以见代码:
程序的源码的下载路径如下( Vs2012 C#编写,程序运行需要.net framework 3.5,可以到网上去搜安装文件):
https://skydrive.live.com/?mkt=zh-CN#cid=423921156EB9AD66&id=423921156EB9AD66%21105 中的statisticsFunc压缩包
 
参考资料:
1) http://v.163.com/special/Khan/khstatistics.html
2)数理统计浅说,陈永秉编著。
3) http://baike.baidu.com/link?url=a5Vre0y9aXdDuSyRYBMhxivfBsqlQAQR5_DRufxXh5FyTCIAaX2ktA4pSd0EGeFo
4) http://baike.baidu.com/view/170892.htm
5) http://baike.baidu.com/subview/170875/8707592.htm?fromId=170875&from=rdtself


你可能感兴趣的:(统计学)