这章后边终于不用截图了,加油吧!!!!
欢迎关注微信公众号 金融类考试资料分享:jq527672718
七、统计推断的假设检验(重点)
1、假设检验问题与假设检验的处理思路。
欢迎关注微信公众号 金融类考试资料分享:jq527672718
(1)假设检验问题提出。 程序化交易的某个交易策略,选择过去连续100天模拟交易结果,按天统计胜率为56%,需要判断如下假设:胜率大于50%。如果不考虑盈亏比例,是否需要采用该策略进行真实交易?这就是一个假设检验的问题。基于样本判定一个关于总体分布的理论假设是否成立就是假设检验。其基本思想是当观察到的数据差异达到一定程度时,就会反映与总体理论假设的真实差异,从而拒绝理论假设。如果提出一种想法(Hypotheses),我们希望检验这种想法是否正确。这种想法或假设称为“原假设”(也称为零假设),记为H0(零表示所提想法没有改变或没有差别)。一般零假设是经过长期检验被认为是正确的,在现在的新情况希望检验它是否仍然正确,所以H0不应轻易被否定
(2)假设检验基本思路。检验统计量是统计检验的重要工具,其功能在用之于构造观察数据与期望数之间的差异程度。否定论证是假设检验的重要推理方法,其要旨在:先假定原假设成立,如果导致观察数据的表现与此假定矛盾,则否定原假设。通常使用的一个准则是小概率事件的实际推断原理。
2、两类错误概率。 (又是重点)
第一类错误(概率)即原假设成立,而错误地加以拒绝(的弃真概率);
第二类错误(概率)即原假设不成立,而错误地接受它(的取伪概率)。
在使用模型的决策会产生两类错误,第一类错误是拒绝一个正确的模型,第二类错误是接受一个错误的模型。
3、显著水平。
理想的检验规则是使得弃真概率(a)和取伪概率(β)都很小,但是,如果样本容量给定,犯两类错误的概率不可能同时小,通常一个减小,另一个就会增加,只有增加样本容量,才能使他们同时减小。奈曼-皮尔森 (Neyman—Pearson)原则:在控制弃真概率(a)的条件下,使得取伪概率(β)尽量小,有时把原则简化为控制第一类错误的概率a。在收集数据之前假定一个准则,在原假设成立条件下,样本落入拒绝域的概率不超过事先设定的 ,则称该拒绝域所代表的检验为显著水平α的检验,而α称为显著水平。所谓显著水平检验就是控制第一类错误概率的检验。
4、假设检验的数学概念。
假设检验需要显著性水平(定义的小概率),依据这个小概率,确定否定H0的空间——拒绝域,利用样本计算的统计量落在了拒绝域,就说明小概率事件发生了,这时对于H0的否决就是显著的。
欢迎关注微信公众号 金融类考试资料分享:jq527672718
5、假设检验的基本步骤
(1)根据实际问题的要求,提出原假设H0,及备择假设H1;
(2)给定显著性水平α以及样本容量n;
(3)确定检验统计量以及拒绝域的形式;
(4)按P值{当H0为真拒绝H0}≤α求出拒绝域;
(5)取样,根据样本观察值作出决策,是接受H0,还是拒绝H0。
不截图然后打字也挺累的哈
回归分析
模型设定;参数估计;模型检验;模型应用。
八、一元回归模型的含义和特征
1、相关关系分析
变量和变量之间通常存在两种关系:确定性函数关系和相关关系。
确定性函数关系表示变量之间存在一一对应的确定关系;相关关系表示一个变量的取值不能由另外一个变量唯一确定,即当变量X取某一个值时,变量Y对应的不是一个确定的值,而是对应着某一种分布,各个观测点对应在一条直线上。分析两个变量之间的相关关系,通常通过观察变量之间的散点图和求解相关系数的大小来度量变量之间线性关系的相关程度。
补充知识:通过散点图看相关关系
线性相关:变量之间的关系近似地表现为一条直线
非线性相关或者曲线相关:变量之问的关系近似地表现为一条曲线
完全相关:如果一个变量的取值完全依赖于另一个变量,各个观测点落在一条直线上
无相关关系:两个变量的观测点很分散,无任何规律。
欢迎关注微信公众号 金融类考试资料分享:jq527672718
异方差产生的原因
(1)模型的设定问题。在模型的设定过程中,省略了重要解释变量,或者由于变量之间本为非线性关系而设定为线性关系从而导致异方差的产生。
(2)测量误差。由于观测解释变量和被解释变量出现了偏误而产生了异方差。
(3)横截面数据中各单位的差异。由于同一时点不同对象的差异通常会大于同一对象不同时间上的差异,因此横截面数据比时间序列数据更容易产生异方差
异方差的后果
计量经济学模型一旦出现异方差性,如果仍采用OLS(最小二乘法)估计模型参数,会产生下列不良后果:(1)OLS估计量仍然具有无偏性,但OLS估计的方差不再是最小的。(2)显著性检验失去意义。(3)模型的预测失效。当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对被解释变量Y的预测误差变大,降低预测精度,预测功能失效
异方差的检验方法
1)图示判断法。异方差的检验方法很多,可以通过散点图做出直观判断,还可以利用X-e2残差图判断异方差性,看是否形成一斜率零的直线,作为判断基础。
2)统计检验方法。检验异方差的方法很多,常用的方法有帕克(Park)检验与戈里瑟(Gleiser)检验、戈德菲尔德-匡特(Goldfeld-Quandt)检验(G-Q检验)、怀特(White)检验、ARCH检验等。
欢迎关注微信公众号 金融类考试资料分享:jq527672718
异方差问题的处理
当模型检验出存在异方差性时,常用加权最小二乘法(WLS)进行估计。其基本思想为:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数,现在常用的统计或者数学计算软件均支持该算法。除此之外,还可以对模型进行对数变换,即将解释变量和被解释变量分别取对数后,再做OLS估计,这样通常可以降低异方差性的影响。
序列相关性问题
(1)序列相关概念及后果
对于回归模型Y=XB+U(用矩阵的形式写的),基本假设之一是随机误差项互不相关,如果对于不同的样本点,随机误差项之间存在某种相关性,则出现序列相关性。其他条件不变时,序列相关性表示
Cov(μi,uj)≠0(i,j)。常见的自相关为一阶自相关,其表示形式为:ui=pui-1+vi,
其中,ρ为自相关系数,通常-1
若模型出现序列相关性,仍采用OLS估计模型参数,则会产生下列不良后果:
(1)参数估计量的线性和无偏性虽不受影响,但是参数估计量失去有效性;(2)模型的显著性检验失去意义;(3)模型的预测失效
序列相关的检验
序列相关性检验方法有多种,但基本思路相同:首先采用OLS对模型做估计,获得随机误差项的估计量。再通过分析这些估计量之间的相关性,以判断随机误差项是否具有序列相关性。常用的序列相关性检验的方法有:图示检验法、回归检验法、杜宾一瓦森(Durbin—Watson)检验法、拉格朗日乘数(Lagrange Muhiplier)检验等,图示法简单,回归检验法可以满足任何类型序列相关性检验,拉格朗日乘数检验适用于高阶序列相关以及模型中存在滞后被解释变量的情形。但是较多使用的是杜宾一瓦森检验(DW检验)。
1)图示检验法。是一种直观的判断方法,它通过OLS估计出的参数,得到残差项 ,再通过观察 的散点图来判断随机误差项的序列相关性。
2)DW检验。该检验假设条件为解释变量x为非随机变量,随机扰动项满足下述一阶自回归形式:µi=ρµi-1+vi,并且回归模型中不应含有滞后因变量作为解释变量,且回归模型含有不为零的截距项。
需要去查询DW分布表,跟t分布,F分布类似。已下载。
DW检验具体步骤如下:
第一步,计算DW值;
第二步,给定显著性水平α,由样本容量n和解释变量的个数k(不包含常数项)的值查DW分布表,得临界值下限dL和上限dU;
第三步,判断是否存在自相关性。当DW值在2附近时,模型不存在一阶自相关。当DW为其他数值时,需要查表比较。
欢迎关注微信公众号 金融类考试资料分享:jq527672718
消除自相关影响方法:若模型经检验证明存在序列相关性,则常采用广义差分法、一阶差分法、科克伦一奥克特迭代法和德宾两步法等方法估计模型
时间序列的基本概念
1、随机过程:随机变量按照时间的先后顺序排列的集合叫随机过程。设Y为一个随机变量,若Y为连续型的随机变量,记为Y(t);若是离散型的随机变量,记为Yt.若一个随机过程的均值和方差不随时间的改变而改变,且在任何两期之间的协方差值仅依赖于两期的距离或滞后的长度,而不依赖于时间,这样的随机过程称为平稳性随机过程。反之,称为非平稳随机过程。
2、白噪声过程是一个平稳的过程。若一个随机过程的均值为0,方差为不变的常数,而且序列不存在相关性,这样的随机过程称为白噪声过程。例如,在线性回归分析中的误差项
3、服从均值为0,方差为不变常数,即为一个白噪声过程。平稳和非平稳时间序列:时间序列的统计特征不会随着时间的变化而变化,即反映统计特征的均值、方差和协方差等均不随时间的改变而改变,称为平稳时间序列;反之,称为非平稳时间序列。
本来想这一篇能写完,累成狗,但是写不完了,还是再断出一篇吧
欢迎关注微信公众号 金融类考试资料分享:jq527672718