数学之路-数据分析进阶-广义线性模型

统计学上, 广义线性模型 (Generalized linear model) 是一种受到广泛应用的线性回归模式。此模式假设实验者所量测的随机变量的分布函数与实验中系统性效应(即非随机的效应)可经由一链结函数(link function)建立起可资解释其相关性的函数。

广义线性模型(generalized linear model, GLM)是简单最小二乘回归(OLS)的扩展,在广义线性模式中,假设每个资料的观测值来自某个指数族分布。 该分布的平均数  可由与该点独立的X解释:

其中为的期望值,是由未知待估计参数与已知变量构成的线性估计式,则为链结函数。

在此模式下,的方差可表示为:

一般假设可视为一指数族随机变量函数

未知参数通常会以最大概似估计量殆最大概似估计量, 或以贝氏方法来估计。

链结函数[编辑]

链结函数解释了线性预测子与分布期望值的关系。链结函数的选择可视情形而定。通常只要符合链结函数的值域有包含分布期望值的条件即可。

当使用具正则参数θ的分布时,链结函数需符合XTY 为β充份统计量此一条件。这在θ与线性预测子的链结函数值相等时方成立。下面列出若干指数族分布的典则链结函数及其反函数(有时称为均值函数):

典则链结函数
分布 名称 链结函数 均值函数
正态 恒等
指数 倒数
Gamma
逆高斯 二次倒数
泊松 自然对数
二项式 Logit
多项式

广义线性回归适合以下2种情况:

 1、因变量的条件平均数为回归参数的非线性函数
2、因变量为非正态分布的数据 
数学之路-数据分析进阶-广义线性模型_第1张图片



数学之路-数据分析进阶-广义线性模型_第2张图片

你可能感兴趣的:(数学之路-数据分析进阶-广义线性模型)