R语言-学习笔记

文章目录

  • 概率函数
  • 描述性统计函数
  • 频数统计函数
  • 独立性检验函数
  • 相关性分析
  • 相关性检验
  • R语言绘图
  • 实战
    • 回归
    • 多元回归
    • 方差分析

概率函数

  • beta Beta分布
  • binomial 二项分布
  • Cauchy 柯西分布
  • chi-squared 非中心卡方分布
  • F F分布
  • gamma
  • geometric 几何分布
  • hypergeometric 超几何分布
  • log-normal 对数正太分布
  • logistsc
  • negative binomia 负二项分布l
  • normal 正态分布
  • Poisson 泊松分布
  • Student’s t T分布
  • uniform 均匀分布
  • Weibull
  • Wilcoxon 秩和分布

正态分布命名特性,d 概率密度函数 、p 分布函数、 q 分布函数的反函数、r 产生相同分布的随机数

?norm 可见

描述性统计函数

  • summary()
  • describe()

频数统计函数

  • prop()

独立性检验函数

  • 卡方检验
  • Fisher检验

相关性分析

相关性衡量指标
Pearson相关系数,Spearman相关系数,Kendall相关系数,偏相关希数,多分格相关系数,多系列相关系数。

  • cor()
  • cov()

相关性检验

对相关分析的结论进行度量。

  • cor.test()
    参数检验 在总体分布形式已知的情况下对总体分布的参数如均值、方差等进行推断的方法。也就是数据分布已知。
    非参数检验就是在数据分布不清楚的情况下进行检验。在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名非参数检验。

R语言绘图

1.基础绘图 graphics
- 高级绘图 直接库函数调用
- 低级绘图 元素级绘图
demo(graphics)
plot()
par()
2 .

实战

回归

  1. 如何建立模型
  2. 如何评价指标

常用 liner mode 函数

  • summary 展示拟合模型的详细结果
  • coefficients 列出拟合模型的模型参数(截距项和斜率)
  • confint 提供模型参数的置信区间
  • residuals 列出拟合模型的残差值
  • anova 生成一个拟合模型的方差分析表
  • vcov 列出模型参数的协方差矩阵
  • aic
  • plot
  • predict 拟合数据对新的数据集预测响应变量值

多元回归

##回归诊断

  1. 这个模型是否是最佳模型?
  2. 模型多大程度满足OSL模型的统计假设?
  3. 模型是否经得起更多数据的检验?
  4. 如果你和模型指标不好,如何继续?
    检验手段

满足ols模型统计假设

  • 正态性:对于固定的自变量值,因变量值成正态分布。
  • 独立性 因变量之间相互独立
  • 线性 因变量与自变量之间为线性相关
  • 同方差性 因变量的方差不随自变量的水平不同而变化

方差分析

方差分析 analysis of variance ,ANOVA 变异数分析 ,用于两个及两个以上样本均属差别的显著性检验,从广义上将,方差分析属于回归分析的一种,线性回归的因变量一般是连续变量,自变量是因子时,关注的重点会有预测专项不同组之间的差异比较。

  1. 单因素方差分析
  2. 双因素方差分析
  3. 协方差分析
  4. 多元方差分析

以上都是在符合正太分布前提下成立的。

很多事情并非是符合已有分布。

先看用spss实现统计的案例,再用r

你可能感兴趣的:(R语言-学习笔记)