stata学习笔记①stata基础介绍

文章目录

  • 一、为什么要学stata
  • 二、软件基本解释
    • 1.软件界面
    • 2.导入示例数据
    • 3.认识几个重要的功能符号
  • 三、数据的基本观测
  • 四、统计性描述
    • 1.codebook 数据字典使用
    • 2.summarize
  • 五、图像初步探索
    • 1.histogram 直方图
    • 2.graph box /hbox 箱线图
    • 3.vioplot小提琴图


一、为什么要学stata

  • 对经济统计、计量比较友好,经济学读博必备、必会
  • 窗口菜单和代码完成一定的功能,简单
  • 上手简单
  • 可靠性强-这里指的是权威性
  • 模型种类丰富-类似R包、python模块

二、软件基本解释

1.软件界面

stata学习笔记①stata基础介绍_第1张图片

  • 注意历史窗口,红色表示报错哦

2.导入示例数据

stata学习笔记①stata基础介绍_第2张图片
stata学习笔记①stata基础介绍_第3张图片
stata学习笔记①stata基础介绍_第4张图片
输入summarize price,有时候可简写为sum price
stata学习笔记①stata基础介绍_第5张图片

3.认识几个重要的功能符号

stata学习笔记①stata基础介绍_第6张图片

  • 1.保存日志
  • 2.帮助文档
  • 3.绘图编辑
  • 4.生成do-file文档
  • 5.数据编辑
  • 6.数据浏览

三、数据的基本观测

  1. describe返回数据的基本情况,如右下角属性窗口
    语法:describe [变量],或者不加,注意[]表示可以加可不加
    例子:describe, price
  2. count查看观测变量个数,可以加逻辑判断
    语法:count if [变量]>80,或者不加
    例子:describe if price>500\ describe if missing(rep78)
  3. isid类似于索引,独特的区分出每一个观测值
    语法:isid 变量
    例子:isid price,如果报错,这说明不可以独立区分出每一个观测值,这里说明,每个观测值可能存在重复值
  4. unique
    语法:unique 变量找唯一
    例子:unique mpg weight

四、统计性描述

1.codebook 数据字典使用

可以用于查看数据类型、简单统计量、缺失值、异常值
codebook [] [] [] [,options]
[]:代表不是必须的
varlist:变量名单
if:逻辑判断
in:第几个到第几个观测值
options:跟在逗号后面,一些自定义选项
stata学习笔记①stata基础介绍_第7张图片
llast
ffirst

2.summarize

stata学习笔记①stata基础介绍_第8张图片
stata学习笔记①stata基础介绍_第9张图片

stata学习笔记①stata基础介绍_第10张图片
Skewness:偏度

Kurtosis:峰度

五、图像初步探索

1.histogram 直方图

histogram varname[if] [] [] [,[continuous_opts | discrrte_opts]options]
注意这里的varname是个单独变量
语法:
hist varname朴素的图
hist varname, freq bin(5) normal连续的 如果离散的discrete
hist varname, by(varname2) 分组

2.graph box /hbox 箱线图

graph box var

stata学习笔记①stata基础介绍_第11张图片
hbox表示横向的直方图
graph box pirce, over(foreign)
分组的直方图

3.vioplot小提琴图

一般情况下,小提琴图比箱线图更好,因为可以看到每一个分位下,数据的观测值数量
stata学习笔记①stata基础介绍_第12张图片
语法和图像展示

你可能感兴趣的:(学习,笔记,python)