应用STATA做统计分析 更新至STATA 12(原书第8版)

Stata 是用于 Windows、 Mac 以及 Unix 操作系统上的一种功能完备的统计软件包。它
的特点包括易操作、速度快,还包括一整套预先编好的分析与数据管理功能,同时也允许
用户根据需要来创建自己的程序、添加更多功能。大部分操作既可以通过下拉菜单系统来
完成,也可以更直接地通过键入命令来完成。初学者可以在菜单的帮助下学习使用 Stata,
任何人在应用自己所不熟悉的程序时都可以由此获得帮助。 Stata 的命令有很强的一致性和
直观意义,可以使有经验的用户更高效地工作,这一特点还使得对更复杂或需要多次重复
的任务进行编程变得十分容易。如有必要, 在应用 Stata 时还可以混用菜单方法和命令方法。
它还提供广泛的帮助、查找和链接功能,轻轻松松便能完成像查询某一命令语法或其他信
息这类的事情。本书即为补充这些特征而著。
本书先提供一些介绍性信息,然后我们从一段 Stata 应用示范来让你领略数据分析过
程,以及怎样使用分析结果。后续各章将做更详细的解释。然而,即使没有任何解释,你
也可以看到有关命令多么简单明了:打开数据文件 filename 的命令就是 use filename,取得
概要统计的命令是 summarize,得到相关矩阵的命令是 correlate,如此等等。或者,也可
以通过 Data 或 Statistics 菜单上的选择来取得同样的结果。
有各种各样的资源来帮助用户学习 Stata,以解决任何难度级别的问题。这些资源并不
只是来自于 Stata 公司,而且也来自于活跃的 Stata 用户群体。本章的一部分内容会介绍一
些主要资源:包括 Stata 的在线帮助和印刷版文档,以及寻求技术帮助时应该给哪里写信或
发电子邮件,提供包括软件更新与常见问题解答等诸多服务的 Stata 网址(www.stata.com)、互
联网论坛 Statalist Internet 以及经审阅的《Stata 期刊》 (Stata Journal)。
1.1 本书体例的说明
本书采用几种不同的印刷体例来标志有关文字的类型意义:
● 用户键入的命令以粗体显示。当给出完整的命令行时,将以一个英文句点作为起始
点,这与在 Stata 结果窗口(Results window)或日志(输出)文件中见到的一样:
. correlate extent area volume temp
Stata 软件与 Stata 的资源
● 命令中的变量或文件名均为斜体,以强调它们是随意指定的,而并不是该命令的固
定部分。
● 本书一般行文中涉及变量或文件名时也将以斜体显示, 以示它们与普通文字内容的
区别。
● Stata 菜单上的项将以 Arial 体表示,以“ ”间隔表示随后的选项。比如,我们可
以通过选择 File Open 来打开已存在的数据集,然后找到并单击这一特定数据集
的文件名。注意,一些常见菜单的动作也可以通过 Stata 主菜单工具条中的文字选
项来完成:
File Edit Data Graphics Statistics User Window Help
或者单击这些文字下面相应的图标来完成。比如,选择 File Open 与单击最左侧的开
启文件夹小图标 的功能完全一样。用户还可以直接键入以下命令来实现同样的操作:
. use filename
于是,我们呈现名为 extent 的一个变量的概要统计指标的计算结果如下:
. summarize extent
这些体例只适用于本书,而不适用于 Stata 程序本身。 Stata 可以显示不同的屏幕字体,
但是它在命令中并不使用斜体。一旦 Stata 的日志文件被导入文字处理软件,或者已将统计
结果表复制并粘贴到文字处理软件, 就应该将其格式改为 Courier 字体的 10 号或更小字号,
这样才能将各列正确对应。
对于命令和变量名, Stata 严格区分大小写。所以 summarize 是一个命令,而 Summarize
和 SUMMARIZE 就不是。 Extent 和 extent 将是两个不同的变量。
1.2 一个 Stata 操作的例子
作为对运行中 Stata 的一个预览,本节将介绍如何打开和分析一个以往创建的数据文
件,名为 Arctic9.dta。这一小规模时间序列涵盖了卫星时代(1979 年到 2011 年)对 9 月份北
冰洋冰情的观测。数据取自三个不同来源(见有关数据来源的附录)。变量 extent 是对每年 9
月份海冰密集度不低于 15%的北半球海域的卫星测量。 Area 数字略小于 extent,表示海冰
本身的面积。另一个变量 tempN 记录了北纬 64°以北平均年度表面气温。气温被表达为以
摄氏度衡量的异常,即与 1951 年到 1980 年平均气温的偏差。我们有 33 个观测(年份)和 8
个变量。
如果我们想记录下这段工作,最好的方法是在工作开始时先打开一个日志文件。日志
文件可以存放命令和统计结果表,但是不能存放图形。要建立一个日志文件,先从顶部菜
单栏中选择 File Log Begin…,并为这个输出的日志文件指定文件名和文件夹。也可以
通过在顶部菜单工具条上选择 File Log Begin,或者直接键入以下命令来开启一个日志
文件:
. log using monday1
有多种方式做这些事情,这在 Stata 中是常见的。每一种都有自己的优点,各自适合于
不同场合或不同用户的偏好。
日志文件既能以一种特殊的 Stata 格式(.smcl)来建立,也可以采用常用的文本或 ASCII
格式(.log)。 .smcl(Stata markup and control language)文件在 Stata 中能很好地浏览或打印。其
中还可以包括超链接以方便理解命令或错误提示。 .log(文本)文件则缺少此类格式化,但是
如果用户将来把这些输出插入其他文档编辑器或做进一步编辑,就会很方便。用户在选择
了想要的日志文件类型后,便可以单击 Save。在这一节中,我们将建立一个.smcl 格式的日
志文件,名为 monday1.smcl。
这里将分析一个现有的 Stata 格式的数据文件 Arctic9.dta。要打开这个数据文件,我们
仍然有好几种方式:
● 从顶部菜单栏中选择 File Open Arctic9.dta;
● 单击 Arctic9.dta;或者
键入命令 use Arctic9。
Windows 默认设置下, Stata 会在用户的文档目录中寻找数据文件。如果想要的文件在
其他文件夹中,我们可以在 use 命令中指定它的位置:
. use C:\books\sws_12\data\Arctic9
或者用 cd(代表 change directory,即改变子目录)命令来更改本次工作的默认文件夹:
. cd C:\books\sws_12\data\
. use Arctic9
或者从菜单中选择 File Change Working Directory…。通常,打开文件的最简单方法
是选择 File Open,然后按常规方式浏览文件夹。
如果想要看当前内存中数据集的简要描述,键入:
. describe

许多 Stata 命令都可以简化为它们的前几个字母。比如,我们可将 describe 命令简化为
仅有一个字母 d。如果要使用菜单,那么选择 Data Describe data Describe data in
memory (OK)也能得到同样的输出表格。
这一数据集只有 33 个观测案例和 8 个变量,所以键入 list 就能列出相应内容(或者仅键
入小写字母 l 也行;或者选择 Data Describe data List data (OK))。此处为节省篇幅,
我们键入 list in 1/10 只列出前 10 年:
. list in 1/10
可从均值、标准差、最小值以及最大值入手来进行分析。直接键入 summarize 或 su;
或者从下拉菜单中选择 Statistics Summaries, tables, and tests Summary and descriptive
statistics Summary statistics (OK):
. summarize
若想将到目前为止得到的结果打印出来,先单击结果窗口,然后单击 图标,或者从
菜单中选择 File Print Results。
如果想将一个表、一些命令或结果窗口的其他信息复制到文字处理软件中,首先用鼠
标选择想要的那些结果,点击鼠标右键,然后选择鼠标菜单中的 Copy Text。转到你的文字
处理软件中,在适当插入点点击鼠标右键,然后点击 Paste,或者点击文字处理软件工具条
上的粘贴图标也行。大多数情形中的最后一步都是将粘贴过来的文本更改成诸如 Courier
等固定宽度的字体。
北极的海冰范围、面积和容积应当与年均气温有关,不仅因为更温暖的空气有助于融
冰,而且因为无冰海洋的表面气温会比有冰的更高。我们通过键入如下后接变量列表的
correlate 命令可以得到它们之间的相关关系。
正如所预期的, 9 月份海冰的 extent、 area 和 volume 都具有强的正相关。它们与年均
气温之间的相关是负的:气温越高,冰越少(或者反之)。同样的相关矩阵可通过点击菜单
Statistics Summaries, tables, and tests Summary and descriptive statistics Correlation
and covariance,然后选择存在相关性的变量来得到。尽管使用菜单选择通常都很简单明了,
但是你能看到在描述它们时却比使用简单文字命令更复杂。因此,后面我们将主要使用命
令,只在少许场合提及菜单选用。对于菜单的探究、搞清它们如何使用才能完成同样的任务,
将留给读者自己来完成。出于同样的原因, Stata 参考手册也是采取以命令为基础的方式。
因此,海冰范围、面积、容积与温度都是有关的。它们如何随时间推移而变动呢?图
1.1 画出了 extent 对 year 的标绘图,由 graph twoway connected 命令得到。此命令中第一
个命名的变量 extent 定义纵轴或 y 轴,最后命名的变量 year 定义横轴或 x 轴。我们看到了
一种不规则的陡峭下行态势,由于 9 月份海冰范围在这一时期减少了超过三分之一。
. graph twoway connect extent year
4 5 6 7 8
Sea ice extent, million km^2
1980 1990 2000 2010
Year

应用STATA做统计分析 更新至STATA 12(原书第8版)_第1张图片

图 1.1
要打印出此图, 首先转到图形窗口(Graph window), 然后点击该窗口中的打印图标 或
者选择 File Print。若要将此图直接复制到文字处理软件或其他文件中,右键点击这一图
形并选择 Copy Graph,再转到你的文字处理软件窗口,定位插入点后,选择一种适当的粘
贴方式,比如 Edit Paste、 Edit Paste Special(Metafile)或直接点击粘贴图标(不同的文字
年份
每百万平方公里的海冰范围
处理软件有不同的处理方式)。
如果需要将此图存起来将来再用,可以右键点击并选择 Save Graph,或点击图形窗口
中的图标 ,或选择图形窗口顶部菜单栏上的 File Save As。在 Save As Type 子菜单可以
选择保存为几种不同的文件格式。在 Windows 系统中,这些选项包括:
● Stata graph(*.gph)(一种“活”的图形,包括足够的信息供 Stata 来编辑)
● As-is graph(*.gph)(一种更紧凑的 Stata 图形格式)
● Windows Metafile(*.wmf)
● Enhanced Metafile(*.emf)
● Portable Network Graphics(*.png)
● TIFF(*.tif)
● PostScript(*.ps)
● Encapsulated PostScript with or without TIFF preview(*.eps)
● Portable Document File(*.pdf)
Mac 或 Linux 等其他操作系统提供图形文件格式的不同选择。不管我们需要哪种图形
格式,都值得同时再以活的.gph 格式多存一份得到的图形。这种活的.gph 格式图形在后续
还可以用 graph use 或 graph combine 命令来重新打开、合并、重新着色或重新设置格式,
或者使用图形编辑器(Graph Editor)加以编辑(参见第 3 章)。
通过以上所有分析,日志文件 monday1.smcl 中已经存放了我们的结果。查阅该文件以
看看我们曾经做了些什么的一个简单方法,就是在其自己的浏览器窗口(Viewer window)中
选择以下菜单来打开这一文件: File Log View OK。
我们可以通过点击日志文件浏览器窗口顶部一栏上的 图标来打印此日志文件。日志
文件将会在一段 Stata 操作完成后自行关闭,也可以通过选择 Close log file、键入命令
log close 或用下列指令要求提前关闭: File Log Close。
一旦关闭,文件 monday1.smcl 在随后的 Stata 操作期间还可以通过 File log View
或 图标来查看。为了创建一个能容易地被你的文字处理软件打开的输出文件,可以键入
以下命令,将日志文件由.smcl 格式(Stata 格式)转换为.log 格式(标准 ASCII 文本格式
)
. translate monday1.smcl monday1.log
或者,一开始就以.log 格式而不是.smcl 格式来创建文件。也可以任意次地临时开启和
结束日志文件:
● File Log Suspend
● File Log Resume
Stata 主图标菜单栏上的 log 图标 也可执行所有这些任务。
1.3 Stata 的文件管理与帮助文件
Stata 第 12 版的整套文档一共 19 卷: 一本较薄的《初学手册》(比如, Getting Started with
Stata for Windows),一本更全面的《用户指南》 (User’s Guide), 4 卷本的《基础参考手册》
(Base Reference Manual),还有分别针对数据管理、制图、纵贯和面板数据、矩阵(Mata)编
程、多重填补、多元统计、编程、结构方程建模、调查数据、存活分析和流行病学梯度表
以及时间序列分析的参考手册。《初学手册》只是帮助用户做最基本的安装、视窗管理、数
据输入、打印等方面的工作。《用户指南》是对一般问题的更广泛讨论,包括资源与问题解
决。新用户尤其要注意的是《用户指南》中的一节:“所有人都应该知道的命令(Commands
everyone should know)”。《基础参考手册》按字母顺序列出了所有 Stata 命令。每一条命令
都包括了完整的命令语法、所有可用选项的描述、例子、有关公式和基本原理的技术说明,
以及其他参考文献。数据管理、制图、面板数据等在一般参考文献中已经涉及,但是更复
杂的话题是在它们自己的专题手册中才提供更具体的处理方法以及例子。还有一本《快速
参考与索引》 (Quick Reference and Index),提供了全部文档的完整清单。尽管纸质手册可充
实书架,不过,通过 Help PDF Documentation,或者通过点击键入 help 后接具体的命令
名称返回的链接,在 Stata 中任何时候都可以获取完整的 PDF 帮助文档。
当我们在操作 Stata 时,很容易取得与手册相连的在线帮助。从顶部菜单栏选择 Help
会出现供进一步选择的下拉菜单,包括对特定命令的帮助、最新更新、在线更新、《Stata
期刊》 (Stata Journal)和用户编写的程序以及连接 Stata 的网址(www.stata.com)。选择 Search
可以对 Stata 的说明文档、网络资源或这两者进行关键词搜索。作为替代方法,选择
Contents(或键入 help 命令)允许我们按类别查找如何做事。 help 命令在与某个命令名一同
使用时是特别有帮助的。比如,键入 help correlate 命令将使有关帮助信息显示在浏览器窗
口(Viewer window)中。与参考手册一样,该屏幕帮助也提供命令语法说明以及完整的选项
清单。它还包括了一些例子,但常常不太具体,而且不提供手册中的那些技术讨论。但是,
屏幕帮助相比手册也有一些优点。浏览器能够在说明文档中或 Stata 网站上搜寻关键词。超
链接可以使你直接找到有关条目。屏幕帮助还包括一些有关最近更新的资料,或者你还可
以从 Stata 网址或其他用户网址下载一些非官方的 Stata 程序。
1.4 搜寻信息
选择 Help Search Search documentation and FAQs,可提供一种直接方式来对 Stata
说明文档或网站的 FAQs(Frequently Asked Questions, 常见问题解答)和其他页面中的信息进
行搜索。或者,我们可以对网络资源进行搜索,包括《Stata 期刊》。浏览器窗口中的搜索
结果包含指向进一步信息或原始引用的可点击超链接。
search 命令可以做类似的事情。快速 search 命令的一个专门用途是在某些场合下提供
更多信息, 比如由于我们的命令没有被成功执行而导致得到的是含义不明的 Stata 错误提示
信息。比如, table 是一个 Stata 命令,但它需要与我们确切想要呈现在表格中的内容有关
的信息。如果我们错误地仅键入 table, Stata 会给出错误信息和具有隐含意义的“返回码
(return code)” r(100):

点击此错误信息中的返回码 r(100)会给出更进一步的说明。我们也可以通过键入 search
rc 100 找到这一说明。键入 help search 查看有关该命令的更多信息。
1.5 Stata 公司
Stata 公司的邮寄地址是:
电话号码也包括易记的 800 号码:
电话: 1-800-782-8272 (或 1-800-STATAPC)美国
传真: 1-800-248-8272 加拿大
传真: 1-979-696-4600 其他地区
传真: 1-979-696-4601
要搜寻有关定购、许可证和更新方面的信息,可以通过下列电子邮箱与 Stata 公司联系:
[email protected]
或者访问他们的网站:
http://www.stata.com
Stata 出版社也有其自己的网站,提供关于 Stata 出版物的信息,包括例题所用的数据。
网址为:
http://www.stata-press.com
前面提到的《Stata 期刑》也已成为一个重要的资源:
http://www.stata-journal.com
Stata 的主站 www.stata.com 提供了广泛的用户资源,包括详细描述 Stata 产品的页面、
如何订购 Stata 以及如下所述的各种用户支持:
FAQs——常见问题解答。如果你有什么困扰,在手册中又找不到答案,那么就可以查
查这里。也许它就是一个 FAQ。这里的问答涉及面很广,既有很基础的问题,比如“如何
将其他软件文件转换为 Stata 格式的数据文件”;也有更技术性的问题,比如“如何在完全
最大似然估计中使用 heckman 命令来限制 rho 为 ”。
Updates ——主要版本中的在线更新免费对已注册 Stata 用户提供。它们提供了一种简
捷的方式来获取适用于你当前版本的最新改进、错误修复等。不必登录网站,用户可以直
接在 Stata 中查询是否有适用的更新,并通过以下命令来启动更新过程:
. update query
Technical support ——技术支持可以通过向以下地址发送电子邮件获取:
[email protected]
反馈往往很迅速且很有帮助。尽管如此,但在写信寻求技术帮助之前,还是应核实一
下你的问题是不是 FAQ。
Training ——报名参加 Stata 导论、 Stata 编程导论或高级 Stata 编程等精选话题的网上
课程。
Stata News ——Stata 新闻包括软件特征、当前网上课程、《Stata 期刊》的新问题以及
其他话题。
Publications ——与《Stata 期刊》、说明文档和手册有关信息的链接,销售与 Stata 和其
他最新的统计推论有关的书籍的书店,以及针对写作关于 Stata 新书人士的 Stata 作者支持
项目。接下来的两节会更多地谈到《Stata 期刊》和 Stata 图书。
Stata 网站开辟有 Stata 博客:
http://blog.stata.com/
社交媒体的用户也许发现在 Twitter(www.twitter.com)上关注 Stata 很有趣且长见识,或
者会在 Facebook(www.facebook.com)上喜欢上 Stata。
1.6 《Stata 期刊》
从 1991 年至 2001 年,称为 Stata Technical Bulletin(简称 STB)的双月刊服务于发布新
的命令和 Stata 更新,其中既有用户撰写的,也有正式渠道发布的。 STB 上的文章累积起
来,每年都出版一本书,名为 Stata Technical Bulletin Reprints,这些书可以从 Stata 公司直
接订购。随着网络的发展,用户之间的即时交流成为可能。程序文件能从遥远的资源地轻
易下载得到。双月刊印的期刊和磁盘对于用户交流或发布更新与用户撰写的程序而言,都
已经不再是最好的途径了。为适应变化了的世界, STB 也必须有新发展。
于是,《Stata 期刊》开始发行,以迎接挑战,满足 Stata 日益扩大的用户群。像以前的
STB 一样,《Stata 期刊》仍包括用户描述研制新命令的文章,也包括 Stata 公司雇员编制的
非正式命令。但是,发布新命令并不是它的首要关注点。《Stata 期刊》还包括带索引的统计
学注释文章、书评、 Stata 使用小窍门以及许多有趣的栏目,比如由 Nicholas J. Cox 主持的
“话说 Stata” (Speaking Stata),讨论如何更有效率地使用 Stata 编程语言。《Stata 期刊》既为
初学者服务也为老用户服务。比如,以下为 2012 年 6 月期的目录。

《Stata 期刊》每季度发行。可以通过访问 www.stata-journal.com 订购。www.stata-journal.com
归案列出了可以单独订购的往期目录,且三年前或更早的文章可免费下载。关于其历史性
意义, Stata 发行 20 周年纪念之际刊发的特刊(5(1), 2005)包含了若干篇介绍 Stata 早期发展
的论文和一篇介绍第一本 Stata 书籍的论文,即“《应用 Stata 做统计分析》的简史”。
1.7 应用 Stata 的图书
除了 Stata 自己的参考手册以外, 描述 Stata 或使用 Stata 来示范分析技术的书目越来越
多。这些书中包括一般性介绍;学科应用,如社会科学、生物统计或经济计量;以及有关
调查分析、实验数据、分类因变量以及其他学科的专门著述。
Stata 网站的 Bookstore 页面提供了最新的书目清单,并附有内容描述:
http://www.stata.com/bookstore/
这个在线书店提供了一个了解和订购不同出版商发行的 Stata 相关图书的好地方。 

购买地址:

https://item.jd.com/12359633.html


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26421423/viewspace-2217462/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/26421423/viewspace-2217462/

你可能感兴趣的:(应用STATA做统计分析 更新至STATA 12(原书第8版))