大静静的学习日志

Stata学习笔记

命令	解释	示例	备注
pwd	显示当前路径	pwd
dir	显示当前路径下所有文件	dir
mkdir	当前路径下新建文件夹	mkdir d:/mydata
cd	更改路径为	cd d:/mydata
append	纵向合并，个案拼接	append using math
merge	横向合并，变量合并	merge using
xpose	转置	xpose,clear
cap	悄悄运行，但无论正误继续do命令	cap	与quiet 区别
qui	悄悄运行，遇错停止	qui
duplicate	重复值	duplicate report 报告重复值 duplicate list 将重复值列表呈现 duplicate drop 删除重复值
bys	sort by简写，字符型变量分组
sort	升序
gsort	降序
gen	生成新变量，无函数	gen newvar=var/10
egen	生成新变量，有函数	egen newvar=mean(var)
xtile ,nq(n)	n等分分组
record	重新赋值		简洁

*使用日志文件
log using c:\logfile			//设置为smcl格式
log using c:\logfile.log,text	//设置为文本格式
log using c:\logfile.log,text replace	//覆盖日志文件
log using c:\logfile.log,text append	//添加到原有文件之后
log off							//暂时关闭
log on							//重新打开，对应的是log off
log close						//完全关闭，对应log using

*其他常用第三方命令，首次使用需运行"ssc install 程序名"下载安装
*回归结果导出
outreg2 被解释变量 解释变量1 解释变量2 using regfile,replace seeout
*日志文件导出，以计算pearson相关系数为例
logout,save(my) excel replace:pwcorr lwt bwt,sig star(0.05) 
*最小二乘回归表导出
esttab using test.rtf

cd		//查看当前工作目录
cd "d:/CHFS_tracking"	//设置当前工作目录

by foreign : count if rep78 > 4
describe
codebook foreign
list foreign price mpg rep78 in 1/5
browse foreign price mpg rep78 in 1/5

generate epi001=1 if foreign==1
replace epi001=0 if foreign==0


ttest price,by(foreign)		//成组t检验
logit foreign rep78 price

*----------------------------------------*
*=========      描述变量       ==========*
*----------------------------------------*

sysuse auto,clear

tabstat price,by(foreign) stat(mean sd min max)		//分层描述


*summarize语句：描述连续性变量
sysuse auto				//使用软件自带的数据auto
summarize price				
summarize mpg			//
summarize mpg,detail	//显示其他更多信息
summarize,separator (8)	//显示所有变量的信息，且每八个变量分割一下

*tabulate语句：描述分类变量
tabulate foreign			
tab1 rep78 foreign			//对多个变量逐个描述 
tabulate rep78 foreign      //rep78和foreign的交叉表
tab2 rep78 foreign 			//为指定变量列表中的变量生成任意可能组合的交叉表

*----------------------------------------*
*=========      循环语句       ==========*
*----------------------------------------*
*----------forvalues循环语句
*带条件语句（if else）的循环语句
forvalues x=1/9{
	if mod(`x',2){
	display "`x' is odd"
	}
	else{
	display "`x' is even"
	}
}
*带条件语句（if continue）的循环语句
forvalues x=1/9{
	if mod(`x',2){
	display "`x' is odd"
	continue
	}
	display "`x' is even"
}
*提前终止(if continue break)循环的循环语句
forvalues x=1/9{
	if mod(`x',2)==0{
	display "The first odd is `x'"
	continue,break
	}
}

*-----foreach循环语句in/of都可，但of效率更高，推荐使用
*循环变量list为字符变量（变量名也可以简写，只写前几个字母，t*表示t开头的变量）
 foreach var of varlist pri-rep t*{
 quietly summarize `var'
 summarize `var' if `var' > r(mean)
 }
 *循环新变量（list为新建字符变量）
 foreach var of newlist z1-z4{
 generate `var' = runiform()
 }
 *循环数字，list为数值
 foreach num of numlist 1/4 8 103{
 display `num'
 }
 *注：foreach上述三种方法不够稳健，推荐使用下面的宏的方法
 *foreach of local macro，list为局部宏
 local grains "rice wheat flax"
 foreach x of local grains{
 display "`x'"
 }
 *foreach of global macro,list为全局宏
 global money "dollar lira pound"
 foreach y of global money {
 display "`y'"
 }
 
 
*-------while循环语句------------*
*continue,break可使命令跳出整个循环
local i = 1
while `i' < 4{
	if mod(`i',2)==0{
	display "The first odd is `i'"
	continue,break
	}
display "The i is `i'"
local i = `i' + 1
}
*exit命令可以退出当前程序或do命令
local i = 1
while `i' < 4{
	if mod(`i',2)==0{
	display "The first odd is `i'"
	exit
	}
display "The i is `i'"
local i = `i' + 1
}
*有多个嵌套循环，只想跳出当前循环，可以使用if break组合
local i = 1
while `i' < 4{
	if mod(`i',2)==0{
	display "The first odd is `i'"
	break
	}
display "The i is `i'"
local i = `i' + 1
}
*若while循环是递增或递减的，还可以使用以下方法：
local i = 0
while (`i++') < 4{
	if mod(`i',2) == 0{
	display "The first odd is `i'"
	continue,break
	}
	display "The i is `i'"
}

*----------------------------------------*
*=========      报表制作       ==========*
*----------------------------------------*

*-------------tabulate命令---------------*
*tabulate命令：生成二维频数表，一般简写为tab
*选项：column——每列相对频数；row——每行相对频数；cell——每个单元格相对频数
*expected——每个单元格期望频数；nofreq——不输出频数；nolabel——输出数值而不是数值标签
webuse citytemp2
tabulate region agecat,row column expected chi2

*------------- table命令------------------*
*table命令：生成概要统计表格
*注意：contents(clist)用于定义表格输出的统计量，最多可选5个统计量，且统计量后边需要跟上变量名，即c(mean varname)

*绘制一维表
webuse auto2
table rep78,c(n mpg mean mpg sd mpg med mpg)  format(%9.2f)  //按照rep78变量取值分组汇总mpg的频数、均值、标准差和中位数，且有小数的保留两位小数

*绘制二维表，表格内容居中对齐，增加行合计和列合计
table rep78 foreign,c(mean mpg) format(%9.2f) center row col

*绘制三维表
*sc——scolumn可以增加超级列合并，比如下面例子不仅按照race分为了other和white两大列，还会新形成一个total列
*fw为赋权
webuse byssin
table workplace smokes race [fw=pop],c(mean prob) format(%9.3f) sc col row

*绘制更高维度的表格——通过by()选项实现
webuse byssin1
table workplace smokes race [fw=pop],by(sex) c(mean prob)format (%9.3f) sc col row

*-------------tabstat命令--------------------*
*tabstat命令：生成精简统计表格
*statistics(statname)用于定义表格输出的统计量
webuse auto
tabstat price weight mpg rep78 ,by(foreign) stat(mean sd min max) long format

*----------------------------------------------*
*====  在数据集中生成包含统计信息的变量   =====*
*---------------------------------------------*

*-------------collapse命令--------------------*
*包含概要统计的数据集：collapse命令
*collapse命令用法：
collapse (stat) varlist
collapse (stat) target_var=varname
*stat选项是用来指定输出的变量的
webuse college,clear
list
collapse (mean) gpa hour (median) medgpa=gpa medhour=hour [fw=number],by(year)
list
*注意：此时的gpa和hour变量都是原gpa和hour的均值

*-------------contract命令--------------------*
*生成包含频数和百分数的数据集：contract命令
*把原始数据整理成频数形式
webuse auto2,clear
list rep78 foreign
contract rep78 foreign
list
expand _freq  //转换成原始数据格式

*-------------statsby命令--------------------*
*按分类生成统计量：statsby
webuse auto2,clear
statsby,by(foreign):regress mpg gear turn
list
*只看gear变量对应的系数
webuse auto2,clear
statsby gear=_b[gear],by(foreign):regress mpg gear turn
list


*----------------------------------------------*
*====         将回归表格导出到excel       =====*
*---------------------------------------------*

*命令1：比较全，可以把F统计量等信息也导出
sysuse auto,clear
regress price turn gear
putexcel set "C:\results.xlsx",sheet("regress results")
putexcel F1 = ("Number of obs") G1 = (e(N))
putexcel F2 = ("F") G2 = (e(F))
putexcel F3 = ("Prob > F") G3 = (Ftail(e(df_m),e(df_r),e(F)))
putexcel F4 = ("R-squared") G4 = (e(r2))
putexcel F5 = ("Adj R-squared") G5 = (e(r2_a))
putexcel F6 = ("Root MSE") G6 = (e(rmse))
matrix a = r(table)'
matrix a = a[.,1..6]   //指定输出的列数，现在只指定了输出回归表格前六列的内容
putexcel A8=matrix(a,names)

*命令2：只导出了回归结果，比较简单，适合只需要回归系数的情况  
putexcel B3 = matrix(r(table)',names) using "C:\results1.xlsx"

*----------------------------------------------*
*====         reshape命令      =====*
*---------------------------------------------*
webuse reshape3,clear
reshape long inc@r ue,i(id) j(year)


*----------------------------------------------*
*====             对变量进行编码          =====*
*---------------------------------------------*
*recode x2 (1 2 = 1)(3 = 2)(4/9 = 3)   //会替代原始数据
recode x2 (1 2 = 1)(3 = 2)(4/9 = 3),prefix(rec)   //将编码后的数据放入新变量且新变量为原始变量名加前缀rec
recode x2 (1 2 = 1)(3 = 2)(4/9 = 3)(nonmissing = 9),prefix(rec)   //重新编码时其他非缺失值可以用nonmissing选项
recode x2 (1 2 = 1 Below)(3 = 2 Average)(4/9 = 3 Above),prefix(rec2) label(reclab)  //给新变量设置变量值标签
recode x2 (1 2 = 1)(3 = 2)(4/9 = 3)(10/max),prefix(rec3)

encode gender,gen(sex)  //将字符变量编码为数值变量，比如将female编码为0，male编码为1
decode sex,gen(gender1)	//将数值变量编码为字符变量

*----------------------------------------------*
*====             对缺失值进行编码        =====*
*---------------------------------------------*
*默认系统缺失值为","
*变量值标签不会随编码自动改变，必要时需手动加以调整
*将数值编码为缺失值的命令：mvdecode
mvdecode rep78 ,mv(998=.\999=.a)  //当rep78=998时将其编码为系统缺失值"."，rep78=999时编码为扩展缺失值".a"
mvdecode _all,mv(998=.\999=.a)  //所有变量都按此规则编码
*将缺失值编码为数值的命令：mvencode
mvencode rep78 if foreign == 0,mv(998)  //foreign=0时将rep78的缺失值编码为998
mvencode rep78 if foreign == 1,mv(999)  //foreign=1时将rep78的缺失值编码为999
mvencode _all,mv(.=999\.a=998\.b=997\else=996)

*----------------------------------------------*
*====      数值变量和字符变量的转换       =====*
*---------------------------------------------*
*字符变量转换为数值变量：destring和real()
destring foreign , gen(foreignd)
gen foreignd = real(foreign)   //另一种方法

destring foreign,replace
destring foreign,replace force
destring foreign,gen(foreignd) ignore(x)  //变量中除了数值，还有x值，可选择忽略x值（设为缺失值）
destring foreign,gen(foreignd) ingore(" ")  //忽略空格
destring trunk weight length turn,gen(trunkd weightd lengthd turnd) ignore("$,%") percent  //同时忽略多个字符，百分数用小数表示

*----------------------------------------------*
*====          数据集的纵向追加           =====*
*---------------------------------------------*
sysuse auto,clear
keep if foreign == 0
keep make price mpg rep78 headroom foreign
save domestic

sysuse auto,clear
keep if foreign == 1
save foreign

use domestic,clear
append using foreign,gen(_append)  //_append为0表示来自主数据集，为1表示来自using的第一个数据集
append using foreign,gen(_append) keep(make price mpg rep78 headroom foreign)  //只选择某些变量追加到主数据集

*----------------------------------------------*
*====          数据集的横向合并           =====*
*---------------------------------------------*
*1:1
webuse autosize
merge 1:1 make using http://www.stata-press.com/data/r13/autoexpense
merge 1:1 make using http://www.stata-press.com/data/r13/autoexpense,keep(match)  //仅保留完全匹配的记录

*1:m
webuse overlap2,clear
merge 1:m id using http://www.stata-press.com/data/r13/overlap1  //如果主数据和using数据有重复变量，保留主数据的变量值
merge 1:m id using http://www.stata-press.com/data/r13/overlap1,update
merge 1:m id using http://www.stata-press.com/data/r13/overlap1,update replace

*m:1
webuse overlap1,clear
merge m:1 id using http://www.stata-press.com/data/r13/overlap2
merge m:1 id using http://www.stata-press.com/data/r13/overlap2,update
merge m:1 id using http://www.stata-press.com/data/r13/overlap2,update replace

*1:1序贯合并：没有关键变量，按记录号合并
webuse sforce,clear
merge 1:1 _n using http://www.stata-press.com/data/r13/dollars


*注：1:m和m:1合并时，数据库间存在同名变量时：
	*默认以主数据中同名变量的变量值作为合并后的变量值
	*用update选项时：匹配的缺失值用using数据集的数据代替
	*用update replace选项时：匹配记录的值用using数据集的数据代替
	*在横向合并前使用cf命令查看主数据和从数据的变量的差别，具体可以help(cf)

cf _all using http://www.stata-press.com/data/r13/autoexpense,all

isid id   //用来判断id的值是否唯一

*----------------------------------------------*
*====       数据集的交叉合并：组内交叉   =====*
*---------------------------------------------*
*joinby命令：实现了m:m，具体help joinby
use "D:\黄静\child.dta",clear
describe 
list


webuse parent,clear
save "D:\黄静\parent.dta"

use "D:\黄静\parent.dta",clear
describe 
list

sort family_id
joinby family_id using child  //只保留匹配上的记录
joinby family_id using child,unmatched(both)  //保留主数据和从数据的所有记录
joinby family_id using child,unmatched(master)  //保留主数据记录
joinby family_id using child,unmatched(using)  //保留从数据记录

describe 
list

stata软件不出图_[求助]stata8画图总是画不出来，不知道为什么？请指点 weixin_39911998 stata软件不出图
+-------------+|x1x2||-------------|1.|2.61.67|2.|3.241.98|3.|3.731.98|4.|4.322.34|5.|4.732.5||-------------|6.|5.183.6|7.|5.583.73|8.|5.784.14|9.|6.44.17|10.|6.534.57|+-------------+graphx1x2(note:sc
linux进程sl状态,linux进程状态s和sl的区别 weixin_39830688 linux进程sl状态
PROCESSSTATECODESHerearethedifferentvaluesthatthes,statandstateoutputspecifiers(header"STAT"or"S")willdisplaytodescribethestateofaprocess:Duninterruptiblesleep(usuallyIO)IIdlekernelthreadRrunningorrun
linux进程状态 Ss,Ss+,D,R+,S< Thinkcortex Linux
ps-auxHerearethedifferentvaluesthatthes,statandstateoutputspecifiers(header"STAT"or"S")willdisplaytodescribethestateofaprocess:Duninterruptiblesleep(usuallyIO)Rrunningorrunnable(onrunqueue)Sinterrupti
人生苦短我用Python pandas文件格式转换程序喵D 人生苦短我用Python python pandas
人生苦短我用Pythonpandas文件格式转换前言示例1excel与csv互转常用格式的方法FlatfileExcelJSONXML示例2常用格式转换简要需求依赖export方法main方法附其它格式的方法HTMLPicklingClipboardLatexHDFStore:PyTables(HDF5)FeatherParquetORCSASSPSSSQLGoogleBigQuerySTATA前
微习惯复盘与感恩日记2022-04-30 小木山庄的溜溜
微习惯复盘：1、写论文15分钟：跟导师聊了一个小时，知道了接下来应该怎么做。整理了导师的指导和经验。又学了一点stata，还没学完，看来要明天才能学完了。2、看文献15分钟：无。3、阅读正经书15分钟：《你的身体是一切美好的开始》。看一些关于健康的书，让自己健康起来。4、写小说15分钟：报名了无戒学堂的马拉松，激励自己完成豆瓣马拉松吧。虽然今天也没有写小说，已经三天没有写了。没关系，明天一定写！5
双重差分模型DID PD我是你的真爱粉计量经济学金融
双重差分模型（DID）–潘登同学的计量经济学笔记文章目录双重差分模型（DID）--潘登同学的计量经济学笔记基本思想构造模型数据前提稳健性检验共同趋势（CT）检验安慰剂检验stata示例DID估计平行趋势检验安慰剂检验基本思想双重差分法可以理解为对随机分配实验的一种模拟，在没有随机实验的情况下去验证因果关系。步骤：分组：对于一个自然实验，其将全部的样本数据分为两组：一组是受到干预影响，即实验组；另一
HMM 隐马尔可夫模型初学（二）小贝学生信
1、HMM，HiddenMarkovmodel隐马尔科夫模型（1）天气举例假设不能直接观察天气阴晴雨情况，只能看到地面的潮湿情况（假如分为非常潮湿，一般潮湿，不潮湿三种对应A，B，C三种评级）。现在我一连观察了一周的地面潮湿情况（AABBCBA），是否能够判断这一周的天气？如上所述，有两类状态：一类是地面潮湿状态observationstata（A、B、C）；一类是天气情况latentstata（
倾向得分匹配法（PSM）姚利汪汪汪
2、PSM的stata应用以数据集ldw_exper.dta为例，该数据集包含结果变量re78（1978年实际收入），处理变量t（是否参加就业培训），协变量age（年龄），educ（教育年限），black（是否为黑人），hisp（是否为拉丁裔），married（是否结婚），re74（1974年实际收入），re75（1975年实际收入），u74（1974年是否失业），以及u75（1975年是否失业）
Linux 软链接和硬链接 Linux开发那些事儿
在Linux系统中，链接是一种文件共享的方式，它分为软链接和硬链接，对应的命令是ln什么是软连接软链接又叫符号链接,它类似于windows系统中的快捷方式，常用于将目录层次较深的文件链接到比较容易访问的目录中创建软链接使用ln-s源文件软链接命令就可以创建一个软链接，软链接可以对文件、目录、跨文件系统的文件或目录创建文件的软链接[root@ecs-centos-7tt]#stata.txt|gre
一文了解什么是倾向得分匹配PSM？ spssau
倾向得分匹配，在医学研究及计量经济领域都有广泛应用，其目的在于减少数据偏差和混杂因素的干扰。很多统计软件都支持PSM，如SPSS和stata。SPSSAU最新版本也提供了倾向得分匹配。下面我们就一起来了解下，究竟什么是倾向得分匹配？以及如何分析？PSM解决的是选择偏差问题（即控制混杂因素），倾向得分配比就是利用倾向评分值，从对照组中为处理做中的每个个体寻找一个或多个背景特征相同或相似的个体作为对照
Stata实证命令代码汇总 m0_71334485 #stata代码 stata实证命令 stata命令内生性解决
Stata代码命令汇总数据内容：包括数据导入和管理、数据的处理、描述性统计、相关性分析、实证模型、内生性解决、检验分析、结果导出具体如下：一、数据导入和管理：数据导入、数据导出二、数据的处理：生成新变量、格式转换、缺失数据、异常数据、重命名变量、编码分类变量、设定面板数据、数据合并、数据追加三、描述性统计：基本统计、变量的详细统计、变量的频率表、变量间的相关性、回归分析及其描述性统计、简单统计四、
学习笔记GMM（其三）天鹰_2019
天鹰（中南财大——博士研究生）E-mail:[[email protected]]在通过前两期对广义矩估计GMM基本理论了解的基础上，下面要做的就是如何在STATA中实现操作。本文所使用的数据是Arellano&Bond(1991)中的数据，具体数据可以在网上进行下载（webuseabdata）xtsetidyear----告诉Stata该数据为面板数据----browsegenlnemp=log
Meta分析入门工具介绍 Jabes
主要目的是先能够简单的复现一些论文的研究方法，按照计划是了解Revman，stata与R语言的相关分析方法即可。锚定复现的论文信息为：论文名称：Clinicalevaluationofprophylacticabdominalaorticballoonocclusioninpatientswithplacentaaccreta:asystematicreviewandmeta-analysis论文
Stata学习（1）何仙鸟学习
一、五大窗口Command窗口：实现人机交互来导入一个自带数据：sysuse是导入系统自带的数据，auto导入该数据的名称，后面的clear是清除之前的数据结果窗口：展示计算结果、查找功能在Edit的find可以实现查找功能，或者ctrl+f；清屏右击有clear回顾窗口：保存执行过的命令，漏斗可以进行筛选，点击后会自动跑到命令窗口，直接双击会执行导入编辑器可以保存：变量窗口：小箭头可以把变量搞到
stata学习（2）何仙鸟学习
先导入自带数据，保留几个变量方便操作生成一个新变量：表里就有了：把make空格后的内容取过来：对原来存在的变量进行修改：删除数据：row(N)也就是矩阵N的行数删除变量：画一个二维图像：qfit是曲线，lfit是直线通过grapheditor可以对图进行修改：画一个三维图：先载一个包：
数据统计分析三大软件之SPSS 科研侠
引言要做好研究，就需要数据，可光有数据是没用的，我们还要学会数据的分析，想要完美精确的数据分析结果就需要一个功能齐全，计算严谨的数据软件，今天我们要给大家介绍的是SPSS。作为与Stata/SAS一起成为世界公认的三大数据软件的SPSS，其功能齐全，操作简单，还具有强大的绘图功能。SPSS简介首先我们来了解一下SPSS，SPSS的英文全称为StatisticalProductandServiceS
Stata收敛性分析（含详细代码说明和样例数据） m0_71334485 数据 #stata代码收敛性分析 stata代码
Stata收敛性分析（含详细代码说明和样例数据）收敛性分析是管理科学和运筹学中重要的概念，是一种解决决策者对他们的管理策略的反馈的方式和手段。它的最终目的是帮助管理者从复杂的环境中筛选最优的解决方案。收敛性分析一般情况下会结合一些概念，例如实验研究，不确定性的分析，以及特定的决策环境，来解决特定问题。收敛性分析旨在帮助决策者认识和理解给定决策情境内的系统性知识组合。它由一系列步骤组成，从分析现有系
微习惯复盘与感恩日记2022-05-01 小木山庄的溜溜
微习惯复盘：1、科研15分钟：stata学完了！非常开心。虽然后半截其实没有很认真地学，因为是一些具体的实证方法，具体用到的时候才会理解得更好。我觉得这些就先知道一下，要用的时候知道在哪里找就行。毕竟只是这样听听课，其实对模型也只是浅尝辄止而已，更何况讲课的老师水平是真的不好，口头禅实在太多，听得我非常痛苦。我准备把“写论文”和“看文献”合并起来，大家都是搞科研，分开写太乱了，还是放在一起吧，给自
如何用stata进行样本配对古铜巧克力
我现在有一个数据库，有symbol，year，size，lev，ROA，top1，insown，ind，treated等变量要求：（1）根据同year同ind，相近的size，lev，ROA，top1，insown等特征变量，对treated=1的样本选择treated=0的匹配样本（1:1），（2）同时size，lev，ROA，top1，insown等为预选变量，我希望能够通过命令进行筛选，选择
stata面板数据回归九十辰科学软件专栏回归数据挖掘人工智能
使用工具：Stata，该工具是一个回归工具数据：面板数据回归函数：面板数据展示：回归过程将数据导入stata：会在变量窗口看到刚刚导入的四种数据根据我们的公式，需要lnrank和lnsize所以进行计算：得到新的两个变量genln_size=log(城市区域人口)genln_rank=log(rank)由于需要进行面板数据回归，所以先需要设置面板数据结构：xtsetcity_name年份由于xts
双重差分法 | 平行趋势检验 KEMOSABE
简单介绍一下实证论文中双重差分法（DID）的平行趋势检验（ParallelTrendTest）在Stata中如何操作。（本文首发于个人微信公众号DMETP，欢迎关注！）一、平行趋势假定平行趋势假定是实证论文中使用DID的前提，处理组与控制组的目标变量在政策发生前（事前）只有满足平行趋势假设才能使用DID。反之，如果处理组和控制组在事前就存在一定的差异，那么用DID做出来（可能还很好看）的结果就不再
Stata17安装教程老虎也淘气开发语言
文章目录**Stata17安装教程**前言系统要求Windows：macOS：Linux：软件下载正式安装1.下载Stata17安装包2.双击Stata17.exe开启安装3.接受同意条款，然后继续安装4.选择想要安装的版本，StataBE为基础版、StataSE为特别版、StataMP为并行计算版；这里选择StataMP版本5.这一步很重要：安装位置可以默认（默认是C盘），也可以自行更改，但更改
泛谈一下数字化技能的学习，SPSS、Stata还是Python？技术、业务+表达、展现！数据科学作家 python SPSS Stata SPSS学习数据分析统计分析机器学习
1.本科、专科上学时对于这些偏数学类的课程还是要好好学习应知乎、小红书、CSDN很多年轻朋友、同学们的邀请，今天我泛谈一下数字化技能的学习。很多学生在本科或专科上学时代学过统计学、计量经济学、机器学习、数据分析、统计分析、数据挖掘、量化建模等一门或多门课程，至少也学过概率论、数理统计、线性代数、微积分等课程，其实就已经具备了相对较好的数据分析基础。等到本科或专科毕业后，有的同学致力于读研、读博，也
各种数据类型meta在stata中的实现找兔子的小萝卜
连续型数据meta初步分析在STATA中的实现1数据提取要对连续性数据进行meta分析，需要提取每篇文章的分组情况、样本量、均值、标准差。需要初步整理为如下格式，如下图所示：image.png对文章效应指标的选择，目前使用较多的是加权均数差（WMD）和标准均数差（SMD）。1）WMD是对均数进行加权，让原始研究效应估计的精度性决定其在meta分析中的权重，消除了绝对值的大小对分析结果的影响。WMD
使用 CSMAR Stata API 自动下载数据虹衣剑客
CSMARAPI提供了Python、R、MATLAB和Stata四种接口，为我们从CSMAR上下载数据，提供了极大的便利性。API支持我们在上面四种编程软件中通过直接使用代码下载数据，而不必每次都要进入CSMAR官网、点选框格进行数据的筛选和下载。CSMARStataAPI的原理是基于Java语言开发的Stata插件（目前仅支持Windows系统），通过调用插件相关方法来实现CSMAR数据库的数据
STATA DEA代码说明及样本数据 m0_71334485 数据 #stata代码 DEA stata dea代码
STATA_DEA代码说明及样本数据含DEA模型代码和malmquist指数stata代码包含具体说明数据包络分析（Dataenvelopmentanalysis，DEA）是运筹学和研究经济生产边界的一种方法。该方法一般被用来测量一些决策部门的生产效率。DEA是一个线性规划模型，表示为产出对投入的比率。通过对一个特定单位的效率和一组提供相同服务的类似单位的绩效的比较，它试图使服务单位的效率最大化。
stata学习3：表达式及相应运算符号小记专家 stata学习
1.关系符号在stata中一共有6中关系符号，等于：“==”不等于：“！=”大于：“>”小于：“=”小于等于：“<=”2.逻辑符号stata运算中，通过加入一个或者多个逻辑符号，便可以将一个或多个关系运算符联系起来，stata中的逻辑运算符号有以下几种：或：“！”且：“&”非：“I”
Stata 爬虫：如何爬取并清洗民政部行政区划代码数据虹衣剑客
下载行政区划代码（Stata爬虫）Stata爬虫数据清洗与主数据对接（merge）这里使用的行政区划代码数据来自于民政部：2020年12月中华人民共和国县以上行政区划代码。首先网页爬取和数据导入。使用copy命令，可以在当前目录生成district_code.txt文件，这里存储的是网页源码。接着使用infix将TXT文件导入Stata。从导入的结果（上图右侧）来看，我们想要的区划名称和区划代码的
Stata 基本回归分析迷茫的小孩2
普通最小二乘估计方法(OrdinaryLeastSquare，简记为OLS)，是单一方程线性回归模型最常用、最基本的估计方法。1.小样本的普通最小二乘法分析OLS的基本思想就是通过让残差e的平方和最小，从而使得模型的估计成为可能。实验原理image.png#打开数据文件、观测数据特征sysuseusaauto,clearedit#关注一下原始数据及其统计特征describe#数据的统计特征regr
Python 自动化办公：一键批量生成 PPT 豆本-豆豆奶 python 自动化 powerpoint 深度学习开发语言学习
StataandPython数据分析一、导读在实际工作中，经常需要批量处理Office文件，比如需要制作一个几十页的PPT进行产品介绍时，一页一页地制作不仅麻烦而且格式可能不统一。那么有什么办法可以一键生成PPT呢？Python提供的pptx包就可以用来自动化处理ppt。pytho****n-pptx是一个用于创建和编辑MicrosoftPowerPoint(.pptx)文件的Python库。它能
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

Stata学习笔记

你可能感兴趣的:(stata)