下面的推文内容是我在这学期期初组会上给研一学弟学妹做的一点经验分享,大概主题是如何选题 + 如何做规范的经济学/金融学实证研究,内容略有增删。
N o t e : Note: Note: 1、该文首发于微信公众号
DMETP
,欢迎关注;2、组会PPT可在公众号后台回复关键词ppt
获取;3、在PPT中,下划线文字代表超链接,在全屏状态下可点击跳转。
这次组会由我主讲,内容主要包括两个问题,一是怎样找到一个自己感兴趣的,并且又不那么“落伍”的选题。第二个问题是在找到一个比较好的选题后,怎样做一项规范的经济学实证研究。
第一个问题是,怎样找到一个自己感兴趣的选题。需要提前说明的是,我们的选题应该还是在金融学这个框架内的,不能脱离金融学这个框架来选题,特别注意应该避免选择一个纯粹的经济学的题目。但这并不是说我们的选题不应该考虑经济学问题,恰恰相反,我们的选题就应该直面过去已经出现、现在正在经历甚至未来可能浮现的重大经济问题,就比如说最近比较热门的“碳中和碳达峰”、“第三次分配”和共同富裕等问题。面对这些经济问题,我们应该思考,金融这一因素是否能够为解决这些问题发挥一些作用?为了解决这些问题,金融发挥作用的余地在哪里,或者说,金融发挥作用的具体机制是什么?比如说“碳中和、碳达峰”,肉眼可见,“双碳”目标必然是未来十几年甚至几十年现实经济领域和相关学术领域的热门话题,那么,对于这个话题,金融是否有发言权呢?其实仔细思考就会发现,对于工业企业来说,“双碳”目标体现在环境保护和能源利用效率提高两个方面,那么现实中金融是否对工业企业的环保和能源利用起到一个促进作用呢?因为从理论上来说,金融的资源配置功能能够促进资源向有利于环保和能源利用效率提高的方向集聚,利用金融的资源配置功能或许能够达到“双碳”目标。事实上,我国分别在2012年和2015年发布了《绿色信贷指引》和《能效信贷指引》,这两个政策文件中明确写明要利用金融系统的资源配置功能促进工业企业的清洁生产、促进制造业企业的绿色化转型、促进我国能源结构的优化转型。因此,我们的论文可以是具体评估这两个政策是否有效,政策实施过程中是否还存在某些问题,对于我们当下工作的开展是否具有重大的指导意义?
但是,找到一个较好的选题是不容易的,可能我们找到了一个关键词A,想研究B对A的影响,但在正式开始写文章的时候一定要问问自己,现实中B是否确实对A具有影响,直接影响还是间接影响,间接影响到底有多间接?回答这些问题一方面需要常识,另一方面就需要深厚的经济学理论和学术研究思维,此时就需要我们大量阅读相关文献,阅读高质量的文献。
高质量文献出自顶级期刊,比如说国内的经济研究、管理世界、世界经济、中国工业经济和金融研究,这里我比较推荐中国工业经济,因为中国工业经济上面的文章一般都会把他们的数据与代码公布在他们的官网上面,这样你可以对论文实证结果进行复盘与验证,也可以学习他们的方法,因为限于篇幅很多实证细节并不会写在论文主体部分。国外期刊比如说美国经济评论AER、JPE、QJE、RES等等,前面几个一般研究纯粹的经济学问题,后面三个为金融学领域的顶刊。美国经济评论AER部分论文的数据和代码可以下载,但是需要会员账号。第三个获取高质量论文的渠道就是作者的工作论文working paper,工作论文可以说是正式论文的草稿,一般篇幅都比较长,但包含很多的细节,比较典型的working paper就是NBER,国外学者有写工作论文的习惯,而且如果他们的工作论文发表在了NBER,之后一般都会发表在AER这样的顶刊上面,只不过是发表时间长短的问题,有些发表周期长达十几年。除了这些官方的工作论文,部分学术大佬也会专门有一个个人主页,比如说空间计量领域的权威学者Elhorst,以及复旦大学的陆铭老师,他们的个人主页也经常会有他们研究团队的最新成果,某些成果影响力巨大,比如说Elhorst公布的面板数据空间计量模型的matlab命令包,现在做面板数据空间计量的一般使用的就是这个。
然后就是怎么在网上搜索文献,可能我们第一个想到的就是CNKI知网,但是,知网的高效利用不是简单的在搜索框打下几个关键词,然后回车搜索结果,这里介绍几个比较有用的功能(省略)。除了知网,百度学术的功能也很强大,特别是在搜索外文文献方面。一般我们搜索外文文献用的就是WOS,然后发表年代比较久远的文献就在JSTOR上面进行搜索。但这些只是一些搜索手段,我们还需要把这些搜到的文献下载下来,很多时候这些网站不提供下载,并且我们去出版商处下载这些文献如果我们学校没买大概率是需要付费的,而且价钱不便宜,这时候就需要一个科研神器——scihub,举个例子(省略)。
文献下载之后我们可以在endnote或知网研学中进行管理,endnote支持中英文文献(省略),知网研学是CNKI自己开发的软件,我没用过所以就不介绍。
其他一些工具软件还有:谷歌浏览器,我主要使用的是他的网页翻译功能,并且对大多数网页都比较兼容,然后就是知云文献翻译,这个软件可以进行划词翻译,支持多个翻译渠道,比如说有道、谷歌、百度、搜狗,还有几个专业翻译功能,最后就是福昕高级PDF编辑器,这是一个付费软件,相对于免费的adobe,我更喜欢福昕,因为用它阅读文献比较体验比较好,字体不会改变,还可以编辑修改,甚至可以整体转为Word和PPT,功能比较强大。
除了阅读文献,我们还可以关注国内外经济动态以及阅读官方报告和政策文件来形成我们的选题。比如说《中国社会科学》,《中国社会科学》上的大多数文章本质上也是学术论文,而且很多论文研究的问题不是经济学领域的,但关注这上面的文章可以让我们了解当下中国最紧迫的重大现实问题,《半月谈》同理,但《半月谈》就是纯粹的杂志了。中国金融四十人论坛和金融学前沿论文速递是两个微信公众号。然后还可以阅读各个季度央行发布的货币政策执行报告,十四五规划的经济问题部分以及其他官方公布的政策文件,比如说上面提到的《绿色信贷指引》和《能效信贷指引》,其实绿色金融这个概念在2007年7月份就在《关于落实环保政策法规防范信贷风险的意见》中提出来了。
第四点是不建议的选题类型。第一个是某某某的影响因素研究,第二个是某某某的测度方法研究,但需要提前说明的是,这里不建议并不意味着这类选题不重要,恰恰相反,研究某个关键问题的影响因素以及对某个关键指标的精准测度是非常重要的,比如说心理学领域经常使用SEM结构方程模型来研究人类后天性格养成的影响因素,国内地理学领域的顶刊《地理研究》就经常研究影响某个地理事件形成的因素。
然而,这类选题如果应用在经济学领域将出现的问题是,影响某个关键变量的因素有很多个,如果我们把这些因素都放在我们的论文中,就会集中出现一个问题:关注核心解释变量的内生性问题是经济学研究的常规操作,并且研究这个核心解释变量影响结果变量y的稳健性与机制是经济学论文的底层逻辑与基本思路,但是一旦加入多个核心解释变量,就需要关注所有核心解释变量的内生性、稳健性与机制,这样的话就会严重分散我们的精力,并且对于每个核心变量来说,他们对y的影响系数或者说边际效应将变得模糊,可能你多加入一个变量系数就会发生巨大变化。因此,经济学应该研究单个核心解释变量对y的影响,其他重要变量作为控制变量即可。
其次是测度某个变量的研究,这类研究存在三点比较明显的问题:一是构建的指标体系相对主观,就算基于已有理论来构建体系,体系下的具体子项指标很难满足代表性和可得性的要求;二是利用这样的指标建立模型很容易导致回归结果显著,因为只要你把某一个和核心解释变量强烈相关的指标放到这个体系中,很容易人为造成显著的结果,这也是经济学研究中多数严谨的学者不考虑使用构造指标的原因;三是这类文章基本不会考虑因果推断,也就是内生性问题,变量之间可能只有相关性,并且这种相关性还很强,但没有因果性,很多复杂的指标体系模糊了相关性和因果性的界限,这在经济学领域中是一个大忌。
五是两个较为合适的选题类型。一个是A、B式,两个因素,其中一个是核心解释变量,一个是被解释变量。比如说山东财经大学的王馨和王营老师今年发表在管理世界上的文章《绿色信贷政策增进绿色创新研究》。绿色信贷政策是核心解释变量,企业绿色创新作为被解释变量;再比如说杨胜刚老师和他的博士生戴鹏毅以及湖南师大的袁礼老师今年八月份发表在世界经济上的文章《资本市场开放与企业全要素生产率》。第二个是A、B、C式,B可能作为A影响C的一个关键机制变量,也就是说A通过影响B,进而影响C,或者A和B共同影响C。比如说人大马勇老师和他的博士生庄毓敏去年发表在金融研究上的文章《金融发展、企业创新与经济增长》,其中金融发展是核心解释变量,经济增长是被解释变量,企业创新是金融发展影响经济增长的关键机制。
最后提供几个比较热门的金融学研究话题:金融开放,绿色金融,金融创新、数字金融和普惠金融,其中金融开放和普惠金融最近几年发的文章比较多,绿色金融、数字金融比如是未来金融学甚至是经济学领域的研究热点。经济学和金融学研究其实有一个比较突出的属性,那就是比较追热点,原因除了文章好发之外,更重要的在于你做的研究对现实经济的运行一定要有指导意义,社科类的研究讲求一个成语:经世致用。这就意味着,我们做的东西,一定要有足够的现实价值与实践意义,做出来的东西能够反映出现实经济运行的某些规律,洞察现实经济运行过程中的存在的问题,并提出中肯的、独特的、一语中的的政策建议。
第二个问题是,怎样做规范的经济学实证研究。首先应该明确一个观点,我们做的实证研究只是为了证明某个观点,我们在论文实证部分所做的一切回归、检验都只是为了辅助证明你提出来的观点,不能为了实证而做实证,实证部分可以使用简单的、通用的数据和模型,也可以使用复杂的、独特的数据或者模型,你甚至做出花来也没问题,但最基本的要求是你的数据和模型确实能够证明你的观点,证明你的机制的的确确是存在的、显著的、无可争议的,你做的东西确实能够说服读者、审稿人接受你的结论、你的观点、你的政策建议。
这一Part我打算分两部分讲,第一部分是准备篇,也就是说要做出规范的实证研究你需要具备的某些技术性能力。
第一个是数据搜集,我将数据搜集分为三个渠道,第一个是官方渠道,比如说国家统计局公布的数据,但统计局公布的数据检索和下载相当麻烦,其实知网除了提供论文服务,还整理了统计局公布的所有数据,我个人觉得比较方便(省略)。其次是做某些研究需要使用的特定数据,这些数据没有官方的下载渠道,基本上也没有人会整理,因此需要我们自己亲手在他们网站上面把这些数据爬取下来,比如说你想研究地区产学研结合程度对企业创新的影响,地区产学研结合程度的一个公认指标是地区博士后工作站数目,这个数据我们可以在人社部留学人员和专家服务中心获得,但是这些数据需要你自己亲手搜集,网站并不会给你整理。这个时候,自己一个一个手工搜集是极其不现实的,这个时候就需要利用Python进行网站数据爬虫。
第二个是商业渠道,比如说国泰安的CSMAR、EPS、和CNRDS数据库,这些数据库的数据来源相对可靠,基本上也是官方公开的可靠数据,但相对于统计局和知网,这些数据库的数据比较完整,整理方式也比较符合我们的使用习惯,比如说EPS的微观经济数据查询系统,这个数据库包括工业企业数据库、企业污染数据库和企业创新数据库。但是这些数据库并不是免费的,我们学校可能已经购买,但不一定会购买全库(省略)。第三个渠道也是我本人最不推荐的一种渠道,包括作者自己公布的数据,比如说中国工业经济官网上面公布的数据,还有经管之家的数据、淘宝上的数据、其他一些公众号提供的数据,比如说马克数据网、Rstata等等。这些非官方的数据有一定的用处,可以用于初步验证自己的猜想,但绝对不能用于正式的写作!
数据搜集之后,一个关键问题是怎么进行论文写作。首先,学术论文不是你高中写的作文,你本科写的报告,更不是你每天写的日记。学术论文要求有“学术”味儿,言语辞藻应该是严谨的、规范的、平实的、精炼的。其次,多看看中外Top期刊上面的文章,学习他们的写作范式,这里推荐几篇国内的论文,他们的行文思路可以称得上是典范,建议仔细、多次研读(省略)。
(实战篇的内容详见往期推文,这里省略)