课程概览
·时间:2020年1月9-10日(模块Ⅰ:python 数据挖掘)
2020年1月11-16日(模块Ⅱ:stata 应用能力提升与实证前沿)
·地点:浙江·杭州(浙江工商大学)
·主讲嘉宾:邓旭东(哈尔滨工业大学)、江艇(中国人民大学)、司继春(上海对外经贸大学)、王非(中国人民大学)、刘文革(课程总策划)、谢杰(课程总协调)
·价格:
模块Ⅰ:2500;模块Ⅱ:4800
优惠政策:两个模块一起报名九折;三人及以上九折;五人及以上八折;老学员九折;学生优惠200元/人。
·授课方式:
·Anaconda 、stata 14及以上
·每天6小时(8:30—11:30;14;00—17:00)+30分钟答疑
·课件数据和相关文献开课前一周发送;纸质版讲义由主办方统一印制
·授课内容:
模块Ⅰ:
邓旭东:python 基础、网络爬虫、入门文本分析、文本分析进阶篇
模块Ⅱ:
江艇:因果推断导论、截面数据因果推断的参数和非参数方法(上)、截面数据因果推断的参数和非参数方法(下)、面板数据因果推断的参数和非参数方法;
司继春:Stata基础与Stata16新功能、OLS:预测与解释、面板数据与动态面板模型、离散选择模型与非线性模型选讲;
王非:数据的获得及处理方法、数据分析流程、遗漏变量偏误及合成控制法、工具变量法理论与实操、断点回归法理论与实操。
注:本次课程按照缴费先后顺序排座位号
彩蛋:本次培训期间会安排一个神秘大咖分享论文课题经验
工作坊简介
为推动我国经济、统计等社会科学量化研究方法学习与应用,培养和训练社会科学相关领域的青年学者、硕博士研究生,促进社会科学相关领域研究方法科学化规范化,《python数据挖掘与stata应用能力提升与实证前沿寒假工作坊》提供一个高水平的学术交流、研究方法普及与研究经验分享的学术平台。工作坊采用模块式教学方法,不仅侧重经济、统计等社会科学量化基本方法的介绍,而且更加注重研究设计与研究选题训练,注重理论与实践相结合,培养学员的社会科学量化分析研究的综合能力。
在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。更可怕的是,Python不仅仅在程序员的圈子里很火热,在程序员的圈子外也十分受欢迎,从经济学、管理学、会计学到医学等等都在学习这样一门语言。主要原因在于,无论是Web程序开发、桌面程序开发还是科学计算、图像处理,Python都可以胜任。
本工作坊邀请走在爬虫分析和实证前沿前端的学者,可谓更强联手的重磅组合,期待在不断升级的富有现场即视感的软件平台,给您带来最前沿计量理论与扎实操作基础并重的高质量课程。
主讲嘉宾简介
邓旭东(大邓):哈尔滨工业大学(HIT)管理学院信息管理系统方向在读博士。曾在多所大学分享数据采集和文本分析,运营【公众号:大邓和他的Python】主要分享Python、爬虫、文本分析、机器学习等相关内容。
江艇:香港科技大学商学院经济学博士,中国人民大学经济学院副教授,人大国家发展与战略研究院研究员,人大微观数据与实证方法研究中心副主任,美国哥伦比亚大学商学院访问学者。主要研究领域为经济增长与发展、城市经济学、新政治经济学,在Economics Letters、Review of Development Economics、《经济研究》、《管理世界》、《世界经济》等国内外著名学术刊物上发表多篇论文。曾应邀在多所高校讲授“应用微观计量经济学”短期前沿课程,学员反响热烈。
司继春(慧航):上海对外经贸大学统计与信息学院助理教授,主要研究领域为微观计量经济学、产业组织理论。在 Journal of Business and Economic Statistics、《财经研究》等学术刊物上发表多篇论文。其实,大家更熟悉的是知乎上大名鼎鼎的[慧航],拥有 219,753 个关注者,获得过 110,578 次赞同,他就是司继春老师 —— [慧航]。
王非:美国南加州大学经济学博士,中国人民大学劳动人事学院副教授,人大国家发展与战略研究院研究员,全球劳动组织(GLO)会员,中国就业研究所副研究员。主持国家自然科学基金青年科学基金项目。主要研究领域为劳动经济学、人口经济学、主观福祉等,在 PNAS,Journal of Happiness Studies,Journal of Population Economics,China Economic Review,《人口研究》等国内外权威期刊上发表多篇论文。曾多次讲授微观实证研究方法,广受好评,《Stata简明讲义》作者。
课程安排
模块Ⅰ
Day 1 上午
主讲人:邓旭东(大邓)
课程安排:《Python基础语法》
1、python跟英语样也是种语
2、环境配置
3、jupyter notebook使法
4、数据类型-list、str、dict、tuple、set
5、for循环、if逻辑
6、try-except
7、常函数常库
8、pip安装问题解决办法
9、常见错误
Day 1下午
主讲人:邓旭东(大邓)
课程安排:《网络爬虫》
1、络爬原理
2、开发者具
3、使数据抓包
4、requests库
5、pyquery库
6、元素(数据)定位
7、数据存储(txt,csv)
8、案例分析
案例1:天涯论坛案例
案例2:众点评案例
案例3:BOSS直聘案例
案例4:百度企业信案例
案例5:京东评论
Day 2 上午
主讲人:邓旭东(大邓)
课程安排:《入门文本分析 》
1、本分析应场景
2、txt、pdf、word等类型件的数据读取
3、中分词-jieba库
4、可视化-pyecharts库
5、英通情感词库-Harvard-IV4
6、英融会计领域情感词库Loughran&MCdonald
7、常的中情感词典
8、中情感词典的构建及使
9、数据分析-pandas库
10、案例1-词频统计
11、案例2-制作词云图案
12、例3-海量公司年报本分析
13、案例4-使情感词典进情感计算
Day 2下午
主讲人:邓旭东(大邓)
课程安排:《文本分析进阶篇》
1、什么是机器学习
2、监督学习与监督学习
3、使机器学习进本分析的步骤
4、表达本数据信息的式(独热编码、词袋法、TF-IDF)
5、本可读性计算
6、公司年报信息含量(标准信息与特有信息)计算思路
7、理解特征矩阵、语料、档、特征
8、机器学习库-sklearn语法学习
9、了解协同过滤-推荐系统
10、案例分析
案例1-在线评论情感分析
案例2-本分类
案例3-LDA话题模型
案例4-计算消费者异质性信息
1、沈艳,陈赟,卓.本数据分析在经济学和融学中的应:个献综述
[EB/OL].http://www.ccer.pku.edu.cn/yjcg/tlg/242968.htm,2018-11-19
2、Loughran T, McDonald B. Textual analysis in accounting and fifinance: A survey[J]. Journal ofAccounting Research, 2016, 54(4): 1187-1230. Author links open overlay panelComputationalsocioeconomics 3、魏伟,郭崇慧,陈静锋.国务院政府作报告(1954—2017)本挖掘及社会变迁研究[J].情报学报,2018,37(04):406-421. 4、孟庆斌, 杨俊华, 鲁冰. 管理层讨论与分析披露的信息含量与股价崩盘险——基于本向量化法的研究[J]. 中国业经济, 2017 (12): 132-150. 5、 王伟,陈伟,祝效国,王洪伟. 众筹融资成功率与语格的说服性-基于Kickstarter的实证研究.管理世界.2016;5:81-98. 6、Chan J T K, Zhong W. Reading China: Predicting policy change with machine learning[J]. 2018. 7、Hansen S, McMahon M. Shocking language: Understanding the macroeconomic effffects ofcentral bank communication[J]. Journal of International Economics, 2016, 99: S114-S133. 8、Wang, Quan, Beibei Li, and Param Vir Singh. "Copycats vs. Original Mobile Apps: A MachineLearning Copycat-Detection Method and Empirical Analysis." Information Systems Research29.2 (2018): 273-291.模块Ⅱ
Day 1上午
主讲人:江艇
课程安排:《因果推断导论》
1、何为因果推断?
2、传统因果模型
3、实验数据与观测数据
4、观测数据研究的基本挑战
5、潜在因果模型
6、分配机制与识别假设
7、潜在因果模型与传统因果模型的关系
Day 1下午
主讲人:江艇
课程安排:《截面数据因果推断的参数和非参数方法(上)》
1、非参数方法的工作原理
2、参数方法的工作原理
3、插曲之一:线性回归中的控制变量
4、插曲之二:交互项模型
Day 2 上午
主讲人:江艇
课程安排:《截面数据因果推断的参数和非参数方法(下)》
1、参数方法与非参数方法的比较
2、匹配方法实操
3、(选讲)逆概率加权与双重稳健估计
4、(选讲)条件平均处理效应
Day 2 下午
主讲人:江艇
课程安排:《面板数据因果推断的参数和非参数方法》
1、面板数据固定效应模型
2、双重差分法的识别和估计
3、双重差分法常见问题剖析
4、双重差分与匹配的结合
5、(选讲)半参数双重差分估计
6、非参数方法初步及其与参数方法的区别和联系
7、(选讲)模糊双重差分
Day 3 上午
主讲人:司继春(慧航)
课程安排:《Stata基础与Stata16新功能》
1、Stata基础:基本操作与数据操作、数据框操作
2、Stata基础:分类变量与数值变量的描述性分析
3、Stata进阶:宏
4、Stata进阶:条件与循环
5、Stata进阶:Stata与Python的结合
Day 3 下午
主讲人:司继春(慧航)
课程安排:《OLS:预测与解释》
1、如何估计条件期望:OLS
2、预测:过拟合、欠拟合与交叉验证
3、预测:使用LASSO回归进行变量选择
4、HCW方法的LASSO方法实例
5、作为因果推断的OLS:控制变量与固定效应
6、作为因果推断的OLS:系数的解释
7、作为因果推断的OLS:异方差稳健标准误与聚类标准误
Day 4 上午
主讲人:司继春(慧航)
课程安排:《面板数据与动态面板模型》
1、面板数据:固定效应与随机效应
2、面板数据:交互固定效应
3、工具变量简介
4、动态面板模型的实现:差分GMM与系统GMM
5、动态面板应用举例
Day 4 下午
主讲人:司继春(慧航)
课程安排:《离散选择模型与非线性模型选讲》
1、分位数回归
2、离散选择模型:Probit、Logit回归
3、计量经济学中的离散选择模型:理论基础与解释
4、多元选择模型:多项Logistics回归
5、多元选择模型:顺序选择模型
6、多元选择模型:分类树、随机森林及其Stata实现
7、其他非线性模型:删失样本模型(Tobit模型)、样本选择模型(Heckman两步法)
Day 5 上午
主讲人:王非
课程安排:《数据的获得及处理方法》
1、常见公开数据库介绍
2、数据的获得和熟悉
3、数据清理流程
4、数据描述方法
Day 5 下午
主讲人:王非
课程安排:《数据分析流程、遗漏变量偏误及合成控制法》
1、数据分析“三件套”:稳健性、异质性和机制分析
2、遗漏变量偏误的估算
3、合成控制法的基本原理和前提假设
4、合成控制法的运算、解读和检验
5、合成控制法的软件操作及论文结果现场复制
Day 6 上午
主讲人:王非
课程安排:《工具变量法理论与实操》
1、工具变量法的基本原理和前提条件
2、工具变量法的操作步骤
3、工具变量的寻找方法
4、工具变量的有效性检验
5、工具变量法的软件操作及经典论文现场复制
Day 6 下午
主讲人:王非
课程安排:《断点回归法理论与实操》
1、断点回归法的基本原理及两类情形
2、断点回归法的估计过程
3、断点回归法的一揽子检验
4、断点回归法的软件操作及前沿论文现场复制
报名信息
参加对象:全国高等院校及研究机构从事经济科学研究的青年教师。尤其适合那些希望掌握高级实证方法,提升量化研究设计能力和国家课题申报能力的研究者。
参会费用:
模块Ⅰ:2500元/人;模块Ⅱ:4800元/人;
优惠政策:两个模块一起报名九折;三人及以上九折;五人及以上八折;老学员九折;学生优惠200元/人。交通与食宿费自理,提供歌江维嘉大酒店周边住宿信息。
住宿安排:工作坊签约四星级酒店,标间或大床房每天约350元,含自助早餐;或附近旅馆标间、大床房每天约200元,会务组提供住宿咨询。
报名时间:从即日起(按缴费顺序安排教室座位)。
报名咨询:19817117852(丁老师)
交通路线指南:杭州东站搭乘地铁1号线下沙江滨方向(注意不要选择间隔的临平方向),40分钟即达报到地点:钱塘新区高教园区东区27号大街301号(地铁1号线云水站旁)歌江维嘉大酒店;在萧山国际机场打的约半小时到达钱塘新区高教园区东区歌江维嘉大酒店。
缴费信息:
单位:杭州国商智库信息技术服务有限公司
开户银行:中国银行杭州大学城支行
银行账户:6232636200100260588
特别提示:为不影响各单位、老师、同学的日常工作和学习,工作坊安排在假期举办。如果一些机构寒假期间暂停财务工作,建议拟报名同学老师在之前办理相关事项,报到则可拿到发票,以免等到春季开学办理而可能有所影响相关程序。
欢迎大家进群咨询!