文本分析论文基本方法论

思路二

参考论文
01政策文献量化研究_公共政策研究的新方向_黄萃(2015年4月)

一、政策文献量化研究的分析方法有两种

1.政策内容量化(定量与定性相结合的一种语义分析方法,目的是测量政策内容中本质性的事实和趋势,通过对政策文献内在特征分析,解释政策内容所含的隐形信息,并推论政策制定的前因、推断政策实施的效果。)

2.政策文献计量(一种量化分析政策文献的结构属性的研究方法,更多地关注大样本量、结构化或半结构化政策文本的定量分析)
文献计量方法在政策文献结构要素上的数据依托:
时间:时间序列分析、频次分析
颁布机构:频次分析、网络分析
文种:频次分析
主题词:频次分析、共词分析、网络分析
参照关系:频次分析、共引分析、共被引分析、网络分析

二.政策文献量化研究的研究范式

1.政策变迁研究
描述与呈现政府执政理念的转变过程,通过对长时间周期内大样本量 政策文献进行量化研究,可以定量地、可视化地描 绘和呈现政策主题特点的变化。
通过对各历史阶段政策文献“主题词” 进行频次分析、共词分析与聚类分析,可以客观、清晰地描述和总结出不同时期的主题热点以及政策主题变迁历程图,实现客观性与可重复性,可以与质性研究相结合,从而避免在政策变迁研究中的主 观性与不确定性缺陷。
共词分析是通过统计两个主题词同 时出现在同一政府文献中的次数,发现主题词之间的关系。
聚类分析则进一步将关系密切的主题词聚集起来形成族群,聚类的标准是最大化组间差异,最小化组内差异。
研究中首先在每篇政策文献中确立 3~4 个主题词,通过词频统计建立高频主题词的共词矩阵,而后进行聚类分析并绘制共词词簇图。

2.府际关系研究
观测指标:不同政府部门的联合行文
研究方法:借鉴科技论文中的合著网络分析,对政策文本的联合行文关系进行分析, 以此描述政府部门间的合作关系,揭示某一政策领域的政府活动规律

科技政策文献主要来源于我国国家立法机关、中央政府及其科技部、发改委、财政部等主要组成部门颁布的科技相关领域的法律、行政法规、部门规章和规范性政策文件等文献的信息

科技政策主要颁布部门之间网络结构的指标值及其变化(可供参考的指标)
节点、连接、子网、单节点子网数、直径、平均路径长度、网络密度

3.政策关联研究
解析政策文献之间参照关系与知识扩散
政策文献之间的关联既可以体现出政策制定的基础和起点,又可以反映出政策意图的继承、发展和进步的脉络,政策文献之间的参照引用实际上是政治价值传递和理念扩散

参照关联
可能体现在政策的标题中,也可能存在于正文中
既包括以政策文献内容形式呈现出的显性关联,又包括以政策意图相似呈现出的隐性关联

通过语义进行关联引用,目前有特定的10种提示词

而其结构要素“时间”、“发布主体”、“文种”、 “文献编号”、“主题词”、“参照关系”都具备自身特性信息涵义,这又提供了方法拓展与创新空间

你可能感兴趣的:(数据挖掘)