关于社会科学研究方法的思考

该文把 “抽样数据等”归类为 第二范式的研究,而把大数据下的研究成为第四范式

大数据与抽样数据相比的优势——摘自《第四研究范式:大数据驱动的社会科学研究转型》

大数据将大大改变传统社会科学以抽样调查为基础的数据获取和分析方式,从数据支撑层面提升社会科学研究的“科学性”。

( 1) 大数据改善变量的测量。在大数据环境中,个人和环境将会“不自觉”“不自知”地加入数据搜集的过程中,数据获取从观测上升为感知记录,优化了变量的“测量”。大数据技术通过智能终端、物联网、云计算等技术手段来“量化世界”,各种延伸和拓展人类感官感知能力的技术设备层出不穷,乃至于完全或接近完全取代人类对外部世界的直接感知,通过把数据呈现给人类,成为人类认识的来源。我们所知的世界将会全部是数据表达的。

( 2) 全样本的整体性分析,田野研究与实验研究的统一。大数据时代可以分析与研究相关的更多数据,甚至是多源异构数据,而不再依赖于单纯的采样。大数据可以通过海量规模的全样本直接呈现或发现社会现象或规律,既不需要控制变量来检验关联,又能避免选择方面的样本偏差。

( 3) 大数据提供了多样兼容的容错性。虽然大数据不能解决反事实问题和遗漏变量误差,但由于数据的海量性甚至全样本的性质,一旦把基于大数据的简单关联分析或时间序列分析结果与文献中的传统回归分析进行比对,就能形成非常具有说服力的证据链。

( 4) 大数据提供现象的相关性涌现。当拥有海量数据时,绝对精准不再是追求的目标,适当忽略微观层面的精确度,将提升社会科学在宏观方面的洞察力。“科学家不再必须做出受过良好训练的那种猜想,或者构想假设和模型,通过基于数据的实验和例子来验证它们。相反,它们能够为显示效果的模型采集完整的数据集,来产生科学结论,而无需更进一步的实验”。

( 5) 大数据的核心技术是数据挖掘,使用人工智能的机器学习从海量数据集中发现模式和知识。在数据驱动下,使用统计学、机器学习、模式识别、数学模型等方法进行探索式的知识发现和数据挖掘,海量数据的全样本性质使得数据挖掘能够分析数据质量、聚焦社会过程和关系、处理非线性的有噪音的或概念模糊的数据等,与依赖简单数量关系的定量研究和传统计算机仿真研究范式相比,依赖海量和实时在线数据的挖掘和学科广泛参与的大数据分析更能够客观反映社会发展的历史、现状和规律。

你可能感兴趣的:(关于社会科学研究方法的思考)