计算社会学发展

▶1.社会可计算吗

一些观点认为,个体行为与社会活动规律如此复杂,很难运用严谨的科学方法进行逻辑推理或精确的定量计算。社会可以计算吗?2009年2月,以哈佛大学教授大卫·拉泽尔(David Lazer)为首的15位来自美国不同学科的教授联名在《科学》杂志上发表了题为《计算社会科学》的论文。此后,这被看作是一个新兴研究领域诞生的标志。计算思维的方法融入人文社会科学目前虽然不乏争议,但是深刻地改变了传统人文社会科学的研究模式。
计算社会科学是利用大规模数据收集和分析能力,揭示个人和群体行为模式的科学。对计算社会科学家而言,大数据时代不仅需要“记录”,更需要“计算”,从看似日常而随机的个体行为与社会运转中,获得对人类社会、经济、政治等更深刻、更具前瞻性的解读。
从计算角度看,微博就是一个矩阵,在特定研究范围内,就是n个博主之间的关系矩阵。可以采用线性代数、矩阵运算、图论等方法建立数学模型。

计算社会科学彻底打破了人们对人文科学的传统观念和原有的学科划分。计算社会科学需要人文学家和计算机科学家的团队合作工作。从大学来看,要考虑是培养计算社会学专业人员,还是要培养懂计算机的社会学专业人员或懂社会学的计算机科学专业人员。

▶2.海量数据的获取与分析

目前人们广泛地以各种不同方式生活在各种网络中,人们频繁地检查电子邮件和使用搜索引擎,随时随地拨打移动电话和发送微信,每天刷卡乘坐交通工具,经常使用信用卡购买商品。写博客、发微博、通过聊天软件来维护人际关系。在公共场所,监视器可以记录人们的活动情况;在医院,人们的医疗记录以数字形式被保存。以上的种种事情都留下了人们的数字印记。通过这些数字印记可以描绘出个人和群体行为的综合图景,这有可能会改变我们对于生活、组织和社会的理解。
Facebook网站是世界上最大的社交网络,截至2008年存储了30PB的数据,在2009年Facebook每天会产生25TB的日志数据。这些数据中蕴含着关于个人和群体行为的规律
人民大学孟小峰教授认为,传统社会科学一般通过问卷调查的方式收集数据,以这种方式收集的数据往往不具有时间上的连续性,对连续的、动态的社会过程进行推断时,准确性有限。计算社会科学以数据挖掘与机器学习为核心技术,使用人工智能技术从大量数据中发现有趣的模式和知识,在数据的驱动之下,进行探索式的知识发现和数据管理。通过数据挖掘,计算社会科学家可以处理非线性、有噪音、概念模糊的数据,分析数据质量,从而聚焦于社会过程和关系,分析复杂的社会系统。
例如,可以通过电子邮件,研究一个群体是趋向稳定还是趋向变化,成员之间什么样的交流模式有利于提高效率,接收信息的多样化是否会提高成员的活力和表现等问题;
可以通过电子商务网站的查询和交易记录,以及网上电话记录等范围覆盖全球的人际互动数据,研究人际互动在经济生产力、公众健康等方面产生的影响;
可以利用互联网上的搜索和浏览记录,研究什么是当前公众最关心的焦点问题。

▶3.谷歌图书词频统计数据库

2010年,谷歌公司推出了与哈佛大学合作的科学实验项目“图书词频统计器”(Google Books Ngram Viewer)。这个系统基于谷歌图书馆已有的520万本数字化图书(占这一时期图书总量的4%),并对数字图书库中5亿个词汇的单词和短语,以及它们每年出现的频率进行了统计,这些图书最早出版于1800年,最迟到2000年,其中包括了英语、法语、西班牙语、德语、中文和俄罗斯语图书。
登录谷歌图书词频统计网站(http://books.google.com/ngrams/),只要在搜索栏输入要搜索的词汇,便可看到1800—2000年的词汇变化。以中文词汇为例,主要的变化在20世纪初、20世纪40年代和80年代,词频的数据增减曲线代表着时代和文化的变化。如输入love(爱情)这个词汇,分别在20世纪30年代、60年代达到两个小高潮,在20世纪80年代则到达了最顶峰;如输入industry(工业)一词,在20世纪60年代和90年代出现了两个高峰。英文词频的变化同样显示了英语国家的社会变化,如woman(女性)一词在20世纪70年代很少出现,但之后却开始出现高峰,这和西方国家女权主义运动同步。

▶4.计算社会科学的制约因素


计算社会科学的发展中还有很大的体制性障碍。从研究方法层面分析,在物理学和生物学中,夸克和细胞既不会介意我们发现它们的秘密,也不会对于我们在研究过程中改变它们的环境提出抗议。而从社会学到计算社会科学的变化中,很大程度上需要解决分布式监控、许可权获取和加密等问题。
最棘手的挑战在于数据的访问和隐私问题。社会科学家感兴趣的大部分数据是私有的(如移动电话号码和金融交易信息等)。因此,迫切需要一种由技术(如同态加密)和规则(如隐私法)构成自律机制,来实现既降低风险又保留进行研究的可能性,更需要建立一种社会与学术界合作的模式。

你可能感兴趣的:(学习)