【科研】计算社会科学与复杂科学

【科研】计算社会科学与复杂科学

简单摘录以下“计算社会科学”研究的相关内容,老刘已经不感兴趣了,可是既然开始了就得收好尾巴。

一、什么是社会计算学(social computing)

  • 定义:
    • 社会计算学是社会学、计算机科学、复杂系统、物理学等多领域交叉的学科,社交网络分析、自然语言处理、机器学习、系统动力学、多主体建模等技术在这一领域碰撞融合,逐渐挖掘出信息时代社会行为的深层规律。
    • 简单来说,就是利用复杂技术解决社会学科问题
  • 诞生:
    • 2009年,以哈佛大学的David Lazer、MIT的Alex Pentland等为首的十六位科学家联合在著名期刊《Science》上,发表了题为“计算社会科学”的论文,标志之这一新型交叉学科的诞生。
  • 关心什么问题?
    • 大范围:大型公司,政府,社会
    • 小粒度:细节的、特异的、真实的个人粒度的信息,可以通过各种电子设备自动记录
    • 长时间:组织/社会的网络关系、结构模式等如何交互,如何演变,如何治理,如何稳定
  • 社会现象中的常见科学问题:
    • 社会现象涉及大量且异构的实体的相互作用,随时间推移,其行为在多个尺度上展开
    • 因此,针对于某一个机构(组织),考虑:
      • 内部实体:机构中工作的个人;
      • 外部交互:与其竞争、合作、比较的其他机构;
      • 内部逻辑/制度:运行所依靠的制度和监管结构;
      • 以上要素之间的相互作用

二、计算社会科学研究方法

传统社会科学学科分类:社会科学、心理学、人类学、经济学、政治科学
当代社会科学研究方法:统计学、数学、计算
研究方法目的分类:描述和归纳(统计)、发展理论研究(数学)、模拟复杂系统(计算)

  • 计算社会科学通过信息处理先进的计算方法,对社会系统进行综合性的跨学科的研究

2.1 自动信息提取 Automated information extraction

  • 用途之一:获得“事件数据”(events data)
  • 分析方法:
    • 时间序列分析、语义分析、隐马尔科夫模型、微波分析、事件生命周期建模、自动文本提取算法和系统(文本挖掘,如从图论和社交网络中分析)
  • 应用:
    • 挖掘实时数据流(如新闻广播、其他电子报告),进行异常检测和预警,趋势监测、评估、干预,以及项目执行等
    • 除了文字文本之外,还可以分析音频、图像、视频

2.2 社交网络分析 SNA

  • 以纯粹的数学理论为基础,社交网络图更像是一个数学图(点、边与现实世界的映射)
  • 研究兴趣
    • 社交网络可视化
    • 网络性质的理解:网络适应性、功能性、弱点及网络分解(根据网络的节点和关系的结构模式,如弹性、脆弱性、可分解性、功能性等,得出关于组织结构更深层次的信息)
  • 研究成果举例
    • Stanley Milgram:“小世界”网络

2.3 地理空间分析/社会地理信息系统 socio-GIS

  • 发展方向:
    • 地理空间科学(如:Google地球及其数据设施的发展)
    • 成立国家地理信息与分析中心,致力于地理信息科学及其相关技术(包括地理信息系统)基础研究和教育

2.4 复杂系统建模 Complexity modeling

  • 复杂系统:个体之间的相互作用比较复杂的系统(如:生态系统、经济市场、社会系统)
  • 复杂系统特征:
    • 非线性、涌现、自适应等,因此不能使用普通的、简单的线性模型来表示
  • 常见复杂系统建模方法:
    • 神经网络建模、基于主体的建模方法、遗传算法、粒子群优化算法、蚁群优化算法等
  • 意义——复杂系统的理论模型,为社会科学中的非均衡系统的动态分析提供了理论支持
    • 非均衡动态系统举例:恐怖袭击、发展中国家的财富和贫困、政治不稳定、外国援助分布、国内外冲突等
    • 均衡系统特点:状态变量接近正态分布(高斯分布或“钟型”分布),很少偏离中心
    • 非均衡动态系统特点:系统中的几个重要变量遵循幂律分布,如战争死亡率

2.5 社会模拟模型 Social simulations models

  • 仿真/模拟(Simulation):泛指基于实验或训练为目的,将原本的系统、事物的关键特性或者行为功能,予以系统化和公式化,从而对关键特征做模拟,达到预计系统的发展趋势,发展结果等效果。
  • 应用:基础社会研究、政策分析
    • 特征1:运行当前的和备选的策略,观察不同策略对系统的影响,以评估不同策略效果
    • 特征2:在模拟过程中对各个参数进行灵敏度分析,以观察各个参数的鲁棒性,或验证模型的性质和假设
  • 研究方法:
    • 系统动力学:
      • 起源:应用于工业企业管理、市场股票与市场增长的不稳定性等研究上。
      • 本质:系统科学与管理科学交叉学科,将系统理论与计算机仿真模拟紧密结合,形成了自己独特的一套理论——即 “从解决问题的角度出发,建立实际问题的计算机仿真模型系统,设计、测试选择解决问题的方案”
      • 常见系统动力学案例:传染病模型、城市发展规划模型、政治动态模型
    • 基于主体的仿真建模(ABMs):
      • 本质:计算机模拟,即模拟一个给定的目标系统,包含系统中一系列可交互的参与者、互动规则、静态或动态的环境特征,对个体的行为准则进行建模,进而解释个体行为或集体和宏观行为的出现
      • 应用:集体、公众情绪影响范围。
    • 其他:微观分析模型,排队模型,细胞自动机,多智能体模型,学习和演化模型

2.6 补充

  • 五种方法间的组合:如在由反弹道导弹模拟时引入表达社会复杂性的幂律分布模型
  • 其他补充:数据可视化、“声处理”

三、论文推荐

社会计算基于系统科学、网络科学、复杂性科学等科学理论,利用人工智能、数据挖掘等科学计算理论作为研究方法,以社会、经济等领域大数据作为研究对象,交叉融合各学科理论,是人类更深入地认识社会、改造社会,解决政治、经济、文化等领域复杂社会问题的一种理论和方法论体系

3.1 计算科学 & 社会计算

(1) 可解释的智能模型 Interpretable Intelligent Models in CSS

* Wang, Jingyuan, et al. "Alphastock: A buying-winners-and-selling-losers investment strategy using interpretable deep reinforcement attention networks." Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019.
* Wang, Jingyuan, et al. "Deep Fuzzy Cognitive Maps for Interpretable Multivariate Time Series Prediction." IEEE Transactions on Fuzzy Systems (2020).
* Wang, Jingyuan, et al. "Multilevel wavelet decomposition network for interpretable time series analysis." Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.
* Wang, Jingyuan, et al. "Empowering A* search algorithms with neural networks for personalized route recommendation." Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019.
* Wu, Ning, et al. "Learning Effective Road Network Representation with Hierarchical Graph Neural Networks." Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020.
* Lazer, David, and Jason Radford. "Data ex machina: introduction to big data." Annual Review of Sociology 43 (2017): 19-39.
* Gao, Jian, Yi-Cheng Zhang, and Tao Zhou. "Computational socioeconomics." Physics Reports 817 (2019): 1-104.
* Kou, Luyao, et al. "Deep learning based inverse model for building fire source location and intensity estimation." Fire Safety Journal 121 (2021): 103310.

(2) 隐私保护与数据伦理 Privacy and Data Ethics in CSS

* Nov, Oded, and Sunil Wattal. "Social computing privacy concerns: antecedents and effects." Proceedings of the SIGCHI conference on human factors in computing systems. 2009.
* Akiti, Chandan, Anna Squicciarini, and Sarah Rajtmajer. "A Semantics-based Approach to Disclosure Classification in User-Generated Online Content." Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings. 2020.
* 孟小峰, 朱敏杰, and 刘俊旭. "大规模用户隐私风险量化研究." 信息安全研究 5.9 (2019): 778-788.
* Debatin, Bernhard. "Ethics, privacy, and self-restraint in social networking." Privacy online. Springer, Berlin, Heidelberg, 2011. 47-60.
* Post, Robert C. "Data privacy and dignitary privacy: Google Spain, the right to be forgotten, and the construction of the public sphere." Duke LJ 67 (2017): 981.
* 孟小峰, et al. "数据垄断与其治理模式研究." 信息安全研究 9 (2019).
* 孟小峰, 王雷霞, and 刘俊旭. "人工智能时代的数据隐私, 垄断与公平." 大数据 6.1 (2020): 0.

(3) 基于代理的社会现象建模 Agent-based Modeling of Social Phenomena

* Fioretti, Guido. "Agent-based simulation models in organization science." Organizational Research Methods 16.2 (2013): 227-242.
* Gómez-Cruz, Nelson Alfonso, Isabella Loaiza Saa, and Francisco Fernando Ortega Hurtado. "Agent-based simulation in management and organizational studies: a survey." European Journal of Management and Business Economics (2017).
* Secchi, Davide, and Martin Neumann. "Agent-based simulation of organizational behavior." Springer, Cham doi 10 (2016): 978-3.
* Zhang, Jun Jason, et al. "Cyber-physical-social systems: The state of the art and perspectives." IEEE Transactions on Computational Social Systems 5.3 (2018): 829-840.

(4) 图像分析与文本挖掘 Image Analysis and Text Mining for CSS

* Wu, Chuhan, et al. "Neural news recommendation with heterogeneous user behavior." Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP). 2019.
* Wang, Hongwei, et al. "DKN: Deep knowledge-aware network for news recommendation." Proceedings of the 2018 world wide web conference. 2018.
* He, Li, Antonio Páez, and Desheng Liu. "Built environment and violent crime: An environmental audit approach using Google Street View." Computers, Environment and Urban Systems 66 (2017): 83-95.

3.2 复杂科学 & 社会计算

(1) 复杂系统动力学 Complex System Dynamics in CSS

* Zhou, Fang, Linyuan Lü, and Manuel Sebastian Mariani. "Fast influencers in complex networks." Communications in Nonlinear Science and Numerical Simulation 74 (2019): 69-83.
* Vosoughi, Soroush, Deb Roy, and Sinan Aral. "The spread of true and false news online." Science 359.6380 (2018): 1146-1151.
* Ni, Shunjiang, Wenguo Weng, and Hui Zhang. "Modeling the effects of social impact on epidemic spreading in complex networks." Physica A: Statistical Mechanics and its Applications 390.23-24 (2011): 4528-4534.
* Lu, Peng, et al. "The sandpile model and empire dynamics." Chaos, Solitons & Fractals 143 (2021): 110615.
* Liu, Lu, et al. "Hot streaks in artistic, cultural, and scientific careers." Nature 559.7714 (2018): 396-399.

(2) 社会系统的网络分析 Network analysis of social systems

* Mariani, Manuel S., and Linyuan Lü. "Network-based ranking in social systems: three challenges." Journal of Physics: Complexity 1.1 (2020): 011001.
* Xu, Jia, et al. "Incentive mechanism for multiple cooperative tasks with compatible users in mobile crowd sensing via online communities." IEEE Transactions on Mobile Computing 19.7 (2019): 1618-1633.
* Wang, Jiangtao, et al. "Social-network-assisted worker recruitment in mobile crowd sensing." IEEE Transactions on Mobile Computing 18.7 (2018): 1661-1673.
* Varga, Attila. "Shorter distances between papers over time are due to more cross-field references and increased citation rate to higher-impact papers." Proceedings of the National Academy of Sciences 116.44 (2019): 22094-22099.
* Xie, Jiarong, et al. "Detecting and modelling real percolation and phase transitions of information on social media." Nature Human Behaviour (2021): 1-8.
* Li, Sijia, et al. "The impact of family violence incidents on personality changes: An examination of social media users’ messages in C hina." PsyCh Journal (2021).
* Lin, Yu-Ru, et al. "Facetnet: a framework for analyzing communities and their evolutions in dynamic networks." Proceedings of the 17th international conference on World Wide Web. 2008.
* Huang, Jianbin, et al. "Density-based shrinkage for revealing hierarchical and overlapping community structure in networks." Physica A: Statistical Mechanics and its Applications 390.11 (2011): 2160-2171.

(3) 智慧城市Smart City

* Bettencourt, Luís MA. "The origins of scaling in cities." science 340.6139 (2013): 1438-1441.
* Blumenstock, Joshua, Gabriel Cadamuro, and Robert On. "Predicting poverty and wealth from mobile phone metadata." Science 350.6264 (2015): 1073-1076.
* Ju, Jingrui, Luning Liu, and Yuqiang Feng. "Citizen-centered big data analysis-driven governance intelligence framework for smart cities." Telecommunications Policy 42.10 (2018): 881-896.
* He, Li, et al. "Ambient Population and Larceny-Theft: A Spatial Analysis Using Mobile Phone Data." ISPRS International Journal of Geo-Information 9.6 (2020): 342.
* Li, Hui-min, et al. "Analyzing the relationship between developed land area and nighttime light emissions of 36 Chinese cities." Remote Sensing 11.1 (2019): 10.
* Wang, Lingli, et al. "Voice-Based AI in Call Center Customer Service: Evidence from a Field Experiment." Call Center Customer Service: Evidence from a Field Experiment (June 22, 2020) (2020).
* Wang, Chenyang, Yang Gao, and Hui Zhang. "Typical patterns of government response measures and trends for COVID-19 pandemic." Proceedings of the 6th ACM SIGSPATIAL International Workshop on Emergency Management using GIS. 2020.

四、相关研究拓展

4.1 社会影响模型(social influence)

  • 社会影响规律:
    • 社会影响随着周遭人群规模变大而变大,但这种规律并非线性(第一个人影响最大,而后面每加一个人的影响总小于前面一个人)
    • 个人受到影响 取决于 影响源强度(对方的社会地位,权力,可信度,声望等)
    • 利用 网络中节点间最短距离 衡量 聚集程度
  • 数学表达/幂率关系
    • I ~ N β I~Nβ INβ,其中 I I I为个体受到的社会影响程度, N N N为周遭所持该行为的人群规模, β β β为介于0,1之间的指数)
  • 解释机制
    • 社会影响理论:人与人相互影响,即某种行为从一个人传染到了另一个人
    • 同质相吸(Homophily):具有某种行为的人更倾向于与其他类似的人交朋友
    • 环境影响:共同环境决定了社会网络上相连的人有近似的行为
    • ——> 群体形成:自由形成(兴趣等特征);社会结构形成(社交距离接近)
  • 如何让网络一分为二(二分图)并持久多样 —— 隔离+社会影响 —— 互联网上的气泡
    • 创始之初,互联网被看作为跨国界跨语言自由交流提供了一个公共空间
    • 互联网平台发展出无数种小而专门化的社区,并推广用户化个性化服务(如:产品推荐系统,内容过滤,好友推荐,标签分类等),加重了用户的内容圈层性(“气泡”),“气泡”中的人的行为、态度、观念趋同且更极端,并产生仇恨。

4.2 强连接与弱连接

  • 定义:
    • 强连接:一般是社会关系;弱链接:一般是“熟人(acquaintance)”关系,存在可拓展性
    • 强连接阻碍了新的信息、新的机会的流入,进一步限制拓展 —— 社会分工(类似环境的影响)
  • 网络应用——网络交友行为:
    • 只是更大规模复制同质化群体,而非扩展异质化群体,因此,网络没有起到减缓个人阻碍的作用,而是加剧了阻碍。
  • 桥/结构洞:连接两个群体之间的人 —— 了解到的信息更多,更容易产生新想法,接触新机遇,有更多的晋升和盈利机会
  • 社交限制性 vs 社群内部联系:
    • 社交狭窄度衡量指标
    • 中心化结构的社群,领导人思想会限制群体里所有人的思想;发散型的社群,人们之间的限制关系很弱,社群整体想法中庸,但是容易出现创新。

4.3 不相关知识

  • (1)计算传播学
    • 传播学领域的受众研究/用户研究:描述性研究和统计 — 理解用户在媒介消费行为上的特点和规律
    • 计算传播学作为计算社会科学的重要分支,主要关注人类传播行为的可计算性基础,以网络分析、文本挖掘等为主要分析工具,(以非介入的方式)收集分析大规模的行为数据,隐藏在行为背后的模式(pattern)和法则(law),并进一步分析模式背后的生成机制与基本原理。
  • (2)数字鸿沟与贫穷
    • 数字鸿沟(Digital Divide):拥有信息者(Information haves)和不拥有信息者(Information havenots)的分化
      • 网络上的数字鸿沟:从事互动者主动地利用互联网资源,在很大程度上塑造建立互联网;潜水者对互联网的使用多为被动地接触被前者所塑造的网络
    • 贫穷的特征:
      • 贫穷意味着资金短缺(需求与资源);
      • 贫困妨碍认知(贫穷和负面行为特征存在相关 —— 人的认知系统资源有限,用户忧虑财务,则会减少分配给决策与执行的认知资源);
      • 贫困降低试错空间(相同的错误可能会带来更糟糕的结果)
    • 社会阶层与贫穷:
      • 韦伯社会分层理论:经济标准(财富)、政治标准(权力)和社会标准(声望)三者是相互联系的,可以综合起来进行社会分层。
      • 低社会阶层个体特征:对威胁高敏感性,低控制感;在社会认知上,强共情能力,倾向于环境归因,对群体类别持社会建构观念;在人际领域上,有更多的亲社会行为;
      • 政策制定/引导新视角——谨防对穷人施加认知税(提供简单的干预政策,如智能缺省、帮助填写表格、计划提示、提醒、教育)
      • 通过一个人的数字足迹去预测他的社会经济特征
  • (3)创新与研究的转型
    • 颠覆性创新(不是沿着既有技术发展,而是冒着巨大风险开辟了新的方向) — 获得更多资源和注意力,维持更多合作关系 — 工作繁忙,决策保守,形成新技术锁定 — 新一轮技术突破
    • 大团队偏向引用新文献,捕捉流行的研究;小团队对过去的文献追溯更深,从而提出新想法,实现“颠覆性”的创新 —— 小团队在创造新的方向,而大团队在发展这些方向;或者说,小团队擅长提出问题,大团队擅长回答问题
    • 获得基金的团队比没有获得基金的团队更加保守
    • 学者在学术圈中的连接程度越高,学者的创新能力越低
  • (4)其他知识点:
    • 旁观者效应(bystander effect)、电灯泡模型(light bulb model)、回转半径、真实熵、随机熵、信息熵、社会分层理论和知沟理论

4.4 学者

  • 施永仁,爱荷华大学社会学系助理教授,博士毕业于康奈尔大学社会学系,曾在耶鲁大学人类本性实验室从事博士后,研究重点在于理解线上与线下的群体行为,乡村社区中社会制度与社会网络,以及美国民众政治观念的演化。
  • 孟小峰,中国人民大学教授,长期从事数据库与数据管理的研究与教学,近期主要研究领域包括:数据智能(空间数据智能、科学数据智能、学术数据智能、商务数据智能等),数据治理(数据隐私、数据垄断、数据透明、数据公平与伦理等),社会计算与社会智能等交叉学科。
  • 罗家德,清华大学社会学系教授、博士生导师,清华大学社会网络研究中心主任,研究领域:圈子理论研究、自组织研究、社区营造研究、组织社会资本研究、外包体系治理问题、高科技产业集群、组织设计与交易成本分析、经济社会学、社会网络理论、社会网络分析、网络动态学与仿真模型

acknowledge:
《计算社会科学:数字时代的社会科学研究》
《融合计算科学、社会科学与复杂科学:社会计算系列读书会启动招募》
以上均为集智俱乐部(书籍&公众号)出品

你可能感兴趣的:(IS研究理论,大数据,网络,算法)