入门学术文献:你需要知道的六大核心定律

摘要

在学术领域,不可避免的要接触到文献阅读这一项工作。数字时代的学者相较于前数字时代学者面临的挑战更大:第一,信息过载会导致你浪费很多时间在不相关信息上;第二,学科的更替与变化,使得你不得不去挑选信息源;第三,学科的交叉,使得学者不得不走出自己的领域,吸收新知识;第四,效率工具的诞生,使得“知识沟(Knowledge-Gap)”加剧。综上,对学术文献的全局认识,从数理逻辑考虑对文献的利用,成为一个有必要的话题。一切的竞争,本质上都是时间的竞争。
注:本文基于《信息分析课二期》

1. 布拉福德定律(Bradford's Law)

布拉福德定律是文献计量学中的奠基性定律之一。定律将一个学科的期刊分为核心区、相关区、非相关区,其关系满足如下公式:

核心区:相关区:非相关区 = 1:n:n² (其中n为布拉福德系数)

简单来说,如果一个领域的期刊总数是100,计量学者统计分析得出布拉福德系数是5,那么该领域相关区有杂志20本(100 / 5),该领域的核心区有4本(100 / 25)。那么,初入这个领域第一步应该是确定核心区期刊数字,然后想办法找到这些核心期刊。而不是应该在所有相关区、非相关区盲选。

实践:在网上搜索一下关于Educational Technology的文献,以 Educational Technology Journals (Peer Reviewed) - Educational Technology为例,大概有70本,如果以布拉福德系数是5来计算,大概Educational Technology领域的核心文献是2.8本。

反向验证,在 google scholar 中选择social science 板块 Social Sciences - Google Scholar Metrics,找到和Educational Technology领域密切相关的杂志有3本。并且,找到最近五年索引量排名第一的是《Computers & Education》杂志,说明在social science这个领域,学者们大概在思考的话题和领域。

题外感叹:火爆的教育技术学。

更复杂的实践请参考:Application of Bradford's Law of Scattering to the Literature of Library & Information Science: A Study of Doctoral Theses Citations Submitted to the Universities of Maharashtra, India

2. 洛特卡定律(Lotka's Law)

洛特卡定律的内容为:(1)发表n篇论文的作者是发表1篇论文作者的1/n²(2)一个领域发表一篇论文的作者约为60.79%。

假如一个领域有1000名学者,那么发表一篇论文的作者为607人,发表10篇论文的作者为6人,发表20篇论文的作者为1.5人,找到“核心作者”可以最快了解一个领域。

以“Computational Thinking”这个话题为例,在google scholar上搜索,先找到被引量排名靠前且重复出现的学者Jeannette M. Wing和Shuchi Grover。搜一搜她们的学术背景分别来自CMU和Stanford,差不多印证了之前自己的了解,两所这个领域顶级的大学。那么就可以以这两个学者为突破口,先通读她们两个的文献。当然,这里也可以应用广义的“上位词”“下位词”,即,找她们的老师 / 学生。

反之,如果有信息接触到一个领域的核心人物,那么顺藤摸瓜,找到其学术脉络,也是可以发现总结出“核心作者”的。比如以学者John Maeda为例,遵循师徒脉络,可以发现Ben Fry, Casey Reas, Golan Levin, Zachary Lieberman等等人物。

3. 齐夫定律(Zipf's Law)

齐夫定律说成大白话就是人类最容易坚持的习惯遵循“最省力法则”。齐夫定律有三个推论:1)开放(Openness)会战胜封闭(Closeness);2)人们会大量引用熟悉的信息;3)核心竞争力是你的差异化程度。

但是,深刻理解齐夫定律(Zipf's Law)却没那么容易。阳志平老师举了一个例子,比如有一座山,有三种翻阅方法 a. 打隧道 b. 坐飞机 c. 徒步。那么在常规的情况下,大多数人肯定会选择c方案,因为这看起来最省力。但是,如果有人能利用自身的差异化法则,构建另一条省力通道(比如,打隧道)。那么越来越多的人就会沿着这条更省力的法则行进。

如果想了解更多请参考:

  • 最省力原则 (豆瓣)

4. 文献增长率

普莱斯(Price)在《巴比伦以来的科学》一书中,提出以科技文献量为纵轴,以历史年代为横轴,不同年代的科技文献量的变化过程表现为一根光滑的曲线。这条曲线十分近似地表示了科技文献量指数增长的规律。

举个例子来说,如果一个领域初始文献是100篇
Q(0) = 100
那么十年后,当常数是1时,估计十年后的文限量Q(10)将达到多少呢?
Q(10) = 100 * exp(1 * 10) = 2202624

那么,在某些领域(比如哲学、艺术学),追根溯源,找到这100篇文献,先进行阅读会不会更有好处呢?

5. 文献老化率

以文献的出版年龄为横轴,现正在使用文献的相对量为纵轴,可以绘制一条负指数曲线,称为文献老化曲线。(Bertram C. Brookes) 文献随着时间的推移,对社会的作用会逐渐减小,这被称为文献的老化!

中国学者邱均平在1988年《文献计量学》中整理了不同学科的“半生期”,比如,物理学的半生期是4.6,而地质学的半生期是11.8。记得阳老师曾经随口说过,不同学科需要关注的切入点不一样,比如,对于哲学这个学科来说,经典的著作格外重要;而对于计算机科学这个学科来说,会议论文就显得格外重要。其本质,就是两个学科的半衰期不同。

6. 信息计量的大一统模型

科学计量学学者叶鹰和他的合作伙伴Ronarld Rousseau,尝试使用波动-扩散方程组讲上述5个模型统一在一起(Ye and Rousseau, 2010; Ye, 2011),感兴趣的小伙伴可以参加后文的Ying Ye链接。

7. 文中提到重要学者或文献

  • Shuchi Grover
  • Jeannette M. Wing
  • John Maeda – Medium
    强烈推荐他的medium,作为设计科普材料
  • Ying Ye

你可能感兴趣的:(入门学术文献:你需要知道的六大核心定律)