ch2进阶作业1-2019-03-12

0. 目录

    1. 摘要
    1. 背景
    1. 分析思路
    • 3.1 查看相关学科
    • 3.2 时间维度,查看心理学的发展历史
    • 3.3 找到领域内的大牛
    1. 通过知网心理学博士论文看国内心理学研究
    • 4.1 从时间维度分析
    • 4.2 空间维度分析
    • 4.3 变量关系
    • 4.3.1 按相关学科统计
    • 4.3.2 分析词频
  • 5.通过中国社会科学引文索引分析
    • 5.1 下载论文
    • 5.2 使用citespace分析知识图谱
  • 6.结论

1. 摘要

本文记录了使用批量下载论文,时间空间维度分析,变量关系分析,知识图谱分析等方法,了解“心理学”学科的发展,以及国内心理学研究的主要院校等宏观信息。本分析耗时14小时左右,主要使用知网论文索引,google学术论文索引,cssci学术论文索引作为原始数据进行分析。了解到心理学在国内是个年青的学科,心理学研究具有 注重人类行为的真实呈现,注重实验等特点。

2. 背景

本文的目标是对心理学产生全局认识。ch2的知识点非常多,其中批量下载论文和zotero的使用已经比较熟练了,希望通过使用citespace等工具探索更多未知领域。由于时间限制,未使用抽样阅读法等方法阅读论文,而是使用citespace和词频分析工具等对论文数据进行汇总分析。

3. 分析思路

3.1 查看相关学科

  • 在美国高等教育的学科分类中查看心理学相关的学科分类
ch2进阶作业1-2019-03-12_第1张图片
image
  • 如上图:心理学是第42号大学科,没有上级学科,心理学的下级学科有,心理学相关学科,社会学相关学科,医学相关学科,教育相关学科,管理相关学科。
  • 在分类中心理学没有上级分类,说明心理学已经成为一个独立的大学科。
  • 这里的启发:通过简单的材料也能得出有用的结论。

3.2 时间维度,查看心理学的发展历史

  • google 搜索 “Timeline of psychology”。
  • 查看维基百科心理学时间表,心理学是在1880年后开始蓬勃发展的。标志性事件是 :1882年 心理研究学会在英国成立。心理作为学科的历史大概140年左右。

3.3 找到领域内的大牛

  • google学术中直接搜索 psychology得到的东西比较杂乱,只下载了前100篇。
  • 搜索psychology领域的大牛们
ch2进阶作业1-2019-03-12_第2张图片
image
  • 下载排名前5的大牛的论文
  • 因为google学术论文不好下载,半途走开去写了个小工具,抓取google学术列表页面。
    zotero抓取google学术,只抓取列表页面信息
  • 排名前5的大牛有:
    Albert Bandura, h 指数 191
    Sigmund Freud, h 指数 261
    Richard M Ryan, h 指数 165
    Donald B Rubin, h 指数 128
    Edward L. Deci, h 指数 142
  • 用上面说的工具,不到一个小时下载了这5个大牛的所有论文,共6000篇
  • 由于时间关系,先不做阅读,论文留到下个作业用继续使用

4. 通过知网心理学博士论文看国内心理学研究

  • 知网有博士论文 1,243 篇,刚好达到1000篇的要求。
  • 下载1,243篇论文,导入zotero
  • 单从这1000 篇论文分析得出的结论会很片面,所以需要很多交叉验证。

4.1 从时间维度分析

image.png

如上图,心理学的高级研究是从2000年以后开始的,心理学在中国是个非常年青的学科。

4.2 空间维度分析

  • 写了个脚本统计所有论文所属的大学,用于计算心理学的空间分布(代码在文章最后)


    ch2进阶作业1-2019-03-12_第3张图片
    image.png
  • 如上图,心理学博士论文产出最多的院校是化东师范大学,西南大学。其他产出比较多的学校有浙江大学,天津师范大学,吉林大学,南京师范大学等。
  • 其中大部分是师范类院校,而少有医学类院校,从这点可以看出,心理学与教育领域关系最为密切。
  • 为了更形象地展示空间分布特性,找一个可以绘制地图上省份热度的工具[1]
    ch2进阶作业1-2019-03-12_第4张图片
    image.png
  • 国内心理学高级的研究主要在中部地区的重庆,湖北;东部地区的上海,江苏,浙江,等地区。

4.3 变量关系

4.3.1 按相关学科统计
ch2进阶作业1-2019-03-12_第5张图片
image.png
  • 如上图,心理学与教育,哲学,医学,企业管理,政治,等领域关系密切。
  • 心理学与教育领域关系最为密切。
4.3.2 分析词频
  • 由于信息量太大,先用简单粗暴的方式,把1200篇论文的标题,进行中文词频分析[2]
    ch2进阶作业1-2019-03-12_第6张图片
    image.png
  • 如上图,出现频率最高的100个词,去掉完全没用的。


    ch2进阶作业1-2019-03-12_第7张图片
    image.png
  • 如上图,出现最多的词是:认知,情绪,记忆,神经,自我,实验,健康,青少年,大学生,等。可以看出,心理学的研究:
    • 注重人类行为的真实呈现,注重实验。(实验,实证,行为)
    • 研究对象多为儿童,青少年,大学生。(儿童,青少年,大学生)
    • 注重人的主观感受和情绪。(情绪,视角)
    • 关注类的认知,记忆,阅读等个人能力。(认知,记忆,阅读,视觉)
    • 研究主题多与神经,自我 ,人格 相关。(神经,自我 ,人格)
    • 受社会和文化等客观环境因素影响。(社会,文化)
    • 多在在教育,管理,健康等领域进行实践。(学习,决策,健康)

5.通过 中国社会科学引文索引[3]分析

5.1 下载论文

  • 在某宝买了个山寨帐号,下载论文
  • cssci 选择内容的时候不能一次清空全部,可以退出重新登录来解决,筛选条件还在。


    ch2进阶作业1-2019-03-12_第8张图片
    image.png
  • 如上图,筛选条件为:心理学,论文,《心理科学》期刊,1998-2019年,共有5243个结果。
  • 分析重点是使用citespace分析知识图谱,为了保证取样完整,把5200篇论文全下载了。

5.2 使用citespace分析知识图谱

  • citespace是个看上去很难很高大上的东西,导入论文进行测试。


    ch2进阶作业1-2019-03-12_第9张图片
    image.png

    ch2进阶作业1-2019-03-12_第10张图片
    image.png
  • 查看关键词
    Modularity Q=0.94
    Mean Silhouette=0.41


    ch2进阶作业1-2019-03-12_第11张图片
    image.png

    网络成瘾,效度,外显学习,内隐联想测试,相似性,孤独感,心理弹性,压力性生活事件。


    ch2进阶作业1-2019-03-12_第12张图片
    image.png
  • 图片看起来有点奇怪。比较难得出有用的结论。
  • citespace 水很深,弄了几个小时几能弄成这样了,还要继续学习。
  • 这里的启发是:没结果也是一个结果。没结果说明问题内部复杂性很高,需要花更多时间理清脉络来研究。

结论

  • 心理学在全世界是个很大的学科,心理学的的发展从1880年左右开始,到现在有140年左右。
  • 心理学的资料相对开放,在各权威学术网站上均能找到大量的资料。完成本文的过程中共下载了13000多篇论文索引。
  • 在中国心理学是从2000年左右开心蓬勃发展的,是个非常年轻的学科。国内心理学专业很好的院校有东师范大学,西南大学,浙江大学,天津师范大学,吉林大学,南京师范大学等。在西北部发展相对落后。
  • 心理学注重人类行为的真实呈现,注重实验。研究对象多为儿童,青少年,大学生。注重人的主观感受和情绪。关注类的认知,记忆,阅读等个人能力。研究主题多与神经,自我 ,人格 相关。受社会和文化等客观环境因素影响。 多在在教育,管理,健康等领域进行实践。
  • 心理学学科的研究主题非常丰富,学科分支很多,且与其他学科有大量交集,应用领域非常广泛。
  • 启发1:通过简单的材料也能得出有用的结论。
  • 启发2:没结果也是一个结果。没结果说明问题内部复杂性很高,需要花更多时间理清脉络来研究。

引用

[1]绘制地图上省份热度的工具
[2]中文词频分析
[3]中国社会科学引文索引

源码

  • 这是一个php程序脚本,用来分析知网博士论文,按学校和作者统计总数量。
([^<]+)0){
        echo "page {$i}:",count($re[1]),"\n";
    }
    else{
        echo $data;die;
    }
    
    
    $regex2 = "/knet\">([^<]+)0){
        echo "page {$i}:",count($re2[1]),"\n";
    }
    else{
        echo $data;die;
    }
}


foreach($count as $k=>$v){
    echo $k,',',$v,"\n";
}

foreach($count2 as $k=>$v){
    echo $k,',',$v,"\n";
}

changelog

2019-03-10 吕明明创建,写了一小半,中间出去写了段代码,太喜欢这个作业了
2019-03-12 搜不动了,搜的东西太多了,头要炸了。论文存得太多,zotero也要炸了。
2019-03-12 主要使用citespace分析论文。先试了知网的,不能出图,再试cssci。感觉citespace水非常深,需要深入学习后才能用得得心应手,浅尝了一下还不得要领。无论怎样还是先完成作业,根据分析数据得出一些比较有用的结论。接下来几天去做进阶作业2。

你可能感兴趣的:(ch2进阶作业1-2019-03-12)