在前面初步接触完叙述统计与推断统计的知识后,介于眼下的研究任务,所以计量学习暂时往后面推。从去年就开始的台风”山竹“研究,由于今年上半年课程繁多与杂事纷扰,一直耽搁。此外,这学期一门课的课程论文需要运用社会网络分析,参考徐志平&刘怡对中国社会学博士互聘网络的分析,做一篇国内公共管理学科博士互聘网络课程论文。上述两个任务都需要我加快对于社会网络分析的学习。
上半年,读了几本关于SNA的书籍,但始终感觉不得要义。纯粹方法论的内容看的越多,就越容易晕眩,反而不知道实地里怎么操作,于是转向矛头,决定从刘军老师的这本书入手。浏览目录,发现了许多与推断统计有关的知识点,这是我萌生重新复习李沛良《社会研究的统计应用》的直接原因。这一阶段主要是对UCINET的学习,但由于这一软件不可复现,因此必定不是定量研究的趋势。由于R语言支持UCINET包,在下一阶段,将借助R语言,试试有没有复现的可能性
《整体网分析》这本书的前两个章节主要是对“网络分析”范式和“整体网研究”的一个概要,先略过,直接进入软件操作层面。在完成对软件操作界面的大概认识后,接下来的学习将会结合现有的案例来。
介于微信公众平台对markdown和latex不完全支持,因此文末“阅读全文”提供链接。
第三章 整体网分析工具——UCINET简介
一、文件操作菜单File
二、数据操作菜单Data
①数据编辑器data editor
②数据的导入与导出等命令
-
make star graph
创建星条图
所谓星条图,是指一点居于核心,其余点和核心店相连,并且其余点之间五关联的图。
-
random
创建随机数据
有时候为了研究需要,需要创建一个满足一定条件的随机数据。
-
import EXCEL
导入Excel数据或者数据语言类型(DL),将其转换为UCINET数据 -
import Text File
导入文本文件
*Export
将UCINET数据导出为其他类型的数据 -
CSS
输入认知社会结构(Cognitive Social Structure,CSS)类型的文件,其功能是把特定类型的数据转换为标准的网络数据。
③ 数据的展示与描述
*Browse
数据浏览矩阵
*Display
在计算机屏幕上现实UCINET数据库
-
header browser/editor
打开一个数据矩阵,展示其维度以及每一行和每一列的标签 -
_describe(obsolete)
执行和header browser/editor 类似的功能,不过不经常使用
④数据的提取、移动、开包、合并一匹配分析
-
Filter/Extract
数据的过滤与提取,这一指令下包含6个指令
*Filter rows via SQL
*Subgroup via attribute vector
通过属性向量从一个数据矩阵中提取出子矩阵
*Main component
提取出与网络的弱成分对应的子图并加以保存。有关强成分与弱成分的界定分类参见本书第6章
*Ego-network
提取出网络某点的个体网成员及其间关系
*Submatrix
从数据中心抽取某个子矩阵。
which rows”and "which columns"例如可以写:"first 2, 4, 5, last 4”
*
Main Diagonal
抽取出主对角线的值。对于主对角线都是0的矩阵来说,该命令基本用不上。
-
Remove
去除UCINET数据中心的某些点
具体包括两个选项:一是去除孤立点(isolate),选择它即可以移除网络中的孤立点;二是移除孤伶点(pendants),即与他者联系很少,度数知识1的点。对于非对称数据来说,该程序去掉的是哪些出度(out-degree)为1的点。
-
Unpack
对于一个包含多种关系的矩阵数据进行开包处理,其结果是分成多个独立的矩阵,并加以保存,这样便于对单个矩阵进行分析。
*Join Join
命令与Unpack界面相反,它是把一系列UCINET数据合并成一个数据文件 -
Match datasets
按照一定标准对网络数据进行匹配处理,保留两个数据中心对应的元素一致的部分
⑤数据的排序、置换、专置、匹配等
-
Sort alphabetically
按照字母顺序对一个网络中的各个点进行排序 -
Sort by attribute
按照属性数据对一个网络中的各个点进行排序(attribute 属性)
*Permute
按照研究人员自己的顺序对行与列同时进行置换)(|美 [pɚ'mjʊt]| v.改变……的次序,重新排列) -
Transpose
对矩阵进行转置处理(vt. 调换;移项;颠倒顺序)
⑥数据的其他操作(略)
三、数据转换操作(Transform)
这个菜单包含一些把图和网络转换为其他类型的子菜单,可以分为三大类:
第一大类:涉及数据的组合,Aggregate(涉及CSS)和Scatter
第二大类:主要针对矩阵的元素进行处理
第三大类:主要针对矩阵进行其他类型的转换
①数据的组合
-
Aggregate(涉及CSS)
-
Block
把一个数据中的各个点进行分块,计算块的密度(block densities)、块中每一个元素的均值、最大值、最小值等。
*Collapse
压缩,即将一个矩阵的多行或多列组合在一起。
-
Scatter
②主要针对矩阵的元素进行处理
序号 | 命令 | 功能 |
---|---|---|
1 | Dichotomize |
二值化处理。将多值数据矩阵转换为二值化处理。 |
2 | Dichotomize interactive |
二值化处理。将该命令给出了一些具体的计算指标,包括数据中心的每个值的z-值、最大值、最小值等。 |
3 | Diagonal |
对角线命令,可以用改命令抽出矩阵对角线的值,或者改变矩阵对角线的值 |
4 | Double |
对一个数据的各列进行双倍处理 |
5 | Granovetterian strong ties |
|
6 | Make Interaction Term For Regression |
计算两个矩阵的对应元素之积 |
7 | Match Marginals |
按照边缘值对数据矩阵进行标准化处理 |
8 | Matrix Operations |
矩阵算法 |
9 | Normalize |
将矩阵的行、列或者整个矩阵进行标准化处理 |
10 | Recode |
对矩阵重新编码 |
11 | replace missing values |
|
12 | Reverse |
取反值,用矩阵中最大值和最小值之和减去矩阵的每一个值 |
13 | Rewire |
按照某种标准重新处理矩阵,达到某种最优 |
14 | Symmetrize |
将数据矩阵进行对称化处理 |
15 | Transitivize |
将数据数据进行传递化处理,具体细节参见P59 |
16 | Transpose |
将数据矩阵进行转置处理 |
Reverse
命令:这相当于利用某种线性转换,将相似性(similarity)数据转换成距离(distance)数据,或者距离数据转换为相似性数据。
Make Interaction Term For Regression
命令:不是矩阵算法中的两个矩阵之积(production)。这相当于计算两个矩阵变量的交互项,可将计算结果用于矩阵的回归分析中。在计算之前,可对两个矩阵进行对中处理(mean-center)或标准化处理。
Matrix Operations
命令:主要包括矩阵内算法(Within Dataset)和矩阵间算法(Between Dataset)
③主要针对矩阵进行其他类型的转换
-
Graph Theoretica
命令:一些图论命令
Bipartite
命令:把一个2-模数据矩阵转换为一个1-模数据矩阵 ;
Make Incidence Matrix
命令:制作一个发生阵。把一个邻接矩阵转换为一个长方形的点-线指标矩阵;
Linegraph
命令:线图,针对有向图;
Multigraph
命令:多图,把一个多值图(valued graph)转换为一系列二值邻接矩阵。
Multiplex
命令:制作多丛图
Semigroup
命令:制作半群图。
Union
将多个矩阵合并成一个数据矩阵,即将匹配的两个或多个矩阵对应元素相加。
Intersection
取多个关系矩阵的合集,即将独立的两个或多个矩阵依次排列,形成一个包含多个数据矩阵的文件。
-
Time Stack
多时段网络的合并。将不同时间段得到的同一群体行动者之间的关系矩阵合并在一起。 -
Egotize
整体网成员的个体网分析(P61) -
Build Ties Change Matrices
建构随时间变化的数据矩阵。
对于至少两个时间段建立的、等来说,可以呦三种方式建构关系变化的矩阵。
* 第一种:计算两个矩阵之差,即计算;
* 第二种:仅仅计算两个矩阵的增量,即如果≥,则计算,其余的值都设定为缺失值0;
* 第三种是计算关系的形成,即如果形成≥,则令,其余的值都设定为缺失值或0。
-
Give Non-responders Missing Rows
将一个矩阵中无回答者视为缺失值。
四、计算工具菜单(Tools)
①第一类命令
-
Profit
:是Property Fiting的缩写,执行拟合性质的分析。 -
Consensus analysis
:分析多个答题者在回答问题方面的一致性。 -
Cluster analysis
对矩阵数据进行聚类分析,包括层次聚类、组合式最优化分析、聚类充分度分析。 -
Scaling/Decomposition
量表及数据分析。它包括六小类命令。
Metric-MDS
:针对相近性矩阵进行量纲式的多维量表分析。
Non- Metric MDS
:针对相近性矩阵进行非量纲式多维量表分析。
Factor analysis
:因子分析。
Correspondence Analysis
:对2-模网进行对应分析。
Eigenvectors of nonsymmetric matrix
:计算非对称方针的特征向量和特征值
SDV
:对2-模网网络数据进行奇异值分解。
②第二类命令
-
Correlate columns across datasets
:计算两个n * n矩阵各列的相关系数矩阵,得到的是一个2n * 2n的矩阵。 -
Similarity
:相似性分析。根据一定标准,计算出矩阵各行之间或者各列之间的相似性系数矩阵。 -
Dissimilarity&Distance
:相异性或者距离分析。根据一定标准计算出各行或者各列之间的相异性系数矩阵。 -
Univariate statistics
:对一个矩阵中的值进行单变量统计分析。可以对一个矩阵的每行(或者每列,或者整个矩阵)计算器均值、标准差、方差、最小值、最大值和总观察值等值。 -
Frequencies
:对行或列进行频次分析。 -
Count combinations
:针对整个网络,计算其各行的模式发生的频次。 -
Testing hypothesis
:假设检验,包括三种:
Node-level
:点层次的假设检验,包括回归分析(regression)、方差分析(Anova)和t检验。
Mixed Diadic/Nodal
:点=关系混合层次的建设检验
Diadic QAP
:关系-关系层次的假设检验。
-
Command line/Matrix Algeria
:矩阵代数分析。
③第三类命令
-
Scatterplot
:散点图。 -
Dendrogram
:树状图。 -
Tree Diagram
:树形图。
五、网络分析菜单(Network)
①第一类命令
-
Cohesion
:凝聚性分析,可计算凝聚力的指标有十几种。
-
region
:区域分析。计算并发现成分(components),包括强成分、双成分(Bi-components)和k-核(k-Cores)。 -
Subgroup
:子图分析,包括三小类共9个命令。
-
Path
:路径分析,分析各个点之间存在的路径。
②第二类命令
-
Ego-network
:个体网分析。 -
Centrality and Power
:中心性和权力分析。 -
Group Centrality
:群体的中心性分析。 -
Core/Periphery
:核心/边缘分析。 -
Roles and Positions
:角色与位置分析。
③第三类命令
-
Triadic Census
:计算一个矩阵的三方谱系的16个同构类。 -
P1
:执行P1模型分析。 -
Balance Counter
:符合三方关系计算。 -
Compare Densities
:计算两个匹配的矩阵密度之差,并给出显著检验。 -
Compare Aggregate Proximity Matrix
:对多个组合的相似性矩阵进行比较。
④第四类命令
-
2-mode networks
:计算2-模网络的凝聚力、分派性、中心性和核心/边缘分析。 -
Trajectories
:针对一个2-模职业轨迹矩阵,计算其中心度和一些基本测度。 -
Exras
:有关网络分析的其他指标。 -
Tester
:检验数据的规模,相当于展示数据的具体行值和列值。
⑤第五类命令
-
Multiple Mearsures
:同时展示一个矩阵的多个凝聚力指标或矩阵中的每个店的各种中心性指标。
六、可视操作菜单(Visualize)
包括三个选项:NetDraw、Pajek、Draw。选择其中一个命令,会调出相应的画图程序,对数据矩阵进行画图处理