详见:Chuan Shi 的论文A Survey of Heterogeneous Information Network Analysis
(写这篇才知道翻译文献比看痛苦的多)
如果觉得下面的格式实在是不堪入目,可以移步
http://note.youdao.com/share/?id=d8910e1cd605dc9c824c911358b73808&type=note
一、基本定义
1.定义一,信息网络(Information Network):
信息网络可以用一个有向图G = (V, E) 来表示,其中V代表 Object,E代表
Edge。并且用映射函数 ϕ : V → A 来表示每一个object v ∈ V 属于object类型集
合A: ϕ(v) ∈ A,用映射函数ψ : E → R.表示每条边 e ∈ E 属于边的类型集
合R: ψ(e) ∈ R。如下图1所示:
图2 图3
注:如果两条边连接的起始节点和终止节点的type都相同,则这两条边是同一种类型。
2.定义二,异构/同构信息网络(Heterogeneous/homogeneous information Network)
如果|A| > 1 或者 |R| > 1 ,则该信息网络为异构信息网络,或简称为异构网
络,否则为同构网络。例如图2即为一个典型的网络实例(network instance,
following 某种 network schema的信息网络可以称为这种网络模式的网络实例)from
DBLP(如果你要做异构信息网络这个方向,你会经常和这个数据集打交道)
异构信息网络(G = (V, E)with ϕ(v) ∈ A 并且 ψ(e) ∈ R)的network
schema TG = (A, R),要指定objects和links的类型约束,就是这种约束使得异构网
络变为半结构化。网络模式如图3所示,图2是图3的网络实例。
注:(1)在不引起歧义的情况下也可以直接用object type来表示元路径。 ,例如:可以直接表示为APA。
(3)形如APA,APVPA,APTPA等,=的,则此元路径为对称的。
(4)不同元路径代表着不同的物理意义,元路径所所蕴含的丰富的语义特征,是
HIN的一大非常重要的特征,所以现在非常promising的一个方向语义挖掘(semantic
mining)大部分还是在针对元路径进行研究。
(5)其他元路径举例:
1.Heterogeneous network vs homogeneous network,同上,不再赘述
2.Heterogeneous network vs multi-relational network,后者只有一种object类
型,但是有大于1中link类型
3.Heterogeneous network vs multi-dimensional/mode network,后者与multi-
relational network含义相同
4.Heterogeneous network vs composite network,后者是杨强提出来的,是说网络
中的用户之间存在多种关系,在同一时间展示着不同的行为或者是共享着某种潜在的关
系,其实也是一种多关系网络
5.Heterogeneous network vs complex network,后者是有着非常规的拓扑特征的网
络,网络中objects间的连接既不规则也不随机。这种非常规的拓扑特征包括:度分布
中的重尾,很高的聚集系数,社区结构和分层结构。社交网络、信息网络、技术网络、
生物网络等都是复杂网络,且很多异构网络也是复杂网络。但是复杂网络的研究主要集
中的网络的结构、功能和特征上。