异构信息网络--基本概念和定义学习笔记

详见Chuan Shi 的论文A Survey of Heterogeneous Information Network Analysis 

(写这篇才知道翻译文献比看痛苦的多闭嘴

如果觉得下面的格式实在是不堪入目,可以移步

http://note.youdao.com/share/?id=d8910e1cd605dc9c824c911358b73808&type=note

一、基本定义

1.定义一,信息网络(Information Network):

    信息网络可以用一个有向图G = (V, E) 来表示,其中V代表 Object,E代表

 Edge。并且用映射函数 ϕ : V → A 来表示每一个object v  V 属于object类型集

A: ϕ(v) ∈ A,用映射函数ψ → R.表示每条边 e  E 属于边的类型集

R: ψ(e) ∈ R。如下图1所示:

异构信息网络--基本概念和定义学习笔记_第1张图片

                                                                                                              图2                          图3

注:如果两条边连接的起始节点和终止节点的type都相同,则这两条边是同一种类型。


2.定义二,异构/同构信息网络(Heterogeneous/homogeneous information Network

    如果|A| > 1 或者 |R| > 1 ,则该信息网络为异构信息网络,或简称为异构网

络,否则为同构网络。例如图2即为一个典型的网络实例(network instance,

following 某种 network schema的信息网络可以称为这种网络模式的网络实例)from

 DBLP(如果你要做异构信息网络这个方向,你会经常和这个数据集打交道)


3.定义三,网络模式?(Network schema

    异构信息网络(= (V, E)with ϕ(v∈ A 并且 ψ(e∈ R)的network

 schema TG = (A, R),要指定objects和links的类型约束,就是这种约束使得异构网

络变为半结构化。网络模式如图3所示,图2是图3的网络实例。


4.定义四,元路径(Meta path
    元路径P是定义在网络模式TG = (A, R)上的,如表示了从A1 到的复杂的关系,。元路径P的长度即为关系R的个数。

注:(1)在不引起歧义的情况下也可以直接用object  type来表示元路径。 ,例如:可以直接表示为APA。

    (2),,则 =。

    (3)形如APA,APVPA,APTPA等,=的,则此元路径为对称的。

    (4)不同元路径代表着不同的物理意义,元路径所所蕴含的丰富的语义特征,是

HIN的一大非常重要的特征,所以现在非常promising的一个方向语义挖掘(semantic

 mining)大部分还是在针对元路径进行研究。

异构信息网络--基本概念和定义学习笔记_第2张图片

    (5)其他元路径举例:

二、相关概念的比较

1.Heterogeneous network vs homogeneous network,同上,不再赘述

2.Heterogeneous network vs multi-relational network,后者只有一种object类

型,但是有大于1中link类型

3.Heterogeneous network vs multi-dimensional/mode network,后者与multi-

relational network含义相同

4.Heterogeneous network vs composite network,后者是杨强提出来的,是说网络

中的用户之间存在多种关系,在同一时间展示着不同的行为或者是共享着某种潜在的关

系,其实也是一种多关系网络

5.Heterogeneous network vs complex network,后者是有着非常规的拓扑特征的网

络,网络中objects间的连接既不规则也不随机。这种非常规的拓扑特征包括:度分布

中的重尾,很高的聚集系数,社区结构和分层结构。社交网络、信息网络、技术网络、

生物网络等都是复杂网络,且很多异构网络也是复杂网络。但是复杂网络的研究主要集

中的网络的结构、功能和特征上。


你可能感兴趣的:(网络,数据挖掘,综述,基本概念,异构信息网络)