第一课-课程介绍和基本概念

什么是图及研究的内容

图是什么

General language for describing complex system of interacting entities.

图的两种常见的说法:

  • 网络(network):偏向于自然存在的图结构,比如互联网、社交网络等。
    Language: Network, node, link
  • 信息图(information graph):偏向于人为概念出来的图,比如知识图谱、相似网络等。
    Language: Graph, vertex, edge

机器学习图研究的具体应用的问题

  • 节点预测:分类、回归。
  • 边预测:两个节点间是否应该有边连接。
  • 社区检测:发现密集连接的节点群。
  • 网络相似度测量:测量多节点/网络的相似度

下面给出了一系列的网络研究和应用的例子,比如FB的social circle发现、基础设施故障的影响、多态知识图谱(KG)、推荐里面应用的边预测、知识图谱在推荐里的应用(Pinterest)、图向量Embedding、社交媒体里的观点分类、Wiki假/欺骗文档的识别、信息传播模式的识别、生物医疗里面的药物副作用预测。

图的基本概念

图的组成部分

  • 对象:node、vertices —— N
  • 交互作用:link、edge —— E
  • 系统:network、graph —— G(N, E)

课程里对network和graph这两个名词进行了区分。Network更多的指向现实世界里的系统;而graph是对network的数学表示(对同一个network的不同表示,可以产生不同的graph)。

节点度概念忽略...

无向完全图(complete graph)

对于无向图,最大的边数是 Emax=(N,2)=N(N-1)/2
如果一个图的边的数量等于Emax,那么这个图就叫完全图。完全图的平均度=N-1。

无向完全图

如果在一个有向图中,每两个顶点之间都存在方向相反的两条边,那么这种图结构称为有向完全图。
对于一个包含N的顶点的有向完全图,其总的边数为N(N-1)。

二分图(bipartite graph)

二部图.PNG
二分图里的折叠图(folded graph)

U或者V中的两个node,如果它们共享一个端节点,则它们之间可以建立起一个link,由此对于U或者V则可以分别构建出一个图,就是折叠图。比如作者->文章的二分图,作者可以沟通co-auther的折叠图,文章可以构成同作者的折叠图。


折叠二部图.PNG

图的表示方法

  • 邻接矩阵(Adjacency Matrix)
  • 邻接表(Adjacency List)
  • 边列表(Edge List)
    只记录边的起点和终点的列表,比如:
    (1,2)
    (1,3)

    (10,50)
边的类型

除了节点,边也可以被赋予很多属性:权重、排序、符号、类别等待。在邻接矩阵里,可以使用数字来代替1,0的值,记录这些边的类型。

图的类型

自环图:节点自己可以有边连接到自己。
多图:节点和节点间有超过一条的变。

连通、连通图、连通分量

在无向图中,两顶点有路径存在,就称为连通的。若图中任意两顶点都连通,同此图为连通图。无向图中的极大连通子图称为连通分量。

以下面两个图为例,下面的图是上面的图的连通分量,并且下面的图是连通图。上面图中I与J也是连通的。


4.PNG

强连通图、强连通分量

image.PNG

在有向图G中,如果两个顶点u,v间有一条从u到v的有向路径,同时还有一条从v到u的有向路径,则称两个顶点强连通。如果有向图G的每两个顶点都强连通,称G是一个强连通图。有向非强连通图的极大强连通子图,称为强连通分量。

5.PNG

图表示举例

img.PNG

你可能感兴趣的:(第一课-课程介绍和基本概念)