图机器学习(CS224W)-第1课

网络定义

网络是描述交互实体的复杂系统的通用语言
Network are a general language for describing complex systems of interacting entities.

网络的分类

自然网络

  • 由70+亿人组成的社会
  • 由电子设备组成的通信系统
  • 基因/蛋白质调节生命的相互作用
  • 脑中的思绪背后所隐藏的亿万级神经元联系

信息网络

  • 信息/知识被组织和链接
  • 场景图:一个场景中的对象如何联系
  • 相似网络:获取连接相似点的数据

有时区分是模糊的

网络的例子

图机器学习(CS224W)-第1课_第1张图片

主要问题

  • 这些系统是如何组织的?
  • 设计原则是什么?

许多系统背后都有错综复杂的接线图,网络,定义了组建之间的相互作用。
如果我们不明白系统背后的网络,将不能有效的对其建模和预测。

很多数据类型都是图:
图机器学习(CS224W)-第1课_第2张图片

我们如何利用关系结构进行更好预测?

复杂域(知识,文本,图像等)具有丰富的关系结构,可以将其表示为关系图。

通过显示建模关系,我们可以得到更好的性能表现。

为什么要研究网络?作用?

  • 描述复杂数据的通用语言,来自科学、自然、技术的网络相似程度比人们意识到的更多。
  • 领域间共享 计算机科学,社会科学,物理,经济,统计,生物学等不同领域的东西可以被表示为网络。意味着可以设计算法交叉来自不同领域的不同网络。
  • 可用数据和计算挑战 网络/移动互联网,生物,医疗和药理。
  • 影响 社交网络,药物设计,AI推论

分析网络的途径

  • 节点分类,预测给定节点的类型/颜色
  • 连接预测,预测两个节点是否连接
  • 群体检测,识别节点的密集连接簇
  • 网络相似性,测量两个网络/节点相似性

网络的应用

  • facebook social graph中的人际圈子,分析他们为什么存在。
  • 不同知识融合的网络,研究之间的联系
  • pinterest的内容推荐
  • 推特上的极化效应
  • 分析文章是否为恶作剧。(真实的文章相比恶作剧的文章具有更连贯性)
  • 级联效应: 由于其他用户的邀请,有60-90%的LinkedIn用户进行了注册。
  • 多种药一起吃的副作用预测 (70-79岁中46%的人同时吃5种以上的药)

课程大纲

  1. 介绍图结构
  2. 网络测量和随机图模型
  3. motif 和 graphlets
  4. 网络结构角色
  5. 谱归并
  6. 信息传递和节点分类
  7. 节点表示学习
  8. 图神经网络
  9. 图的深度生成模型
  10. 关系分析:pagerank和simrank
  11. 网络影响和级联行为
  12. 网络影响最大化
  13. 网络爆发检测
  14. 网络健壮性和优先连接
  15. 知识图谱和元路径
  16. 网络建设、推理和反卷积

网络结构

网络是对象的集合,其中一些对象对通过链接连接

网络元素:
对象Objects:节点nodes,顶点vertices N N N
链接Interactions:链接links,边edges E E E
系统System:网络network,图graph G ( N , E ) G(N,E) G(N,E)

网络和图的区别:
网络通常表示真实系统,如互联网,人际网,代谢网络,常用网络,节点和链接来描述。
是对网络的数学表示,如互联网图,社交图,知识图谱等,常用图,顶点,边来描述。

虽然在尽力区分两者,但是在大多数情况下,这图和网络是都使用的。解决不同问题的时候,选择最适合的、正确的网络表示。

网络定义

  • 有向&无向

图机器学习(CS224W)-第1课_第3张图片

  • 节点度数 Node Degress
    图机器学习(CS224W)-第1课_第4张图片

  • 完全图 Complete Graph
    图机器学习(CS224W)-第1课_第5张图片
    一个带有 N N N个节点的无向图的边的最大数量
    E m a x = ( N 2 ) = N ( N − 1 ) 2 E_{max} = \bigl( \begin{matrix}N \\2\end{matrix}\bigl) = \frac{N(N-1)}{2} Emax=(N2)=2N(N1)
    一个边的数量 E E E等于$E_{max} 的 无 向 图 被 称 为 ∗ ∗ 完 全 图 ∗ ∗ , 他 的 平 均 度 为 的无向图被称为**完全图**,他的平均度为 N-1$

  • 二分图 Bipartite Graph
    图机器学习(CS224W)-第1课_第6张图片
    二分图是一种节点可以被划分为没有交集的两个集合 U U U V V V 且任一链接都是连接 U U U中的一个节点和 V V V中的一个节点,这意味着 U U U V V V是独立的集合。

例子:
作者-论文(作者的论文)
演员-电影(演员参与电影)
用户-电影(观众给电影评估)
配方-原料(配方包含原料)

“折叠的”网络 “Foled” Network:
作者合作网络
电影共同评价网络
图机器学习(CS224W)-第1课_第7张图片
在Projection U中,节点6和7连接是因为在U-V图中,6和7都链接在了节点D上。Projection D同理。

图的表示

邻接矩阵

图机器学习(CS224W)-第1课_第8张图片
度的计算

  • 无向图
    图机器学习(CS224W)-第1课_第9张图片
    无向图来说,一个节点的度 = 横向/纵向上非0元素的个数
  • 有向图
    图机器学习(CS224W)-第1课_第10张图片
    对于有向图来说,出度为横向上非零元素的个数,入度为纵向非零元素的个数

边集合

图机器学习(CS224W)-第1课_第11张图片

邻接表

  • 当网络规模大或者稀疏的时候,邻接表更易工作。
  • 允许快速检索给定节点的所有邻居。
    图机器学习(CS224W)-第1课_第12张图片

图的性质

  • 大多数现实的网络是稀疏的。(即使显示中的网络很大,平均度数都是比较小的)
    图机器学习(CS224W)-第1课_第13张图片

边的属性可选项

  • 权重,如沟通频率
  • 排序,如最好的和次好的朋友
  • 类型,如朋友,有关系,合作
  • 标记, 如朋友与陌生,信任与不信任
  • 基于网络其他信息的结构的属性,如共同朋友的数量

图的更多类型:
-边上带权重的和不带权重的
图机器学习(CS224W)-第1课_第14张图片
-节点上有回边的和节点间有多边的
图机器学习(CS224W)-第1课_第15张图片

无向图的连接性

  • 连通图 Connected Graph:任意两个顶点都有一个路径相连
    一个非联通图是由于两个或者多个连通部分组成
    图机器学习(CS224W)-第1课_第16张图片
    桥边 Bridge edge:如果我们去除这条边,连通图将变成非连通。
    接合节点 Atriculation node: 如果我们去除这个点,连通图将变成非连通。

例子:
图机器学习(CS224W)-第1课_第17张图片

  • 强连通与弱连通
    强连通有向图 Strongly connected directed graph:有向图中有一条路径连通两点,反向也是连通的。如存在A-B的路径,就会存在B-A的路径。
    图机器学习(CS224W)-第1课_第18张图片
    弱连通有向图 Weakly connected directed graph:有向图在不考虑方向的情况下是连通图

强连通组成 Strongly connected components (SCCs)
图机器学习(CS224W)-第1课_第19张图片

阅读材料

  • P. Erdos, A. Renyi. On Random Graphs I. Publ. Math. Debrecen,1959.
  • P. Erdos, A. Renyi. On the evolution of random graphs. Magyar Tud. Akad. Mat. Kutato Int. Koezl., 1960.
  • B. Bollobas. Random Graphs. Cambridge University Press.
  • M.E.J. Newman, S. H. Strogatz and D.J. Watts. Random graphs with arbitrary degree distributions and their applications. Phys. Rev. E 64, 026118, 2001.
  • R. Milo, N. Kashtan, S. Itzkovitz, M.E.J. Newman, U. Alon. On the uniform generation of random graphs with prescribed degree sequences. Arxiv,2004.
  • D. Ellis. The expansion of random regular graphs. Lecture notes from Algebraic methods in combinatorics, Cambridge University,2011.
  • S. Arora, S. Rao and U. Vazirani. Expander Flows, Geometric Embeddings and Graph Partitioning. In proc. STOC '04, 2004.

参考与来源

CS224W
cs224w-第1课:介绍图的结构

你可能感兴趣的:(图机器学习,机器学习,图论)