Graph Summarization

文章目录

  • 1 Preliminaries
  • 2 Recent Summarization Techniques
    • 2.1 Graph Clustering
    • 2.2 Statistical Summarization
    • 2.3 Goal-Driven Summarization
  • 3 Key Research Findings
  • 4 Applications
  • 5 Future Research Directions


1 Preliminaries

  • Knowledge Graphs
  • 描述实体的概念属性,以及它们的关系
  • Property Graphs
    边和点附加了属性值,比如属于何种类型
  • Streaming Graphs
    节点和边带上时间戳

2 Recent Summarization Techniques

2.1 Graph Clustering

  • Structural Clustering
    • 用基于划分和计算模块性、密度或自定义度量的标准算法
    • 谱方法(容易收到噪声污染,采用移除低密度点的方法)
    • 分解节点邻接矩阵来计算集群,低维节点嵌入,或通过最大化邻域概率进行随机游走来学习这种嵌入
    • 此外还有基于连续最近邻相似图和马尔可夫稳定性质量度量的多尺度社区检测技术等等
  • Attributed Clustering.
    • 图卷积网络
    • 高阶图卷积网络与谱聚类相结合
    • 基于流的局部聚类技术
    • 基于星型模式图表示

2.2 Statistical Summarization

底层方法基于模式挖掘或抽样

2.3 Goal-Driven Summarization

  • 在线聚类算法
  • Fast and accurate graph stream summarization
    图权重由时间戳给出,并基于哈希压缩努力找到邻接矩阵的替代数据结构
  • GRASP
  • Utility-driven graph summarization
    它们的目标是效用函数的最大化

3 Key Research Findings

Graph Summarization_第1张图片

  • 关于图聚类,最近的研究集中在局部性和效率上
  • 在考虑定量标准时,可以使用统计方法来提取相关的模式
  • 当面对查询相关性或内存占用的问题时,可以考虑效用函数

下图为本文各个方法的分类汇总
Graph Summarization_第2张图片

4 Applications

  • Query Efficiency
    查询效率
  • Query Size Estimation
    查询大小估计
  • Query Disambiguation
    查询消歧
  • Source Selection
    源的选择
  • Graph Visualization
    图可视化
  • Schema Discovery
    模式发现
  • Pattern Extraction
  • 模式提取
  • Knowledge Graph Search
    知识图谱搜索

5 Future Research Directions

  • 处理混合数据集
  • 构建重叠图簇
  • 处理动态图,确保流摘要可更新
  • 研究摘要和评估基准的质量度量

有不正确的地方欢迎指出,thanks

你可能感兴趣的:(聚类,数据挖掘)