论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning

文章目录

  • 一、论文相关信息
  • 二、摘要
    • 1、现有研究的不足
    • 2、解决措施
  • 三、AMPLE框架
    • 1、Graph Simplification
      • (1)基于类型的图简化
    • (2)基于变量的图简化
    • 2、增强型图表征学习
      • (1)与边有关的图卷积模块
      • (2)Kernel-scaled 表征模块
  • 四、实验
    • 1、研究问题
    • 2、实验数据集信息
    • 3、实施细节
    • 4、主要实验结果

一、论文相关信息

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第1张图片

二、摘要

1、现有研究的不足

  • GNN本质上很难处理代码结构图中远距离节点之间的关系;
  • 现有研究没有充分利用代码结构图中多种类型的边。

2、解决措施

  针对现有研究的不足,论文提出了一种名叫AMPLE的漏洞检测框架,其主要由以下两部分组成:
  1)图的简化。通过减少代码结构图的大小来缩短结点之间的距离。
  2)增强图表征学习。通过边感知(edge-aware)图卷积模块将异构边的信息融入到结点向量中;通过kernel-scaled表征模块捕捉图结点之间的关系。

三、AMPLE框架

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第2张图片

1、Graph Simplification

  图简化旨在通过压缩代码结构图中的重复信息来缩小图的尺寸和节点之间的距离。可分为基于类型的图简化基于变量的图简化

(1)基于类型的图简化

  基于类型的图简化旨在根据结点类型来合并相邻结点。本论文提出了以下七种合并规则:

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第3张图片

  下图是一个基于类型的图简化实例。图中红色虚线框内的结点满足上图第二条规则,故红色虚线框代表的结点被删除。

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第4张图片

(2)基于变量的图简化

  基于变量的图简化旨在根据结点变量合并叶子节点。该措施主要应用在AST的叶子节点上。

 图4中变量”str“出现在”char str[15]“和”scanf (”%s“,str)“的子节点中,因此整合两个“str”结点为一个。

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第5张图片

2、增强型图表征学习

  增强型图表征学习分为两个模块:与边有关的图卷积模块kernel-scaled 表征模块

(1)与边有关的图卷积模块

  主要思想是考虑边的类型(AST,CFG…)。首先通过对不同类型的边分别加权来计算结点向量,然后基于多头注意力机制增强结点向量。
论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第6张图片

(2)Kernel-scaled 表征模块

  这个模块旨在通过捕获远距离节点之间的关系来学习图的全局信息。这个模块包含两种卷积核:大卷积核关注于远距离节点之间的关系,小卷积核关注于邻居节点之间的关系。
论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第7张图片

四、实验

1、研究问题

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第8张图片

2、实验数据集信息

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第9张图片

3、实施细节

(1)对于所有的baseline,使用相同的数据,且训练集、验证集核测试集的比例分别为8:1:1;

(2)预处理细节

  • 把结点中的代码看成token序列,并将代码token化(保留标点);
  • 基于word2vec,为每一个token训练词向量;
  • 将结点中所有token的向量平均,作为整个结点的向量。

4、主要实验结果

论文阅读:Vulnerability Detection with Graph Simplification and Enhanced Graph Representation Learning_第10张图片

你可能感兴趣的:(论文研读,网络安全)