关于深度学习的网络流量分类论文整理(二)

Paper:End-to-end Encrypted Traffic Classification with One-dimensional Convolution Neural Networks

论文:基于一维CNN的端到端的加密流置分类方法

论文下载:https://ieeexplore.ieee.org/document/8004872
代码下载:https://github.com/echowei/DeepTraffic
数据处理工具包使用方法:https://github.com/yungshenglu/USTC-TK2016
作者博士毕业论文收录于知网:基于深度学习的网络流量分类及异常检测方法研究

这篇论文和笔者上一篇分析的论文关于深度学习的网络流量分类论文整理(一)是同一个作者写的,中科大的王伟博士。
在本篇论文中,作者称创造性地提出了一个端到端的使用深度学习技术的加密流量分类方法,下面我们一起来看看。下图1展示了传统分治模型和端到端模型。

关于深度学习的网络流量分类论文整理(二)_第1张图片

关于数据预处理和流量表示的方法,在上一篇博客中已经分析过,这里就不再赘述了,感兴趣的朋友可以自行查看。这里主要介绍一下不同之处,包括使用的数据集、卷积核、所做的实验。

一、数据集

不像上一篇使用的是自己制作的数据集USTC-TFC2016,这篇使用的是公开数据集,可信度更高,由加拿大网络安全研究所提供,地址:VPN-nonVPN dataset (ISCXVPN2016),包括了7种常规加密流量和7种协议封装流量,共14种加密流量。论文没有把Browser和VPN-Browser选进去,因为例如Facebook_video等文件既可归为Browser也可归为Streaming,因此选择了12种数据,如下表1。
关于深度学习的网络流量分类论文整理(二)_第2张图片

二、整体工作流程

分为预处理阶段、训练阶段、测试阶段。这里就不再详细展开了。
关于深度学习的网络流量分类论文整理(二)_第3张图片

三、模型架构

文中说1D-CNN适用于文本语言处理,2D-CNN适用于图片,3D-CNN则是语音视频。在这之前流量分类领域的研究都是将流量转换为二维图片,然后用二维卷积神经网络进行分类,然而网络流量本质上是一种时序的一维字节流,类似自然语言处理中词语、句子的结构。所以使用的模型是在自然语言处理任务中应用较多的一维卷积神经网络。模型参数如下表三。

网络架构与在上一篇论文中使用的模型基本一致,只不过上一篇用的卷积核是5x5,这篇用的是25x1。

关于深度学习的网络流量分类论文整理(二)_第4张图片

四、扩展实验

实验分为4类,2分类、6分类、12分类
关于深度学习的网络流量分类论文整理(二)_第5张图片

五、实验结果及分析

一维CNN和二维CNN的精度比较如下图,两种神经网络的精度全部在80%以上,一维CNN的精度全部比二维CNN的精度高。验证了一维CNN比二维CNN更适用于网络流量分类。

关于深度学习的网络流量分类论文整理(二)_第6张图片

你可能感兴趣的:(流量分类,神经网络,深度学习)