








  • 系统调用特征
  • 规范化代码特征
  • N-gram特征
  • 控制流(CFG特征)
  • 指令序列特征
  • 文件格式等特征


Byte n-gram Features:从文件的二进制代码中提取Byte n-gram特征,其中选择训练集中每个类的L个最常出现的n克来表示类的配置文件。

Opcode n-gram Features:首先拆卸所有数据集的可执行文件和操作码提取。一个操作码的汇编语言指令描述要执行的操作。它是短形式的操作码。一条指令包含一个操作码和操作数,选择应该采取的操作。一些操作的操作数操作码可能操作,根据CPU体系结构,寄存器,值存储在内存和堆栈等等。一个操作码的作用在算术、逻辑运算和数据处理操作。操作码能够统计得出之间的可变性恶意和正版软件。

Portable Executables:这些特征是从EXE文件的某些部分提取出来的。利用可执行文件的结构信息,通过静态分析提取可执行文件的特征。这些有意义的特性表明文件被操纵或感染以执行恶意活动。

String Features:这些特征是基于纯文本编码在可执行文件,如windows, getversion, getstartupinfo, getmodulefilename, messagebox,库等。这些字符串是用PE和非PE可执行文件编码的连续可打印字符。

Function Based Features:在程序文件的运行时行为上提取基于函数的特征。基于函数的特性函数驻留在要执行的文件中,并利用它们生成表示文件的各种属性。

Hybrid Analysis Features:静态分析和动态分析的结合。


  • 基于静态特征的恶意代码检测技术
  • 基于动态特征的恶意代码检测技术
  • 基于融合特征的恶意代码检测技术(各种集成特征类型的检测方法)
[1] Bo Yun Zhang.Survey on Malicious Code Intelligent Detection Techniques

[2]Smita Ranveer,Swapnaja Hiray.Comparative Analysis of Feature Extraction Methods of Malware Detection
