数据挖掘的数据处理

一.高维度概括特征的抽取

告警事件,它包括:告警来源、攻击行为、攻击目标等,多项内容。其告警事件数据的多维性使得难以对其直接进行分析和利用。故,我们需要高纬度概括特征的抽取,依据实际的应用需求选择适合的特征。比如,结合电力互联网对于网络安全风险事件的预测需求,我们选择了被攻击IP地址和攻击性行为来作为高维度概括特征,实现对电力物联网告警事件数据的刻画。

二.数据标记与统一

在对数据进行利用之前,需将其转化为易于处理和分析的形式,从而为后续的挖掘工作模型建立提供有利条件。

三.数据库构建

初次被标记和统一化后的数据项不能直接被关联规则挖掘算法所利用,需采用一定算法对数据库进行构建。

你可能感兴趣的:(数据挖掘,人工智能)