2018-09-07

MALICIOUS URL DETECTION USING CONVOLUTIONAL NEURAL NETWORK - 2017

这篇主要思想是先利用blacklist对URL进行过滤,blacklist里面有的URL直接输出为恶意,其他URL数据使用三种算法进行进一步判断,三种算法依次是:SVM、逻辑回顾、CNN,其中SVM使用TF-IDF特征,CNN使用word2vec特征。
数据集:https://github.com/faizann24/Using-machine-learning-to-detect-malicious-URLs/tree/master/data 恶意URL样本从网站上爬取,正常URL样本使用现有的,共420464个URL,其中恶意的有75643个。
结论:SVM和CNN的效果都略好于逻辑回归

你可能感兴趣的:(2018-09-07)