2015_ICSE_Mining Apps for Abnormal Usage of Sensitive Data

有的时候就会想,怎么看ICSE和FSE等比较好的会议和期刊的文章,总都觉得好像还都挺有意思的。自己的工作嘞,好像也不行啊。

最近对app挖掘分析的文章比较感兴趣,所以下了几篇看看。这个也是这一类,这一类,刚突然想到,也许并不算新,原来也有对malicious software进行识别分析的文章,这个只不过对象换成了APP而已,或者说,全靠移动互联的兴起,造就了传统软件的各种已分析的问题在移动平台由于平台本身的特殊性又兴起的研究。

说道本文,就是各种app,malicious app和benign app的识别。本文的出发点,是从对sensitive data的使用即data flow出发,通过2类data flow的dissimilarity的程度来最后识别出malicious app。这里的一个创新是,以往的malicious app的识别是用将a novel app将已有的malicious apps去做相似度匹配,匹配程度越高,则越可疑。本文呢,从相反的角度出发,不同malicious app,即你可以没有malicious app,只用benign apps,先将benign apps中的对sensitive data的使用即dataflow common usage给提取出来,随后计算新的app其与这个common usage的偏差程度有多大,偏差越大,则越可疑。当然,本文对benign apps中对sensitive data的使用进行了事先了分类,每一类都去计算一个偏差值。这样dissimilarity就有N类的N个偏差值,最后文章好像还对这个结果进行了一个分类算法的预测。最终得出这个app是否是likely malicious的。

ps:文章中提到了现有的malicious apps和benign apps的那么多个app数据如何获得的。malicious apps用的现有的2个列表数据。benign apps用的Google play中的30类的apps中的top100. 这样有现成的数据还是很好的。

以上!

zou@Home

2015-07-23

你可能感兴趣的:(2015_ICSE_Mining Apps for Abnormal Usage of Sensitive Data)