数据挖掘与深度学习

        本人正在从事于深度学习相关的工作,有感于深度学习强大的特征表达能力,本以为深度学习会在各行各业的人工智能中能够发光发热,但是发现在数据挖掘、网络安全(网络漏洞)数据挖掘中深度学习应用还较少,主要是因为漏洞挖掘中一个比较难处理的地方在于漏洞之间的相似性,正常输入和异常输入没有太多相似特征,在属性类别或特征提取方面还有待研究,目前直接把深度学习用在漏洞挖掘领域并不好用。

        本文将持续记录一些能够将深度学习应用于数据挖掘的最新文献及方法、思路。

        数据挖掘中很常见的一类数据是自然语言,而对自然语言的处理,有专门的处理:natural language processing。natural language processing,简称NLP,其处理的主要目的是理解文本的含义与结构,即句子的意思。其应用领域较广,包括:机器翻译,语音转文本,自动摘要(即对给定文本进行总结),聊天机器人,自动编写媒体文章等。
        基于文本的数据挖掘,也叫文本挖掘或文本分析,其是建立在NLP的基础之上,通过将人类的模糊的,非结构化的数据使用NLP进行处理后,我们可以理解这些大型的非结构化数据中的模式,最后达到提取文本数据中隐藏的信息的目的。
        简单点说,NLP可以理解自然语言,得到相应的语义,即这段语言是要做什么。文本挖掘是通过理解的语义来分析出潜在的模式。NLP 可使用大数据解决商业中的难题,比如零售、医疗、金融领域中的业务
参考文章:
http://www.chinarobots.cn/RenGongZhiNeng/2346.html



你可能感兴趣的:(深度学习(deep,learning))