数据挖掘与模式识别、机器学习的研究与应用

#数据挖掘与模式识别、机器学习的研究与应用#
机器学习,让机器模拟人类来学习新的技能与知识。让计算机学会像人一样举一反三,让程序从大量的历史样本数据中寻找出其中隐含的规律与模式,利用这个规律与模式可以对新的样本进行预测和分类等。机器学习分为监督学习,半监督学习和无监督学习。监督学习可以看做是寻找一个函数f(x),而这个函数是通过大量的已知的样本x与其所对应的y值所确定的,这个函数不仅仅适用于已知样本,当输入新的样本时,可以得到一个期望值,根据这个期望值,便可以对新样本进行预测和分类。半监督学习就是原始的样本x部分有其所对应的y值,部分原始的样本没有其对应的y值,程序根据这些数据一样找到规律,得到一个f(x)。而无监督学习就是原始样本x都没有其所对应的y值,需要自己去摸索,来找到样本x中所符合的规律,从而可以总结出一个f(x),这个f(x)同样也适用于新的样本。近年来,机器学习多应用在大数据下,产生了巨大的价值,大数据是的核心是利用数据价值,而机器学习是利用数据价值的关键技术,而大数据为机器学习提供了大量的数据,使机器学习的预测与分类准确。机器学习是实现人工智能的一种重要的方法,而深度学习是一种实现机器学习的技术。人工智能还可用于计算机视觉,语音识别等多个领域。
模式识别,就是对模式的区分和分类,把研究对象根据其特征归到众多类中的一种,也可以叫模式分类。有一些复杂的模式识要对其结构特征进行描述才能进行识别,如汉字识别,景物识别。模式识别是让计算机通过一系列的数学方法来达到人类神经生理学的识别功能。模式识别属于机器学习的一种,是利用机器学习来对样本进行识别后分类。所以,模式识别与机器学习的方法是相同的,分为监督模式学习识别,半监督模式学习识别和非监督模式学习识别。比如鲈鱼和鲑鱼的自动识别分类。先对大量鲈鱼与鲑鱼的特征进行提取,并通过机器学习,选择合适分类特征,找到鲈鱼和鲑鱼所对应的特征规律,当有一条新鱼到来时,首先对鱼的图像进行处理,然后将新的样本鱼的特征进行提取,然后利用机器学习的结果根据特征将鱼进行分类。模式识别还可以用来进行人脸识别,指纹识别,字符识别,计算机辅助医疗诊断,视频智能识别等多个领域。
数据挖掘是数据库中的知识发现。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。其中,数据源必须是真实的,有噪声的,模糊的。且发现的知识必须是有用的。这里的知识,并不单单指的是数据,它更指的是潜在的信息,规律,共性,规则,模式等。而且这些知识是相对的,运用于特定的领域,并不只自然规律,科学真理。这里的数据也并不指传统的数据,还包括文本,图形,图像等。数据挖掘时,并不是对从大量的原始数据中进行知识的直接提取,根据需要,可以对数据进行各种变换转化,从而挖掘出更多知识。所以数据挖掘也可以称作数据处理与分析。但是数据挖掘与传统的数据分析是不同的,数据挖掘是要发现那些不能靠直觉发现的知识信息。数据挖掘知识的过程是机器学习,数据是从数据库中得到,所以数据挖掘是机器学习与数据库的整合。数据挖掘可应用于市场营销,企业危机原理等。是使用较为广泛的技术。
总的来说,机器学习,模式识别与数据挖掘是目前十分热门的应用技术,都是在大量数据中总结规律,挖掘知识与信息的过程。可以将这些技术与其他技术,例如大数据等有机的结合起来,使数据发挥更大的作用,产生更大的价值,造福于人类。

你可能感兴趣的:(数据挖掘与模式识别、机器学习的研究与应用)