本文知识来源参考网络与专业书籍
参考书籍
1、机器学习 - 周志华
2、统计学习 - 李航
理解机器学习首先来找个参照物,因为科学创造很多时候都来源于现实,在现实的基础上进行模仿,改造升级;学习是人的基本本能,从呱呱坠地时就开始不断开始学习和实践,并应用在生活工作上,聪明的计算机科学家们于是在想能否让机器也具备人的这种学习能力?让机器具备学习能力,就是机器学习了!
机器学习简明的定义:使机器能够自动从数据中学习,从经验中提高性能,并在没有明确编程的情况下预测事物。
机器学习的实现流程:
在样本历史数据的帮助下,机器学习算法构建了一个数学模型,无需明确编程即可帮助做出预测或决策。机器学习将计算机科学和统计学结合在一起,以创建预测模型。机器学习构建或使用从历史数据中学习的算法。我们提供的信息越多,性能就越高。
人工智能,即AI主要是研究如何使得计算机去做过去只有人才能做的智能工作,它不仅仅涉及到计算机科学,还包括心理学、哲学以及语言学等其他学科,而它的一些研究成果,比如说扫地机器人、智能家居等在很大程度上都极大的改变了我们的生活方式。
人工智能是一个很广泛的领域,而机器学习则是实现人工智能的核心所在;
深度学习就是一种比较火的机器学习算法,它是基于神经网络发展起来的。机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科,而深度学习作为机器学习研究中的一个新的领域,主要目标在于建立、模拟人脑进行分析学习的神经网络,换句话说就是深度学习是研究如何使得机器去模拟人脑分析解释数据,比如图像、声音文本等。
大数据是相对于传统数据出现的一个概念,它是当今社会下高科技时代的产物,是一种规模大到在获取、存储、管理、分析方面都远远超出了传统数据库软件工具能力范围的数据集合,具有大量、高速、多样、低价值密度以及真实性这五大特性。对于大数据技术来说,其主要目的不是在于去掌握这些庞大的数据信息,而主要是在于对这些庞大数据进行专业化处理以此来挖掘其背后含义。
大数据和机器学习经常一起出现,是因为我们会使用机器学习这个工具去做大数据的分析工作,也就是说机器学习可以看作是我们做大数据分析的一个比较好用的工具,但是大数据分析的工具并不止机器学习,而机器学习也并不只能做大数据分析。
今天,在计算机科学的诸多分支学科领域中,无论是多媒体、图形学还是网络通信、软件工程,乃至体系结构、芯片设计,都能找到机器学习的身影,尤其是在计算机视觉、自然语言处理等计算机领域,机器学习已成为最重要的技术进步源泉之一;
机器学习的应用已经融入到我们在日常生活中的方方面面,例如谷歌地图、谷歌助手、Alexa 等。 下面介绍一些最常见的机器学习的应用领域:
图像识别是机器学习最常见的应用之一。它用于识别物体、人物、地点、数字图像等。图像识别和人脸检测的流行用例是,自动好友标记建议:
机器学习最令人兴奋的应用之一是自动驾驶汽车。机器学习在自动驾驶汽车中发挥着重要作用。最受欢迎的汽车制造公司特斯拉正在开发自动驾驶汽车。它使用无监督学习方法训练汽车模型在驾驶时检测人和物体。
在医学科学中,机器学习用于疾病诊断。有了这个,医疗技术发展得非常快,并且能够建立可以预测大脑中病变的确切位置的 3D 模型。它有助于轻松发现脑肿瘤和其他脑相关疾病。
语音识别是将语音指令转化为文字的过程,也称为“语音转文字”,或“计算机语音识别”。目前,机器学习算法被各种语音识别应用广泛使用。如谷歌助手、Siri、Cortana和Alexa正在使用语音识别技术来遵循语音指令。
如今,如果我们访问一个新地方并且我们不知道该语言,那么这根本不是问题,因为机器学习也通过将文本转换为我们已知的语言来帮助我们。谷歌的GNMT(谷歌神经机器翻译)提供了这个功能,这是一种将文本翻译成我们熟悉的语言的神经机器学习,称为自动翻译。自动翻译背后的技术是一种序列到序列学习算法,它与图像识别一起使用并将文本从一种语言翻译成另一种语言。
在学习机器学习之前,您必须具备以下基础知识,以便您轻松理解机器学习的概念:
1)高数、概率和线性代数的基础知识。
2)使用任何计算机语言进行编码的能力,尤其是 Python 语言。
书籍:机器学习、统计学习
视频:吴恩达,林轩田、B站白板推导系列
paper:非常好的学习资料,建议认真研读并复现
机器学习并非是若干种算法(方法)的堆积,不要过度将目光仅聚焦在具体算法推导和编程实现,而是把握好算法背后的思想脉络,才能在实践中灵活运用,根据任务特点对现有套路进行改造融通;