该篇文章为个人在准备考研复试对计算机前沿知识梳理,旨在帮助清晰化理解一些常见前沿术语的逻辑框架和对概念的熟悉,故答案可能会有重复或者不同的定义,读者可根据自身需求理解并进行碎片记忆,不需要完全记忆,只要能够有话说即可。
Q:你认为的计算机发展前景,那些方面比较热门
A:人工智能、大数据、云计算和物联网
Q:什么是人工智能,谈谈你对她的理解?
Q:什么是机器学习?讲讲具体的算法。你认为你本科学的数学有哪些会用到机器学习中?
Q:什么是神经网络?
Q:什么是深度学习?
Q:什么是数据挖掘?
Q:什么是模式识别?
Q:什么是大数据?你接触到的最大的数据有多大?
Q:大数据和机器学习之前有什么联系?
Q:区块链技术?
Q:机器视觉?
Q:什么是云计算?
Q:什么是物联网?
Q:梯度下降优化算法
Q:用过哪些搜索引擎,他们的区别是什么
Q:什么是嵌入式系统
人工智能(AI)与机器学习经常被混淆,但它们不是一回事。人工智能是指机器执行智能任务的能力,而机器学习是指机器清除数据中有意义模式的自动化过程。没有机器学习,人工智能无法实现。
20世纪50年代以来,计算机科学家们致力于研发与人类智能类似的程序。当这些程序被开发到一定水平后,它们就可以在一些特定的应用场景中替代人类。它们被称为人工智能(AI)和认知计算。
在计算机科学里,人工智能是一个跨学科的研究领域。根据研究目标的不同,它涉及数学、信息学、语音识别、计算机视觉和机器人学等学科的解决方案。而自从研发人员开始教导计算机理解同情、快乐和愿意提供帮助等情感后,心理学和哲学模型也被纳入了研究范围内。此外,由于计算机程序还需要在自主驾驶或保险公司的管理等工作中做出决策,它还必须能够回答法律领域,尤其是涉及责任求偿等方面的问题。
神经网络类似人类大脑,由一个个神经元组成,每个神经元和多个其他神元连接,形成网状。单个神经元只会解决最简单的问题,但是组合成一个分层的整体,就可以解决复杂问题。
传统的机器学习方法只利用了一层芯片网络。
深度学习的最核心理念是通过增加神经网络的层数来提升效率,将复杂的输入数据逐层抽象和简化。
当下流行的深度神经网络可分为应对具有空间性分布数据的CNN(卷积神经网络)和应对具有时间性分布数据的RNN(递归神经网络,又称为循环神经网络)。
CNN往往用于图像识别,
RNN则往往用于语音识别和自然语言处理,
机器学习主要是工具集,数据挖掘和模式识别,则是这套工具集的两块用武之地
机器学习(MachineLearning),在我看来就是让机器学习人思维的过程。机器学习的宗旨就是让机器学会“人识别事物的方法”,机器学习就是模仿人识别事物的过程,即:学习、提取特征、识别、分类。
机器学习的方法主要有三种:监督学习、半监督学习和无监督学习。
监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。白话一点,就是根据已知的,推断未知的。
代表方法有:Nave Bayes、SVM、决策树、KNN、神经网络以及Logistic分析等;
半监督学习方法主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题,也就是根据少量已知的和大量未知的内容进行分类。
代表方法有:最大期望、生成模型和图算法等。
无监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。也就是及其自个儿学。
代表方法有:Apriori、FP树、K-means以及目前比较火的Deep Learning。
目前的发展是,监督学习技术已然成熟,无监督学习还在起步,所以对监督学习方法进行修改实现半监督学习是目前的主流。但这些方法基本只能提取信息,还不能进行有效的预测(人们就想,既然没法得到更多,就先看看手里有什么,于是数据挖掘出现了)。
正是基于机器学习技术的应用,数据才能发挥其魔力。大数据的核心是利用数据的价值,而机器学习是利用数据价值的关键技术。对于大数据而言,机器学习是不可或缺的。相反,对于机器学习而言,越多的数据会就越能提升模型的精确性,同时,机器学习算法复杂的计算时间也迫切需要分布式计算与内存计算等关键技术。因此,机器学习的兴盛也离不开大数据的帮助,大数据与机器学习互相促进相依相存。
机器学习(Maching Learning):是实现人工智能的一种手段
深度学习(Deep Learning):是一种机器学习的技术。
深度学习是一种实现机器学习的技术,也包含了监督学习算法和无监督学习算法。常见的卷积神经网络就是一种监督学习方法,在图像分类(如人脸识别)上应用非常广泛。生成对抗网络(GAN)是一种无监督学习方法,经常被用来做图像生成(如深度卷积对抗生成网络(DCGAN)可用于生成卡通图像)。
深度学习是指通过多层人工神经网络进行学习。这种网络模型以人类神经系统为基础。在人类大脑中,神经通路使用得越多就会越活跃,而这一点同样适用于软件网络。
强化学习(Reinforcement Learning):是一种机器学习的技术。区别于监督学习,强化学习具有很强的决策优化能力。
传统机器学习模型在数据中集中寻找固定模式,而强化学习程序则更进一步。它们会做出决策以尽可能地实现特定的目标。这体现了从预测性分析到指导性分析的过渡。
深度学习:是一类通过多层非线性变换对高维复杂性数据建模算法的集合。
深度学习的整体流程:第一步准备数据集(例如图片或音源)二。搭建模型(选用适当的处理函数)3.进行迭代训练,再没有得出结果,不断循环,(十分烧显卡,我的电脑最近感觉都快炸了)4.最终使用模型。
深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
现在流行的深度学习网络结构有"CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的等。
现在流行的深度学习框架有MXnet,tensorflow,caffe等,而在这些框架之上(或许不太准确),还有PyTorch,Keras等。
eg:啤酒与尿布-沃尔玛
就是在各种数据之中,通过一定的方法和工具,挖掘发现感兴趣的知识。
归结来说,数据挖掘就是要解决三个问题,去哪挖、挖什么和怎么挖。
数据挖掘有三大块工序,数据采集、数据预处理和数据分析。
分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CART
聚类算法:K-Means,EM
关联分析:Apriori
连接分析:PageRank
模式识别的重点在于两个字,识别,所以一般的应用形式都叫XX识别,譬如说现在大家都很熟的人脸识别,往大了说就是图像识别。除了图像,模式识别也研究其它各种数据形式,譬如音频类的语音识别,以及文本类的自然语言识别,当然,现在更习惯称之为自然语言理解。
区块链,就是一个又一个区块组成的链条。每一个区块中保存了一定的信息,它们按照各自产生的时间顺序连接成链条。
区块链是一个信息技术领域的术语。从本质上讲,它是一个共享数据库,存储于其中的数据或信息,具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。基于这些特征,区块链技术奠定了坚实的“信任”基础,创造了可靠的“合作”机制,具有广阔的运用前景。
这个链条被保存在所有的服务器中,只要整个系统中有一台服务器可以工作,整条区块链就是安全的。这些服务器在区块链系统中被称为节点,它们为整个区块链系统提供存储空间和算力支持。如果要修改区块链中的信息,必须征得半数以上节点的同意并修改所有节点中的信息,而这些节点通常掌握在不同的主体手中,因此篡改区块链中的信息是一件极其困难的事。
相比于传统的网络,区块链具有两大核心特点:数据难以篡改和去中心化。基于这两个特点,区块链所记录的信息更加真实可靠,可以帮助解决人们互不信任的问题。
云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的
HTML5
HTML5指的是包括HTML、CSS和JavaScript在内的一套技术组合。
问一些大数据的知识,不让你说定义,问大数据的特征,举一个例子说明什么是大数据,具体是怎么实现的
注重个体,从整体的地方发现一些特定的规律,比如很著名的啤酒和尿布的故事
Focusing on the individual, Discover some specific laws.
交互。
在机器学习算法中,有时候需要对原始的模型构建损失函数,然后通过优化算法对损失函数进行优化,以便寻找到最优的参数,使得损失函数的值最小。而在求解机器学习参数的优化算法中,使用较多的就是基于梯度下降的优化算法。