为什么现在机器学习突然如此火爆

 

为什么现在机器学习突然如此火爆_第1张图片
图片发自App

而今机器学习的改进大致在两个方面,一方面是软件,就是算法方面,从最小二乘法出发,到贝叶斯思想。另一方面就是硬件一是采用并行计算,比如GPGPU,FPGA;二是分布式计算,比如Apache的Hadoop,把任务划分成多个相同的线程,在大型集群中运行应用程序。

为什么现在机器学习突然如此火爆_第2张图片
图片发自App

  谈机器学习总以为全是那些复杂的数学推导。这倒不全对。大数据有好处也有劣处。好处是海量,而坏处是冗余。你获得的海量数据可能只用一个特征便可实现回归或者聚类。往往将数据输入模型训练前,对数据的准备工作要耗费整个流程百分之八十的时间。

  爱上数据,而非学到算法。

  在数据处理阶段的硬件层次,曾多采用异构架构进行算法加速。一是多核CPU.二是专用硬件,要么用ASIC流片,要么用FPGA设计大规模并行加速器。而在软件层面,你用Python也好,Java也好,不过是利用架构的接口给你提供了一个易用的框架

为什么现在机器学习突然如此火爆_第3张图片
图片发自App

  在统计学看来,机器学习不过是统计学的应用罢了,他们忽视了实际的工程思想,在懂业务的人看来这就是特征学习的大思想,又忽略了数理逻辑。

  在机器学习中,赢得胜利不是因为开发出了一个新算法,往往在于对数据巧妙的预处理,归一化,以及组合现有方法。因为实测表明,在数据足够大足够好的的情况下,最终采用不同算法的影响微乎其微。这是数据为王的思想。也是近来数据分析师岗位大热的原因。

为什么现在机器学习突然如此火爆_第4张图片
图片发自App

  对于我们普通人而言,在开始学习机器学习前总是畏难,所谓困难,总是会者不难。拿数据的思想来看,我们大多数人可能很少有机会成为分子,甚至可能一生都是分母。这里要谈到逆商,就是敢不敢不断接受打击,不断接受不可能,不断逆水行舟。在这个过程中会慢慢认清自己。

  选择没有错,初心没有错,更重要的是不能骗自己。努力成为海量数据中那个偏差或者方差足够大的样本,也是很有意思的一生。

你可能感兴趣的:(为什么现在机器学习突然如此火爆)