5分钟入门机器学习 | 文末视频教程福利大放送


今年科技创投界的爆款是什么?当然是人工智能。


作为支撑人工智能的底层技术之一,机器学习是许多从事人工智能研发和应用的创业公司真正在做的事情。今天小编就给大家带来一篇超详细的机器学习入门指南。


提纲


 (一) 机器学习是什么

(二) 机器学习能干什么

(三) 机器学习基本概念

(四) 机器学习理论简介

(五) 机器学习的局限性

(六) 思考题
(七) 面试求职


什么是机器学习?


探究和开发一系列算法来如何使计算机不需要通过外部明显的指示,而可以自己通过数据来学习,建模,并且利用建好的模型和新的输入来进行预测的学科。 


机器学习能干什么呢?


人脸识别 


手写数字识别 


垃圾邮件过滤 


以上技术都使用到了机器学习



我们学习机器学习能干什么呢?


互联网公司都需要大量的机器学习工程师,很多的创业公司都已经开始搞机器学习和大数据了,这是一个非常有想象空间的领域。 当然大疆创新、face++、第四范式、地平线这些非互联网公司也做的很不错。

根据处理的数据类型不同 有文本处理(NLP,这个需 求最大)、语音识别(如百度语音搜索、讯飞语音) 视频识别(如无人车)以及其他的数据挖掘,如金融征信、量化交易、智能硬件中的数据挖掘等。以熟知的互联网公司举例,今日头条做个性化推荐、滴滴打车做智能调度算法。


机器学习与人工智能有什么关联?


人工智能是一种应用领域,机器学习是实现人工智能的 一种手段,但是不限于此。 PR(模式识别)DM(数据挖掘)属于 AI 的具体应用。


重头戏 | 理论框架



监督学习( Supervised Learning)

  • 从标记的训练数据来推断一个功能的机器学习任务 

  • 根据输出变量的类型,监督学习分为以下两类学习问

  • 回归:定量输出称为回归,或者说是连续变量预测

  • 分类:定性输出称为分类,或者说是离散变量预测 


在我们的面试过程当中,面试官常常喜欢问 回归和分类是什么区别?



无监督学习Unsupervised Learning


  • 用于处理未被标记的样本集,模型能够自主学习到知识。
    常用:GMM、聚类、降维、深度学习的逐层训练等 

  • K-means是无监督的聚类方法,KNN是有监督的分类方法,所以不要弄混喔! 


强化学习(Reinforcement Learning

强化学习就是智能系统从环境到行为映射的学习,以 使奖励信号(强化信号)函数值最大。

  • 基本组件:

  • 环境 

  • agent(交互对象)

  • 动作

  • 反馈(回报,奖赏)

  • 应用:机器人等 


经典算法


机器学习不是万能的 | 局限性


在手机上的一些照相app中,有这样一种功能,通过面 部拍照可以识别出人的年龄,但是经过亲测发现,在面 部光线充沛和光线偏暗两种情况下,程序判断出的人的 年龄差别很多,差十年都是很正常的,这是为什么呢


机器学习本质上还是一种统计方法,它只讲求统计意义未必考虑的是事情的本质 

对于机器学习模型来说,准确率和召回率都不可能是 100%,极端case难以避免。

 

还记得大明湖畔GAN?通过GAN合成一些噪声一 样毫无意义的图片,就能轻易骗过你高大上的机器学习模型


对于金融交易、自动驾驶等事关大笔资金安全、人身安 全的场景中,不要盲目迷信AI。不要把你的安全全部交给模型。


正确的做法是:规则(经验)+模型融合。 


学会批判热点 

为了否定和质疑别人的机器学习模型,有哪些思考的角度


Facebook聊天机器人开始自创语言了?程序的bug! ”在通过照片识别同性恋这样的任务中,斯坦福的人通过 平均人脸的模型发现同性恋男性更少留胡子那么 会不会出现这样的情况 一个人模型判定为非同性恋的家伙剃掉胡子以后再用模型判断,就变成了同性恋,从机器学习的角度,完全会有这样的情况发生。


机器学习工程师面试题有哪些?

  • 大数据基础: 大小表的map-reduce

  • NLP基本知识: edit distance
    数据结构与coding

  • 手写快排、二分查找(C++/python)leetcode 


  • 深度学习理论

       lstm原理 CNN做文本分类的网络结构 

  • 传统机器学习理论

       boosting的原理, 手推SVM

       手写造轮子:kmeans hadoop实现 


 

怎样成为机器学习工程师?

  • 辅助技能(linux python 数学

  • 机器学习概念和实战 

  • 深度学习理论和实战 tensorflow 等工具 

  • 具体业余领域的训练(NLP、视 觉、SLAM

  • 最好还懂基础编程语言(C++/java) 

  • 最好有大数据的基础(hadoop spark) 


  我该学什么 ?

  • 基本的语言能力: linux Python C++或者JAVA

  • 算法和数据结构功底

  • 机器学习理论和一定的实战经验

  • hadoop  spark(加分

  • 实习或者竞赛经验(加分


  怎么学?

  • step1: 拜师 剃发明志 

  • step2: 扎马步 

  • step3: 学武功 


  •  step4: 结合具体应用场景

    (如NLP 计算机视觉) 进行实践做项目参加竞赛或者实习 

  • step5:找工作 面试

  • step6:修炼圆满 走进FLAG/BAT 


文末福利

Ape君特此献上

斯坦福大学机器学习入门视频课程

无套路,无需分享

只需要关注并回复即可直接获取课程链接




你可能感兴趣的:(5分钟入门机器学习 | 文末视频教程福利大放送)