机器学习实战第一章-机器学习基础

一,开发机器学习应用程序的步骤

  1. 收集数据
  2. 准备输入数据
  3. 分析数据:在此阶段可以对原始数据填充空值、过滤垃圾数据(如异常数据)、进行特征选择与特征降维、可视化分析等等。
  4. 训练算法
  5. 测试算法
  6. 应用算法

二, Python语言实现机器学习算法的优势

  1. 语法简单清晰
  2. 易于处理纯文本文件
  3. 使用广泛,存在大量的开发文档
  4. 科学函数库:Scipy & Numpy;绘图工具库:Matplotlib等等
  5. 总之,Python使得我们可以花费更多的时间处理数据内在的含义,而不是其他细枝末节,使得我们更容易更快速地表达自己的真正目的,例如快速的检验算法和思想是否正确。

三,Numpy常用操作

from numpy import *
randA = random.rand(4,4)    #1,产生一个4*4的随机数组,数据类型是array
randMat = mat(randA)        #2,将array数据类型的数据转换为matrix数据类型array和matrix看起来很相似,但是执行相同的数学运算可能得到不同的结果。
randMat.I                   #3,一个矩阵的逆矩阵
randMat.T                   #4,一个矩阵的转置矩阵
eye(4)                      #5,得到4*4的单位矩阵
eye(4,3)                    #6,得到4*3的单位简化行阶梯型矩阵

总是,array数据类型总是元素之间一一对应的数学运算,而matrix才是真正的矩阵运算。

你可能感兴趣的:(机器学习)