机器学习sklearn实战笔记(一)

写在开始的话:
本系列教程主要以讲解代码的方式,注重程序代码本身,以一个个实战列子来熟悉sklearn和机器学习,适用于有一定理论基础却没有手写过代码的同学,如:刚看完吴恩达的机器学习视频,打算实战的同学.

什么是sklearn?TensorFlow又是什么?
sklearn是python的一个非常流行的机器学习库.
TensorFlow是google研发的非常流行的深度学习库.
简单讲,深度学习是机器学习的一个分类,这里不再赘述.

通过本系列文章你将懂得:

  1. 了解监督学习,非监督学习,数据处理等在sklearn上的应用
  2. 了解画图类工具的使用
  3. 可以亲自通过使用sklearn上的api来解决一些小型问题.

在进行sklearn的实战之前,需要有如下前提要求,已经配置好环境的同学可以略过
基础知识需求:
懂机器学习一些基本知识.如:吴恩达的机器学习,懂python的最基础语法以及’切片’部分的知识
参考视频: 吴恩达机器学习
参考书目: 周志华西瓜书
python基础 :廖雪峰
sklearn中文api地址 http://sklearn.apachecn.org/#/
sklearn官网: https://scikit-learn.org/stable/user_guide.html
numpy中文文档: https://www.numpy.org.cn
环境需求:
搭建好python环境,无论是使用pycharm还是jupyter都可以.本人使用pycharm,主要环境搭建步骤如下:
8. 配好python环境,要求python3版本
9. 下载pyCharm编译器,破解码百度一搜就有
10. 下载Acaconda,并将Acaconda配置在pyCharm中,通过使用Acaconda可以略去安装各种python机器学习库.
11. 使用Acaconda下载升级相关依赖包 如matplotlib,sk-learn等.请注意: 本文使用的sklearn版本为0.21

升级sklearn到0.21版本 命令行输入:

conda install scikit-learn=0.21

升级matplotlib到3.1.0 命令行输入:

conda install matplotlib=3.1.0

以上具体配置这里不再赘述.

建议从未接触过sklearn的同学首先阅读该网站内容: http://sklearn.apachecn.org/#/docs/51
以便对sklearn有基本概念.在阅读完毕后正式开始代码实战.
下一章:线性回归

你可能感兴趣的:(教程)