机器学习教学大纲

一、周志华《机器学习》西瓜书训练营

【第一阶段】

1.了解机器学习基本概念

2.线性模型

3.入门比赛:“达观杯”NLP算法大赛

【第二阶段】

1.支持向量机

2.贝叶斯分类器

3.入门比赛:“达观杯”NLP算法大赛(其他算法进阶应用)

【第三阶段】

1.决策树

2.集成学习

3.进阶比赛:决策树和集成学习应用于天池o2o优惠券使用预测赛

【第四阶段】

1.特征选择

2.降维

3.进阶比赛:特征选择和降维应用于天池o2o优惠券使用预测赛

【第五阶段】

1.模型的评估与选择

2.神经网络与深度学习

3.进阶比赛:模型评估与选择应用于天池o2o优惠券使用预测赛

【第六阶段】

1.概率图模型

2.聚类

3.强化学习

4.进阶比赛:强化学习应用于天池o2o优惠券使用预测赛

 

二 全国高校大数据与人工智能双师型骨干师资研修班

第一部分:线上实习(基础部分共计35个课时)

学习时间

报名后即可开始学习

学习地址https://edu.tipdm.org/course/7(Python快速入门),备注:该部分内容是前导课,请一定提前学习。

课程模块

内容

课时

Python基础

1 准备工作

1.1 认识Python

1.2 搭建Python环境

1.3 安装PyCharm并创建一个应声虫程序

2 Python基础知识

2.1 掌握Python固定语法

2.2 创建字符串变量并提取里面的数值

2.3 计算圆形的各参数

3 Python数据结构

3.1 创建一个列表(list)并进行增删改查操作

3.2 转换一个元组(tuple)并进行取值操作

3.3 创建一个字典(dict)并进行增删改查操作

3.4 将两个列表转换为集合(set)并进行集合运算

4程序流程控制语句

4.1实现考试成绩划分

4.2实现一组数的连加与连乘

4.3使用冒泡排序法排序

4.4实训(猜数字游戏)

5 函数

5.1自定义函数实现输出方差

5.2使用匿名函数添加列表元素

5.3存储并导入函数模块

6 面向对象

6.1 认识面向对象编程

6.2 创建Car类

6.3 创建Car对象

6.4 迭代Car对象

6.5 产生Land_Rover对象(子类)

7 文件基础

7.1 认识文件

7.2 读取txt文件中的数据

7.3 保存数据为csv格式文件

7.4 认识os模块

15

Python数据分析与应用

1 Python数据分析概述

1.1认识数据分析

1.2熟悉Python数据分析的工具

1.3安装Python3的Anaconda发行版

1.4掌握Jupyter Notebook常用功能

2 NumPy数值计算基础

2.1认识NumPy数组对象ndarray

2.2认识NumPy矩阵与通用函数

2.3利用NumPy进行统计分析

3 Matplotlib数据可视化基础

3.1了解绘图基础语法与常用参数

3.2分析特征间的关系

3.3分析特征内部数据分布与分散状况

4 Pandas统计分析基础

4.1读写不同数据源的数据

4.2掌握DataFrame的常用操作

4.3转换与处理时间序列数据

5 使用Pandas进行数据预处理

5.1合并数据

5.2清洗数据

5.3标准化数据

5.4转换数据

20

第二部分:线下实战(实部分共计40个课时)

学习时间

2020年1月12-16日

日期

内容

时间

第一天

报到

全天

第二天

大数据人才培养方案/课程设置分享

09:00-09:30

实战任务说明及启动

09:30-09:45

Python数据分析与处理实训

实训1开始了解你的数据-餐饮数据探索

实训2数据过滤与排序-欧洲杯数据与分析

实训3数据分组-酒类消费数据探索

实训4Apply应用-犯罪数据探索与处理

实训5数据框合并综合应用

实训6时间序列数据处理-股价数据分析与处理

实训7统计分析-招聘数据探索与分析

09:45-12:00

14:00-17:00

第三天

机器学习算法挑战赛与教学转化

1 机器学习介绍

1.1有监督学习:分类、回归

1.2无监督学习:聚类

1.3半监督学习

1.4强化学习

2 算法挑战赛:能力提升与教学转化

2.1赛题分析

2.2数据准备

2.3数据预处理

2.4特征工程

2.5使用scikit-learn构建模型

2.6集成学习

2.7成果提交

2.8案例总结与教学转化

09:00-12:00

14:00-17:00

第四天

Python网络爬虫实战

1 Python爬虫环境与爬虫简介

1.1认识爬虫

1.2认识反爬虫

1.3配置Python爬虫环境

2 网页前端基础

2.1认识Python网络编程

2.2认识HTTP协议

3 简单静态网页爬取

3.1实现HTTP请求

3.2解析网页

3.3数据存储

4 常规动态网页爬取

4.1逆向分析爬取动态网页

4.2使用Selenium库爬取动态网页

4.3存储数据至MongoDB数据库

5 模拟登录

5.1使用表单登录方法实现模拟登录

5.2使用Cookie登录方法实现模拟登录

6 终端协议分析

7 项目实战:大数据岗位招聘数据爬取及分析

09:00-12:00

14:00-17:00

第五天

人工智能应用实战

1 TensorFlow安装与入门

1.1 TensorFlow环境搭建

1.2 TensorFlow计算模型性:计算图

1.3 TensorFlow数据模型:张量Tensor

1.4 TensorFlow运行模型:会话

2 TensorFlow数据类型

2.1 常量、变量及其构建

2.2 TensorFlow实现线性回归模型

2.3 操作:TensorFlow实现鸢尾花分类

3案例一:手写数字识别

3.1 图片预处理

3.2 占位符:placeholder

3.3 操作:利用TensorFlow实现SoftMax网络对手写数字识别

4案例二:基于深度神经网络的车牌号识别

4.1数据读取

4.2定位并截取车牌图片

4.3灰度处理车牌图片

4.4降噪处理车牌图片

4.5车牌分割

4.6卷积神经网络(CNN)的处理层构建

4.7定义损失函数、优化器

4.8计算正确率

4.9执行训练并保存模型

4.10模型调用并测试评估

09:00-12:00

14:00-17:00

 

第六天

大数据企业参观访学习

 

 

机器学习教学大纲_第1张图片

 

 

你可能感兴趣的:(机器学习)