机器学习进阶之路

今天将历史技术博文重新整理了一下,分类更加清晰了,接下来尽量多写一些。


机器学习进阶之路_第1张图片

1. 关于如何入门机器学习/深度学习的方法

有很多朋友会问我要如何入门机器学习,第一篇文章中就给出了比较简单可行并且效果不错的学习路线。

2. 好玩儿的人工智能应用实战

兴趣是最好的老师,当你发现用机器学习技术可以做很多好玩的实用的东西时,你会深深地被吸引。

3. 解决机器学习问题的一般步骤

从整体的视角了解一般机器学习问题需要经过哪些步骤。

4. 通俗易懂详解机器学习各个算法

这部分会详细介绍一些常用算法的理论,也会包含一些面试常问知识点。

5. 机器学习实战技巧

这部分针对机器学习问题的每个环节解答一些实战中遇到的问题。

6. 详解深度学习主要神经网络模型

这部分按照时间轴,从神经网络的基础,到 RNN,LSTM,双向 LSTM,seq2seq,再到注意力机制,层层递进详解各个模型的理论基础和代码实例。

7. 深度学习实践技巧

这部分介绍深度学习的实战步骤中的一些关键问题。

8. 自然语言处理

关于自然语言处理的课程笔记或者实例。

9. 聊天机器人

包括聊天机器人的理论和实战。

10. TensorFlow

比较系统地学习 TensorFlow,之前都是 1.x 版本的。

11. Keras

后面会结合 TensorFlow 2 的内容一起写。

12. 强化学习

理论基础。

13. 数据科学

这里会包括数据科学家所需要的技术栈。


1. 关于如何入门机器学习/深度学习的方法:

有很多朋友会问我要如何入门机器学习,第一篇文章中就给出了比较简单可行并且效果不错的学习路线。

  • 简单粗暴地入门机器学习

  • 机器学习模型算法 List

  • 九大常用机器学习分类算法

  • 机器学习到底是什么?

  • 如何自学数据科学?一份线上免费课程学习路线

  • 机器学习的技术栈及应用实例脑洞

  • 深度学习相关最新图书推荐

  • 深度学习的主要应用举例

  • 数据科学家养成路线

  • 纯粹的数学之美

  • Python很强大

  • 一张图带你看懂何为数据分析


2. 好玩儿的人工智能应用实战:

兴趣是最好的老师,当你发现用机器学习技术可以做很多好玩的实用的东西时,你会深深地被吸引。

  • 5分钟构建一个自己的无人驾驶车
  • 自己动手写个聊天机器人吧
  • 自己写个 Prisma
  • 用 TensorFlow 创建自己的 Speech Recognizer
  • 用 TensorFlow 让你的机器人唱首原创给你听
  • 如何自动生成文章摘要
  • 一个 tflearn 情感分析小例子
  • AI 在 marketing 上的应用

3. 解决机器学习问题的一般步骤:

从整体的视角了解一般机器学习问题需要经过哪些步骤。

  • 一个完整的端对端机器学习项目一共分几步?
  • 一个框架解决几乎所有机器学习问题
  • 通过一个kaggle实例学习解决机器学习问题
  • 从 0 到 1 走进 Kaggle
机器学习进阶之路_第2张图片

4. 通俗易懂详解机器学习各个算法:

这部分会详细介绍一些常用算法的理论,也会包含一些面试常问知识点。

【0】数学基础:

  • 简述极大似然估计
  • 凸优化有什么用

【1】常用算法:

  • 轻松看懂机器学习十大常用算法

【2】逻辑回归:

  • Logistic Regression 为什么用极大似然函数
  • Logistic regression 为什么用 sigmoid ?

【3】支持向量机:

  • SVM 的核函数选择和调参
  • 如何通过对偶问题求解线性可分 SVM

【4】决策树:

  • 决策树的python实现
  • CART 分类与回归树

【5】集成学习:

(1)Bagging:
  • Bagging 简述
(2)Boosting:
  • Adaboost 算法
  • 浅谈 GBDT
  • Kaggle 神器 xgboost
  • LightGBM 如何调参
(3)Stacking:
  • 详解 Stacking 的 python 实现

【6】降维:

  • What is PCA ?
  • PCA 的数学原理和可视化效果
  • 用线性判别分析 LDA 降维

【7】时间序列:

  • 用ARIMA模型做需求预测

【8】推荐系统:

  • 推荐系统

【9】聚类:

  • 白话什么是谱聚类算法
  • 如何用高斯混合模型 GMM 做聚类
  • 如何设置 k-means 中的 K?
  • 什么是条件随机场 CRF: Conditional Random Fields
机器学习进阶之路_第3张图片

5. 机器学习实战技巧:

这部分针对机器学习问题的每个环节解答一些实战中遇到的问题。

  • 机器学习中常用评估指标汇总

  • 什么是 ROC AUC

  • 机器学习面试题集 - 如何画 ROC 曲线

  • 机器学习算法应用中常用技巧-1

  • 机器学习算法应用中常用技巧-2

  • 特征工程怎么做

  • 机器学习面试题集 - 特征工程相关面试题

  • 为什么要用交叉验证

  • 机器学习面试题集 - 详解四种交叉验证方法

  • 如何选择优化器 optimizer

  • 用学习曲线 learning curve 来判别过拟合问题

  • 用验证曲线 validation curve 选择超参数

  • 用 Grid Search 对 SVM 进行调参

  • 机器学习面试题集 - 超参数调优

  • 用 Pipeline 将训练集参数重复应用到测试集

  • 机器学习面试题集 - 如何进行 A/B 测试

  • Auto ML 一种自动完成机器学习任务的系统

Kaggle:

  • 和Top Kagglers学习如何赢得一场数据科学竞赛:如何解码匿名数据

  • 数据可视化之后要如何分析?三个步骤发现新见解

  • Kaggle 比赛中如何划分数据集?

  • 数据科学竞赛中,高手是如何通过特征工程进入前三的

  • 机器学习中回归模型的 5 种评估指标要如何选择?

  • Kaggle: Detect toxicity - Basic EDA -1

机器学习进阶之路_第4张图片

6. 详解深度学习主要模型:

这部分按照时间轴,从神经网络的基础,到 RNN,LSTM,双向 LSTM,seq2seq,再到注意力机制,层层递进详解各个模型的理论基础和代码实例。

【1】神经网络基础知识

  • 神经网络的前世
  • 神经网络 之 感知器的概念和实现
  • 神经网络 之 线性单元
  • 什么是神经网络
  • 手写,纯享版反向传播算法公式推导

【2】CNN

  • 图解何为CNN
  • 用 Tensorflow 建立 CNN
  • 按时间轴简述九大卷积神经网络

【3】RNN

  • 详解循环神经网络(Recurrent Neural Network)

  • 图解RNN

  • CS224d-Day 5: RNN快速入门

  • 用深度神经网络处理NER命名实体识别问题

  • 用 RNN 训练语言模型生成文本

  • RNN与机器翻译

  • 用 Recursive Neural Networks 得到分析树

  • RNN的高级应用

【4】LSTM

  • 详解 LSTM

  • 用 LSTM 来做一个分类小问题

  • 用 LSTM 做时间序列预测的一个小例子

  • 用线性回归和LSTM做股价预测

  • 6 种用 LSTM 做时间序列预测的模型结构 - Keras 实现

【5】双向 LSTM

  • 双向 LSTM

【6】seq2seq

  • seq2seq 入门
  • seq2seq 的 keras 实现

【7】Doc2Vec

  • 用 Doc2Vec 得到文档/段落/句子的向量表达

【8】Attention

  • attention 机制入门

【9】GAN

  • 详解 GAN 生成对抗网络
  • GAN 的 keras 实现

【10】Transformer

  • 图解什么是 Transformer

【11】BERT

  • 5 分钟入门 Google 最强NLP模型:BERT

  • 如何应用 BERT :Bidirectional Encoder Representations from Transformers

  • github 项目介绍:海量中文语料上预训练ALBERT模型


7. 深度学习实践技巧:

这部分介绍深度学习的实战步骤中的一些关键问题。

  • 权重初始化的几个方法

  • 常用激活函数比较

  • 梯度消失问题与如何选择激活函数

  • 为什么在优化算法中使用指数加权平均

  • 为什么需要 Mini-batch 梯度下降,及 TensorFlow 应用举例

  • 为什么要做 batch normalization

  • 什么是 Dropout


8. 自然语言处理:

关于自然语言处理的课程笔记或者实例。

【1】斯坦福大学 cs224d 课程笔记

  • Day 1. 深度学习与自然语言处理 主要概念一览
  • Day 2. TensorFlow 入门
  • Day 3. word2vec 模型思想和代码实现
  • Day 4. 怎样做情感分析
  • Day 5. CS224d-Day 5: RNN快速入门
  • Day 6. 一文学会用 Tensorflow 搭建神经网络
  • Day 7. 用深度神经网络处理NER命名实体识别问题
  • Day 8. 用 RNN 训练语言模型生成文本
  • Day 9. RNN与机器翻译
  • Day 10. 用 Recursive Neural Networks 得到分析树
  • Day 11. RNN的高级应用

【2】中文自然语言处理

  • 几种简单的文本数据预处理方法

  • 中文分词常用方法简述

  • 一个隐马尔科夫模型的应用实例:中文分词

  • 中文NLP笔记:中文自然语言处理的一般流程

  • 中文NLP笔记:3. 关键词提取的几个方法

  • 盘点自然语言处理的 2018,预测 2019

  • 盘点 2018 年自然语言处理 10 个激动人心的想法


9. 聊天机器人:

  • 开启聊天机器人模式
  • 用 TensorFlow 做个聊天机器人

论文

  • 使聊天机器人具有个性
  • 使聊天机器人的对话更有营养

10. TensorFlow:

比较系统地学习 TensorFlow,之前都是 1.x 版本的,后面会写一写 2.0 的应用。

  • 代码实例:如何使用 Google 近日推出的 TensorFlow 2.0 Preview

  • TensorFlow 2.0 Tutorial: 2 - 识别 Fashion MNIST

  • TensorFlow 2.0 Tutorial: 4 - 几个常用技术

  • 一文学会用 Tensorflow 搭建神经网络

  • TensorFlow 入门

  • 用 TensorFlow.js 在浏览器中训练神经网络

  • TensorFlow-11-策略网络

  • TensorFlow-10-基于 LSTM 建立一个语言模型

  • TensorFlow-9-词的向量表示

  • TensorFlow-8-详解 TensorBoard-如何调参

  • TensorFlow-7-TensorBoard Embedding可视化

  • TensorFlow-6-TensorBoard 可视化学习

  • TensorFlow-5: 用 tf.contrib.learn 来构建输入函数

  • TensorFlow-4: tf.contrib.learn 快速入门

  • TensorFlow-3: 用 feed-forward neural network 识别数字

  • TensorFlow-2: 用 CNN 识别数字

  • TensorFlow-1: 如何识别数字

  • 用 Tensorflow 建立 CNN


11. Keras:

  • 对比学习用 Keras 搭建 CNN RNN 等常用神经网络

12. 强化学习:

  • 强化学习是什么

  • 一文了解强化学习

  • 用一个小游戏入门深度强化学习

  • 什么是 Q-learning

  • David Silver深度强化学习第1课

  • 强化学习第1课:像学自行车一样的强化学习

  • 强化学习第2课:强化学习,监督式学习,非监督式学习的区别

  • 强化学习第4课:这些都可以抽象为一个决策过程

  • 强化学习第5课:什么是马尔科夫决策过程

  • 强化学习第6课:什么是 Crossentropy 方法

  • 强化学习第7课:交叉熵方法的一些局限性

  • 强化学习 8: approximate reinforcement learning

  • 强化学习 9: 当 Action 的空间连续时

  • 强化学习 10: 实践中的一些技巧


13. 数据科学:

这里会包括数据科学家所需要的技术栈。

EDA:

  • 5 种常用数据可视化工具包,9 种 seaborn 常用图形

基础概念:

  • AB Testing, Type 1 / 2 Error

  • Critical value,Alpha,Z-score,P-value 关系

  • 图解精度和召回率

Pandas

  • Pandas常用命令-1
  • Pandas常用命令-2

Sklearn

  • Sklearn 快速入门
  • 了解 Sklearn 的数据集

SQL

  • 数据科学高频面试题-SQL篇:1~3
  • 数据科学高频面试题-SQL篇:4~6
  • 数据科学高频面试题-SQL篇:7~9
  • 数据科学高频面试题-SQL篇:10~12
  • 数据科学高频面试题-SQL篇:13~15
  • 数据科学高频面试题-SQL篇:16~18
  • 数据科学高频面试题-SQL篇:19~21

Scala

  • 手把手用 IntelliJ IDEA 和 SBT 创建 scala 项目

爬虫

  • Python 爬虫 1 快速入门
  • Python 爬虫 2 爬取多页网页

cs230

  • cs230 深度学习 Lecture 2 编程作业: Logistic Regression with a Neural Network mindset

Java:

入门:

  • 2 天入门 Java-Day 1
  • Day 1-Java-imooc-2.变量常量
  • Day 1-Java-imooc-3.运算符
  • Day 1-Java-imooc-4.流程控制语句
  • Day 1-Java-imooc-5.数组
  • Day 1-Java-imooc-6.方法
  • 2 天入门 Java-Day 2
  • Day 2-Java-imooc-8-封装
  • Day 2-Java-imooc-9-继承
  • Day 2-Java-imooc-10-多态

机器学习--初期的笔记很粗糙:

  • 机器学习-多元线性回归
  • Udacity-Machine Learning纳米学位-学习笔记1
  • Machine Learning Notes-Decision Trees-Udacity
  • Machine Learning Notes-Linear Regression-Udacity
  • 支持向量机
  • 神经网络
  • Instance Based Learning
  • Ensemble Learners

软件安装:

MySQL

  • 5分钟入门MySQL Workbench
  • 图解Mac下如何安装管理MySQL

Virtualenv

  • 详解Mac配置虚拟环境Virtualenv,安装Python科学计算包

面试:

  • 面试官是怎么看你的Github profile

Leetcode:

  • LEETCODE - Linked List 题目思路汇总

读论文:

  • Copying Mechanism in Sequence-to-Sequence
  • 论文 | AlphaGo Zero 的模型和算法
    AlphaGo Zero 初探

读书(思维导图):

  • 读书|《推荐系统实践》
  • 读书|《Mastering Machine Learning with Python in Six Steps》

Kaggle winner 方案:

  • Kaggle winner 方案 | Instacart Market Basket Analysis: 2nd place
  • Kaggle winner 方案简介 | Understanding the Amazon from Space: 1st place

公众号 机器学习X计划 同步更新,欢迎扫码关注!

机器学习进阶之路_第5张图片
机器学习X计划

你可能感兴趣的:(机器学习进阶之路)