【李宏毅2021机器学习深度学习——作业1 Regression】COVID-19 Cases Prediction 记录(双过strong baseline)

文章目录

  • 写在前面
    • 修改样例代码的地方(双过srong baseline)
    • 实验记录()
    • 收获:
    • 改进想法:
    • 一些参考:

写在前面

[视频学习-bilibili] | [课程主页——sample code & slide] | [ML2021学习笔记]

预备知识(常用包):
matplotlib 绘图
pandas 数据处理
numpy 数据处理

别人的修改,重点看数据分析部分
完成这个作业的收获:机器学习调优步骤:数据 – 网络 – 超参数

数据 - 数据处理,清洗,分析相关性,选取相关性大的特征
网络
超参数

修改样例代码的地方(双过srong baseline)

  1. 特征选取:feats = [40, 41, 42, 43, 57, 58, 59, 60, 61, 75, 76, 77, 78, 79, 92]
  2. 数据集随机划分,且比例为0.1train_indices, valid_indices = train_test_split([i for i in range(data.shape[0])], test_size=0.1, random_state=1)-------------train_test_splitsklearn包下: from sklearn.model_selection import train_test_split
  3. L2正则化:weight_decay: 1e-3

实验记录()

在这里插入图片描述

在这里插入图片描述

【李宏毅2021机器学习深度学习——作业1 Regression】COVID-19 Cases Prediction 记录(双过strong baseline)_第1张图片

收获:

15个特征选取:涉及数据处理,相关性分析【等待学习中…】
RMES:loss曲线更平滑
归一化:是整体(训练集 + 验证集)的归一化,不是每个数据集单独的归一化
L1正则化:【等待学习中…】
L2正则化:这里选取L2,且λ = 1e-3,参考李沐老师视频-12 权重衰退【动手学深度学习v2】
k-fold:k-fold在数据集小情况下,应该是个好方法【等待 实践中…】
数据集随机划分

改进想法:

  1. 数据清洗?
  2. k-fold验证?
  3. ensemble?

一些参考:

[李宏毅深度学习作业笔记]HW1 Covid-19(Regression))

HW1 COVID-19 Cases Prediction (Regression)

pai4451 add hw1

主要参考:Hung_Yi_Lee_ML_2021/hw/hw1/hw1_code.ipynb

你可能感兴趣的:(【李宏毅ml2021作业】,深度学习)