SVC案例

一、概述

SVC在我们现实生活中的应用十分广泛,尤其是在图像和文字识别方面。然而,这些数据不仅非常难以获取,还难以在课程中完整呈现出来,但SVC真实应用的代码其实就是sklearn中的三行,真正能够展现出SVM强大之处的,反而很少是案例本身,而是我们之前所作的各种探索。
学习算法的时候,我们会使用各种各样的数据集来进行演示,但这些数据往往非常干净并且规整,不需要做太多的预处理。不过,在实际工作中,数据预处理往往比建模难得多,耗时多得多,因此合理的数据预处理是非常必要的。心在我们获得的是未经过处理的澳大利亚天气数据集,我们的目标是在这个数据集上来预测明天是否会下雨。
这个案例的核心目的是通过巧妙的预处理和特征工程来向大家展示,在现实数据集上我们往往如何做数据预处理,或者我们都有哪些预处理的方式和思路。预测天气是一个非常困难的主题,因为影响天气的因素太多,而Kaggle的这份数据也丝毫不让我们失望,是一份非常难的数据集,难到我们目前学过的所有算法在这个数据集上都不会有太好的结果,尤其是召回率recall,异常地低。在这里,我们在这15W行数据的数据集上,随机抽样5000个样本来为大家演示我的数据预处理和特征工程的过程,为大家提供一些数据预处理和特征工程的思路。希望使用原数据集的小伙伴们可以到Kaggle下载最原始版本或者直接打包下载的数据中获取:
Kaggle下载链接走这里:https://www.kaggle.com/jsphyg/weather-dataset-rattle-package

二、代码实现

1.数据与处理

2.建模与模型评估

3.模型调参

https://nbviewer.jupyter.org/github/Wxj-0920/cda-/blob/master/%E6%94%AF%E6%8C%81%E5%90%91%E9%87%8F%E6%9C%BASVM%E6%A1%88%E4%BE%8B%EF%BC%9A%E9%A2%84%E6%B5%8B%E6%98%8E%E5%A4%A9%E6%98%AF%E5%90%A6%E4%BC%9A%E4%B8%8B%E9%9B%A8.ipynb

你可能感兴趣的:(Python)