【Datawhale】零基础入门数据挖掘 - 二手车交易价格预测[task1 赛题理解]

目录

  • 一、理解框架
  • 二、1.3代码示例
  • 三、遇到bug汇总及解决方法:
  • 四、总结
  • 五、Ref.

一、理解框架

【Datawhale】零基础入门数据挖掘 - 二手车交易价格预测[task1 赛题理解]_第1张图片

二、1.3代码示例

【Datawhale】[task1]1.3代码示例

三、遇到bug汇总及解决方法:

1、ValueError: only single character unicode strings can be converted to Py_UCS4, got length 0
在这里插入图片描述
2、在这里插入图片描述
ValueError: Found input variables with inconsistent numbers of samples: [86, 891]

3、没有看到测试集A的数据,待解决

已解决,在群文件夹中找到了。

四、总结

理清思路

  • 明确任务目标:分清问题类型
    • 预测(回归)
  • 数据基本特征:
    • 数据量(shape;训练集/测试集)
    • 数据类型(label encoding)
  • 评价指标(对模型效果的数值型量化)
    • 分类(二分类/多分类)
      • 二分类:accuracy,[Precision,Recall,F-score,Pr曲线],ROC-AUC曲线
      • 多分类:accuracy,[宏平均和微平均,F-score]
    • 回归
      • 平均绝对误差(Mean Absolute Error,MAE),均方误差(Mean Squared Error,MSE),平均绝对百分误差(Mean Absolute Error,MAPE),均方根误差(Rcot Mean Squared Error),R2(R_Square)
  • 代码实现
    • sklearn的metric

分类

from sklearn.metrics import accuracy_score
...
accuracy_score(y_true,y_pred)
from sklearn import metrics
...
print('Precision:',metrics.precision_score(y_true,y_pred))
print('Recall:',metrics.recall_score(y_true,y_pred))
print('F1-score:',metrics.f1_score(y_true,y_pred))

回归

from sklearn import metrics
...
#MSE
print('MSE:',metrics.mean_squared_error(y_true,y_pred))
#RMSE
print('RMSE:',np.sqrt(metrics.mean_squared_error(y_true,y_pred)))
#MAE
print('MAE:',metrics.mean_absolute_error(y_true,y_pred))

(期待后续task的学习)

五、Ref.

[Datawhale 零基础入门数据挖掘-Task1 赛题理解 — By: AI蜗牛车]
知乎: https://www.zhihu.com/people/seu-aigua-niu-che
github: https://github.com/chehongshu
公众号: AI蜗牛车

你可能感兴趣的:(日常学习)