阿里云天池打卡笔记兼错题集

一、python训练营

raise关键字:抛出指定异常

try:
	raise NameError('HiThere')
except NmaeError:
	print('An exception flew by!')

二、数据挖掘

*分类指标评价计算示例

## accuracy
import numpy as np
from sklearn.metrics import accuracy_score
y_pred = [0, 1, 0, 1]
y_true = [0, 1, 1, 1]
print('ACC:',accuracy_score(y_true, y_pred))

y_pred:模拟预测结果
y_true:模拟实际结果
二者初次赋值无意义,仅是为了调用accuracy_score

一、XGBoost知识点补充

  • numpy:进行科学计算的基础软件包
    pandas:开源数据分析和处理工具
    matplotlib和seaborn绘图

  • 数据集中NaN一般代表缺失值

  • 可视化描述
    箱型图:
    阿里云天池打卡笔记兼错题集_第1张图片
    小提琴图:小提琴图和箱线图类似,用来显示数据分布和概率密度,
    这种图结合了箱线图和密度图的特征,用来显示数据的分布形状
    阿里云天池打卡笔记兼错题集_第2张图片

  • XGBoost中的重要属性
    weight:是以特征用到的次数来评价
    gain:当利用特征做划分的时候的评价基尼指数
    cover:利用一个覆盖样本的指标二阶导数平均值来划分
    total_gain:总基尼指数
    total_cover:总覆盖

  • 热力图绘制

plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix_result, annot=True, cmap='Blues')
plt.xlabel('Predicted labels')
plt.ylabel('True labels')
plt.show()

你可能感兴趣的:(python,机器学习)