Xgboost可视化中文乱码问题

Xgboost可视化中文乱码问题

  • Xgboost生成png图片方法
    • 搜索资料查到的信息:
    • 代码修改

Xgboost生成png图片方法

# xgb 训练好的模型,num_trees 获取第1个数的可视化结果
digraph = xgboost.to_graphviz(xgb, num_trees=0)
digraph.format = 'png'
digraph.view('./xgb_visualization/xgb_province_0')

上述代码会生成文件如下:
可视化文件
会出现中文乱码问题,如下:
Xgboost可视化中文乱码问题_第1张图片

搜索资料查到的信息:

graphviz默认设置下是不支持中文,如果在dot文件中直接写中文,会显示成乱码,要解决这个问题要做两件事,

1、把源文件保存为UTF-8的格式
2、设置fontname,也就是在node属性里添加fontname一项。例如下图标记处fontname="FangSong"表示结点中字体用仿宋体。

打开,xgb_province_0结果如下:
Xgboost可视化中文乱码问题_第2张图片
按照上面的信息,添加

添加node
通过命令行生成图片中文乱码问题解决,具体命令如下

dot -Tjpg xgb_province_0 -o xgb_province_0.jpg

结果:
Xgboost可视化中文乱码问题_第3张图片

代码修改

在上面的分析中发现是代码生成的dot文件少一个node,故添加一个中文字体的node即可,代码如下:

digraph = xgboost.to_graphviz(xgb, num_trees=0)
digraph.format = 'png'
# 添加一个node,防止中文乱码问题
digraph.body.insert(0, '\tnode [fontname="FangSong" shape=plaintext]')
digraph.view('./xgb_visualization/xgb_province_0')

重新生成图片,中文乱码问题解决。

你可能感兴趣的:(【Python】)