多标签分类算法技术细节笔记

一:多标签分类算法阈值函数(Threshold Calibration)

这里的阈值函数是指:对于每一个标签的预测值,当它达到多少时被判定为此标签存在,小于多少时被判定为词标签不存在。
主要有两种阈值函数:常数阈值函数和基于训练集的阈值函数。

1. 常数阈值函数

常见的选择为0或者0.5。比如取0.5,当给定标签预测值大于它时,被判定为存在,反之不存在。

2. 基于训练集的阈值函数

二:多标签分类评价指标

多标签分类算法技术细节笔记_第1张图片

三:tanh激活函数的优化

它的原始公式为:(Math.exp(x) - Math.exp(-x)) / (Math.exp(x) + Math.exp(-x))
为了提高运行效率:转化为2.0 / (1.0 + Math.exp(-2.0 * inputValue)) - 1.0
它们作了等价变换。

。。。未完结

参考文献

[1] Zhang M L, Zhou Z H. A Review on Multi-Label Learning Algorithms[J]. IEEE Transactions on Knowledge & Data Engineering, 2014, 26(8):1819-1837.

你可能感兴趣的:(机器学习,多标签分类)