weixin_30437481

论文笔记：多标签学习综述（A review on multi-label learning algorithms）

2014 TKDE(IEEE Transactions on Knowledge and Data Engineering)
张敏灵，周志华

简单介绍
传统监督学习主要是单标签学习，而现实生活中目标样本往往比较复杂，具有多个语义，含有多个标签。本综述主要介绍了多标签学习的一些相关内容，包括相关定义，评价指标，8个多标签学习算法，相关的其它任务。

论文大纲

相关定义：学习任务，三种策略
评价指标：基于样本的评价指标，基于标签的评价指标
学习算法：介绍了8个有代表性的算法，4个基于问题转化的算法和4个基于算法改进的算法
相关任务：多实例学习，有序分类，多任务学习，数据流学习

相关定义

学习任务
$X = \mathbb{R}^{d}$表示d维的输入空间，$Y=\{y_1, y_2, ..., y_q\}$表示带有q个可能标签的标签空间。
训练集$D = {(x^i, y^i)| 1 \leq i \leq m} $，m表示训练集的大小，上标表示样本序数，有时候会省略。
$x^i \in X$，是一个d维的向量。$y^i \subseteq Y$，是$Y$的一个标签子集。
任务就是要学习一个多标签分类器$h(\cdot )$，预测$h(x) \subseteq Y$作为x的正确标签集。
常见的做法是学习一个衡量x和y相关性的函数$f(x, y_j)$，希望$f(x, y_{j1}) > f(x, y_{j2})$，其中$y_{j1} \in y, y_{j2} \notin y$。
$h(x)$可以由$f(x)$衍生得到，$h(x) = \{y_j | f(x,y_j) > t(x), y_j \in Y\}$。
$t(x)$扮演阈值函数的角色，把标签空间对分成相关的标签集和不相关的标签集。
阈值函数可以由训练集产生，可以设为常数。当$f(x, y_j)$返回的是一个概率值时，阈值函数可设为常数0.5。
三种策略
多标签学习的主要难点在于输出空间的爆炸增长，比如20个标签，输出空间就有$2^{20}$，为了应对指数复杂度的标签空间，需要挖掘标签之间的相关性。比方说，一个图像被标注的标签有热带雨林和足球，那么它具有巴西标签的可能性就很高。一个文档被标注为娱乐标签，它就不太可能和政治相关。有效的挖掘标签之间的相关性，是多标签学习成功的关键。根据对相关性挖掘的强弱，可以把多标签算法分为三类。

一阶策略：忽略和其它标签的相关性，比如把多标签分解成多个独立的二分类问题（简单高效）。
二阶策略：考虑标签之间的成对关联，比如为相关标签和不相关标签排序。
高阶策略：考虑多个标签之间的关联，比如对每个标签考虑所有其它标签的影响（效果最优）。

评价指标
可分为两类

基于样本的评价指标（先对单个样本评估表现，然后对多个样本取平均）
基于标签的评价指标（先考虑单个标签在所有样本上的表现，然后对多个标签取平均）

每类又可分为用于分类任务和用于排序任务的指标，具体指标如下图所示

下面对图中的每个指标进行介绍。

基于样本的评价指标

Subset Accuracy（衡量正确率，预测的样本集和真实的样本集完全一样才算正确。）
\[ \frac{1}{p}\sum_{i=1}^{p} 1\{h(x^i)=y^i\}\]
其中p表示测试集的样本大小，$1\{\pi\}$表示$\pi$为真时返回1，否则返回0。
Hamming Loss（衡量的是错分的标签比例，正确标签没有被预测以及错误标签被预测的标签占比）
\[ \frac{1}{p}\sum_{i=1}^{p}\frac{1}{q}\left | h(x^i)\Delta y^i \right | \]
其中$\Delta$表示两个集合的对称差，返回只在其中一个集合出现的那些值。
Accuracy, Precision, Recall, F值（单标签学习中准确率，精准率，召回率，F值的天然拓展）
\[ Accuracy(h) = \frac{1}{p}\sum_{i=1}^{p}\frac{\left | h(x^i)\cap y^i \right |} {\left | h(x^i)\cup y^i \right |} \]
\[ Precision(h) = \frac{1}{p}\sum_{i=1}^{p}\frac{\left | h(x^i)\cap y^i \right |} {\left | h(x^i) \right |} \]
\[ Recall(h) = \frac{1}{p}\sum_{i=1}^{p}\frac{\left | h(x^i)\cap y^i \right |} {\left | y^i \right |} \]
\[ F^{\beta}(h) = \frac{(1+\beta^2) \cdot Precision(h) \cdot Recall(h)}{\beta^2 \cdot Precision(h) \cdot Recall(h)}\]
One-error（度量的是：“预测到的最相关的标签” 不在 “真实标签”中的样本占比。值越小，表现越好）
\[ one-error(f) = \frac{1}{p}\sum_{i=1}^{p} 1\{ [arg \; \mathop {max}\limits_{y_j \in Y} \; f(x^i, y_j)] \notin y^i\} \]
Coverage（度量的是：“排序好的标签列表”平均需要移动多少步，才能覆盖真实的相关标签集）
\[ coverage(f) = \frac{1}{p}\sum_{i=1}^{p} \mathop {max}\limits_{y_j \in y^i} \; rank_f(x^i, y_j) - 1\]
其中$ rank_f(x^i, y_j) $ 表示用$f(\cdot, \cdot)$ 对$Y$中的所有标签（注意是对$Y$中所有标签）进行降序排序，给个排名，最后返回的是$y_j$标签在这个排序列表中的一个排名，排名越大，相关性越小。而 $\mathop {max}\limits_{y_j \in y^i}$表示取到，真实标签$y^i$中的标签在上面这个排名中最大的，那个排名。
如果真实标签$y^i$被完全预测正确的话，取到的值是$\left | y^i \right | $，$y^i$中的排名就是从1到$\left | y^i \right | $。如果$y^i$中有一个标签$y_j$没有被预测正确，那么取的值就是那个标签$y_j$在$Y$中的排名，因为预测正确的那些都是排名最小（相关性最大）的那些标签，这个$y_j$肯定是大于$\left | y^i \right | $的。
Ranking Loss（度量的是：反序标签对的占比，也就是不相关标签比相关标签的相关性还要大的情况）
\[ rloss(f) = \frac{1}{p}\sum_{i=1}^{p} \frac{1}{ \left | y^i \right | \left | \overline{y^i}\right | } \left | \{ (y_{j1}, y_{j2}) \; | \; f(x^i, y_{j1}) \leq f(x^i, y_{j2}) \; , \; (y_{j1}, y_{j2}) \in (y^i \times \overline{y^i}) \}\right | \]
其中$\overline{y^i}$为$y^i$在$Y$上的补集。$y_{j1}$从相关的标签集$y^i$中取，$y_{j2}$从不相关的标签集$ \overline{y^i}$中取，两两组合形成标签对。
Average Precision（度量的是：比特定标签更相关的那些标签的排名的占比）
\[ avgprec(f) = \frac{1}{p}\sum_{i=1}^{p} \frac{1}{ \left | y^i \right | } \sum_{y_{j1} \in y^i}\frac{\left | \{ y_{j2} \; | \; rank_f(x^i, y_{j2}) \leq rank_f(x^i, y_{j1}) \; , \; y_{j2} \in y^i\} \right |}{rank_f(x^i, y_{j1})} \]

基于标签的评价指标

Macro-averaging
\[B_{macro}(h)= \frac{1}{q}\sum_{j=1}^{q}B(TP_j,\;FP_j,\; TN_j,\; FN_j) \]
Micro-averaging
\[B_{micro}(h)= B(\sum_{j=1}^{q}TP_j,\; \sum_{j=1}^{q}FP_j,\; \sum_{j=1}^{q}TN_j,\; \sum_{j=1}^{q}FN_j)\]
其中$TP_j,\;FP_j,\; TN_j,\; FN_j$为单个标签下传统二分类的四个数量特征，真正例，假正例，真负例，假负例。
$B \in { Accuracy, Precision, Recall, F^\beta } $ 表示对四个数量特征进行相关运算得到常规的二分类指标。
macro是先对单个标签下的数量特征计算得到常规指标，再对多个标签取平均。
micro是先对多个标签下的数量特征取平均，再根据数量特征计算得到常规指标。
AUC-macro（度量的是：“排序正确”的数据对的占比，macro是先对单个标签计算，再平均）
（这里的“排序正确”指的是根据$f(\cdot,\cdot)$函数，对于相关标签的打分会大于不相关标签的打分
\[ AUC_{macro} = \frac{1}{q} \sum_{j=1}^{q} \frac{\left | \{ ({x}',{x}'')\;|\; f({x}',y_j) \geq f({x}'',y_j) \; , \; ({x}',{x}'') \in Z_j \times \overline{Z_j} \}\right |}{\left | Z_j \right | \left | \overline{Z_j} \right |} \]
其中$Z_j = \{x^i \;|\; y_j \in y^i, 1 \leq i \leq p \}$表示的是含有$y_j$标签的样本数量
其中$\overline{Z_j} = \{x^i \;|\; y_j \notin y^i, 1 \leq i \leq p \}$表示的是不含$y_j$标签的样本数量。
AUC-micro（度量的是：“排序正确”的数据对的占比，micro是直接把多个标签考虑在内来计算占比）
\[AUC_{micro} = \frac{\left | \{ ({x}', {x}'', {y}', {y}'')\;|\; f({x}',{y}') \geq f({x}'',{y}'') \; , \; ({x}',{y}') \in S^+ \; , \; ({x}'',{y}'') \in S^- \}\right |}{\left | S^+ \right | \left | S^- \right |} \]
其中$S^+= \{(x^i, y_j) \;|\; y_j \in y^i, 1 \leq i \leq p \}$表示的是相关的样本标签对
其中$S^- = \{(x^i, y_j) \;|\; y_j \notin y^i, 1 \leq i \leq p \}$表示的是不相关的样本标签对

学习算法
可分为两类（具体算法如下图所示）

问题转换的方法：把多标签问题转为其它学习场景，比如转为二分类，标签排序，多分类
算法改编的方法：通过改编流行的学习算法去直接处理多标签数据，比如改编懒学习，决策树，核技巧。

下面对图中的每个算法进行介绍。
Binary Relevance
把多个标签分离开来，对于q个标签，建立q个数据集和q个二分类器来进行预测。
这是最简单最直接的方法，是其它先进的多标签算法的基石。
没有考虑标签之间的关联性，是一个一阶策略（first-order）

Classifier Chains
首先按特定的顺序（这个顺序是自己决定的）对q个标签排个序，得到$y_{\tau(1)}\succ y_{\tau(2)} \succ ...\succ y_{\tau(q)}$。对于第j个标签$y_{\tau(j)}$构建一个二分类的数据集

\[D_{\tau(j)}=\{ ([x^i, pre^i_{\tau(j)}], 1\{ y_{\tau(j)} \in y^i \}) \; | \; 1 \leq i \leq m\} \\ where \ pre^i_{\tau(j)}=(1\{ y_{\tau(1)} \in y^i \},...,1\{ y_{\tau(j-1)} \in y^i \})^T\]

第j个标签构建的二分类数据集中，$x^i$会concat上前j-1个标签值。
以这样chain式的方法构建q个数据集，训练q个分类器。
在预测阶段，由于第j个分类器需要用到前j-1个分类器预测出的标签集，所以需要顺序调用这q个分类器来预测。

显然算法的好坏会受到顺序$\tau$的影响，可以使用集成的方式，使用多个随机序列，对每个随机序列使用一部分的数据集进行训练。
虽然该算法把问题分解成多个二分类，但由于它以随机的方式考虑了多个标签之间的关系，所以它是一个高阶策略（high-order）。
该算法的一个缺点是丢失了平行计算的机会，因为它需要链式调用来进行预测

Calibrated Label Ranking
算法的基本思想是把多标签学习问题转为标签排序问题，该算法通过“成对比较”来实现标签间的排序。
对q个标签，可以构建q(q-1)/2个标签对，所以可以构建q(q-1)/2个数据集。
\[ D_{jk} = \{ (x_i, \psi (y^i, y_j, y_k)) \; | \; \phi (y^i, y_j) \neq \phi (y^i, y_k), 1 \leq i \leq m \} \\ where \ \psi (y^i, y_j, y_k)) = \left\{\begin{matrix} +1, & if \ \phi (y^i, y_j) = +1 \ and \ \phi (y^i, y_k) = -1\\ -1, & if \ \phi (y^i, y_j) = -1 \ and \ \phi (y^i, y_k) = +1 \end{matrix}\right. \\ \phi (y^i, y_j) = \left\{\begin{matrix} +1 & if \ y_j \in y^i\\ -1 & else \end{matrix}\right.\]

只有带有不同相关性的两个标签$y_j$和$y_k$的样本才会被包含在数据集$D_{jk}$中，用该数据集训练一个分类器，当分类器返回大于0时，样本属于标签$y_j$，否则属于标签$y_k$。
可以看到，每个样本$x^i$会被包含在$\left | y^i \right | \left | \overline{y^i} \right |$个分类器中。
在预测阶段，根据分类器，每个样本和某个标签会产生一系列的投票，根据投票行为来做出最终预测。
前面构造二分类器的方法使用one-vs-rest的方式，本算法使用one-vs-one，缓和类间不均衡的问题。
缺点在于复杂性高，构建的分类器个数为q(q-1)/2，表现为二次增长。
考虑两个标签之间的关联，是二阶策略（second-order）

Random k-Labelsets
算法的基本思想是把多标签学习问题转为多分类问题。把$2^q$个可能的标签集，映射成$2^q$个自然数。
映射函数记为$\sigma _Y$，则原数据集变为$D^+_Y = \{ (x^i, \sigma_Y(y^i)) \ | \ 1 \leq i \leq m \}$。
所对应的新类别记为 $ \Gamma(D^+_Y) = { \sigma_Y(y^i) | 1 \leq i \leq m}$，显然$ \left | \Gamma(D^+_Y) \right | \leq min(m, 2^{|Y|})$。
这样来训练一个多分类器，最后根据输出的自然数映射回标签集的算法称为LP（Label Powerest）算法，它有两个主要的局限性

LP预测的标签集是训练集中已经出现的，它没法泛化到未见过的标签集
类别太大，低效

为了克服LP的局限性，Random k-Labelsets使用的LP分类器只训练Y中的一个长度为k的子集，然后集成大量的LP分类器来预测。
$Y^k$表示$Y$的所有的长度为k的子集，$Y^k(l)$表示随机取的一个长度为k的子集，这样就可以进行收缩样本空间，得到如下样本集和标签集。
\[D^+_{Y^k(l)}= \{ (x^i, \sigma_{Y^k(l)}(y^i \cap Y^k(l) )) \ | \ 1 \leq i \leq m \}\]
\[\Gamma(D^+_{Y^k(l)})= \{ \sigma_{Y^k(l)}(y^i \cap Y^k(l) ) \ | \ 1 \leq i \leq m \}\]

更进一步，我们随机取n个这样的子集：$Y^k(l_r), 1 \leq r \leq n$来构造n个分类器做集成。
最后预测的时候需要计算两个指标，一个为标签j能达到的最大投票数，一个为实际投票数。
\[\tau(x, y_j) = \sum_{r=1}^{n} 1\{ y_j \in Y^k(l_r)\}\]
\[\mu (x, y_j) = \sum_{r=1}^{n} 1\{ y_j \in \sigma_{Y^k(l)}^{-1}(g^+_{Y^k(l)}(x) )\} \]
其中$ \sigma_{Y^k(l)}^{-1}(\cdot)$表示从自然数映射回标签集的函数，$g^+(\cdot)$表示分类器学习到的函数。最后预测的时以0.5为阈值进行预测，得到标签集。
\[y = \{ y_j \ | \ \mu (x, y_j) \ / \ \tau(x, y_j) > 0.5\ , \ 1 \leq j \leq q\}\]
因为是随机长度为k的子集，考虑了多个标签之间的相关性，所以是高阶策略（high-order）。

Multi-Label k-Nearest Neighbor（ML-KNN）
用$N(x)$表示x的$k$个邻居，则$C_j = \sum_{(x,y) \in N(x)} 1\{y_j \in y\}$表示样本x的邻居中带有标签$y_j$的邻居个数。用$H_j$表示样本x含有标签$y_j$，根据后验概率最大化的规则，有
\[y = \{y_j \ | \ P(H_j \ | \ C_j)\ / \ P(\urcorner H_j \ | \ C_j) > 1 \ , \ 1 \leq j \leq q \}\]
根据贝叶斯规则，有
\[ \frac{P(H_j \ | \ C_j)} {P(\urcorner H_j\ | \ C_j)} = \frac {P(H) \cdot P(C_j \ | \ H_j)} {P(\urcorner H) \cdot P(C_j \ | \ H_j)}\]
先验概率$P(H_j), P(\urcorner H_j)$可以通过训练集计算得到，表示样本带有或不带有标签$y_q$的概率
\[P(H_j) = \frac { s + \sum_{i=1}^{m} 1\{ y_j \in y^i \} } {s \times 2 + m} \\ P(\urcorner H_j) = 1 - P(H_j) \ \ (1 \leq j \leq q)\]
其中s是平滑因子，s为1时则使用的是拉普拉斯平滑。
条件概率的计算需要用到两个值
\[\kappa_j[r] = \sum_{i=1}^{m} 1\{ y_j \in y^i \} \cdot 1\{ \delta_j(x^i) = r \} \ \ \ \ (0 \leq r \leq k) \\ \tilde{\kappa}_j[r] = \sum_{i=1}^{m} 1\{ y_j \notin y^i \} \cdot 1\{ \delta_j(x^i) = r \} \ \ \ \ (0 \leq r \leq k) \\ where \ \ \delta_j(x^i) = \sum_{(x^*,y^*) \in N(x^i)} 1 \{y_j \in y^*\}\]
$\kappa_j[r]$表示“含有标签$y_j$而且r个邻居也含有标签$y_j$的”样本的个数。
$\tilde{\kappa}_j[r]$表示“不含有标签$y_j$但是r个邻居含有$y_j$的”样本的个数。
根据这两个值，可以计算相应的条件概率
\[P(C_j \ | \ H_j) = \frac{s+\kappa_j[C_j]} {s \times (k+1) + \sum_{r=0}^{k} \kappa_j[r]} \ \ (1 \leq j \leq q, 0 \leq C_j \leq k) \\ P(C_j \ | \ \urcorner H_j) = \frac{s+\tilde{\kappa}_j[C_j]} {s \times (k+1) + \sum_{r=0}^{k} \tilde{\kappa}_j[r]} \ \ (1 \leq j \leq q, 0 \leq C_j \leq k) \]
这两个条件概率表示的是，样本带有或不带有标签$y_j$的条件下，它有$C_j$个邻居带有标签$y_j$的概率。

由上述的条件概率，先验概率则可以根据贝叶斯规则和后验概率最大化，计算出样本的标签集
需要注意的是该方法不是KNN和独立二分类的简单结合，因为算法中还使用了贝叶斯来推理邻居信息
没有考虑标签之间的相关性，是一阶策略（first-order）

Multi-Label Decision Tree（ML-DT）
使用决策树的思想来处理多标签数据，数据集T中，使用第l个特征，划分值为$\vartheta$，计算出如下信息增益：
\[IG(T, l, \vartheta ) = MLEnt(T) - \sum_{\rho \in \{-, +\} } \frac{|T^{\rho }|} {\left | T \right |} \cdot MLEnt(T^{\rho}) \\ where \ \ T^- = \{ (x^i, y^i) \ | \ x_{il} \leq v, 1 \leq i \leq n\} \\ where \ \ T^+ = \{ (x^i, y^i) \ | \ x_{il} \gt v, 1 \leq i \leq n\} \]
递归地构建一颗决策树，每次选取特征和划分值，使得上式的信息增益最大。
其中式子中的熵的公式可以按如下计算（为了方便计算，假定标签之间独立）。
\[MLEnt(T) = \sum_{j=1}^{q} -p_j log_2p_j - (1-p_j)log_2(1-p_j) \\ where \ \ p_j= \frac {\sum_{i=1}^{n} 1\{ y_j \in y^i \}} {n}\]

新样本到来时，向下遍历决策树的结点，找到叶子结点，若$p_j$大于0.5则表示含有标签$y_j$
该算法不是决策树和独立二分类的简单结合（如果是的话，应该构建q棵决策树）
没有考虑标签的相关性，是一阶策略（first-order）

Ranking Support Vector Machine（Rank-SVM）
使用最大间隔的思想来处理多标签数据。
Rank-SVM考虑系统对相关标签和不相关标签的排序能力。
考虑最小化$x^i$到每一个“相关-不相关”标签对的超平面的距离，来得到间隔。
\[\min_{(x^i, y^i) \in D} \min_{(y_j, y_k) \in y^i \times \overline{y^i}} \frac{ \langle w_j-w_k,x^i \rangle +b_j-b_k}{\left \| w_j - w_k\right \|}\]
像SVM一样对w和b进行缩放变换后可以对式子进行改写，然后最大化间隔，再调换分子分母进行改写，得到：
\[ \begin{matrix} \min_{w} & \max_{1 \leq j < k \leq q} {\left \| w_j - w_k\right \|^2}\\ subject\ to: & \; \langle w_j - w_k, x^i \rangle + b_j - b_k \geq 1 \\ & (1 \leq i \leq m, \ \ (y_i,y_k) \in y^i \times \overline{y^i}) \end{matrix}\]
为了简化，用sum操作来近似max操作
\[ \begin{matrix} \min_{w} & \sum_{j=1}^q {\left \| w_j \right \|^2}\\ subject\ to: & \; \langle w_j - w_k, x^i \rangle + b_j - b_k \geq 1 \\ & (1 \leq i \leq m, \ \ (y_i,y_k) \in y^i \times \overline{y^i}) \end{matrix} \]
跟SVM一样，为了软间隔最大化，引入松弛变量，得到下式：
\[ \begin{matrix} \min_{w, \Xi } & \sum_{j=1}^q {\left \| w_j \right \|^2} + C \sum_{i=1}^m \frac {1}{\left | y^i \right | \left | \overline{y^i} \right | } \sum_{(y_i,y_k) \in y^i \times \overline{y^i})} \xi _{ijk} \\ subject\ to: & \; \langle w_j - w_k, x^i \rangle + b_j - b_k \geq 1 - \xi _{ijk}\\ & \xi _{ijk} > 0 \ (1 \leq i \leq m, \ \ (y_i,y_k) \in y^i \times \overline{y^i}) \end{matrix} \\\]
其中$\Xi = \{ \xi_{ijk} \ | \ 1 \leq i \leq m, \ (y_i,y_k) \in y^i \times \overline{y^i} \}$

跟SVM一样，最终的式子是一个二次规划问题，通常调用现有的包来解。
对于非线性问题则使用核技巧来解决。
由于定义了”相关-不相关“标签对的超平面，这是个二阶策略（second-order）

Collective Multi-Label Classifier（CML）
该算法的核心思想最大熵原则。用$(x,y),$表示任意的一个多标签样本，其中$y = (y_1, y_2, ..., y_q) \in \{-1, +1\}^q$。
算法的任务等价于学习一个联合概率分布$p(x,y)$，用$H_p(x,y)$表示给定概率分布$p$时$(x,y)$的信息熵。
最大熵原则认为熵最大的模型是最好的模型。
\[ \begin{matrix} &\max_{p} H_p(x,y) \\ &subject \ to: E_p[f_k(x,y)] = F_k \ (k \in K) \end{matrix} \]
其中$f_k(x,y)$是一个特征函数，描述$x$和$y$之间的一个事实$k$，满足这个事实时返回1，否则返回0。
约束做的是希望这个分布上，特征函数的期望能够等于一个我们希望的值$F_k$，这个值通常通过训练集来估计。
解这个优化问题，会得到
\[p(y|x) = \frac{1}{Z_{\Lambda}(x) } exp(\sum_{k \in K} \lambda_k \cdot f_k(x,y)) \]
其中$\Lambda = \{ \lambda_k | k \in K \}$表示一系列的权重。$Z_{\Lambda} = \sum_y exp(\sum_{k \in K} \lambda_k \cdot f_k(x,y)) $作为规范化因子。假设有一个高斯先验$\lambda_k \sim N(0, \varepsilon^2)$，就可以通过最大化以下这个log后验概率来求得参数$\Lambda$。
\[ \begin{matrix} l(\Lambda | D) & = log P(D|\Lambda) + log P(\Lambda) \\ & = log \prod_{(x,y) \in D} p(y|x) + log P(\Lambda) \\ & = log(\prod_{(x,y) \in D} p(y|x)) - \sum_{k \in K} \frac {\lambda^2}{2 \varepsilon^2} \\ \end{matrix}\]

这是个凸函数，可以调用现成的无约束优化方法比如BFGS直接求解。求得参数就可以得到要学习的概率分布$p(y|x)$。
对于一系列约束K，分为两个部分
$K_1 = \{ (l,j) | 1 \leq l \leq d, 1 \leq j \leq q\}$，有$d \cdot q$个约束，特征函数为
\[f_k(x,y) = x_l \cdot 1 \{ y_j == 1 \} , \ \ k = (l,j) \in K_1\]
$K_2 = { (j_1, j_2, b_1, b_2) | 1 \leq j_1 < j_2 \leq q, b_1, b_2 \in { -1, +1 } } $，有$4 \cdot \binom{q}{2}$个约束，特征函数为
\[ f_k(x,y) = 1 \{ y_{j1} = b_1 \} \cdot 1 \{ y_{j2} = b_2 \}, \ \ k = (j_1, j_2, b_1, b_2) \in K_2\]
由于K约束中考虑了标签对之间的关联，该算法是个二阶策略（second-order）。

相关任务

多实例学习（Multi-instance learning）：每个样本由多个实例和一个标签组成，多个实例中至少一个为正，认为该样本为正。和多标签学习的输出空间模糊相反，多实例学习是输入空间模糊。
有序分类（Ordinal classification）：对于每个标签，不再是简单地判断是还是否，而是改成一系列的等级排序，把$y_j = \{-1,+1\}$替换成$y_j = \{m_1, m_2, ..., m_k\}, \ where \ m_1 < m_2 < ... < m_k$
多任务学习（Multi-task learning）：同时训练多个任务，相关任务之间的训练信息会帮助其它任务。比如目标定位既要识别有没有目标（分类问题）又要定位出目标的位置（回归问题）。
数据流学习（Data streams classification）：真实世界的目标是在线生成和实时产生的，如何处理这些数据就是数据流学习要做的事。一个关键的挑战就是“概念漂移”（目标变量的统计特性随着时间的推移以不可预见的方式变化），一般处理方式有：当一大批新数据到来时更新分类器；维持一个检测器来警惕概念漂移；假定过去数据的影响会随着时间而衰减。

总结

论文主要介绍了多标签学习的一些概念定义，策略，评价指标，以及8个有代表性的算法，其中对多种评价指标和多个算法都做了清晰的分类和详细的阐述。
尽管挖掘标签关联性的想法被应用到许多算法中，但是仍然没有一个正式的机制。有研究表示多标签之间的关联可能是非对称的（我对你的影响和你对我的影响是不同的），局部的（不同样本之间的标签相关性不同，很少关联性是所有样本都满足的）。
但是不管怎么说，充分理解和挖掘标签之间的相关性，是多标签学习的法宝。尤其是巨大输出空间场景下。

转载于:https://www.cnblogs.com/liaohuiqiang/p/9339996.html

电信星卡定向流量可以使用哪些app(电信星卡定向流量app有哪些) 全网优惠分享
电信星卡定向流量可以使用哪些app(电信星卡定向流量app有哪些)关注微•信•公•众•号"卡泡泡"就知道啦！电信的定向流量包括哪些app?1、电信定向流量app如下：头条系应用今日头条、今日头条lite版本、西瓜视频、抖音火山版、抖音视频、多闪、图虫、懂车帝、皮皮虾APP、海豚股票、海豚财富、gogokid、轻颜、好好学习、飞聊、时光相册、半次元。电信星卡大流量版合集：电信星卡定向流量app有哪些
倒计时一天曲晓彤
开工作室摄影在齐河新家。或者买个别的房子或者嘉和馨园挑战一下自己多学习^^一年半时间瘦到150140生祥云
一个40+女人的认知觉醒：经济独立比“你养我”更加自信霸气周芷晴聊情感
身为一个40+的已婚女人，当我拿着自己兼职挣的钱在42岁生日当天完成了人生清单里必须体验一次的海上高空跳伞后，落地第一时间收到了两位教练的生日祝福，朋友圈里也满满都是亲戚朋友的点赞与祝福，只有一个人给了我劈头盖脸一顿骂，因为这样的“高危”活动是他不敢也不能接受的，这个人就是我的老公。一个偶然的机会，我有幸遇到筝小钱老师，走进了她的读书变现训练营。35天的基础班学习，让前半生都在与文字打交道的我找到
【JS笔记】Java Script学习笔记
JavaScript输出语句document.write()：将内容写入html文档console.log()：将内容写入控制台alert()：弹窗变量JS是弱类型语言，变量无类型var：全局变量，可重复声明let：局部变量，不可重复声明const：常量，不可重复声明数据类型number：数字。整数、浮点数、NaNstring：字符串。单引号：'Hello'双引号："Hello"模板字符串：使用反
初恋终成过去式空白格wy
多肉初恋终究还是挂掉了！近一周没看过多肉，今天下午看了一眼，没什么大变化，只是黄丽长高了一半。看看我的初恋（一个品种名称），只轻轻碰了一下，叶子竟然哗啦啦地往下落。坏了！肯定是生病了。侧生出来的一株，茎都有点黑了！迅速找度娘，原因竟是水浇多了。迅速拯救初恋，一边挖根、叶子一边掉落。等初恋露出了跟，它只剩一枝有叶子了。并且我也没发现根系有什么问题……第一批多肉是朋友在万象更新买来的，其中就有初恋。当
最新1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，欢迎大家！研究概述：本研究首先使用R语言在三个基因表达数据集中找到
在坚持的路上走远一点眯陌
很迷茫不知所措，我害怕好多东西，可是我又不愿意放弃尝试，这一切的一切我多希望就此结束，可是又会想到自己想干的事还没干，未来那么远，为什么不去创造自己的美好人生呢？疑问???从小到大的坚持上学，可是自己对自己喜欢的东西却没有加以坚持，所以啊！我总是鼓励自己要努力要努力啊！但忽略了自己的感受。唉！人哦！所以进入大学，我不愿意放弃，我希望自己可以经受得住嘲讽，冷眼，然后学习很多东西，增强自己的能力，而坚
聚众识别漏检难题？陌讯多尺度检测实测提升 92%
一、开篇痛点：复杂场景下的聚众识别困境在安防监控、大型赛事等场景中，实时聚众识别是保障公共安全的核心技术。但传统视觉算法常面临三大难题：一是密集人群重叠导致小目标漏检率超30%，二是光照变化（如夜间逆光）引发误报率飙升，三是复杂背景干扰下实时性不足（FPS＜15）。某景区监控项目曾反馈，开源模型在节假日人流高峰时，因漏检导致预警延迟达20秒，存在严重安全隐患。这些问题的根源在于传统算法的局限性：单
学生信息管理系统的VFP数据库设计与实现溪水边小屋
本文还有配套的精品资源，点击获取简介：《学生管理系统vfp数据库》是一个基于VisualFoxPro（VFP）的学生信息管理软件，旨在帮助教育机构记录、管理学生数据并提供分析功能。该系统包括数据库设计、用户界面设计、数据操作、事务处理、报表统计、安全性管理、程序架构及代码优化等核心功能。学生管理系统是VFP数据库开发的学习和实践平台，适用于初学者。1.VisualFoxPro数据库开发基础Visu
AI数字人系统开发上线全攻略：从0到1全流程解析 v_qutudy 人工智能 AI系统开发 AI数字人开发
一、需求分析：定义数字人核心能力1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/语音输入AR/VR空间交互1.2非功能性指标实时性：唇形同步延迟B[语音识别]A-->C[姿态检测]A-->D[文本理解]B-->E[NLP引擎]C-->F[动作解析
二维码在教学中的应用小尘老师
7月7日，阅读《现代极简教育技术》P174-180模块二主要是将二维码在教学中的灵活应用。二维码在生活中非常常见，大部分人看到都知道那是二维码。但真要问什么是二维码，应该有很多人跟我一样是有点懵的。没想到二维码背后还有这么多的知识。真的是长见识了。关于教师如何设计二维码，黎教授也分成5个小点教大家。主要是网页，PPT，word文件，图片音视频，其他二维码。黎教授介绍的方法中，草料二维码我用的是最多
Redis面试精讲 Day 3：Redis持久化机制详解在未来等你 Redis面试专栏 Redis 面试题持久化 RDB AOF 数据库缓存
【Redis面试精讲Day3】Redis持久化机制详解文章标签Redis,面试题,持久化,RDB,AOF,数据库,缓存,后端开发,分布式系统文章简述本文是"Redis面试精讲"系列第3天内容，深入解析Redis持久化机制这一面试高频考点。文章从基础概念出发，详细剖析RDB和AOF两种持久化方式的实现原理、触发机制和优缺点对比，提供多语言客户端操作示例和性能测试数据。针对"如何选择持久化策略"、"A
趁现在！江湖乱哉呼喊边缘
掩卷长吁，七分柔情，三分剑气。感叹今朝——武林无主，江湖乱哉！图片发自App仙人驾鹤西去，群龙争霸，谁得首？我说后尘难步啊，你总叫我开天辟地。我心里卧虎身后藏龙，却可惜了一腔孤勇。图片发自App这场人生在世，不称意，天地虽宽啊，扁舟难容。我多羡慕佩剑带刀去闯荡，飞雪连天射白鹿，笑书神侠倚碧鸳。来人间笑傲一场，归大荒撒手无憾！图片发自App
方块斗罗的激战（三） - 草稿故事小卖家
这里是方块斗罗的激战三，也是第三集了，我决定一口气能写多少写多少，多剧透一点嘛，哈哈哈，以后写到这里就直接跳过就行啦。他们吃完肯德基以后，来到了赤瞳的家里，因为赤瞳的妈妈是光闪的养母，所以经过了几年的相处之后，光闪就是一口一个妈的叫。可是，自从光闪15岁的时候去了冥界，就一直没回来，这次冥界的修为到达了一定的程度，再修炼已经没有那么难了，所以光闪就回来了。坐标：赤瞳家里赤瞳的妈妈正在洗衣服，而赤瞳
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
大家都不容易，谁也别嘲讽谁自律的黄老爷
日日更，碎碎念。第229天序这个社会能活下来的，大家自己心里都有数。能活的好的，也都付出了自己该付出的。谁也别嘲讽谁，谁也不要可怜谁。001拼的是你几点睡觉了？昨天和我老婆聊天，他说以前的几个小伙伴，现在怎么怎么怎么了。我说很好啊，别人付出了那么多，也该是得到回报了。然后我老婆说：太夸张了，都在比谁晚睡。注：本人平均入睡时间是21点，哈哈哈。然后我就接着问：几点啊？老婆答曰：四五点。。。。我x，那
git 入门格林姆大师
git入门学习笔记----3个入门命令：gitinit、gitadd、gitcommit-v学习场景（首次在github上创建newrepository）：…orcreateanewrepositoryonthecommandlineecho"#blog-02">>README.mdgitinitgitaddREADME.mdgitcommit-m"firstcommit"gitremoteadd
vue 不同版本下v-model的底层实现
下面把「底层实现」和「差异」拆开讲，先给代码级流程，再给一个对照表，面试或源码阅读都能直接用。一、底层实现（编译→运行时的两条链路）Vue2•编译阶段：模板编译器遇到v-model，根据元素类型生成不同的AST指令对象。•运行时指令：src/platforms/web/compiler/directives/model.js里的model()函数把指令对象转成原生标签addProp(el,'val
“希望是比钻石更珍贵的，在当下最需要的东西”，袁明辉《六项精进》打卡学习273天 YuanWelldon
流浪地球流浪地球姓名：袁明辉公司：宁波惠尔顿婴童安全科技股份有限公司364期学员组别：利他一组403期志工组别:谦虚一组宁波盛和塾8月月度学习会《用数字经营企业》志工宁波盛和塾道盛哲学全国企业家践行成果发表会志工【知～学习】背诵《六项精进大纲》3遍，共761遍。背诵《大学》3遍，共761遍。【经典名句分享】今天开启2019年农历新年计划一、修身1、背诵《般若波罗蜜多心经》0遍，共808遍2、陪女儿
乱了全乱了/亲情账户开通第347天情雪儿
践行中……生活被打乱了一、和母亲一起带孩子因为疫情，放假了，待在家想要做任何事情也做不了，只能带孩子。如果把两个孩子推给母亲一个人带，而我安心学习，也是一件不可能的事情，所以只能两个人一起带。在放假一周的时间里，慢慢从不适应到适应了当下的日子，逐渐趋于正常生活，但一个电话打破了一切。二、一个熟悉的电话电话铃响起，是侄子打来的，自从侄子从新疆姑姑家回来，一直没有见到母亲，所以非常想念母亲。侄子:奶奶
中原焦点团队网络中级第19期吕娟坚持分享第333天我心安然无恙
2020年3月24号约练收获本周第一，二次，总第26，27次。初21课程复盘咨询流程:关系，目标，资源，一小步。平常多读书，有些知识也许短时间用不上，但是，可以先储存着。知识有时候用不上，属功利心太强了。生活中并不缺少美，只是缺少发现美的眼睛。授之以鱼，不如授之以渔，不如授之以欲。有些家长是灭欲的。(自以为是，还不愿承认)有时候家长会说:我吃的盐比你吃的米都多。问题是你吃的盐是多年前的盐，不是现在
成长锦囊[82]：心理咨询师在个人成长中如何设定目标？素心人生设计
Q：素心，在进行个人自我成长时，我要如何确定设定自己的成长目标？心理咨询师小雨正在学习认知行为疗法技术，想要更熟练精通这个心理技术，也想要进行认知行为咨询师的自我成长，前来咨询。@素心人生设计：我们进入到个人成长的模块2：解析问题，为改变做准备。这个模块的目标是帮助你发现更多挑战性问题，并明确你希望这个问题如何改变。今天为大家分享识别优势、设定目标、优化目标和制定达成策略。在上一部分我们有了五因素
晨间日记2021-2-03 蚊蚊幸福妈妈联盟
活在当下，少说多做，知行合一早睡早起5：30～10：30英语+家庭+经络【今日青蛙】点亮自己的明灯早上:大礼拜走路上班上午:上班小组作业中午:午休下午:上班晚上:潘多拉小组会经络【优秀是一种习惯，让开心成为一种习惯】事业～每天听1课~6/音频~2健康～跑步人脉～无家庭～锻炼理财～节制支出学习～潘多拉休闲～听歌心灵～大礼拜114
你是一个不会说“不”的人吗菲仪索斯
你是否会有这样的情况，不太懂得如何拒绝别人，特别在意别人对你的看法，别人说了伤害你的话，只会忍气吞声或者特别生气的时候，才怼回去；别人不回你的信息了，会想这条信息是不是发的不合适；两人打了照面对方没有给你打招呼，是不是想自己哪里得罪了别人；自己总是为别人考虑，宁愿牺牲自己也要让别人舒服，让别人觉得自己是一个不错的人，善解人意的人...我原来就是这样的人。当了两年多的小领导，自觉没有领导架子，最初员
2023-03-21 卯金刀_fafd
师家大院中国大院看山西，山西的大院是非常多的，在山西全省各地都有分布，山西原何能出这么多私家大院，这离不开“晋商”，在明清时期，山西是中国最富有的省份之一，山西的商人富甲天下，晋商的兴起，首先是明朝"开中制"政策的实施，为晋商的发展提供了契机。明代沈思孝在《晋录》里的描述，广为研究者所征引:"平阳、泽、潞，豪商大贾甲天下，非数十万不称富。"其次，山西矿产资源丰富，手工业和加工制造业当时已初具规模，
STL 简介（标准模板库）
前言通过对C++的特性，类和对象的学习和C++的内存管理对C++基本上有了全面的认识，但是C++的核心在于STL一、STL简介什么是STLC++STL（StandardTemplateLibrary，标准模板库）是C++编程语言中一个功能强大的模板库，它提供了一系列通用的数据结构和算法。STL的设计基于泛型编程，这意味着它使用模板来编写独立于任何特定数据类型的代码。STL的核心组件包括容器（如向量
儿子被我激怒以后（日更201）终身学习践行者杨倩
今天儿子的情绪很低落，因为他最近天天耍游戏和玩电话手表，昨天去办身份证，那个照片上明显的眼睛都变小了，我们很担心他这样下去视力会越来越差，所以他爸今天就把电脑设置了新的密码，没收了他的手机，没有这两样他心情特别不好。我不知道怎么，就想刺激他多说话，我看他一天到晚闷在家里，心里也特别烦躁，他躺在床上闷闷不乐，我看他把我的床弄乱了，怒火一下就上来了，吼他，说他不讲卫生，一天到晚的不看书，不学习，成绩又
兴成长遇见更好的自己九台896敖佳丽
2019，是特殊的一年，继往开来。这一年，我告别了学生的身份，成为了一名教师，一名幼儿教师！我深知作为一名教师身上的责任与重担。所以平时会严格要求自己，做一个有爱心，有耐心，有责任心的老师！作为教师的我们，更重要的是，提升我们的专业素养，能充实自己，丰富自己，更好的教授给孩子们知识，丰富他们的头脑，作他们的引路人，摆渡人和方向标！所以在2019年的夏天，我报名学习了兴成长计划！通过假期的学习，让我
渣土车识别漏检率高？陌讯算法实测降 90% 2501_92487936 目标跟踪人工智能计算机视觉目标检测算法智慧城市
在城市建筑垃圾运输管理中，渣土车的合规性监测一直是行业痛点。传统视觉算法在复杂工况下常常出现误判——阴雨天车牌识别模糊、夜间车灯眩光导致车型误分类、不同品牌渣土车混检时准确率骤降。某市政管理局的统计显示，采用传统方案时，日均漏检率高达23%，由此引发的违规倾倒投诉占比超60%。技术解析：从单模态到多特征融合的突破传统渣土车识别多依赖单一目标检测模型（如FasterR-CNN），其核心缺陷在于：特征
路面裂缝漏检率高？陌讯多尺度检测降 30% 2501_92487936 计算机视觉 opencv 人工智能深度学习算法目标检测
在市政工程与公路养护领域，路面裂缝检测是保障交通安全的关键环节。传统人工巡检不仅效率低下（日均检测≤50公里），且受主观因素影响漏检率高达15-20%[1]。而主流开源视觉算法在面对阴影干扰、多类型裂缝混杂等场景时，往往陷入"精度与速度不可兼得"的困境。本文将结合实战案例，解析陌讯视觉算法在路面裂缝检测中的技术突破与落地经验。一、技术解析：从传统方法到多模态融合架构传统裂缝检测多采用"边缘检测+形
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

论文笔记：多标签学习综述（A review on multi-label learning algorithms）

你可能感兴趣的:(论文笔记：多标签学习综述（A review on multi-label learning algorithms）)