SATAN 先生

OT1：Sinkhorn Distances: Lightspeed Computation of Optimal Transport

前言

为学习最优传输问题（Optimal Transport），拜读了博客《最优运输（Optimal Transfort）：从理论到填补的应用》，博文里简要介绍了三篇经典论文：

Sinkhorn Distances: Lightspeed Computation of Optimal Transport $\Rightarrow$ 博文
Wasserstein Generative Adversarial Networks $\Rightarrow$ 博文
Missing Data Imputation using Optimal Transport $\Rightarrow$ 博文

本系列博文打算精读之，下面是第一篇。认知有限，有不理解之处，也可能有理解不当或错误之处，请读者多多指教。

Abstract

OT Distance 是什么以及有什么用途就不说了，上面的博文以及我其他的一些博文有讲。这段 Abstract 的四种颜色标记分别表示：

黄色，计算 OT 距离涉及的线性规划求解复杂度很高，一旦概率向量的维度超过几百，则开销就大到不可接受；
绿色，作者提出从最大熵的角度看 OT 问题，产生新的 OT 距离；
蓝色，具体做法：用熵正则项平滑经典 OT 问题，性质：加上熵正则项后，最优解依然是一个距离，且可以用 Sinkhorn’s Matrix Scaling Algorithm 以几个数量级的更快速度求解；
红色，作者为验证新 OT 距离的有效性，在 MNIST 数据集上进行了分类实验。

1 Introduction

P1 > 在统计机器学习中，有一些衡量概率分布差异的信息散度（information divergences），包括 Hellinger, $\chi^2$ , total variation or Kullback-Leibler divergences；而 OT 距离（也称“推土距离 EMD”）在比较概率方面提供了更强的几何性。【?】

P2 > 但 OT 问题求解复杂度相当高，包括网络单纯形法和内点法在内的求解方法复杂度最低也要 $O(d^3log(d))$ 。

P3 > 尽管有 embedding 之类的简化求解方案，但实用性欠佳；在高维数据盛行的时代，较高的计算成本甚至使 OT 受到了质疑。

P4 > 和 Abstract 中的绿色和蓝色一样，更详细了一点：熵正则化使 OT 问题转化为严格凸优化，Sinkhorn’s Matrix Scaling Algorithm 是不动点迭代（fixed point iteration），具有线性收敛性，具体是实现仅需 matrix-matrix products。

P4 中 “two histograms of dimension $d$ or two point clouds each of size $d$ ”，看到 “point clouds” 想起当初《Notes on Optimal Transport (笔记)》中的数据点插入问题，当时对 “数据点怎么能最优传输呢？” 迷惑不解，苦苦思考才弄懂。现在看点云，是否还是：
“那我们就给他恢复这种概念，把这些点想象成一堆堆的小土堆，如何以最小的代价将 “土堆集” set1 变成 “土堆集” set2？点与点之间运送的土量就是连接强度。既然同一集合中小土堆都一样（没有谁是特别的），那它们的土量都是一样的。设土量为 1，set1 中有 n 个土堆，每个土堆的土量为 1/n，set2 中有 m 个土堆，每个土堆的土量为 1/m，运送土的代价就是两个土堆之间的距离。”？

2 Reminders on Optimal Transport

本节简单介绍什么是最优传输。博客《最优运输（Optimal Transfort）：从理论到填补的应用》以及《Notes on Optimal Transport》有较为详细的介绍，尤其后者借助糕点分配的故事讲解得较为生动，我已将其翻译为中文并加以注释。

这里需要说的是一个概念：Transport Polytope
翻译成中文就是传输多面体，怎么理解呢？从文中的意思看，它是 a Set of Joint Probabilities，一个联合分布的集合，写为

也即它包含了所有可能的传输方案。可是它为什么叫多面体？猜想可能限制条件 $P\bm{1}_d = \bm{r}, P^\intercal \bm{1}_d = \bm{c}$ 在空间中的几何形态类似多面体吧，想想三维空间中的线面，到高维空间就是多面体了。《Convex Optimization - Polyhedral Set》中有定义，同时也定义了距离矩阵集合为什么叫 cone？

现将其搬运过来：

A set in $\mathbb{R}^n$ is said to be polyhedral if it is the intersection of a finite number of closed half spaces, i.e., $\{ {\bm{x} \in \mathbb{R}^n: \bm{p}^\intercal_i \bm{x} \le \alpha_i, i = 1, 2, \dots, n \}}$
For example, $\{ {\bm{x} \in \mathbb{R}^n: A^\intercal_i X = \bm{b}\}}; \{ {\bm{x} \in \mathbb{R}^n: A^\intercal_i X \le \bm{b}\}}, \{ {\bm{x} \in \mathbb{R}^n: A^\intercal_i X \ge \bm{b}\}}$
Polyhedral Cone A set in $\mathbb{R}^n$ is said to be polyhedral cone if it is the intersection of a finite number of half spaces that contain the origin, i.e., $\{ {\bm{x} \in \mathbb{R}^n: \bm{p}^\intercal_i \bm{x} \le 0, i = 1, 2, \dots, n \}}$ 其包含原点，对数乘封闭，下图是维基百科给出的形状：

应该是圆锥吧。

本节还有个问题：

这里说只要 $M$ 是个距离矩阵，那么 OT 解也是个距离。如果 $M$ 不是距离矩阵呢？就如同糕点故事中的偏好矩阵， $d_M(\bm{r}, \bm{c})$ 还是距离吗？答：从第三节末尾对 “ $d_M(\bm{r}, \bm{c})$ 是距离” 证明来看，用到了不等式 $m_{ik} \le m_{ij} + m_{jk}$ ，那么应该是以 “ $M$ 是个距离矩阵” 为前提的。

3 Sinkhorn Distances: Optimal Transport with Entropic Constraints

这一节给出限制联合分布熵的 OT 问题，作者想说他是在遵循最大熵原则（maximum-entropy principle），以及在限制熵以后，OT 解依然保持着度量的性质。用到了有关熵的知识，如果这一块比较欠缺，则可以参考我的博文《由一个熵不等式引发的数学调研》。

3.1 Entropic Constraints on Joint Probabilities

首先要说明的是，作者是如何限制联合分布熵的，先看下面两个不等式

第一个是天然成立的，第二个是作者添加的熵限制，组合起来看，有 $h(\bm{r}) + h(\bm{c}) - \alpha \le h(P) \le h(\bm{r}) + h(\bm{c})$ 熵被限制在了一个长度为 $\alpha$ 的区间内。那么如何理解这个熵限制呢？从 $I(\bm{r} \| \bm{c}) = KL(P \| \bm{r}\bm{c}^\intercal) \le \alpha$ 的角度来看，他是想让 $\bm{r}$ 和 $\bm{c}$ 的相关性少一点，也即使 $P$ 更趋于均匀。限制熵的原因将在第四节说明。

限制 $P$ 的熵之后，所得的最优传输解就叫 Sinkhorn Distance：

本节也给出了一个限制熵的原因：最大熵原则。但在我看来，这并不能成为限制熵的理由，因为不限制熵时算出的最优解是实实在在地比限制熵的情况下算出的解要小（即代价最小）。来看一看作者说了什么吧。

OT 的最优解往往在多面体 $U(\bm{r}, \bm{c})$ 的一个顶点上，这个很好理解，我在《Notes on Optimal Transport (笔记)》文中的 “问题思考” 部分给出了解释。Such a vertex is a sparse $\times d$ matrix with only up to $2 d - 1$ non-zero elements. 这个稀疏性从感觉上可以知道，在顶点上嘛，至于为什么是 “up to $2 d - 1$ non-zero elements”，我不知道，有人知道的请留言。不过从《笔记》中可以看出，确实是非常稀疏的。

3.2 Metric Properties of Sinkhorn Distances

这一小节讲述限制 $P$ 的熵之后，Sinkhorn Distances 的度量性质。首先是两个特殊情况：

（1） $\alpha = 0$

当 $\alpha = 0$ 时， $h(\bm{r}) + h(\bm{c}) - \alpha \le h(P) \le h(\bm{r}) + h(\bm{c})$ 的区间长度变为 $0$ ， $h(\bm{r}) + h(\bm{c})$ 或者说 $I(\bm{r} \| \bm{c}) = KL(P \| \bm{r}\bm{c}^\intercal) = 0$ ，则 $U_\alpha (\bm{r}, \bm{c}) = \{ P = \bm{r}\bm{c}^\intercal \}$ 。

初看 “has a closed form”，懵逼了，啥是 “has a closed form”？维基百科中有定义

而中文维基百科中查到 “闭式解” 就是我们通常说的 “解析解”。这个 “closed form” 就是包含有限次常见运算的表达式，不包括极限、积分等。
因为现在 $\bm{r}\bm{c}^\intercal$ ，本质上可行解 $U_0 (\bm{r}, \bm{c}) = \{ P = \bm{r}\bm{c}^\intercal \}$ 已不是一个集合，而是一个点，此时 $d_{M,0}(\bm{r}, \bm{c}) = \langle \bm{r}\bm{c}^\intercal, M \rangle = \bm{r}^\intercal M \bm{c}$ 这不再是一个要求解的 problem，而是一个解析表达式，即 closed form。

至于为什么又 “becomes a negative definite kernel”？更让人匪夷所思。回想 SVM 中的正定核： $\mathscr{k}(\bm{x}, \bm{y})$ ，一组向量 $\{\bm{x}_i\}_1^n$ 用 $\mathscr{k}(\bm{x}, \bm{y})$ 计算 “高维内积” 得到的 Gram 矩阵半正定，则 $\mathscr{k}(\bm{x}, \bm{y})$ 为正定核。那如今 $d_{M,0}(\bm{r}, \bm{c}) = \langle \bm{r}\bm{c}^\intercal, M \rangle$ 怎么成了负定核？是给定一组概率单纯形 $\{\bm{p}_i\}_1^n$ ，由其计算的 Gram 矩阵半负定吗？

先看后面的说法，“one assumes that $M$ is itself a negative definite distance, or equivalently a Euclidean distance matrix，意思是说 $M$ 是一个负定距离，“等价地一个欧式距离矩阵”。暂时只能理解为：欧式距离是一个负定距离，欧氏距离矩阵是半负定矩阵 。可是这不对啊，当场就能推翻：假设有点 $x_1 = 1, x_2=2$ ，那么欧式距离矩阵为 $\begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}$ ，此时二次型 $\begin{bmatrix} x \ y \end{bmatrix} M \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} x \ y \end{bmatrix} \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 2xy$ ，肯定不是恒小于等于 $0$ 的嘛。搜索维基百科又搜不到正负定距离的概念，只能搜到矩阵正定负定的定义和正定核的概念。既然本段里说 $d_{M,\alpha}(\bm{r}, \bm{c})$ 是负定核，就当欧氏距离 $d(\bm{x}, \bm{y}) = \|\bm{x} - \bm{y}\|$ 是个负定核，可是现在欧式距离矩阵明明不负定哎！搜谷歌吧，有一个网页中提出了这个问题

这个人也是困惑于为何欧氏距离是负定，他能证明欧式距离是条件负定的： $\sum_i r_i = 0$ ，即刚才的 $f (x, y) = 2 x y$ 中 $x + y = 0$ ，如此看来就通了。

问题下面的回答也说 “作者可能是指条件负定”。对于欧氏距离矩阵的条件负定性此处不给出证明了（因为我不会），不过我编程试验了，确实是条件负定的。而且，经试验，如果 $M$ 是条件负定的话， $d_{M,0}(\bm{r}, \bm{c}) = \langle \bm{r}\bm{c}^\intercal, M \rangle$ 也是条件负定的。【读到论文末，在其补充材料处发现了 $d_{M,0}(\bm{r}, \bm{c})$ 的负定证明，此过程亦可证明欧氏距离 $M$ 的条件负定。此博文末予以证明。】

扯了这么多，作者扯负定干嘛？有什么卵用吗？也许他只是想说：当 $\alpha = 0$ 时，如果 $M$ 是个距离矩阵，那么 $d_{M,\alpha}(\bm{r}, \bm{c}) = \langle \bm{r}\bm{c}^\intercal, M \rangle$ 也是个距离。本来就是要证明 Sinkhorn Distance 是距离，不能少了 $\alpha = 0$ 的情况。

问题在于，“条件负定矩阵” 和 “负定距离” 是不是等价的？如果是，那么作者扯这些正负定就有意义了，否则讲不通！

（2） $\alpha$ 足够大时

当 $\alpha$ 足够大时，它就不起作用了， Sinkhorn Distance 变回普通的 OT 距离。因为 $\color{red}{h(P) \ge \frac{1}{2} [h(\bm{r}) + h(\bm{c})]}$ ，这个可以通过上面的 FIGURE 2.2 直接观察得出。那么只要有 $\alpha \ge \frac{1}{2} [h(\bm{r}) + h(\bm{c})]$ ， $\alpha$ 便不起作用了。给定 $\bm{r}$ 和 $\bm{c}$ 的维度 $n$ ，则有 $h(\bm{r}) \le log(n)$ ，那么，当 $\alpha > log(n)$ 时，铁定不起作用，有 $U_\alpha(\bm{r}, \bm{c}) = U(\bm{r}, \bm{c})$ 。

还是那个问题，扯正定负定干嘛？我现在有两个猜想：【不懂，也验证不了】

是不是条件负定核就是距离矩阵？
和下面的求解算法有关吗？【下面的求解算法并没有提正定负定的事!】

继续分析其度量性质

加了熵限制后，其不再满足 $\Leftrightarrow x= y$ ，例如，当 $\alpha = 0$ 时，有 $\begin{aligned} d_{M,0}(\bm{r}, \bm{r}) &= \bm{r}^\intercal M \bm{r} \\ &= \sum_{ij}^n r_i r_j \| \bm{x}_i - \bm{x}_j \|^2 \end{aligned}$ 若有 $r_k \ne 0, r_l \ne 0, k \ne l$ ，则 $r_k r_l > 0~\&\&~ \| \bm{x}_i - \bm{x}_j \|^2 > 0$ ，必有 $d_{M,0}(\bm{r}, \bm{r}) > 0$ 。作者通过 $\bm{1}_{\bm{r} \ne \bm{c}}d_{M,\alpha}(\bm{r}, \bm{c})$ 将 $d_{M,\alpha}(\bm{r}, \bm{r})$ 乘以 $0$ 来恢复这种性质。

对称性是公式自带的，不论是 $\langle P, M \rangle$ ，还是后面的熵限制 $\ge h(\bm{r}) + h(\bm{c}) - \alpha$ ，都是天然的对称。

三角不等式的证明

Computational Optimal Transport 一书中对基本的 p-Wasserstein distance 的三角不等式证明很详细，其用到了一个叫 gluing lemma 的东西：

大概意思就是：利用两个 Wasserstein 距离的解空间 $\in U(\bm{a}, \bm{b}),~ Q \in U(\bm{b}, \bm{c})$ 构建出一个新的解空间 $\overset{def.}{=} Pdiag(1/\tilde{b})Q \in U(\bm{a}, \bm{c})$ ，即 $S\mathbb{1}_n = \bm{a}, S^\intercal \mathbb{1}_n = \bm{c}$ 。

有了这个耦合器，再利用闵可夫斯基不等式就能证明三角不等式了：

到了带熵限制的 Sinkhorn 距离，这个叫 gluing lemma 的耦合器也自然要带上熵限制的：

可以看到形式上基本是一模一样的，只是这里的解空间变成了 $U_\alpha$ ，至于三角不等式的证明，就更没有什么差别了。所以，要注意的是，这个新建的 $S$ 到底是不是 $\in U_\alpha$ 的？即： $\ge h(\bm{x}) + h(\bm{z}) - \alpha$ 是否成立？

这是文末补充材料给出的证明，根据

可构造出一个马尔科夫链 $\to Y \to Z$ ，链状之后，应该是有个定理啥的：链中，挨得更近的变量之间互信息更大，因为依赖更大。所以就有了后面的不等式，进而的出： $\ge h(X) + h(Z) - \alpha$ 。

Computing Regularized Transport with Sinkhorn’s Algorithm

以正则项的方式限制熵，系数 $-\frac{1}{\lambda}$ 会使 $h (P)$ 变大，且 $\lambda \in (0, \infin)$ 使主目标 $\langle P, M \rangle$ 和正则项 $-\frac{1}{\lambda}h(P)$ 之间分配权重。当 $\lambda \to 0$ 时，系数会无穷大，致使目标函数只考虑熵项，而忽略主目标，自然就对应了 $\alpha = 0$ ；当 $\lambda \to \infin$ 时，系数为 0，致使目标函数只考虑主目标，而忽略熵项，恢复原本的瓦斯距离，即上文的 $\alpha$ “足够大”。故而，each $\alpha$ corresponds a $\lambda \in [0, \infin]$ 。

$d_M, d_{M,\alpha}, d_M^\lambda$ 的示意图，从上到下吧，看一看。

箭头 $M$ 应该是指 $\langle P, M \rangle$ 关于 $P$ 的梯度，是代价降低的反方向，绿红蓝三条虚线大概是代价等高线吧，这解释了为何 $P^\star$ 总会出现在 Polytope $U(\bm{r}, \bm{c})$ 的角上，我在博文 Notes on Optimal Transport (笔记) 中已经从线性规划的角度讲述了可行域 $U(\bm{r}, \bm{c})$ 的样子，以及为什么最优解会出现在多边形的角落上。

那么 $U_\alpha$ 是以 $\bm{r}\bm{c}^\intercal$ 为中心的 ball 吗？我们来算一算， $h (P)$ 的范围是： $h(\bm{r}) + h(\bm{c}) - \alpha \le h(P) \le h(\bm{r}) + h(\bm{c})$ 注意， $\bm{r}, \bm{c}$ 是给定的，那 $h(\bm{r}) + h(\bm{c})$ 自然是确定的，再给定 $\alpha$ ，则 $h (P)$ 就有一个固定的范围。前面讨论过， $h (P)$ 有一个自然的上下限 $\frac{1}{2}(h(\bm{r}) + h(\bm{c})) \le h(P) \le h(\bm{r}) + h(\bm{c})$ ， $h(\bm{r})$ 和 $h(\bm{c})$ 也有范围 $[0, l o g n]$ ，那么 $h(\bm{r}) + h(\bm{c}) \in [0, 2logn]$ 。

当取 $\alpha = 0$ ，即 $h(\bm{r}) + h(\bm{c})$ 时，就是中心点 $\bm{r}\bm{c}^\intercal$ ，随着 $\alpha$ 增大，大到失去作用时，就是铺满整个 Polytope $U(\bm{r}, \bm{c})$ 。当取一个起作用的 $\alpha$ 时，令 $h(\bm{r}) + h(\bm{c}) - \alpha$ ，则 $-\sum_{ij}P_{ij} logP_{ij} \ge t$ 它的边界是 $-\sum_{ij}P_{ij} logP_{ij} = t$ ，不是线性的，也不是二次的，所以它应该是个超曲面。所以，途中画成曲线围成的范围是合理的。但是不是 ball 就不知道了！

随着 $\lambda$ 的增大，熵限制越来越松弛，最优解沿着从 $\bm{r}\bm{c}^\intercal$ 到 $P^\star$ 的曲线滑动，也很形象。

Computing $d_M^\lambda$ with Matrix Scaling Algorithms

这个引理意思是说：对偶解 $P^\lambda$ 是唯一的，且形式为 $P^\lambda = diag(\bm{u}) K diag(\bm{v})$ ，其中 $\bm{u}$ 和 $\bm{v}$ 是非负向量，且唯一地被乘子(应该是 $\lambda$ )确定。

这个结论来源于 Sinkhorn’s Theorem：

一个元素全部为正的方阵 $A$ ，有唯一的正对角矩阵 pair $D_1, D_2)$ 使 $D_1 A D_2$ 是 Doubly Stochastic Matrix，即行和列和都为 $\bm{1}$ 的方阵。

但是论文中有不一样的地方： $P^\lambda = diag(\bm{u}) K diag(\bm{v})$ 并不是所谓的 Doubly Stochastic Matrix，它的行和等于 $\bm{r}$ ，列和等于 $\bm{c}$ 。这里是 $P^\lambda$ 唯一地属于 $U(\bm{r}, \bm{c})$ 。然后就可以用 Sinkhorn’s fixed point iteration 进行求解了。咱就当它是个引理吧，Sinkhorn’s Theorem 咱不懂背后的原理，这里的变更版就更不懂了，记住这个结论吧。

来看 $p_{ij} = e^{-1/2 - \lambda \alpha_i} e^{-\lambda m_{ij}} e^{-1/2 - \lambda \beta_j}$ ，确实有 $\begin{aligned} \bm{u} &= [e^{-1/2 - \lambda \alpha_1}, e^{-1/2 - \lambda \alpha_2}, \cdots, e^{-1/2 - \lambda \alpha_n}] \\ \bm{v} &= [e^{-1/2 - \lambda \beta_1}, e^{-1/2 - \lambda \beta_2}, \cdots, e^{-1/2 - \lambda \beta_n}] \\ K &= \begin{bmatrix} m_{11} & m_{12} & \dots & m_{1n} \\ m_{21} & m_{22} & \dots & m_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ m_{n1} & m_{n2} & \dots & m_{nn} \\ \end{bmatrix} \end{aligned}$ 知识有限，只能理解到这了，后面的计算是很简单的，这里有更简单的 python 代码。

问题在于：通篇都是按 $M$ 是个对称的距离矩阵讲述与证明的，而现实中， $\bm{r}$ 和 $\bm{c}$ 不同维的情况很多，代价矩阵 $M$ 也未必是对称的负定距离矩阵，这种计算的合理性还在吗？不过根据糕点实验，这一切似乎都照常进行。最要紧的是，我们并不知道作者是如何做实验的。

5. 实验

5.1 实验过程

在这里看到了核，终于明白作者想做什么实验了。这个 $e^{-d/t}$ 很像高斯核 $e^{-\frac{\|\bm{x} - \bm{y}\|^2}{2\sigma^2}}$ 和拉普拉斯核 $e^{-\frac{\|\bm{x} - \bm{y}\|}{\sigma}}$ ，相似之处在于，它们都是距离的指数函数。这也是个收获：可能距离函数的指数，都能作为核函数吧。 $t$ 根据距离值域的百分位 $q_s(d)$ 进行选择。【关于这个 $t$ 的讲究，它和高斯核中的 $\sigma$ 一样，《支持向量机通俗导论》中说， $\sigma$ 越大，拟合能力越弱，越小拟合能力越强，调节它可以在欠拟合和过拟合之间平衡】

有了核函数，就可以利用 SVM 进行分类了：

作者说可以用库 $L ib s v m$ 跑 $s v m$ 进行多分类。多分类策略是 OvO，不过 MNIST 有 10 个类别，那么就需要 $10 * 9/2 = 45$ 个二分类器，开销还是蛮大的。

果然，作者还尝试了高斯核，高斯核中的距离函数是平方欧式距离。

这个独立核，就是上文的 $e^{−td_{M,0}} = e^{−t\langle \bm{r}\bm{c}^\intercal, M \rangle}$ ，那么这就是实验的一个特例 $\alpha = 0$ ，即 $\lambda \to 0$ 时的情况。而 $m_{ij}^a]$ 中的 $a$ 只是一种超参数调整。但我觉得这没意义吧，均匀分布的 Sinkhorn 距离，估计都没什么距离区分性！

5.2 实验结果

作者给出的 matlab 代码确实实现了 Sinkhorn 算法，但是真正的实验代码并未提供，故而实验结果真假难辨，就不必看了。后来在 GitHub 搜到了一份印度人写的复现代码，有些许不一样，也不能直接运行！太难了！她计算了图片之间的 Sinkhorn Distance 之后，直接将距离矩阵带上核范数输入到了一个叫 fitcecoc 的函数：

官方文档说这个函数训练一个 ECOC 多分类器，所用的二元分类器是 SVM，第一个参数是数据特征，第二个是类别。这样的话，作者说的核 $e^{-d/t}$ 如何体现呢？

结语

到最后，也没看到强调正定负定有什么用，这个让人头疼的问题。如果非要找出个用处，大概是 SVM 中的核函数 $e^{-d/t}$ 要求 $d$ 是个距离，而 “负定距离” 和 “条件负定矩阵” 的概念可以保证 Sinkhorn Distance 能用于核函数。【这只是猜想，知识有限，不能明确!】

Update1：欧式距离的条件负定证明

给定一组向量 $\bm{x}_1, \bm{x}_2, \dots, \bm{x}_i, \dots, \bm{x}_n \in \mathbb{R}^d$ ，其欧式距离矩阵为 $M$ ，其元素 $m_{ij} = \|\bm{x}_i - \bm{x}_j\|^2$ ， $\forall \bm{r} \in \mathbb{R}^n$ $\begin{aligned} \bm{r}^\intercal M \bm{r} &= \sum_{ij}^n r_i r_j \| \bm{x}_i - \bm{x}_j \|^2 \\ &= \sum_{ij}^n r_i r_j (\| \bm{x}_i \|^2 + \| \bm{x}_j \|^2 - 2\bm{x}_i^\intercal \bm{x}_j) \\ &= \sum_{ij}^n r_i r_j \| \bm{x}_i \|^2 + \sum_{ij}^n r_i r_j \| \bm{x}_j \|^2 - 2\sum_{ij}^n r_i r_j\bm{x}_i^\intercal \bm{x}_j \\ &= \sum_{j}^n r_j\sum_{i}^n r_i \| \bm{x}_i \|^2 + \sum_{i}^n r_i\sum_{j}^n r_j \| \bm{x}_j \|^2 - 2\sum_{ij}^n r_i r_j\bm{x}_i^\intercal \bm{x}_j \end{aligned}$ 到这，其实没法进行下去了。经过编程验证，如果不对 $\bm{r}$ 加以限制为 $\sum_i r_i = 0$ ， $\bm{r}^\intercal M \bm{r}$ 是有正有负的，即不定。现假定 $\sum_i r_i = 0$ ： $\begin{aligned} \bm{r}^\intercal M \bm{r} = - 2\sum_{ij}^n r_i r_j\bm{x}_i^\intercal \bm{x}_j \le 0 \end{aligned}$ 就得到了条件负定。

不过这里是欧氏距离的平方 $d^2(\bm{x}, \bm{y}) = \| \bm{x}_i - \bm{x}_j \|^2$ ，对于 $d(\bm{x}, \bm{y}) = \| \bm{x}_i - \bm{x}_j \|$ ，我还没找到证明的方法，虽然能验证它是条件负定的。文中脚注说：

也即 $d^t(\bm{x}, \bm{y}) = \| \bm{x}_i - \bm{x}_j \|^t, \forall t \in (0, 2]$ 是条件负定的。故欧式距离是条件负定的。至于为什么是这样，Berg1984 $\S3.2.10$ 中这样写道：

全然不懂，也不打算去深究了，暂且就这么认为。

Update2： $U_\alpha(\bm{r}, \bm{c})$ 的凸性证明

凸集，用数学语言写就是： $\begin{align*} & \forall P^{(1)}, P^{(2)} \in U_\alpha(\bm{r}, \bm{c}) \\ \Rightarrow & \forall t \in [0, 1], P = tP^{(1)} + (1-t) P^{(2)} \in U_\alpha(\bm{r}, \bm{c}) \end{align*}$ 先看看 $U(\bm{r}, \bm{c})$ 凸不凸吧 $\begin{align*} P\bm{1}_m &= [tP^{(1)} + (1-t) P^{(2)}]\bm{1}_m \\ &= tP^{(1)}\bm{1}_m + (1-t) P^{(2)}\bm{1}_m \\ &= t\bm{r} + (1-t)\bm{r} \\ &= \bm{r} \end{align*}$ 同理 $P^\intercal \bm{1}_n = \bm{c}$ ，故 $\in U(\bm{r}, \bm{c})$ ，凸！下一步，我们要导出 $\begin{align*} h(P) &= h(tP^{(1)} + (1-t) P^{(2)}) \\ &\geq th(P^{(1)}) + (1-t) h(P^{(2)}) \ \ \ ① \\ &\geq t[h(\bm{r}) + h(\bm{c}) − \alpha] + (1-t)[h(\bm{r}) + h(\bm{c}) − \alpha] \\ &= h(\bm{r}) + h(\bm{c}) − \alpha \\ \Rightarrow P &\in U_\alpha(\bm{r}, \bm{c}) \end{align*}$ 其中 $①$ 来源于熵函数的凹性。故 $U_\alpha(\bm{r}, \bm{c})$ 是凸的。

Update3：条件负定矩阵和距离矩阵的关系

其实从 Metric Properties of Sinkhorn Distances 一节中已经可以看出一些结论，只不过我在不明白怎么回事的情况下不愿意接受而已。先看看从论文中能得到什么。

这一句话中，negative definite distance 和 Euclidean distance matrix 是等价的。从 “itself” 可知 negative definite distance 和 negative definite kernel 等价。

脚注说：对于 Euclidean distance matrix $[m_{ij}] = [\|\varphi_i - \varphi_j\|_2^2]$ 而言，矩阵 $m_{ij}^t]$ 也是 Euclidean distance matrix，其中 $。$

好家伙，这么说来，有以下概念是等价的： $\begin{aligned} &negative~definite~kernel \\ \Leftrightarrow & negative~definite~distance \\ \Leftrightarrow & Euclidean~distance~matrix \\ \Leftrightarrow & [\|\varphi_i - \varphi_j\|_2^t], t \in (0, 2] \end{aligned}$ Sinkhorn Distance 也是欧式距离矩阵？

再看这一段， $d_{M, 0}$ 是一个 negative definite kernel，并且 $e^{-td_{M, 0}}$ 是 positive definite，其中 $t > 0$ 。大致可猜想：如果 $d$ 是个负定核，那么 $e^{-td}$ 是 positive definite。

从这里可确定上面的猜想，只要 $d$ 是个距离、 $t > 0$ ， $e^{-d/t}$ 就是个核函数，作者用这个核去跑 SVM 了。

真不敢相信，负定核真的和距离函数是等价的。

Scattered Data Interpolation with Polynomial Precision and Conditionally Positive Definite Functions 中的一些定理引理让我相信了这个结论，虽然这里面并没有给出详细的证明，即使有估计也看不懂。

你可能感兴趣的:(机器学习,Optimal,Transport,机器学习,人工智能,算法,概率论)

AI常见的算法纠结哥_Shrek 人工智能算法
人工智能（AI）中常见的算法分为多个领域，如机器学习、深度学习、强化学习、自然语言处理和计算机视觉等。以下是一些常见的算法及其用途：1.机器学习(MachineLearning)监督学习(SupervisedLearning)线性回归(LinearRegression)：用于预测连续值，如房价预测。逻辑回归(LogisticRegression)：用于分类问题，如垃圾邮件检测。支持向量机(SVM)
python中最小公倍数函数_Python 最小公倍数算法琅邪杨文理 python中最小公倍数函数
Python最小公倍数算法以下代码用于实现最小公倍数算法：#Filename:test.py#authorby:www.w3cschool.cn#定义函数deflcm(x,y):#获取最大的数ifx>y:greater=xelse:greater=ywhile(True):if((greater%x==0)and(greater%y==0)):lcm=greaterbreakgreater+=1r
【书生·浦语大模型实战营】学习笔记（五）：LMDeploy 量化部署 GoAI 深入浅出LLM 深入浅出AI 大模型 LLM 部署人工智能 LMDeploy
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI1；；爱好者学习，性价比非常高！加入星球➡️点击链接
软件开发中的密码学（国密算法）自己的九又四分之三站台 #软件架构师的“不归之路“密码学算法
1.软件行业中的加解密在软件行业中，加解密技术广泛应用于数据保护、通信安全、身份验证等多个领域。加密（Encryption）是将明文数据转换为密文的过程，而解密（Decryption）则是将密文恢复为明文的过程。以下是加解密在软件行业中一些常见的应用和技术：1.1.对称加密与非对称加密对称加密：加密和解密使用相同的密钥。常见算法包括AES（高级加密标准）、DES（数据加密标准）、3DES（Trip
代码随想录算法训练营day32：动态规划01 树懒爱沙发算法动态规划 leetcode 数据结构
动态规划理论基础动态规划刷题大纲适用范围：某一问题有很多重叠子问题，使用动态规划是最有效的。所以动态规划中每一个状态一定是由上一个状态推导出来的，这一点就区分于贪心，贪心没有状态推导，而是从局部直接选最优的。套路：dp数组，下标的含义——定义一维或者二维的状态转移数组递推公式：当前状态是怎么被上一个状态决定出来的dp数组如何初始化遍历顺序打印dp数组——来check算法是否正确509.斐波那契数力
两个免费的英文论文润色网站知足常乐2023 论文润色笔记
1.DeepL：常用，感觉比较好用，可选择多种润色模式，但润色的字数有限制。DeepLWrite：人工智能驱动的写作助手https://www.deepl.com/write2.赛特新思：用的较少，润色字数也有限制。SCI润色|文献润色|英文润色|Editing|英文写作|论文写作|citexs斯特新思https://www.citexs.com/Editing
代码随想录算法训练营day10 魏进算法数据结构 java
代码随想录算法训练营day10来到了栈与队列，经过昨天的总结感觉自己快忘干净了。。有种G的感觉来到这先搞一下吧什么是栈？在我认为是一种储存方式，但他的存入存出顺序比较有意思，他是先进后出但我看完发现他是，为容器的适配器。。containeradapter什么是队列也是一种方式但是先进先出。queue就像一个队伍在排先到先得，而stack像一个瓶子，在往里塞。都是适配器，为了配合vectororli
python中cv是什么_python里面cv是什么意思 weixin_39639568 python中cv是什么
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
为什么说软件架构师应该关心性能优化？ AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术文章目录1.简介2.基本概念术语说明2.1服务器架构2.2云计算3.核心算法原理和具体操作步骤以及数学公式讲解3.1概述3.2CPU3.2.1CPU缓存和页面置换算法3.2.2NUMA架构3.3内存3.3.1内存分配策略（1）如何划分内存给进程（2）如何划分内存给堆和栈（3）是否允许堆和栈向操作系统申请更多的内存3.3.2内存碎片3.4网络3.4.1网络协议优化（1）协
论文AI率：检测原理是什么？该如何降低论文AI率？迪娜学姐人工智能
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。上一篇介绍了10个检测AI率的在线工具。本篇来说说AI率到底是如何检测出来的？该如何有效降低论文的AI率？和AI大模型一样，AI检测的核心也是机器学习模型，它们在包含人类创作和AI生成文本样本的大型数据集上进行训练，通过学习每种文本中存在的模式和特征，以此来区分人类创作的文本和AI生成文本。AI检测器查找的一些关键特征包
代码随想录算法训练营Day32 Nruonan 算法算法深度优先
78.子集力扣题目链接classSolution{List>res=newArrayListpath=newLinkedList>subsets(int[]nums){dfs(nums,0);returnres;}publicvoiddfs(int[]nums,intstart){res.add(newArrayList(path));for(inti=start;i
Python编程入门指南：从基础到高级编程咕咕gu- python 零基础学习开发语言学习零基础入门
如果你正在学习Python，那么你需要的话可以，点击这里Python重磅福利：入门&进阶全套学习资料、电子书、软件包、项目源码等等免费分享！一、引言1.1Python编程语言简介Python是一种高级编程语言，它具有简单易学、代码简洁、易维护等特点，因此被广泛应用于科学计算、数据分析、人工智能等领域。Python的语法简洁，代码易于阅读和编写，因此它被广大开发者所喜爱。同时，Python还拥有庞大
深入剖析ipywidgets-7.0.0b1：Python交互式前端库的新进展多行不易
本文还有配套的精品资源，点击获取简介：ipywidgets是一个用于创建交互式用户界面的Python库，广泛应用于数据可视化和科学计算。最新版本7.0.0b1带来了新特性、性能优化、API改进和兼容性增强。本详细解析包括ipywidgets的核心概述、主要功能、版本新特性以及其在教育、数据探索和应用原型开发等场景中的应用。1.ipywidgets核心概念介绍在当今数据科学和机器学习领域，交互式可视
机器学习Day01 酒脑猫机器学习人工智能
人工智能三大概念及其关系人工智能（AI）：使用计算机来模拟或者代替人类机器学习（ML）：机器自动学习，并不只由人定义规则编程深度学习（DL）：大脑仿生，模拟人大脑神经网络，设计一层层神经元模拟事物机器学习是实现人工智能的一种途径，深度学习是机器学习的一种更加深入的方法。机器学习学习方法基于规则的学习：程序员根据自己经验定义规则基于模型的学习：由于某些事物，问题无法可以定义明确的规则，如：图片，语音
动态规划算法（25.1.27）一位不愿透露姓名的程序猿算法动态规划
写在前面：已经有半年在忙计算机四大件了，算法可以说是除了10月份看了看代码随想录的题并跟着写了点题之外一点题都没做。1月末开始重拾算法，打算用点时间从做题曲成为algorithm高手，在那些中学就开始接触算法然后故意在我们零基础高考er面前大声讨论“茴字的写法”的OIer面前可以不再装死。0.前置了解：递归思想以及相关题目（详解递归思想-CSDN博客）1.动态规划算法基础概念：最简单的例子：斐波那
机器学习Day1 一飞学编程机器学习机器学习人工智能
1.背景以周志华教授的《机器学习》为核心学习AI知识2.绪论中的重要概念整理机器学习的目的：利用经验（数据）来改善系统性能记录：(key1:value1,key2:value2…)数据集：记录的集合示例（样本）：对一个事件或对象的描述属性（特征）：key1,key2…属性值：value1,value2…属性空间（样本空间、输入空间）：key1,key2等组成的多维空间特征向量：形如（value1,
机器学习建模流程 day02 扫把星133 机器学习人工智能 python
机器学习建模流程通常可以分为以下几个主要步骤：问题定义与数据收集：确定问题的类型（分类、回归、聚类等可见上篇所讲内容）和目标。收集相关数据，可以是从数据库、API、文件或其他来源获取。注释：数据库是计算机里面的存储的数据的，当然可以对数据进行一些操作增删改查，通常用于存储大量结构化数据，并提供高效的数据操作和查询功能。API（ApplicationProgrammingInterface，应用程序
2024年AIGC技术未来发展趋势与挑战：从应用创新到伦理监管小宝哥Code ChatGPT与AIGC AIGC
生成式人工智能（AIGC，ArtificialIntelligenceGeneratedContent）作为人工智能领域的一个重要分支，正在快速发展并改变着多个行业的格局。2024年，AIGC技术持续取得突破，并进入更多实际应用场景。本文将详细介绍AIGC的基本概念、原理、最新前沿技术及发展趋势。1.生成式人工智能（AIGC）基本概念与原理生成式人工智能（AIGC）是指通过人工智能技术，尤其是深度
【DL】神经网络与机器学习基础知识介绍（一） MengWoods 深度学习机器学习神经网络人工智能
原博客：https://mengwoods.github.io/post/dl/009-dl-fundamental/文章目录基本通用概念梯度下降算法数据工程训练技术偏差与方差防止过拟合评估指标决策树基本通用概念机器学习的类型：监督学习（SupervisedLearning）：分类，回归无监督学习（UnsupervisedLearning）：聚类，降维强化学习（ReinforcementLearn
AI 集群：Exo 项目详解 ivwdcwso 运维人工智能 AI Exo
引言随着人工智能技术的迅猛发展，越来越多的人希望在家中运行自己的AI集群。传统的AI集群通常需要昂贵的硬件和复杂的配置，但Exo项目正是为了解决这个问题而诞生的。Exo项目旨在让你利用日常电子设备，轻松搭建一个高效的AI集群。本文将详细介绍Exo项目的特点、安装步骤和实战示例。©ivwdcwso(ID:u012172506)Exo项目特点1.广泛的模型支持Exo支持多种流行的AI模型，包括但不限于
使用seaborn绘制相关性热力图 CodeWG python
使用seaborn绘制相关性热力图在数据分析和机器学习中，热力图是一种常见的可视化方法，用于显示不同变量之间的相关性。在Python中，我们可以使用seaborn库绘制相关性热力图。本文将介绍如何使用seaborn中的heatmap函数来绘制相关性热力图，并为读者提供示例代码。首先，我们需要导入必要的库：pandas、numpy和seaborn。我们还使用了matplotlib库以便于展示结果。i
HTTPS协议简述 free-9d https 网络协议 http
HTTPS协议简介HTTPS是HTTP+Security的组合，即在HTTP的基础上加入了安全性机制，主要通过加密传输、身份认证和数据完整性保护来确保通信的安全性。为了实现这一目标，HTTPS引入了加密技术，包括对称加密、非对称加密和数字证书机制。1.对称加密概念对称加密是一种加密方式，服务器和客户端共用一个密钥。信息通过密钥进行加密和解密，密钥本身也需要在双方之间传递。优点算法简单，效率高。缺陷
python 监控键盘输入_python 监控键盘输入 weixin_39717121 python 监控键盘输入
软件测试精品文章汇总测试基础python测试开发库及项目谷歌如何测试软件python工具书籍下载-持续更新2018软件测试标准汇总下载python测试开发自学每周一练python测试工具开发自学每周一练-2018-06软件测试工具书籍与面试题汇总下载(持续更新)python测试开发自动化测试数据分析...文章python人工智能命理2019-05-131907浏览量Shell历史记录异地留痕审计与
Leetcode 240. 搜索二维矩阵 II 无名小卒一枚 LeetCode C++二分查找二分搜索树二维数组 hot100
题目描述编写一个高效的算法来搜索mxn矩阵matrix中的一个目标值target。该矩阵具有以下特性：每行的元素从左到右升序排列。每列的元素从上到下升序排列。示例：输入：matrix=[[1,4,7,11,15],[2,5,8,12,19],[3,6,9,16,22],[10,13,14,17,24],[18,21,23,26,30]],target=5输出：true来源：力扣（LeetCode）
LeetCode Hot100 240.搜索二维矩阵II 爱笑的coder 算法刷题-矩阵 leetcode 矩阵算法
题目：编写一个高效的算法来搜索mxn矩阵matrix中的一个目标值target。该矩阵具有以下特性：每行的元素从左到右升序排列。每列的元素从上到下升序排列。方法：逐行二分查找classSolution{publicbooleansearchMatrix(int[][]matrix,inttarget){for(int[]row:matrix){intindex=search(row,target)
LeetCode 每日一题119. 杨辉三角 II 喜欢下雨所以爱上雷震子每日一题杨辉三角动态规划空间复杂度 Java 算法
119.杨辉三角II给定一个非负索引k，其中k≤33，返回杨辉三角的第k行。在杨辉三角中，每个数是它左上方和右上方的数的和。示例:输入:3输出:[1,3,3,1]进阶：你可以优化你的算法到O(k)空间复杂度吗？方法一：解题思路大年初一，祝大家新年快乐～，祝自己早日上岸。和杨辉三角一样，没啥难度，直接上代码了～参考代码publicListgetRow(introwIndex){Listans=new
算法(哈希表)——字符串中所有字母异位词花生酱拌面算法(哈希表)算法散列表 leetcode c++数据结构
文章目录1.题目描述2.解题思路3.代码实现1.题目描述给定两个字符串s和p，找到s中所有p的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。异位词指由相同字母重排列形成的字符串（包括相同的字符串）。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/find-all-anagrams-in-a-string示例1:输入:s="
2021年2月12日 Leetcode每日一题：119. 杨辉三角 II 冲就完事了 leetcode每日一题 java leetcode 算法
杨辉三角Ⅱ1.题目描述给定一个非负索引k，其中k≤33，返回杨辉三角的第k行。在杨辉三角中，每个数是它左上方和右上方的数的和。2.示例示例:输入:3输出:[1,3,3,1]3.读题今天又是很简单的每日一题。这个题目本身不难，难点在于题目给出了附加挑战：你可以优化你的算法到O(k)空间复杂度吗？也就是说，不能使用额外空间，最多只能使用目标层长度的空间。但是，如果将杨辉三角左对齐，就能够发现两个规律：
LeetCode刷题之路：119. 杨辉三角II Super灬Dan 力扣LeetCode 算法 python leetcode 杨辉三角II
如果帮助到您，还请点个关注吧，hahaha给定一个非负索引k，其中k≤33，返回杨辉三角的第k行。在杨辉三角中，每个数是它左上方和右上方的数的和。示例:输入:3输出:[1,3,3,1]进阶：你可以优化你的算法到O(k)空间复杂度吗？#最直观的思路这道题跟118题非常相似这个题只需要返回最后一行的结果就行，而不需要中间行的结果所以我们可以设置一个变量，让其随着行数改变而一直改变一个小坑：这个题的行数
进阶之路：从传统编程到AI大模型与Prompt驱动的爬虫技术大模型老炮人工智能 prompt 爬虫语言模型大模型学习 AI大模型
前言爬虫相信很多人都对此有所了解，它主要依靠编写代码实现对网页结构的解析，通过模拟浏览器行为获取目标数据！随着人工智能技术的发展，LLM大模型的出现为爬虫技术带来了新的思路。与传统的编程模式不同，使用AI大模型+prompt可以显著提高程序员的编程效率。通过结合人工智能和自然语言处理技术，开发者可以更加高效地编写爬虫代码，并实现对网页内容的智能解析和提取。前置内容下面我将通过爬取豆瓣电影top25
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。