腾讯AI实验室

ICML 2018 | 腾讯AI Lab详解16篇入选论文

感谢阅读腾讯AI Lab微信号第30篇文章。我们将深度解析机器学习领域顶会ICML 2018收录的16篇腾讯AI Lab论文。

7月10日至15日，第 35 届国际机器学习会议（ICML 2018）将在瑞典斯德哥尔摩举行。ICML是机器学习领域最顶级的学术会议，今年共收到2473篇投递论文，比去年的1676篇提高47.6%，增幅显著。最终入围论文共621篇，接收率25%，与去年26%持平。

这是腾讯AI Lab第二次参与这一顶级会议，共有16篇论文入选，去年则入选4篇，均位居国内企业前列。我们将在下文中分三类介绍这些文章——新模型与新框架、分布式与去中心化、及机器学习优化方法与理论研究。有的研究具有多重贡献，并不严格按照研究内容区分。

第一部分：新模型与新框架

1、用于强化学习的基于反馈的树搜索

Feedback-based Tree Search for Reinforcement Learning

论文地址：https://arxiv.org/abs/1805.05935

蒙特卡洛树搜索（MCTS）已经在游戏智能体方面取得了很大的成功（比如 AlphaGo），但对于 Atari 或 MOBA 等需要快速决策的视频游戏，树搜索的速度却太慢了。针对这一问题，该论文提出了一种新型的基于模型的强化学习技术，可在原无限范围的马尔可夫决策过程的小型有限范围版本批量上迭代式地应用 MCTS。在以离策略的方式完成强化学习训练之后，智能体无需进一步的树搜索就能实现快速实时的决策。

研究者将这一思想融合到了一个基于反馈的框架中，其中 MCTS 会使用其根节点处生成的观察结果来更新自己的叶节点评估器。其反馈过程如下图所示：（1）从一批采样的状态（三角形）开始运行一组树搜索，（2）使用第 k 次迭代时的策略函数近似（PFA）πk 和价值函数近似（VFA）Vk 的叶估计被用于树搜索过程，（3）使用树搜索结果更新 πk+1 和 Vk+1。

研究者对该方法进行了理论分析，结果表明当样本量足够大且进行了足够多的树搜索时，估计得到的策略能够接近最优表现。这也是对基于批 MCTS 的强化学习方法的首个理论分析。

研究者还使用深度神经网络实现了这种基于反馈的树搜索算法并在《王者荣耀》1v1 模式上进行了测试。为了进行对比，研究者训练了 5 个操控英雄狄仁杰的智能体，结果他们提出的新方法显著优于其它方法，下图给出了他们的方法训练的智能体相对于其它智能体随时间的金币比值变化。

其中，NR 是指没有 rollout 但参数设置与该论文的新方法一样的智能体，DPI 是使用了直接策略迭代的智能体，AVI 是使用了近似价值迭代的智能体，SL 是一个在大约 10 万对人类游戏数据的状态/动作对上通过监督学习训练得到的智能体。

2、通过学习迁移实现迁移学习

Transfer Learning via Learning to Transfer

论文地址：

https://ai.tencent.com/ailab/media/publications//icml/148_Transfer_Learning_via_Learning_to_Transfer.pdf

迁移学习的三个核心研究问题是：何时迁移、如何迁移和迁移什么。为特定的迁移任务选择合适的迁移算法往往需要高成本的计算或相关领域的专业知识。为了能更有效地找到适合当前任务的迁移算法，研究者根据人类执行迁移学习的方式，设计了一种可根据之前的迁移学习经历提升新领域之间的迁移学习有效性的新框架：学习迁移（L2T：Learning to Transfer）。

L2T 分为两个阶段。在第一个阶段，每个迁移学习经历都会被编码成三个组件：一对源域和目标域、它们之间被迁移的知识（被参数化为隐含特征向量）、迁移学习带来的性能提升比。然后再从所有经历中学习一个反射函数（reflection function），该函数能将领域对和它们之间被迁移的知识映射到性能提升比。研究者相信这个反射函数就具备决定迁移什么和如何迁移的迁移学习能力。在第二个阶段，新出现的领域对之间所要迁移的内容则可以通过最大化所学习到的反射函数的值而得到优化。

为了证明这种迁移学习方法的优越性，研究者在 Caltech-256 和 Sketches 这两个图像数据集上对 L2T 框架进行了实验评估。下图给出了 L2T 及另外 9 种基准方法在 6 个源域和目标域对上的分类准确度。

可以看到，不管源域与目标域有较紧密的联系（比如 (a) 中的“galaxy”、“saturn”和“sun”）还是没有显著关联（比如 (c) 和 (f)），L2T 方法的表现都明显优于其它所有基准方法。

3、通过强化学习实现端到端的主动目标跟踪

End-to-end Active Object Tracking via Reinforcement Learning

论文地址：https://arxiv.org/abs/1705.10561

目标跟踪的目标是根据视频的初始帧中的目标标注定位该目标在连续视频中的位置。对于移动机器人和无人机等视角会变动的平台或目标会离开当前拍摄场景的情况，跟踪目标时通常还需要对摄像头的拍摄角度进行持续调整。该论文提出了一种使用强化学习的端到端的主动目标跟踪方法，可直接根据画面情况调整摄像头角度。具体而言，研究者使用了一个 ConvNet-LSTM 网络，其输入为原始视频帧，输出为相机运动动作（前进、向左等）。

上图展示了这个 ConvNet-LSTM 网络的架构，其中的强化学习部分使用了一种当前最佳的强化学习算法 A3C。

因为在现实场景上训练端到端的主动跟踪器还无法实现，所以研究者在 ViZDoom 和 Unreal Engine 进行了模拟训练。在这些虚拟环境中，智能体（跟踪器）以第一人称视角观察状态（视觉帧）并采取动作，然后环境会返回更新后的状态（下一帧）。研究者还设计了一个新的奖励函数以让智能体更加紧跟目标。

实验结果表明，这种端到端的主动跟踪方法能取得优异的表现，并且还具有很好的泛化能力，能够在目标运动路径、目标外观、背景不同以及出现干扰目标时依然稳健地执行主动跟踪。另外，当目标偶尔脱离跟踪时（比如目标突然移动），该方法还能恢复对目标的跟踪。下表给出了不同跟踪方法在 ViZDoom 环境的几个不同场景上的表现比较，其中 AR 表示累积奖励（类似于精确度），EL 表示 episode 长度（类似于成功跟踪的持续帧数）。

最后，研究者还在 VOT 数据集上执行了一些定性评估，结果表明从虚拟场景学习到的跟踪能力也有望迁移到真实世界场景中。

4、使用局部坐标编码的对抗学习

Adversarial Learning with Local Coordinate Coding

论文地址：https://arxiv.org/abs/1806.04895

生成对抗网络（GAN）是近来一个非常热门的研究方向，也实现了一些成功应用。但 GAN 仍有一些局限性：很多研究都使用了简单的先验分布，GAN 在隐含分布的维度上的泛化能力是未知的。针对这些问题，研究者基于对图像的流形假设提出了一种全新的生成模型，该模型使用了局部坐标编码（LCC），可提升 GAN 在生成拟真图像上的表现。

上图展示了该论文提出的 LCC-GAN 方案。研究者首先使用了一个自动编码器（AE）在隐含流形上学习了嵌入来获取数据中的含义信息。然后，他们又使用 LCC 学习一组基数来在该隐含流形上构建局部坐标系统。之后，他们再通过使用一个与一组编码相关的线性函数来近似生成器而将 LCC 引入了 GAN。基于这种近似，他们再通过利用在隐含流形上的局部信息而提出了一种基于 LCC 的采样方法。LCC-GAN 的具体训练过程如下：

其中 LCC 采样方法分为两个步骤：（1）给定一个局部坐标系，我们随机选择一个隐含点（可以是一个基（basis）），然后找到其 d-最近邻点；（2）我们构建一个 M 维向量作为采样的 LCC 编码。其中，该向量的每个元素都对应于那个基的权重。

研究者用 PyTorch 实现了 LCC-GAN 并通过大量基于真实世界数据集的实验对该方法进行了评估。结果表明 LCC-GAN 的表现优于其它多种 GAN 方法（Vanilla GAN、WGAN、Progressive GAN）。下图展示了 LCC-GAN 和 Progressive GAN 基于 CelebA 数据集的人脸生成结果比较。

研究者还推导了 LCC-GAN 的泛化界限，并证明维度较小的输入就足以实现优良的泛化表现。

5、一种可变度量超松弛混合临近外梯度方法的算法框架

An Algorithmic Framework of Variable Metric Over-Relaxed Hybrid Proximal Extra-Gradient Method

论文地址：https://arxiv.org/abs/1805.06137

极大单调算子包含（maximal monotone operator inclusion）问题是非平滑凸优化和凸凹鞍点优化的 Karush-Kuhn-Tucker（KKT）广义方程的一种扩展，其包含大量重要的优化问题并且在统计学、机器学习、信号与图像处理等领域有广泛的应用。在该论文中，研究者关注的算子包含问题是：

其中， X是一个有限维度的线性向量空间，T:X⇉X是一个极大单调算子。

针对这一问题，研究者提出了一种可变度量超松弛混合临近外梯度方法（VMOR-HPE）的新型算法框架，能保证在解决该问题时的全局收敛。不同于已有的混合临近外梯度（HPE）方法，该框架能根据一种全新的相对误差准则来生成迭代序列，并且还在外梯度步骤中引入了一种超松弛的步长来提升其收敛速度。尤其值得一提的是，这个外梯度步长和超松弛步长都可以事先设定为固定常量，而不是从某个投影问题中获取的值，这能减少很多计算量。

研究者还提供了该框架的迭代复杂度和局部线性收敛速率，从理论上证明一个较大的超松弛步长有助于加速 VMOR-HPE。并且，研究者在文中严格证明了VMOR-HPE算法框架包含大量一阶原始算法和一阶原始-对偶算法为特例。此外，研究者还将 VMOR-HPE 应用到了一类具有线性等式约束的多块可分复合凸优化问题的KKT 广义方程上，得到了一种尺度化的外梯度校正步骤的临近交替方向乘子法（PADMM-EBB），在该步骤中的尺度化矩阵是通过一种分块式的 Barzilai-Borwein 线搜索技术生成的。该算法的迭代格式如下：

PADMM-EBB 算法

最后，研究者在合成和真实数据集上进行了实验，将 PADMM-EBB 应用在了非负双图正则化低秩表征问题上，结果表明该方法是有效的。

研究表明，这种 VMOR-HPE 算法框架能为原始与原始-对偶算法提供新见解并可用作证明它们的收敛性、迭代复杂度和局部线性收敛速率的强大分析技术。

第二部分：分布式与去中心化

6、针对次模函数最小化的元素安全筛选算法

Safe Element Screening for Submodular Function Minimization

下载地址：https://arxiv.org/abs/1805.08527

次模函数可以看成是离散函数中的凸函数，其在众多领域中有着重要应用，比如：机器学习、计算机视觉和信号处理。然而，在大规模实际应用中，次模函数最小化问题的求解依然是一个具有挑战性的问题。在本文中，我们第一次尝试将大规模稀疏学习中新兴的筛选方法扩展到次模函数最小化中，以加快它的求解过程。通过仔细研究次模函数最小化问题和其对应凸问题之间的关系以及该凸问题最优解的估计，我们提出了一种新颖安全的元素筛选算法，能够在优化过程中迅速检测出一定包含在最优解中的元素（我们称为活跃元素）以及一定不包含在最优解中的元素（不活跃元素）。通过删除不活跃元素和固定活跃元素，问题规模得以显著减小，从而我们能够在不损失任何精度的情况下大大减少计算量。据我们所知，我们的方法是次模函数最优化领域乃至组合优化领域中的第一个筛选算法。因此，我们的方法为加速次模函数最小化算法提供了一种新思路。在合成数据集和实际数据集上的实验结果均证实我们的算法能够显著加速次模函数最小化问题的求解。

研究者首先研究了 SFM 和对应的凸近端问题之间的关系，还研究了这些近端问题的准确原始最优估计。基于该研究，他们提出了一种全新的安全筛选方法：不活动和活动元素筛选（IAES）。该框架由两个筛选规则构成：不活动元素筛选（IES）和活动元素筛选（AES）；这两个规则在 IAES 框架中是交替执行的，如下算法 2 所示。

最终该框架可快速识别确保可在优化过程中被包含（活动元素）在 SFM 的最终最优解之内或被排除在外（不活动元素）的元素。然后，研究者可移除不活动元素并固定活动元素，从而大幅降低问题规模，进而在不降低准确度的前提下显著降低计算成本。

该研究为加速 SFM 算法指出了一个新方向。研究者在合成和真实数据集上进行了实验，结果表明他们所提出的方法确实能实现显著加速。下表给出了在图像分割任务上求解 SFM 的运行时间结果（单位：秒）。

可以看到，IAES 带来的加速效果非常明显，最高甚至可达 30.7 倍！

7、生成对抗网络的复合函数梯度学习

Composite Functional Gradient Learning of Generative Adversarial Models

论文地址：https://arxiv.org/abs/1801.06309

生成对抗网络（GAN）已经得到了非常广泛的研究和使用，但由于不稳定问题，GAN 往往难以训练。从数学上看，GAN 求解的是一种最小最大优化问题。而这篇论文则首先提出了一个不依赖于传统的最小最大形式的生成对抗方法理论。该理论表明，使用一个强大的鉴别器可以学习到优良的生成器，并使得每一个函数梯度（functional gradient）步骤之后真实数据分布和生成数据分布之间的 KL 散度都能得到改善，直至收敛到零。

基于这一理论，研究者提出了一种稳定的新型生成对抗方法，即复合函数梯度学习（CFG）；如算法 1 所示。

在此基础上，研究者又提出了渐进式 CFG（ICFG，见算法 2）以及更进一步的近似式 ICFG（xICFG，见算法 3）。其中 ICFG 是以渐进方式使用生成器的更新一点一点地逐步更新鉴别器，使得生成器可以不断提供新的更有难度的样本，从而防止鉴别器过拟合。而 xICFG 则能通过训练一个固定大小的近似器（近似 ICFG 所获得的生成器的行为）来对 ICFG 得到的生成器进行压缩，从而提升效率。

研究者还发现，通常的使用 logistic 模型的 GAN 与使用一种极端设置的 xICFG 的特例高度相关，即：GAN 的生成器更新等效于粗略近似 T=1 的 ICFG 得到的生成器。这个视角是理解 GAN 的不稳定性的新角度，即：GAN 的不稳定性源自 T 过小以及粗略近似。

研究者进行了图像生成的实验，结果表明他们提出的新方法是有效的。下图给出了各种方法生成的图像的质量（inception 分数）随训练时间的变化情况。

可以看到，尽管 GAN1（使用了 logd 技巧的 GAN）在 LSUN 数据集上偶尔有更优的表现，但 xICFG 的表现总体更优且更稳定。

8、用于高斯图模型中最优估计的图非凸优化

Graphical Nonconvex Optimization for Optimal Estimation in Gaussian Graphical Model

论文地址：https://arxiv.org/abs/1706.01158

高斯图模型已被广泛用于表示一组变量之间的成对的条件依赖关系。graphical lasso 是估计高斯图模型的最常用方法之一。但是，它还未达到理想的收敛速度。具体而言，一般认为 graphical lasso 的谱范数中的最优收敛率大约为

其中 n 是样本规模，d 是节点数量，s 是实际的图中的边数。

在这篇论文中，研究者提出了用于高斯图模型中的最优估计的图非凸优化。然后又通过一系列自适应的凸程序来近似求解。研究者指出，尽管新提出的方法求解的是一系列凸程序，但研究表明在某些规律性条件下，这种新提出的用于估计稀疏集中度矩阵的估计器能实现的理想收敛率，就好像非零位置事先已知一样。算法 1 展示了这个近似求解过程。然后，通过使用估计的边际方差来重新调整逆相关矩阵，可以得到该集中度矩阵的一个估计器，其谱范数收敛率大约为和中的最大值。

算法 1 可使用 glasso 等现有的 R 语言软件包实现。

这种新提出的方法在计算上是可行的，并且能得到能实现理想收敛速度的估计器。使用凸程序通过序列近似引入的统计误差可以使用稀疏模式的概念来进一步提升。

研究者分析了新提出的估计器的理论性质，还将这种新方法扩展到了半参数图模型中，并通过数值研究表明新提出的估计器在估计高斯图模型方面的表现优于其它常用方法。

9、用于大型多类分类问题的候选项与噪声估计

Candidates v.s. Noises Estimation for Large Multi-Class Classification Problem

论文地址：https://arxiv.org/abs/1711.00658

图像分类和语言建模等很多任务的类别数量往往很大，采样是应对这类任务的常用方法，能够帮助降低计算成本和提升训练速度。这篇论文对这一思想进行了扩展，提出了一种使用一个类别子集（候选项类别，其余类别被称为噪声类别——会被采样用于表示所有噪声）的用于多类分类问题的方法：候选项与噪声估计（CANE）。

研究者表明 CANE 总是能保持一致的表现并且很有计算效率。此外，当被观察到的标签有很高的概率属于被选择的候选项时，所得到的估计器会有很低的统计方差，接近最大似然估计器的统计方差。

研究者通过两个具体算法展现了 CANE 方法的优越性。其一是用于 CANE 的一般随机优化过程（算法 1）：

另外，研究者还使用了一种树结构（叶表示类别）来促进对候选项选择的快速波束搜索（算法 2）。这种波束搜索具有更低的复杂度，能快速得到预测结果，还能自然地输出最靠前的多项预测。

研究者实验了 CANE 方法在有大量类别的多类分类问题和神经语言建模任务中的应用。下图展示了各种方法在不同分类数据集上的测试准确度随 epoch 的变化情况。可以看到，有更大候选项集的 CANE 在准确度方面基本优于其它方法，有时甚至能超过 softmax 方法。而且 CANE 方法的收敛速度明显胜过噪音对比估计（NCE）和 Blackout。

下图则给出了神经语言建模实验的结果。可以看到，CANE 方法的收敛速度比 NCE 和 Blackout 更快，同时还达到了与 softmax 方法同等的困惑度。

总体而言，实验结果表明 CANE 的预测准确度优于 NCE 及其变体方法和多种之前最佳的树分类器，同时其速度也显著优于标准的 O(K) 方法。

10、使用演示的策略优化

Policy Optimization with Demonstrations

论文地址：

https://ai.tencent.com/ailab/media/publications//icml/152_Policy_Optimization_with_Demonstrations.pdf

对强化学习方法而言，探索仍然是一个突出的难题，尤其是在奖励信号稀疏的环境中。目前针对这一问题的研究方向主要有两个：1）通过鼓励智能体访问之前从未见过的状态来重塑原来的奖励函数；2）使用从某个专家策略采样的演示轨迹来引导学习过程。从演示中学习的方法看起来有克服探索难题的希望，但这通常需要难以收集的质量很高的演示。

结合这两种思路，研究者提出了一种有效地利用可用演示来引导探索的方法，即强制所学到的策略与当前演示之间的占有率匹配。这种方法背后的直观思想是，当奖励信号不可用时，智能体应该在早期学习阶段模拟所演示的行为，从而实现探索。在获得了足够多的能力之后，智能体就可以自己探索新状态了。这实际上是一种动态的固有奖励机制，可被引入强化学习用于重塑原生的奖励。

基于此，研究者开发了一种全新的使用演示的策略优化（POfD）方法，可从演示数据获取知识来提升探索效果。研究表明 POfD 能隐式地塑造动态奖励并助益策略提升。此外，它还可以与策略梯度方法结合起来得到当前最佳的结果。

研究者在一系列常见的基准稀疏奖励任务上进行了实验。结果发现，他们提出的方法的表现甚至可媲美用在理想密集奖励环境中的策略梯度方法；而且即使演示很少且不完美，这种新方法依然表现优异。下面两张图给出了新提出的 POfD 方法与几种强基准方法分别在具有离散动作空间和连续工作空间的稀疏环境中的学习曲线。

各种方法在具有连续动作空间的稀疏环境中的学习曲线

11、边密度屏障：组合推理中的计算-统计权衡

The Edge Density Barrier: Computational-Statistical Tradeoffs in Combinatorial Inference

统计推理的一大最主要目标是确定变量之间的依赖结构，即推理底层图模型的结构。这篇论文关注的是一个更加具体的推理问题：检验底层图中是否有特定的组合结构。

尽管对这一问题的信息论极限的研究已有很多了，但能否通过有效的算法得到这样的极限很大程度仍未被研究过。此外，检验问题（尤其是图模型的组合结构）的构建方式对信息论极限的可达成性的影响方式也并不明朗。

为了理解这两个问题，研究者在这篇论文中描述了图模型中组合推理的这种基本极限；并基于一种 oracle 计算模型量化研究了达到这个信息论极限所需的最小计算复杂度。

研究证明，要在空图上检验团（clique）、最近邻图、完美匹配等常见组合结构，或在小团上检验大团，信息论极限是无法通过一般的可实现算法达到的。

更重要的是，研究者定义了名为弱边密度 µ 和强边密度 µ' 的结构量。根据定义，边集的弱边密度表征了可从一个无效（null）变到另一个图的关键边的密集程度。这能反应这两个图的差异水平。强边密度是另一个表征这两个图的差异水平的量，且总是不小于弱边密度。下面给出了 µ 和 µ' 的定义：

这两个结构量的一大突出性质是它们仅依赖于被测试的组合结构的拓扑性质。它们能帮助研究者理解组合推理问题的结构性质决定其计算复杂度的方式。研究表明，如果 µ 远小于 µ'，则信息论下界和计算有效的下界之间会存在明显差距。下面给出了 4 个案例的具体最优比率；可以看到，这些案例都存在统计与计算的权衡。

本研究也是首个确定和解释无向图模型中组合推理问题的统计和计算之间的基本权衡的研究。

第三部分：机器学习优化方法与理论研究

12、异步去中心化并行随机梯度下降

Asynchronous Decentralized Parallel Stochastic Gradient Descent

论文地址：https://arxiv.org/abs/1710.06952

最常用的分布式机器学习系统要么是同步的，要么就是中心化异步的。AllReduce-SGD 这样的同步算法在异构环境中表现很差，而使用参数服务器的异步算法则存在很多问题，其中包括工作器（worker）很多时参数服务器的通信问题以及当参数服务器的流量拥堵时收敛性下降的问题。

研究者在这篇论文中提出了一种异步去中心化并行随机梯度下降（AD-PSGD），能在异构环境中表现稳健且通信效率高并能维持最佳的收敛速率。理论分析表明 AD-PSGD 能以和 SGD 一样的最优速度收敛，并且能随工作器的数量线性提速。下面是该算法的工作过程：

研究者使用 Torch 和 MPI 在多达 128 个 P100 GPU 的 IBM S822LC 集群上实现和评估了 AD-PSGD。实验结果表明，AD-PSGD 的表现优于最佳的去中心化并行 SGD（D-PSGD）、异构并行 SGD（A-PSGD）和标准的数据并行 SGD（AllReduce-SGD）。AD-PSGD 在异构环境中的表现往往能超出其它方法多个数量级。

下图给出了在 ImageNet 数据集上基于 ResNet-50 模型得到的训练损失和每 epoch 训练时间情况。可以看到，AD-PSGD 和 AllReduce-SGD 的收敛情况接近，都优于 D-PSGD。在使用 64 个工作器时，AD-PSGD 每 epoch 耗时 264 秒，而另外两种方法每 epoch 耗时会超过 1000 秒。

下图则展示了各种方法在 CIFAR10 上为 VGG（通信密集型）和 ResNet-20（计算密集型）模型带来的加速情况。可以明显看到 AD-PSGD 一直都有最优的表现。

AD-PSGD 是首个在超过 100 个 GPU 的规模上达到接近 AllReduce-SGD 的 epoch 收敛速度的异步算法。

13、D2：在去中心化数据上的去中心化训练

D2: Decentralized Training over Decentralized Data

论文地址：https://arxiv.org/abs/1803.07068

以去中心化的方式训练机器学习模型近来得到了很大的研究关注。在使用多个工作器训练机器学习模型时（其中每一个都会从自己的数据源收集数据），从各个不同的工作器收集的数据也各不相同时这些数据是最有用的。但是，近期的很多去中心化并行随机梯度下降（D-PSGD）研究都假设托管在不同工作器上的数据并没有很大的差异——否则这些方法的收敛速度会非常慢。

研究者在这篇论文中提出了一种全新的去中心化并行随机梯度下降算法 D2，该算法是为各工作器之间数据差异很大的情况（可以说是“去中心化”数据）设计的。

D2 基于标准的 D-PSGD 算法，但添加了一个降低方差的组件。在这种 D2 算法中，每个工作器都会存储上一轮迭代的随机梯度和局部模型，并将它们与当前的随机梯度和局部模型线性地结合到一起。这能将收敛速度改善，其中 ζ2 是不同工作器上的数据差异，σ2 是每个工作器内的数据方差，n 是工作器的数量，T 是迭代次数。

研究者在图像分类任务上对 D2 进行了评估，其中每个工作器都仅能读取一个有限标签集的数据。实验结果表明 D2 的表现显著优于 D-PSGD。下面给出了在无数据混洗（unshuffled）情况下（不同工作器之间的数据差异最大）的不同分布式训练算法的收敛性比较。

可以看到，D-PSGD 算法的收敛速度比中心化方法慢，而 D2 也比 D-PSGD 快很多，并且损失非常接近中心化算法。

14、实现更高效的随机去中心化学习：更快收敛和稀疏通信

Towards More Efficient Stochastic Decentralized Learning: Faster Convergence and Sparse Communication

论文地址：https://arxiv.org/abs/1805.09969

去中心化优化问题近来得到了越来越大的关注。大多数现有方法都是确定性的，具有很高的每次迭代成本，并且收敛速度与问题条件数呈二次关系。此外，为了确保收敛还必需密集的通信，即使数据集是稀疏的也是如此。

在这篇论文中，研究者将去中心化优化问题泛化成了一个单调算子根查找问题，并提出了一种名为去中心化随机反向聚合（DSBA）的算法。

在 DSBA 的计算步骤，每个节点都会计算一个随机近似的单调算子的预解式（resolvent），以降低对问题条件数的依赖程度。这样的预解式接受脊回归等问题中的闭式解。在 DSBA 的通信步骤，每个节点都接收连续迭代之间差异的非零分量，以重建其临近节点的迭代。因为 ℓ2-relaxed AUC 最大化问题等效于凸凹函数的极小极大问题，其微分是一个单调算子，因此能无缝地适配 DSBA 的形式。

该算法具有以下优势：（1）能以与问题条件数呈线性的速度以几何方式收敛，（2）可以仅使用稀疏通信实现。此外，DSBA 还能处理 AUC 最大化等无法在去中心化设置中高效解决的学习问题。研究者在论文中也给出了对该算法的收敛性分析。

研究者在凸最小化和 AUC 最大化上进行了实验，结果表明新提出的方法是有效的。下图给出了 DSBA 与几种之前最佳方法在 logistic 回归上的结果比较

可以看到，DSBA 的表现是最优的，而且能以更低的计算成本更快地收敛。

15、误差补偿式量化 SGD 及其在大规模分布式优化中的应用

Error Compensated Quantized SGD and its Applications to Large-scale Distributed Optimization

论文地址：https://arxiv.org/abs/1806.08054

这一轮机器学习热潮的出现很大程度上得益于计算机处理能力的指数级发展以及出现了可用于训练模型的海量数据。为了有效地完成海量数据的训练，往往需要用到分布式优化方法，其中包括数据并行化的处理方法。但在这样的分布式框架中，各个节点之间的通信速度往往会成为整体性能的关键制约因素。目前的常见解决方法是对节点之间的通信信息进行压缩，但这会引入量化误差。

为了解决这一问题，这篇论文提出通过使用累积的所有之前的量化误差的误差反馈方案来补偿当前的局部梯度。研究者将该方法称为“误差补偿式量化随机梯度下降（ECQ-SGD）”。实验结果表明这种方法能实现比很多基准方法更快更稳定的收敛。下面是该算法的工作过程：

在量化完成之后，总体通信成本会降至 32+dr 比特（r ≪ 32），远少于原来的 32 位全精度梯度所需的 32d 比特；其中 d 是原向量的维度；其中 s 是非零量化级别的数量：s 越大，则量化越细粒度，通信成本也就越高。下图给出了在 ILSVRC-12 数据集上训练 ResNet-50 模型时，使用不同数量的 GPU 的吞吐量情况比较：

在使用 512 个 GPU 进行训练时，ECQ-SGD 相对于普通 SGD 实现了 143.5% 的加速（每秒各 66.42k 与 27.28k 张图像）。如果节点之间的带宽更小，这样的优势还会更加显著。

研究者还在该论文中提供了该方法的理论保证：分析了其收敛行为并证明了其相对于其它之前最佳方法的优势。

16、使用联网智能体的完全去中心化多智能体强化学习

Fully Decentralized Multi-Agent Reinforcement Learning with Networked Agents

论文地址：https://arxiv.org/abs/1802.08757

在多智能体强化学习（MARL）问题中，多个智能体的联合行动会影响它们所处的共同环境。在每个状态，每个智能体都会执行一个动作，这些动作共同决定了环境的下一个状态和每个智能体的奖励。此外，这些智能体可能针对的是不同的任务，会有不同的奖励函数；但每个智能体都只能观察自己的奖励。每个智能体都会基于局部观察到的信息以及从网络中的临近智能体接受到的信息各自做出决策。在这种设置内，所有智能体的整体目标是通过与其临近智能体交换信息而最大化在整个网络上的全局平均回报。

针对这一问题的中心化方法存在可扩展性和稳健性等方面的问题，因此，研究者在这篇论文中基于一种用于 MARL 的全新策略梯度定理提出了两种去中心化 actor-critic 算法；结合函数近似，可应用于状态和智能体数量都非常大的大规模 MARL 问题。

基于动作-价值函数的联网式 actor-critic 算法

基于状态-价值 TD 误差的联网式 actor-critic 算法

具体来说，actor 步骤是由每个智能体单独执行的，无需推断其它智能体的策略。对于 critic 步骤，研究者提出了一种在整个网络通过通信实现的共识更新（consensus update），即每个智能体都会与其网络中的临近智能体共享其价值函数的估计，从而得到一个共识估计。这个估计又会被用在后续的 actor 步骤中。通过这种方式，每个智能体的局部信息都能散布到整个网络，从而最大化整个网络层面的奖励。

这种算法是完全渐进式的，可以以一种在线形式实现。研究者还提供了当价值函数位于线性函数类别内近似求取时的算法收敛性分析。

研究者使用线性和非线性函数近似执行了大量模拟实验，对所提出的算法进行了验证。下图给出了当使用神经网络进行函数近似时，在协同导航任务上的全局平均奖励。其中 Central-1 和 Central-2 分别是算法 1 和算法 2 对应的中心化方法。

研究者表示该研究是首个使用函数近似的联网智能体的完全去中心化 MARL 算法研究。

你可能感兴趣的:(ICML 2018 | 腾讯AI Lab详解16篇入选论文)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
那个抄袭的大张伟猫小努
最近一直在追《即刻电音》这个综艺，除了觉得出场节目的音乐制作人有意思之外，也觉得有两个导师挺有趣的（另外一个就忽略了吧）。孙艺兴在上一篇文章里面已经说过了，那么这篇就说说我们的大老师，大张伟吧。其实在节目刚开始大张伟出来的时候，我以为他是属于导师里面来活跃气氛负责搞笑的，毕竟孙艺兴属于卖萌卖傻卖老实的，尚雯婕一般负责装逼耍狠的，而大张伟一贯以来上综艺的形象基本上都是蹦蹦跳跳带动气氛的。谁知道，两期
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
本周第二次约练 2cfbdfe28a51
中原焦点团队中24初26刘霞2021.12.3约练161次，分享第368天当事人虽然是带着问题来的，但是咨询过程中发现，她是经过自己不断地调整和努力才走到现在的，看到当事人的不容易，找到例外，发现资源，力量感也就随之而来。增强画面感，或者说重温，会给当事人带来更深刻的感受。
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
《小满细雨轻湿尘》快乐的人ZZM
图片发自App《小满细雨轻湿尘》文/快乐的人zzm小满细雨轻湿尘石榴花开落纷纷落红不是无情物坠入泥土育养根2018-5-23
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
2018/02/12 Tracy_zhang
人生并不在于获取，更在于放得下。放下一粒种子，收获一棵大树;放下一处烦恼，收获一个惊喜;放下一种偏见，收获一种幸福;放下一种执著，收获一种自在。放下既是一种理性抉择，也是一种豁达美。只要看得开放得下，何愁没有快乐的春莺在啼鸣，何愁没有快乐的泉溪在歌唱，何愁没有快乐的鲜花绽放!
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s