人工智能学家

贝叶斯机器学习前沿进展

来源：人机与认知实验室

概要：随着大数据的快速发展，以概率统计为基础的机器学习在近年来受到工业界和学术界的极大关注，并在视觉、语音、自然语言、生物等领域获得很多重要的成功应用。

摘要

随着大数据的快速发展，以概率统计为基础的机器学习在近年来受到工业界和学术界的极大关注，并在视觉、语音、自然语言、生物等领域获得很多重要的成功应用，其中贝叶斯方法在过去２０多年也得到了快速发展，成为非常重要的一类机器学习方法．总结了贝叶斯方法在机器学习中的最新进展，具体内容包括贝叶斯机器学习的基础理论与方法、非参数贝叶斯方法及常用的推理方法、正则化贝叶斯方法等．最后，还针对大规模贝叶斯学习问题进行了简要的介绍和展望，对其发展趋势作了总结和展望。

关键词

贝叶斯机器学习；非参数方法；正则化方法；大数据学习；大数据贝叶斯学习

机器学习是人工智能及模式识别领域的共同研究热点，其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题．2010年的图灵奖获得者为哈佛大学的LeslieValliant 授，其获奖工作之一是建立了概率近似正确（probably approximate correct，PAC）学习理论；2011年的图灵奖获得者为加州大学洛杉矶分校的JudeaPearl教授，其主要贡献为建立了以概率统计为理论基础的人工智能方法，其研究成果促进了机器学习的发展和繁荣。

机器学习的一个重要分支是贝叶斯机器学习，贝叶斯方法最早起源于英国数学家托马斯·贝叶斯在1763年所证明的一个关于贝叶斯定理的一个特例[1-2]．经过多位统计学家的共同努力，贝叶斯统计在20世纪50年代之后逐步建立起来，成为统计学中一个重要的组成部分[2-3]。贝叶斯定理因为其对于概率的主观置信程度[4]的独特理解而闻名。此后由于贝叶斯统计在后验推理、参数估计、模型检测、隐变量概率模型等诸多统计机器学习领域方面有广泛而深远的应用[5-6]。从1763年到现在已有250多年的历史，这期间贝叶斯统计方法有了长足的进步[7]。在21世纪的今天，各种知识融会贯通，贝叶斯机器学习领域将有更广阔的应用场景，将发挥更大的作用。

1. 贝叶斯学习基础

本节将对贝叶斯统计方法进行简要的介绍[5]：主要包括贝叶斯定理、贝叶斯模型的推理方法、贝叶斯统计学的一些经典概念。

1.1 贝叶斯定理

用表示概率模型的参数，D表示给定的数据集．在给定模型的先验分布和似然函数的情况下，模型的后验分布可以由贝叶斯定理（也称贝叶斯公式）获得［２］：

(1)

其中是模型的边缘似然函数。

贝叶斯定理已经广为人知，这里介绍一种与贝叶斯公式等价但很少被人知道的表现形式，即基于优化的变分推理：

(2)

其中Ｐ为归一化的概率分布空间。可以证明，式(2)中的变分优化的最优解等价于式(1)中的后验推理的结果［８］。这种变分形式的贝叶斯定理具有两方面的重要意义：1）它为变分贝叶斯方法［９］（variational Bayes）提供了理论基础；2）提供了一个很好的框架以便于引用后验约束，丰富贝叶斯模型的灵活性［10］。这两点在后面的章节中将具体阐述。

1.2 贝叶斯机器学习

贝叶斯方法在机器学习领域有诸多应用，从单变量的分类与回归到多变量的结构化输出预测、从有监督学习到无监督及半监督学习等，贝叶斯方法几乎用于任何一种学习任务．下面简要介绍较为基础的共性任务。

１）预测。给定训练数据Ｄ，通过贝叶斯方法得到对未来数据ｘ的预测［5］：

(3)

需要指出的是，当模型给定时，数据是来自于独立同分布的抽样，所以通常简化为。

２）模型选择。另一种很重要的贝叶斯方法的应用是模型选择［11］，它是统计和机器学习领域一个较为基础的问题。用Ｍ表示一族模型（如线性模型），其中每个元素Θ是一个具体的模型。贝叶斯模型选择通过比较不同族模型的似然函数来选取最优的：

(4)

当没有明显先验分布的情况下，被认为是均匀分布．通过式（4）的积分运算，贝叶斯模型选择可以避免过拟合。

关于贝叶斯统计和贝叶斯学习更为详细的内容，有些论文和教材有更进一步的说明］。

2 非参数贝叶斯方法

在经典的参数化模型中模型的参数个数是固定的，不会随着数据的变化而变化．以无监督的聚类模型为例，如果能通过数据本身自动学习得到聚类中心的个数，比参数化模型（如K均值、高斯混合模型等）根据经验设定一个参数要好得多；这也是非参数模型一个较为重要的优势。相比较参数化贝叶斯方法，非参数贝叶斯方法（nonparametric Bayesian methods）因为其先验分布的非参数特性，具有描述数据能力强的优点［13］，非参数贝叶斯方法因此在2000年以后受到较多关注［14］。例如具有未知维度的隐式混合模型［15］和隐式特征模型［16］、描述连续函数的高斯过程［17］等。需要强调的是非参数化贝叶斯方法并不是指模型没有参数，而是指模型可以具有无穷多个参数，并且参数的个数可以随着数据的变化而自适应变化，这种特性对于解决大数据环境下的复杂应用问题尤其重要，因为大数据的特点之一是动态多变。下面将主要针对其中的一些较为重要的模型和推理方法进行简要介绍。

2.1 狄利克雷过程

狄利克雷过程（Dirichletprocess, DP）是统计学家Ferguson于1973年提出的一个定义在概率测度Ω上的随机过程［18］，其参数有集中参数α＞０和基底概率分布

，通常记为Ｇ～。狄利克雷过程得到的概率分布是离散型的，因此非常适合构建混合模型，例如，Antoniak于1974年通过给每个数据点增加一个生成概率，构造了一个狄利克雷过程混合模型（Dirichlet process mixture, DPM）［15］，即

(5)

其中，是生成每个数据点概率分布的参数，比如高斯分布的均值和协方差等，Ｎ为数据点的个数。

与狄利克雷过程等价的一个随机过程是中国餐馆过程（Chinese restaurant process, CRP）［19］。中国餐馆过程是定义在实数域上的具有聚类特性的一类随机过程，也因为其特有的较好展示特性而被经常使用。如图１所示，在中国餐馆过程中，假设有无限张餐桌和若干客人；其中第１名顾客选择第１张餐桌，之后的顾客按照多项式分布选择餐桌，其中选择每张餐桌的概率正比于该餐桌现在所坐的人数，同时以一定概率（正比于参数α）选择一个没人的餐桌．可以看到，当所有的客人选择完毕餐桌，我们可以按照餐桌来对客人进行一个划分．这里每张餐桌代表一个聚类，每个客人代表一个数据点。

可以证明所有的聚类点参数θ可以通过式（6）得到：

(6)

将狄利克雷混合模型中的Ｇ积分即可得到中国餐馆过程，这也说明了两个随机过程的关系．这种简洁的表述也很有利于马尔可夫蒙特卡洛方法的采样［20］。

另一种构造性的狄利克雷过程的表述是截棍过程（stickbreaking construction）［21］．具体地说，将一根单位长度的棍，第ｋ次切割都按照剩下的长度按照贝塔分布的随机变量，按比例切割：

(7)

即如图２所示，对于一根长度为单位１的棍，第１次切割长度，以后每次切割都切割剩下部分的比例长度。狄利克雷过程的截棍表述是变分推理的基础［22］。

2.2 印度自助餐过程

与混合模型中每一个数据点只属于一个聚类不同，在特征模型中每一个数据点可以拥有多个特征，这些特征构成了数据生成的过程。这也符合实际情况中样本数据点有多个属性的实际需求。经典的特征模型主要有因子分析（factor analysis）、主成分分析（principal component analysis）［24-25］等。在传统的特征模型中，特征的数目是确定的，这给模型的性能带来一定限制．印度自助餐过程（indian buffet process, IBP）是2005年提出的［26］，因其非参数特性能从数据中学习得到模型中的特征个数，使得模型能够更好地解释数据，已经在因子分析、社交网络链接预测等重要问题中应用［27-29］。

以二值（“０”或“１”）特征为例，假设有Ｎ个数据点，所有数据点的特征向量组成一个特征矩阵，IBP的产生式过程可以形象地类比为Ｎ个顾客到一个无穷多个餐品的自助餐馆进行选餐的过程，用“１”表示选择，“０”表示不选择，具体描述如图３所示的方法进行：

1）第１名顾客选择个餐品，其中；

2）第２名及以后的顾客有两种情况：1. 对于已经被选过的餐品，按照选择该餐品的人数成正比的概率选择该餐品；2. 选择个未被选过的餐品，其中。

与中国餐馆过程类似，印度自助餐过程也有其对应的截棍过程［30］．这里不再赘述，仅列出其构造性表述如下：

(8)

但是与中国餐馆过程的截棍过程不同的是棍的长度之和并不为１．印度自助餐过程也有其对应的采样方法和变分优化求解方法［16,30-31］。

2.3 应用及扩展

贝叶斯方法特别是最近流行的非参数贝叶斯方法已广泛应用于机器学习的各个领域，并且收到了很好的效果［32］。这里简要提出几点应用和扩展；对于大规模贝叶斯学习的相关应用将在第５节介绍，也可查阅相关文献［13－14，33］。

经典的非参数化贝叶斯方法通常假设数据具有简单的性质，如可交换性或者条件独立等；但是，现实世界中的数据往往具有不同的结构及依赖关系。为了适应不同的需求，发展具有各种依赖特性的随机过程得到了广泛关注。例如，在对文本数据进行主题挖掘时，数据往往来自不同的领域或者类型，我们通常希望所学习的主题具有某种层次结构，为此，层次狄雷克利过程（hierarchical Dirichlet process, HDP）［34］被提出，可以自动学习多层的主题表示，并且自动确定主题的个数．另外，具有多个层次的IBP过程也被提出［35］，并用于学习深层置信网络的结构，包括神经元的层数、每层神经元的个数、层间神经元的连接结构等。其他的例子还包括具有马尔可夫动态依赖关系的无限隐马尔可夫模型［36］、具有空间依赖关系的狄雷克利过程［37］等。

另外，对于有监督学习问题，非参数贝叶斯模型最近也受到了广泛的关注．例如，社交网络数据建模和预测是一个重要的问题，近期提出的基于IBP的非参数化贝叶斯模型［27，29］可以自动学习隐含特征，并且确定特征的个数，取得很好的预测性能。使用DP混合模型同时作聚类和分类任务也取得了很好的结果［38］。

3 贝叶斯模型的推理方法

贝叶斯模型的推理方法是贝叶斯学习中重要的一环，推理方法的好坏直接影响模型的性能。具体地说，贝叶斯模型的一个关键性的问题是后验分布通常是不可解的，使得式（３）和式（４）中的贝叶斯积分也是不可解的。这时，就需要一些有效的推理方法。一般而言，主要有两类方法：变分推理方法（varia-tional inference）和蒙特卡洛方法（Monte Carlo methods）。这两类方法都在贝叶斯学习领域有广泛的应用，下面分别介绍这两类方法。

3.1 变分推理方法

变分法是一种应用较广的近似优化方法［39－40］，在物理、统计学、金融分析、控制科学领域解决了很多问题。在机器学习领域，变分方法也有较多应用：通过变分分析，可以将非优化问题转化成优化问题求解，也可以通过近似方法对一些较难的问题进行变分求解［41］。

在变分贝叶斯方法中，给定数据集Ｄ和待求解的后验分布，变分方法界定其后验分布的近似分布为。运用杰森不等式，可以得到对数似然的一个下界（evidence lower bound，ELOB）。

(9)

通过最大化该对数似然下界：

(10)

或者最小化和之间的KL散度，就可以完成优化求解的过程。因此，变分推理的基本思想是将原问题转化成求解近似分布的优化问题，结合有效的优化算法来完成贝叶斯推理的任务［22，42－43］。

很多时候，模型Θ中往往有一些参数θ和隐变量ｈ。这时变分问题可以通过变分期望最大化方法求解（variational EM algorithm）：通过引入平均场假设（mean-fieldassumption），可以迭代进行ＥＭ算法［44］。

3.2 蒙特卡洛方法

蒙特卡洛方法是一类通过利用模拟随机数对未知的概率分布进行估计；当未知分布很难直接估计或者搜索空间太大、计算太复杂时，蒙特卡洛方法就成为重要的推理和计算方法［45－46］。例如，贝叶斯机器学习通常需要计算某个函数在某种分布（先验或者后验）下的期望，而这种计算通常是没有解析解的。假设是一个概率分布，目标是计算如下积分：

(11)

蒙特卡洛方法的基本思想是使用如下估计来近似Ｉ:

(12)

其中是从P中得到的采样。根据大数定律，在采样数目足够多时，蒙特卡洛方法可以很好地估计真实期望。

上面描述的是蒙特卡洛方法的基本原理，但实际过程中ｐ的采样并不是很容易就可以得到，往往采用其他的方法进行，常用的方法有重要性采样（importance sampling）、拒绝采样（rejection sampling）、马尔可夫蒙特卡洛方法（Markov Chain Monte Carlo, MCMC）等。前两者在分布相对简单时比较有效，但是对于较高维空间的复杂分布效果往往不好，面临着维数灾难的问题。下面重点介绍ＭＣＭＣ方法，它在高维空间中也比较有效。

ＭＣＭＣ方法的基本思想是构造一个随机的马尔可夫链，使得其收敛到指定的概率分布，从而达到推理的目的［47］。一种较为常用的ＭＣＭＣ方法是Metropolis-Hastings算法［48］（ＭＨ算法）。在ＭＨ算法中，通过构造一个从状态到状态的转移规则：

1）根据从旧的状态采样中得到一个新的状态采样；

2)计算接受概率：

(13)

3）从０－１均匀分布中采样得到［0, 1］。若，则接受采样，否则拒绝采样。

另一种常用的ＭＣＭＣ方法是吉布斯采样（Gibbs sampling）［46,49］，它是ＭＨ算法的一种特例，吉布斯采样已广泛应用在贝叶斯分析的推理中。吉布斯采用是对多变量分布中每一个变量在其他已经观察得到采样的变量已知的条件下依次采样，更新现有的参数，最后收敛得到目标后验分布。假设需要采样的多元分布为，即每次选出一个维度ｊ：１≤ｊ≤ｄ，其中ｄ是多元分布的维度；随后从条件概率分布对进行采样。

有很多贝叶斯模型都采用了ＭＣＭＣ的方法进行推理，取得了很好的效果［20，30，50］。除此之外，还有一类非随机游走的ＭＣＭＣ方法———LangevinＭＣＭＣ［51］和Hybrid MonteCarlo［52］。这一类方法往往有更快的收敛速度，但是表述的复杂程度较大，因此受欢迎程度不及吉布斯采样，但是，最近在大数据环境下发展的基于随机梯度的采样方法非常有效，后文将会简要介绍。

4 正则化贝叶斯理论及应用举例

在第２节中提到了贝叶斯方法的两种等价表现方式，一种是后验推理的方式，另一种是基于变分分析的优化方法，其中第２种方式在近年有了较大发展．基于这种等价关系，我们近年来提出了正则化贝叶斯（regularized Bayesian inference, RegBayes）理论［10］：如图４所示，在经典贝叶斯推理过程中，后验分布只能从两个维度来获得，即先验分布和似然函数；而在正则化贝叶斯推理中，后验推理转化成一种变分优化的方式，通过引入后验正则化，为贝叶斯推理提供了第３维自由度，极大地丰富了贝叶斯模型的灵活性。在RegBayes理论的指导下，我们系统研究了基于最大间隔准则的判别式贝叶斯学习以及结合领域知识的贝叶斯学习等，取得了一系列的成果［］。

正则化贝叶斯推理的基本框架可以简述如下，在式（２）的基础上，引入后验正则化项，考虑领域知识或者期望的模型属性：

(14)

其中是一个凸函数。在运用RegBayes解决具体问题时需要回答下面３个问题：

问题１．后验正则化从何而来．后验正则化是一个通用的概念，可以涵盖任何期望影响后验分布的信息。比如，在有监督学习任务（如图像/文本分类）中，我们期望后验分布能够准确地预测，这种情况下我们可以将分类错误率（或者某种上界）作为优化目标，通过后验正则化引用到学习过程中，典型的例子包括无限支持向量机［38］（infinite SVM）、无限隐式支持向量机［56］（infinitelatent SVM）、最大间隔话题模型［57］（maximummargin supervised topic model, MedLDA）等，这些方法均采用了最大间隔原理，在贝叶斯学习过程中直接最小化分类错误率的上界（即铰链损失函数），在测试数据上取得显著的性能提升。

另外，在一些学习任务中，一些领域知识（如专家知识或者通过众包方式收集到的大众知识）可以提供数据之外的一些信息，对提高模型性能有很大帮助。在这种情况下，可以将领域知识作为后验约束，与数据一起加入模型中，实现高效贝叶斯学习。需要指出的是大众知识往往存在很大的噪音，如何采取有效的策略过滤噪音实现有效学习是问题的关键。在这方面，我们提出了将使用逻辑表达的领域知识鲁棒地引入贝叶斯主题模型，实现了更优秀的模型效果［58］。

问题２．先验分布、似然函数以及后验正则化之间有何关系。先验分布是与数据无关的，基于先验知识的概率分布不能反映数据的统计特性；似然函数则是基于数据产生的概率分布，反映了数据的基本性质，通常定义为具有良好解析形式的归一化的概率分布。而后验正则化项同样是利用数据的特性来定义的，但是，它具有更广泛灵活的方式，不受归一化的约束，因此，可以更方便准确地刻画问题的属性或者领域知识，如问题１中所举的最大间隔学习以及领域知识与贝叶斯统计相结合等示例。甚至可以证明，一些后验分布不可以通过贝叶斯定理得到，但是可以通过后验正则化得到［10］。因此，RegBayes是比经典贝叶斯方法更灵活更强大的方法。

问题３．如何求解优化问题。虽然正则化贝叶斯具有极强的灵活性，其学习算法仍然可以使用变分方法或者蒙特卡洛方法进行求解，具体的求解方法请阅读相关论文。下面介绍的大数据贝叶斯学习理论和算法均可以应用到快速求解正则化贝叶斯模型［55］，这也是目前的研究热点。

5 大数据贝叶斯学习

随着互联网技术的发展，研究面向大数据的机器学习理论、算法及应用成为当前研究的热点［［59］59］，得到学术界和工业界的广泛关注。贝叶斯模型有较好的数据适应性和可扩展性，在很多经典问题上都取得了很好的效果，但是，传统贝叶斯模型的一个较大的问题在于其推理方法通常较慢，特别是在大数据背景下很难适应新的模型的要求。因此，如何进行大规模贝叶斯学习方法是学术界的重要挑战之一。可喜的是近期在大数据贝叶斯学习（big Bayesian learning, BigBayes）方面取得了显著的进展。下面简单介绍在随机算法及分布式算法方面的进展，并以我们的部分研究成果作为示例。表１所示为对目前的若干前沿进展简要总结：

5.1 随机梯度及在线学习方法

当数据量较大时精确的算法往往耗时较长，不能满足需要。一类常用的解决方案是采用随机近似算法［60－61］。这类算法通过对大规模数据集的多次随机采样（random subsampling），可以在较快的时间内收敛到较好的结果。这种思想已经在变分推理和蒙特卡洛算法中广泛采用，简要介绍如下。

在变分推理方面，如前所述，其核心是求解优化问题，因此，基于多次随机降采样的随机梯度下降算法成为很自然的选择。具体地说，随机梯度下降算法（stochastic gradient descent, SGD）［62］每次随机选取一个数据子集，并用该子集上计算的梯度估计整个数据集上的梯度，对要求解的参数进行更新：

(15)

其中Ｑ是待优化的目标函数，是数据的第t个子集。值得注意的是，欧氏空间中的梯度并非最优的求解变分分布的方向；对于概率分布的寻优，自然梯度往往取得更快的收敛速度［63］。近期的主要进展包括随机变分贝叶斯方法［61］以及多种利用模型特性的快速改进算法［64］［64］。

在蒙特卡洛算法方面，可以将随机梯度的方法用于改进对应的基于梯度的采样算法，如随机梯度朗之万动力学采样方法（stochastic gradient langevin dynamics, SGLD）［65］、随机梯度哈密尔顿蒙特卡洛（stochasticHamiltonian Monte Carlo, SHM）［66］［66］。这些算法加快了蒙特卡洛采样的速度、有较好的效果。

例１．为了适应动态流数据的处理需求，基于在线学习的大规模贝叶斯推理算法也成为近期的研究热点，主要工作包括流数据变分贝叶斯［67］等。我们近期提出了在线贝叶斯最大间隔学习（online Bayesian passive-aggressive learning, Online BayesPA ）框架，显著提高了正则化贝叶斯的学习效率，并且给出了在线学习后悔值的理论界［55］。在100多万的维基百科页面数据上的部分实验结果如图５所示，可以看出，基于在线学习的算法比批处理算法快100倍左右，并且不损失分类的准确率。

5.2 分布式推理算法

另一种适用于大规模贝叶斯学习问题的算法是基于分布式计算的［68］，即部署在分布式系统上的贝叶斯推理算法。这类算法需要仔细考虑算法的实际应用场景，综合考量算法计算和通信的开销，设计适合于不同分布式系统的推理算法。

一些算法中的部分参数之间不需要交换信息，只需要计算得到最后结果汇总即可；对于这类问题，只需要对原算法进行适当优化，部署在系统上即可有较好的效果。但是，还有更多算法本身并不适合并行化处理，这就意味着算法本身需要修改，使得其可以进行分布式计算，这也是大规模贝叶斯学习的研究热点之一，并且已经取得很多重要进展，包括分布式变分推理［67］和分布式蒙特卡洛方法［69］等。

例２．以主题模型为例，经典的模型使用共轭狄利克雷先验，可以学习大规模的主题结构［70］，但是，不能学习主题之间的关联关系。为此，使用非共轭 Logistic-Normal先验的关联主题模型（correlated topic model, CTM）［71］被提出。ＣＴＭ的缺点是其推理算法比较困难，已有的算法只能处理几十个主题的图结构学习。为此，笔者课题组近期提出了ＣＴＭ的分布式推理算法［72］，可以处理大规模的数据集，学习上千个主题之间的图结构。该算法的部分结果如表２所示，其中Ｄ表示数据集大小，Ｋ表示主题个数。由表２可以看出分布式推理算法（即gＣＴＭ）极大地提高了模型可以承载的数据量（如600万的维基百科网页）和更多的主题个数（如1000）。这个项目的代码及更多信息已经公布，读者可以自行浏览［73］。

在上述大规模主题图结构的学习基础上，进一步开发了“主题全景图”（TopicPanorama）可视化界面，它可以将多个主题图结构进行融合，并且以用户友好的方式展现在同一个界面上，如图６所示，其中每个节点代表一个主题，节点之间的边代表相关联关系，边的长度代表关联强度，所用数据集为微软、谷歌、雅虎等３个IT公司相关的新闻网页。该可视化工具具有多种交互功能，用户可以使用放大或缩小功能对主题图的局部进行仔细查看，同时，也可以修改图的结构并反馈给后台算法进行在线调整。多位领域专家一致同意该工具可以方便分析社交媒体数据。更多具体描述参见文献［74］。

5.3 基于硬件的加速

随着硬件的发展，使用图形处理器（graphics processing units, GPU）、现场可编程逻辑门阵列（field-programmablegate array, FPGA）等硬件资源对贝叶斯学习方法进行加速也是最近兴起的研究热点。例如，有研究者利用GPU技术对话题模型的变分方法［75］和ＭＣＭＣ算法［76－77］进行加速，还有一些研究者利用FPGA对蒙特卡洛算法［78］进行加速。利用强大的硬件设备，搭配适当的模型和算法架构，可以起到事半功倍的效果。

6 总结与展望

贝叶斯统计方法及其在机器学习领域的应用是贝叶斯学习的重要研究内容。因为贝叶斯理论的适应性和可扩展性使得贝叶斯学习得到广泛的应用．非参数贝叶斯方法和正则化贝叶斯方法极大地发展了贝叶斯理论，使其拥有更加强大的生命力。

近年来，大数据贝叶斯学习成为人们关注的焦点，如何加强贝叶斯学习的灵活性以及如何加快贝叶斯学习的推理过程，使其更加适应大数据时代的挑战成为人们考虑的问题。在这一时期许多新的方法和理论将被提出，贝叶斯学习也与其他许多方面的知识相结合，如并行计算、数据科学等，产生很多新的成果。可以预想，贝叶斯学习肯定会有更多更新更好的成果，也会在将来有更广泛的应用。

Zhu Jun. born in 1983. Associateprofessor and PhD supervisor in Tsinghua University. His current researchinterests include machine learning, Bayesian statistics, and large-scalelearning algorithms and applications.

Hu Wenbo, born in 1992.PhDcandidate in Tsinghua University. His current research interests includemachine learning and scalable Bayesian learningmethods([email protected]).

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能，互联网和脑科学交叉研究机构。由互联网进化论作者，计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

你可能感兴趣的:(贝叶斯机器学习前沿进展)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
原力元宇宙：Web3时代下的虚拟现实融合与普通人逆袭的机遇口碑信息传播者
在数字化浪潮席卷全球的今天，一个崭新的概念——原力元宇宙，正以其独特的魅力吸引着越来越多的目光。作为元宇宙国际性的一个项目，原力元宇宙不仅融合了Web3第三代互联网的前沿技术，更将虚拟现实与现实生活紧密相连，为我们描绘出一幅前所未有的数字新世界画卷。13分钟视频内容讲明白原力元宇宙创富项目，中国区运营服务对接微信：ForceZen原力元宇宙，是一个时代的跨越，它代表着互联网技术的又一次革新。Web
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
OpenAI o1 的价值意义及“强化学习的Scaling Law” & Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考光剑书架上的书 ChatGPT 大数据AI人工智能计算人工智能算法机器学习
OpenAIo1的价值意义及“强化学习的ScalingLaw”蹭下热度谈谈OpenAIo1的价值意义及RL的Scalinglaw。一、OpenAIo1是大模型的巨大进步我觉得OpenAIo1是自GPT4发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT4o和o1是发展大模型不同的方向，但是o1这个方向更根本，重要性也比GPT4o这种方向要重要得多，原因下面会分析。为什
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
加油，打工人！职场阿良
据说格力铁娘子董大姐开始转型在阿里国际站做新外贸，看到这个消息，其实这个按照董明珠的风格一点也不觉得意外，格力的眼光一直站在世界的前沿。2020年受新冠疫情影响，很多行业受到重挫，财务资金上也是举步维艰，所以在这一年出现倒闭潮、失业潮一点都不足为奇，因为在这一年能活下来就已经非常不容易了。不过所幸的事，再难的2020终将过去，剩下最后一个月过完之后，便是全新的2021年，我们的希望之旅会重新开启，
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
LLM 进展和前进道路晨曦_子画人工智能学习人工智能
近年来，语言模型取得了重大进展。这一进步是对数十亿个参数进行广泛训练和调整的结果，也是商业用途基准测试的结果。这项工作的起源可以追溯到1950年代，当时自然语言理解和处理的研究开始了。本文旨在概述过去70年语言模型的历史和演变。它还将检查当前可用的大型语言模型（LLM），包括其架构、调优参数、企业就绪情况、系统配置等，以深入了解其训练和推理过程。这种探索将使我们能够了解该领域的进展，并评估可用于商
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/