sooner高

[生成模型新方向]: score-based generative models

0.前言

最近(2021.6)发现了生成模型的一种新的trending范式: score-based generative model, 用一句话来介绍这种结构，就是:

通过在噪声扰动后的大规模数据集(noise-perturbed data distributions)上学习一种score functions (gradients of log probability density functions)(得分函数, 一种对梯度的对数似然估计)，用朗之万进行采样得到符合训练集的样本. 这种新的生成模型，叫做score-based generative models (or diffusion probabilistic models)

这种score-based generative model有如下的优点:

① 可以得到GAN级别的采样效果，而无需对抗学习(adversarial training)
② 灵活的模型结构
③ 精确的对数似然估计计算(exact log-likelihood computation)
④ 唯一可识别表征学习(uniquely identifiable representation learning)
⑤ 流程可逆，我理解是不需要像StyleGAN的模型训练一个feature网络，可能也不需要像FLOW那么大的计算量

本篇博客的目的，是为了介绍score-based generative model提出的动机，基本概念以及潜在的应用，本文主要翻译自此领域先驱Song Yang博士(斯坦福大学博士)的博客[1]。

下图来自Twitter用户Simone的分享

1. 介绍

目前，生成模型(generative models)可以根据其表示概率分布的方式主要分为2个大类别:

likelihood-based models: 通过近似极大似然估计(via (approximate) maximum likelihood)来直接学习分布的PDF(概率密度(D for density)函数)或者PMF(概率质量(M for mass)函数). 典型的基于likelihood的方法有: autoregressive模型[2], normalizing flow models(如NICE, FLOW等)[3], EBM(基于能量的方法)[4]以及VAE[5].

implicit generative models: GAN中的方法，这种方法的概率分布是通过生成模型的采样过程隐式进行的。GAN中的新样本是通过对随机的高斯向量喂入GAN的生成模型得到的。

这两大类生成模型，都有一些问题: likelihood-based models需要确保易处理的规则化常数(这个后面会提到)以便方便的计算likelihood，而这通常意味着网络结构有较大限制，即无法像NAS那样任意组织和设计网络结构。或者必须依赖于替代的objectives来在训练过程中，近似最大似然(approximate maximum likelihood training). implicit generative models的最大问题是需要对抗训练，而这种训练的方法通常会很不稳定[6]。

本篇博客介绍的就是宋博士提出的score-based generative model, 用这种新的生成模型来解决/规避刚才提到的这些问题。score-based generative model的核心idea是:

对log PDF的梯度进行建模得到一个名为(Stein) score function[7]的量.

这种score-based generative models不需要处理类似likelihood-based models的规则化常数。而且，score-based generative models在噪声干扰的数据下训练的效果非常好。这类方法可以恢复被噪声干扰的图片本身，并且有着良好的sample quality(采样质量)。

在图像生成[8, 9]，音频合成(WaveGrad, DiffWave)，形状生成[10]，音乐生成都有着良好表现，甚至音频合成领域的效果优于GAN！

当噪声扰动的过程是由 随机可微分方程(stochastic differential equation (SDE)) 给出时, score-based generative models和FLOW这种模型在数学上联系起来了，因此可以进行精确的似然估计计算以及表征学习。

此外，对score的建模以及估计促使其逆向问题得到解决(inverse problem，我想这也是FLOW,NICE等流式模型擅长的地方)，这些逆向问题包括:

image inpainting[8,9]
image colorization[9]
医疗图像重建以及压缩感知等.

2. The score function, score-based models, and score matching

假定我们有一个数据集 ${x_1, x_2, ... , x_N}$ , 其中的每个 $x_i, i \in {1, ..., N}$ 都是从一个潜在的数据分布 $p_{\theta}(x)$ 中独立取得的(i.i.d). 生成模型的目的是能够完美的建模这个数据分布 $p_{\theta}(x)$ ，以便任意的采样生成符合这个分布的新数据。

为了构造这个生成模型，我们首先需要找到一种可以表示这种概率分布的方式。一种方式就如上面提到的，是likelihood-based models, 即直接对PDF, PMF进行建模。

probability density function (p.d.f.) or probability mass function (p.m.f.)

我们设定， $f_{\theta}(\bf{x}) \in \mathbb{R}$ 是一个以 $\theta$ 为参数的函数。那么，**(p.d.f.)**就可以通过下面的公式定义:

这里, $Z_{\theta} > 0$ 是一个依赖于 $\theta$ 的normalizing constant(规则化常数)，其目的是让 $\int p_{\theta}(x)dx = 1$ . 函数 $f_{\theta}(\bf{x})$ 是一个unnormalized 概率模型，或者叫做EBM能量模型.

我们可以训练 $p_{\theta}(x)$ 来最大化数据的对数似然[11].

然而，上面的这个公式要求 $p_{\theta}(x)$ 是一个规则化的PDF，而这对于计算 $p_{\theta}(x)$ 提出了挑战:

我们必须计算归一化常数 $Z_{\theta}$ ，对于任何一般情况下的 $f_{\theta}(\bf{x})$ ，这是一个典型的难以处理的量

所以，为了使得maximum likelihood training的训练变得可行，likelihood-based models通过如下2种方式，而这2种方式，尤其是FLOW-based模型，会使得计算量极具增加:

限制模型结构（causal convolutions in autoregressive models, invertible networks in normalizing flow models）来使得 $Z_{\theta}=1$
近似规则化常数（variational inference in VAEs, or MCMC sampling used in contrastive divergence）

而score-based模型则是通过构造一个score function而非density function来避开处理这个规则化常数的问题。对一个分布 $P (x)$ , 其score function定义为:

使用这种score function的模型我们就统称为score-based model, 用 $s_{\theta}(\bf{x})$ 来表示，这种模型的目标是在无需考虑规则化常数项的情况下，使得 $s_{\theta}(\bf{x}) \approx \nabla_{x} log p(x)$ 。以 $p_{\theta}(x)=\frac{e^{-f_{\theta}(\bf{x})}}{Z_{\theta}}$ 为例进行展开，得到如下结果:

可以看出, $s_{\theta}(\bf{x})$ 和normalizing constant $Z_{\theta}$ 相互独立。这个性质可以保证我们可以扩展生成模型的类别，并无需像之前的likelihood类方法那样，通过设计复杂的结构来使得 $Z_{\theta}$ 易于处理(tractable).

Parameterizing probability density functions(pdfs). No matter how you change the model family and parameters, it has to be normalized (area under the curve (AUC) must integrate to one).

Parameterizing score functions. No need to worry about normalization.

同likelihood类方法类似，我们可以通过最小化the Fisher divergence between the model and the data distributions来训练得到一个score-based models：

直觉上来说，Fisher divergence (Fisher散度)是计算ground-truth数据和score-based模型的 $l_2$ 距离的平方。但是由于不知道数据得分 $\nabla_{x} log p(x)$ , 我们没法直接优化Fisher divergence. 幸运的是，现存了一系列称之为score matching的方法[12,13,14]，这种方式可以在不知道ground-truth data score的情况下，minimize Fisher divergence.

score matching的objectives(目标)可以在给定数据上通过SGD(随机梯度下降)的方式估计得到。类比于 log-likelihood objective 在训练likelihood-based models的情况。

Score matching objectives can directly be estimated on a dataset and optimized with stochastic gradient descent, analogous to the log-likelihood objective for training likelihood-based models (with known normalizing constants

我们可以训练一个score-based模型来优化score-matching objective, 而不需要对抗学习!

此外，使用score matching objective给了我们在模型结构设计的灵活性。Fisher Divergence不需要 $s_{\theta}(\bf{x})$ 是任意的规则化分布的实际得分函数(actual score function). 即: 无需像之前的方法那样，对 $s_{\theta}(\bf{x})$ 有一个较强的假设！ 在使用中，score-based model的唯一要求是
score-based model should be a vector-valued function with the same input and output dimensionality, which is easy to satisfy in practice.

本节内容，我们可以通过建模score function来模拟/代表一种分布，这种模型的构建是通过使用score matching技术来得到的。

3. Langevin dynamics (郎之万动力学)

一旦我们训练得到一个 $s_{\theta}(\bf{x}) \approx \nabla_{x} log p(x)$ ，我们可以使用 Langevin dynamics[15,16]的方法来迭代式的进行数据采样。

Langevin dynamics仅通过使用score function $\nabla_{x} log p(x)$ 来对真实数据分布 $P (x)$ 进行MCMC(MCMC, 马尔科夫链蒙特卡洛(Markov Chain Monte Carlo)方法,是用于从复杂分布中获取随机样本的统计学算法)的采样。具体来说，它先从任意的先验的分布中 $\bf{x}_{0} \sim \bf{\pi(x)}$ , 初始化构造一个chain，然后按着下面公式所述的那样进行迭代：

这里, $\bf{z}_{i} \sim N(0, I)$ , 当 $\epsilon$ 趋近于0且 $\bf{K}$ 趋近于无穷的时候，在常规条件下， $\bf{x}_{K}$ 近似于实际数据分布 $P (x)$ 的数据，两者的误差在 $\epsilon$ 足够小且 $\bf{K}$ 足够大的时候，可以忽略不计。这就说明，可以通过Langevin dynamics来采样得到我们希望得到的和原始数据分布一模一样的分布！

4. 最基础的score-based模型以及其问题

截至目前，我们讨论了如何用score matching来优化训练一个score-based模型，并使用Langevin dynamics的方法去做数据采样。然而，这种最朴素的方式在实践中通常不太work，本节的内容主要聚焦在这些问题（secret pitfalls）上面。

目前的版本，由于在score matching中的一些问题，导致出现了较为明显的失败情况，而这些问题，前人的文章并没有仔细的探究。

一个核心的挑战(key challenge)是估计出来的score function在低维空间非常不准确。我们之前提到，score-based模型是通过最小化F真实数据和模型输出的Fisher divergence进行的

但是，由于true data score function and score-based model 的 $l_2$ 误差由数据分布 $P (x)$ 决定，而真实数据分布在低维空间被极大的扭曲和扰动，因此无法代表真实的数据分布了。这种情况导致了低于平均水平（subpar）的结果，如下图所示：

当使用 Langevin dynamics进行数据采样时，我们的初始样本极易出现在low density区域而非高维空间。因此，基于一个不准确的score-based模型进行采样，会让Langevin dynamics的采样过程derail（出轨），无法生成高质量的，能够代表真实数据分布的数据！

5. multiple noise perturbation后的score-based模型

如第4部分所说，我们如何绕过在低维空间/低密度区域中，score估计的准确性问题呢？ 我们的思路是对数据点进行扰动，并让我们的模型在这种noisy data上面进行训练。

当噪声的幅度足够大时，它可以填充低数据密度区域，以提高估计分数的准确性。具体的，下图就是我们使用额外的高斯噪声对混合高斯模型进行扰动的结果:

但是这引发了另一个问题：我们该怎样选择适合的噪声幅度来进行扰动呢？更大的噪声可以明显的覆盖更多的低密度区域，提升score estimation结果。但是它会极大的损害数据本身，并使其偏离原始的数据分布。

而微小的噪声扰动则无法cover我们所希望覆盖的低密度区域(low density regions)，即使其对原始数据的分布没有做出很大的改变。

为了达到最佳的效果，宋博士提出了同时使用多尺度的噪声干扰[8, 9]。假设我们总是用均值为零(mean zero)的各向同性高斯噪声(isotropic Gaussian noise)来干扰数据, 假设有 $L$ 个扰动信号，标准差从小到大排列: $\sigma_1 < \sigma_2 < ... < \sigma_L$ , 首先，用每个扰动信号去扰动数据 $P (x)$ :

注意，我们可以通过对 $\sim P(x)$ 采样，并计算 $\bf{x} + \sigma_i \bf{z}$ 来得到被第i个噪声扰动后的数据，其中 $\bf{z} \sim N(0, I)$ 。

第二步，我们通过训练Noise Conditional Score-Based Model $s_{\theta}(\bf{x, i})$ ，对每个被噪声扰动的分布的score function进行估计: $\nabla_{\bf{x}} log p_{\sigma_i}(\bf{x})$ ，以使得:

那么接下来就很符合直觉了，训练的目标 $s_{\theta}(\bf{x, i})$ 是不同噪声尺度 $L$ 的加权结果。具体的，我们使用如下的目标函数:

这里唯一需要注意的是权重 $\lambda(i)$ 的取值, 在宋博士的论文中，让 $\lambda(i)=\sigma_i^{2}$ . 这个目标函数可以使用score matching技术进行优化，就跟优化最朴素的score based model $s_{\theta}(\bf{x})$ 一样。

在得到noise-conditional 的score-based模型 $s_{\theta}(\bf{x, i})$ 后，我们就可以使用Langevin Dynamics来进行采样了. $i = L, L - 1, . . ., 1$ . 这种方法称之为退火Langevin Dynamics算法(Annealed Langevin Dynamics, 在[8]的算法1中定义), 之所以称之为退火，可以理解为噪声的幅度是逐渐缩小的。

下面是一些用于训练一个score-based生成模型with multiple noise scale的实用的建议:

噪声的等级由低到高最好要有成百上千个级别.
U-Net结构来设计模型.
在测试阶段，使用EMA.

Annealed Langevin dynamics for the Noise Conditional Score Network (NCSN) model (from ref.
[17]) trained on CelebA . We can start from complete noise, modify images according to the scores, and generate nice samples. The method achieved state-of-the-art Inception score on CIFAR-10 at its time.

使用上面的说明，我们可以生成和GAN类似的高质量的图像样本，如下所示：

6. Score-based generative modeling with stochastic differential equations (SDEs)

根据前面的讨论，我们知道在score-based生成模型训练中，加入多层次、尺度的噪声是成功的关键因素。现在，当我们想把噪声的数量扩展到infinity（无限）的时候，我们可以基于score-based生成模型构造迄今为止最强大的框架。这不仅可以生成更高质量的样本，而且可以用精确地log-likelihood来优化模型，并加快采样速度，使得学习的特征具有更好的，更加独立的表征，并且可以用于编辑(inverse problem solving).

宋博士提供了Google Colab的版本来完成一个step-by-step的MNIST模型的训练。同样的，对更复杂的任务有更复杂的模型。

6.1 使用SDE(`随机微分方程`)来扰动数据

当噪声的规模和尺度趋近于无穷时，我们本质上是在用逐渐增加的噪声来干扰数据。在这种情况下，噪声干扰过程是一个随时间连续的随机过程(continuous-time stochastic process)

GIF图具体看[1], 这里可以看到，随着随机过程的加深，原图的信息被大量的隐藏起来。

那么，怎么能够用更加精确地方式来表示这种随机过程呢？随机的随机过程(以扩散过程为例)是SDEs(随机微分方程)的解。一般地，SDE具有如下的形式:

$\mathbf{f}(\mathbf{x}, t) : \mathbb{R}^d \rightarrow \mathbb{R}^d$ 代表的是飘移系数(drift coefficient), $\in \mathbb{R}$ 表示的是扩散系数, $\mathbf{w}$ 则表示为标准的布朗运动, $\mathrm{d}\mathbf{w}$ 可以视为无穷小的白噪声(infinitesimal white noise)。这个随机微分方程的解是一组连续的随机变量 $\{\mathbf{x}(t)\}_{t \in [0, T]}$ ，这些随机变量描述在t时刻的轨迹。

用 $p_t(\mathbf{x})$ 来表示 $\mathbf{x}(t)$ 的边缘概率密度函数。这里的 $\in [0, T]$ 可以类比为不同尺度下的噪声 $i = 1, 2, . . ., L$ ； $p_t(\mathbf{x})$ 可以类比为 $p_{\sigma_i}(\mathbf{x})$ 。这里, $p_0(\mathbf{x}) = p(\mathbf{x})$ 代表了本来的数据分布(没有噪声干扰的情况)。

在用随机过程的方法对 $p(\mathbf{x})$ 干扰了足够长的时间 $T$ 后, $p_T(\mathbf{x})$ 已经变成了一个简单的随机噪声分布，我们将其表示为一个prior distribution(先验分布), 相似地，这可以类比为有限扰动尺度下的 $p_{\sigma_L}(\mathbf{x})$ 。

我们知道，对数据进行扰动的方式非常多，选择SDEs的方式进行扰动也没啥特别的。如下式这种SDE，是使用均值为0，方差指数增长的高斯噪声对数据进行干扰，这同之前的 $\sigma_1^2I), N(0, \sigma_2^2I), ..., N(0, \sigma_L^2I)$ 类似。

因此，SDE的过程应该被视为模型的超参数，如 $\{\sigma_1, \sigma_2, ... , \sigma_L\}$ 。对图像生成任务，我们提供了3种比较适合这个领域的SDE。

6.2 Reverse SDE用于生成样本

之前我们提到的annealed Langevin dynamics(退火郎之万动力学算法), 其方式是按顺序从每个噪声干扰的分布中，使用Langevin dynamics的方式进行采样。对于我们的这种SDE的方式(无穷噪声)，也可以使用类似的方式来进行。

需要注意的是，SDE是可逆的，有其对应的Inverse SDE, 有着明确的close-form solution:

这里， $\mathrm{d}t$ 表示负的无穷小时间步，由于SDE需要被逆向求解(从时间 $t = T$ 到时间 $t = 0$ ), 那么我们需要对 $\nabla_{\mathbf{x}}log p_t(\mathbf{x})$ 进行估计，而这与 $p_t(\mathbf{x})$ 的score function是一样的。

6.3 Estimating the reverse SDE with score-based models and score matching

如6.2所述，我们需要估计 $\nabla_{\mathbf{x}}log p_t(\mathbf{x})$ 来逆向求解，得到被噪声干扰前的图像、语音等信息。那么，为了估计 $\nabla_{\mathbf{x}}log p_t(\mathbf{x})$ ，我们提出一种 Time-Dependent Score-Based Model $\mathbf{s}_{\theta}(\mathbf{x}, t)$ , 从而使得 $\mathbf{s}_{\theta}(\mathbf{x}, t) \approx \nabla_{\mathbf{x}}log p_t(\mathbf{x})$ 。同样，这可以和noise-conditional score-based model $\mathbf{s}_{\theta}(\mathbf{x}, i)$ 进行类比。

我们对于 $\mathbf{s}_{\theta}(\mathbf{x}, t)$ 的训练目标很直接，就是一个连续的Fisher散度的Mixture:

这里 $u (0, T)$ 表示在 $[0, T]$ 的均匀分布, $\lambda > 0: \mathbb{R} \rightarrow \mathbb{R}$ 表示为不同时间下的噪声权重，是正的。

我们用如下的方程(当 $\lambda(t) = g^2(t)$ )来表示 $\lambda(t)$ :

这里，Fisher散度和KL散度产生了一些奇妙的联系:

这里， $\mathtt{p}_t$ 和 $\mathtt{q}_t$ 分别代表 $\mathbf{x}_{t}$ 的分布( $\mathbf{x}(0) \sim \mathtt{p}_0$ 和 $\mathbf{x}(0) \sim \mathtt{q}_0$ )。

由于KL散度和Fisher散度的特殊联系以及KL散度和最大似然估计的等价性，
我们将 $\lambda(t) = g^2(t)$ 称为似然权重函数likelihood weighting function。

同之前讲的那样，我们的目标函数: 混合Fisher散度(mixture of Fisher divergence)能够通过score matching方法进行高效的优化，如denoising score matching[17]以及sliced score matching[14]。

当我们的score-based模型训练完毕后，我们可以将其插入reverse SDE过程中，用于数据的采样过程。

6.4 How to solve the reverse SDE

通过数值SDE求解器，我们可以估计reverse SDE，我们可以模拟reverse随机过程来用于生成样本。最简单的数值SDE求解器也许是Euler-Maruyama方法。当将其应用到我们的SDE中，Euler-Maruyama方法使用有限的时间步和小的高斯噪声去离散SDE。具体来讲，就是其选择了small, negative的时间步，进行初始化，然后按照下列方式进行迭代优化直到 $\approx 0$ :

这里 $\mathbf{z}_t \sim N(0, I)$ , Euler-Maruyama 方法和Langevin dynamics方法的性质很相似: “They both update $\mathbf{x}$ by following score functions perturbed with Gaussian noise”.

除了Euler-Maruyama方法外，还有一些可以直接用于求解SDE逆过程的方法: Milstein 方法[18]以及stochastic Runge-Kutta 方法[19], 在宋博士最新的ICLR2021的论文中，提出了一种新的reverse diffusion solver来近似Euler-Maruyama方法，这种方法更适合解决reverse-time的SDE。

对我们的reverse SDE，有2类特殊的性质可以使得我们进行更为灵活的采样:

基于上面的2个性质，我们可以使用马尔科夫链蒙特卡洛方法去fine-tune通过数值SDE solver得到的轨迹(trajectories)。宋博士提出了Predictor-Corrector samplers.

实际对照MNIST代码，我发现采样过程如下所示 \sigma^{2t}实际上就是 $g(t)^2$ , 以500次迭代为例进行分析，我们可以将其和公式一一对应起来，得到扰动前的结果。

num_steps =  500#@param {'type':'integer'}
def Euler_Maruyama_sampler(score_model, 
                           marginal_prob_std,
                           diffusion_coeff, 
                           batch_size=64, 
                           num_steps=num_steps, 
                           device='cuda', 
                           eps=1e-3):
  """Generate samples from score-based models with the Euler-Maruyama solver.

  Args:
    score_model: A PyTorch model that represents the time-dependent score-based model.
    marginal_prob_std: A function that gives the standard deviation of
      the perturbation kernel.
    diffusion_coeff: A function that gives the diffusion coefficient of the SDE.
    batch_size: The number of samplers to generate by calling this function once.
    num_steps: The number of sampling steps. 
      Equivalent to the number of discretized time steps.
    device: 'cuda' for running on GPUs, and 'cpu' for running on CPUs.
    eps: The smallest time step for numerical stability.
  
  Returns:
    Samples.    
  """
  t = torch.ones(batch_size, device=device)
  init_x = torch.randn(batch_size, 1, 28, 28, device=device) \
    * marginal_prob_std(t)[:, None, None, None]
  time_steps = torch.linspace(1., eps, num_steps, device=device)
  step_size = time_steps[0] - time_steps[1]
  x = init_x
  with torch.no_grad():
    for time_step in tqdm.notebook.tqdm(time_steps):      
      batch_time_step = torch.ones(batch_size, device=device) * time_step
      g = diffusion_coeff(batch_time_step) # g(t) 扩散系数.
      mean_x = x + (g**2)[:, None, None, None] * score_model(x, batch_time_step) * step_size
      x = mean_x + torch.sqrt(step_size) * g[:, None, None, None] * torch.randn_like(x)      
  # Do not include any noise in the last sampling step.
  return mean_x

随着Predictor-Corrector方法来优化采样过程，以及更好的score-based模型架构的提出，宋博士的算法在CIFAR10上达到了SOTA效果，并且比StyleGAN2取得的效果还要惊人！

参考资料

[1]: Generative Modeling by Estimating Gradients of the Data Distribution: 宋飏-20210505
[2]: The neural autoregressive distribution estimator
[3]: NICE: Non-linear independent components estimation
[4]: A Tutorial on Energy-Based Learning
[5]: Auto-encoding variational bayes
[6]: Unrolled Generative Adversarial Networks
[7] A kernelized Stein discrepancy for goodness-of-fit tests
[8] Generative Modeling by Estimating Gradients of the Data Distribution
[9] Improved Techniques for Training Score-Based Generative Models
[10] Learning Gradient Fields for Shape Generation
[11] 最大似然估计
[12] Estimation of non-normalized statistical models by score matching
[13] A connection between score matching and denoising autoencoders
[14] Sliced score matching: A scalable approach to density and score estimation
[15] Correlation functions and computer simulations, 1981, G. Parisi.
[16] Representations of knowledge in complex systems, 1994, U. Grenander, M.I. Miller.
[17] A connection between score matching and denoising autoencoders
[18] Milstein method
[19] Runge–Kutta method (SDE)

你可能感兴趣的:(算法,深度学习,机器学习,生成模型,score-based)

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少