weixin_45955767

gan 5小时速成

名词解释

多模态学习：每一种信息的来源或者形式，都可以称为一种模态；多模态机器学习，旨在通过机器学习的方法实现处理和理解多源模态信息的能力；比较热门的研究方向是图像、视频、音频、语义之间的多模态学习

图像标记：用词语对图像中不同内容进行多维度表述

图像描述：把一幅图片翻译为一段描述文字获取图像的标记词语理解图像标记之间的关系
生成人类可读的句子

词向量模型：Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型
通过词的上下文得到词的向量化表示，使得语义上相似的单词在向量空间内距离也很近
来源于2013年的论文《Efficient Estimation of Word Representation in Vector Space》
有两种方法：CBOW（通过附近词预测中心词）和SKIp-gram（通过中心词预测附近的词）

结构loss

图像建模的结构化损失图像到图像的转换问题通常被表述为逐像素分类或回归。这些公式将输出空间视为“非结构化”，因为在给定输入图像的情况下，每个输出像素都被认为有条件地独立于所有其他像素。有条件的gan相反地学习一个结构损失，结构损失惩罚输出的联合配置。

Structured losses for image modeling Image-to-image translation problems are often formulated as per-pixel classification or regression. These formulations treat the output space as "unstructured" in the sense that each output pixel is considered conditionally independent from all others given the input image. Conditional GANs instead learn a structured loss, Stryctured losses penalize the joint configuration of the output.

unet

基于经典的Encoder-decoder结构在很多图像翻译任务中，输出和输出图像外观看起来不同，但结构信息是相同的在Encode过程中，feature map的尺寸不断减小，低级特征将会丢失
在第1层与第n-i层间加入skip-connection，把i层的特征直接传到第n-i层

patchgan

PatchGAN像素级的1 loss能很好的捕捉到图像中的低频信息，GAN的判别器只需要关注高频信息把图像切成N"N的patch，其中N显著小于图像尺寸假设在大于N时，像素之间是相互独立的，从而可以把图像建模成马尔科夫随机场把判别器在所有patch上的推断结果，求平均来作为最终输出可以把PatchGAN理解为对图像纹理/style损失的计算PatchGAN具有较少的参数，运行得更快，并且可以应用于任意大的图像

前置知识

1.数字图像：

有什么用：最早海底电缆传输图像，数字图像可以加快传输

是什么：用矩阵表示图像

怎么形成数字图像：物体发送电磁波被设备接收形成数字图像

例子：x射线成像

人体密度高的地方（骨头）对x射线吸收多吸收的能量多，就发白

人体密度低的地方，x射线直接穿透，就发黑

紫外线波段成像

展示细胞

可见光波段成像：物体反射可见光进入人眼

数字图像的任务

输入/输出	图像	知识
图像	数字图像处理	计算机视觉
知识	计算图形学	人工智能

2.图像处理，机器视觉，人工智能关系

图像处理的输出还是图像

机器视觉包括图像处理，目标是理解图像

人工智能实现机器视觉理解图像的目标

3.opencv c实现提供python接口的计算机视觉工具包

4.图像属性

图像格式

bmp,tiff原图

gif可静可动

图像尺寸：表征图像的长宽

像素：像素=细胞每个像素有个强度值（对应能量的强度值）

5.图像直方图

统计不同像素亮度的直方图，左侧为黑的点，右侧为亮的点

6.颜色空间

7.opencv画图

8.图像的缩放

下采样：缩小图像

上采样：放大图像

计算机视觉背景知识

模型结构设计：

1.堆积使用小卷积核（3*3卷积）

2.分辨率减半，通道数加倍

3.卷积分解：7*7卷积用3*3卷积代替

非对称卷积 n*n 卷积 = 1*n卷积+n*1卷积这个在网络后半段效果比较好

4.辅助分类层：

是什么？中间的特征图用于分类的结构

有什么用？可以起正则作用，并不能提升底层的特征提取能力

5.特征图下降策略

因为池化后存在信息瓶颈，所以需要特征图下降策略

inception采用一半卷积一半池化的方式，拼接特征图

怎么做：选择步长为2的卷积核，可以将特征图缩小为原来一半

6.标签平滑

7.低分辨率图像分类

vgg的训练技巧:

1.尺度扰动

2.预训练模型初始化

vgg的测试技巧：

多尺度测试

dense测试

muti-crop测试

多模型融合

背景知识

1.图像描述：将图像描述为一段文字，理解标记间的关系从而生成人类可读的句子

2.多模态学习用机器学习方法理解多模态信息

3.表征学习得到好的特征

表征学习的方式

有监督的表示学习

无监督的表示学习

4.纳什均衡

又称为非合作博弈均衡，对于一个策略组合，当其他所有人都不改变策略日没有人会改变自己的策略，则该策略组合就是一个纳什均衡又称为非合作博弈均衡，对于一个策略组合，当其他所有人都不改变策略日没有人会改变自己的策略，则该策略组合就是一个纳什均衡

5.半监督学习

在特征空间中位置相近的无标签样本默认和有标签样本一个标签

6.图像翻译

图像与图像之间以不同形式的转换。根据source domain的图像生成target domain中的对应图像，约束生成的图像和source图像的分布在某个维度上尽量一致

7.图像质量评价（image Quality Assessment，IQA）

像素损失 MSE或PSNR 对模糊不够敏感

结构性损失 SSIM 引入像素的关联性从两张图片分别裁取小块进行比对

锐度损失 GMSD

感知损失利用网络提取图像特征，然后再计算l1,l2距离

8.域自适应/泛化（Domain Adaptation/Generalization）
domain自适应/泛化是迁移学习的一块重要研究领域
不同形式和来源的数据，其domain各不相同，数据分布存在域差异（Domain Discrepancy

而domain自适应/泛化的目标，就是学习到不同domain间的域不变（Domain Invariant）特征

9.神经自回归网络

通过链式法则把联合概率分布分解为条件概率分布的乘积

使用神经网络参数化每个p

效率很低

10.VAE-GAN

编码器和判别器

编码器最小化生成器和输入x的差距

判别器给真实样本高分给重建样本和生成样本低分

11.图像生成的评价指标

可以评价生成样本的质量可以评价生成样本的多样性，

能发现过拟合、模式缺失、模式崩溃、直接记忆样本的问题有界性，即输出的数值具有明确的上下界

给出的结果应当与人类感知一致

计算评价指标不应需要过多的样本

计算复杂度尽量低

12.谱归一化（spectral normalization）

13.参数初始化

什么用？使得输入输出方差一样

应用的例子 Xavier初始化，kaiming初始化，单位初始化，正交矩阵初始化

进入正题

gan可以做什么？

生成图像和文本

gan的提出 lan Goodfellow

gan的摘要

1，提出了一个基于对抗的新生成式模型，它由一个生成器和一个判别器组成

2，生成器的目标是学习到样本的数据分布，从而能生成样本欺骗判别器；判别器的目标是判断输入样本是生成/真实的概率
3.GAN模型等同于博弈论中的二人零和博弈
4，对于任意的生成器和判别器，都存在一个独特的全局最优解

5，在本文中，生成器和判别器都由多层感知机实现，整个网络可以用反向传播算法来训练

6，通过实验的定性与定量分析显示，GAN具备很大的潜力

We propose a new framework for estimating generative models via an adversarial process, in which we simultaneously train two models: agenerative model G that captures the data distribution, and a discriminative mode That esumates the probability that a sample came from the training data rather than G. The training procedure for G is to maximize the probability of D making a mistake. This framework corresponds to a minimax two-player game, In the space of arbitrary functions G and D, a unique solution exists, with G recovering the training data distribution and D equal to everywhere. In the case where G and D are defined by multilayer perceptrons, the entire system can be trained with backpropagation.
There is no need for any Markov chains or unrolled approximate inference networks during either training or generation of samples. Experiments demonstrate the potential of the framework through qualitative and quantitative evaluation of the generated samples.

cgan的提出 Mehdi Mirza, Simon Osindero

cgan在哪用？ gan在多模态学习的应用

cgan的摘要

1，提出了一个基于生成对抗网络的条件生成式模型

2，在原模型基础上，输入额外的数据作为条件

3，在原模型基础上，对生成器和判别器都进行了修改

4，在MNIST数据集上，新模型可以生成以数字类别标签为条件的手写数字图像

5，新模型还可以用来做多模态学习，可以生成输入图像相关的描述标签

Generative Adversarial Nets [8] were recently introduced as a novel way to train generative models. In this work we introduce the conditional version of generative adversarial nets, which can be constructed by simply feeding the data, y, we wish to condition on to both the generator and discriminator. We show that this model can generate MNIST digits conditioned on class labels. We also illustrate how this model could be used to learn a multi-modal model, and provide preliminary examples of an application to image tagging in which we demonstrate how this approach can generate descriptive tags which are not part of training labels.

dcgan的提出 Representation Learning with Deep Convolutional Generative Adversarial Networks>Alec Radford, Luke Metz, Soumith Chintala

dcgan在哪用？ gan在表征学习的应用 DCGAN使GAN在图像生成任务上的效果大大提升

dcgan的摘要

1，希望能让CNN在无监督学习上，达到与监督学习一样的成功

2，通过架构约束，构建了深度卷积生成对抗网络（DCGAN）
3，证明了DCGAN是目前先进的无监督学习网络

4，证明了DCGAN的生成器和判别器学习到了从物体细节到整体场景的多次表征

5，证明了DCGAN判别器提取的图像特征具有很好的泛化性

In recent years, supetvised learning with convolutional networks (CNNs) has seen huge adoption in computer vision applications. Comparatively, unsupervised learning with CNNs has received less attention. In this work we hope to help bridge the gap between the success of CNNs for supervised learning and unsupervised learning. We introduce a class of CNNs called deep convolutional generative adversarial networks (DCGANs), that have certain architectural constraints. and demonstrate that they are a strong candidate for unsupervised learning. Training on various image datasets, we show convincing evidence that our deep convolutional adversarial pair learns a hierarchy of representations from object parts to scenes in both the generator and discriminator. Additionally, we use the learned features for novel tasks -demonstrating their applicability as general image representations.

DCGAN是具有语义信息的

ITgan的提出 Tim Salimans, lan Goodfellow, et al.

ITgan的摘要

1，提出了一系列新的GAN结构和训练方式
2，进行了半监督学习和图像生成相关实验
3，新的技术框架在MNIST、CIFAR-10和SVHN的半监督分类中取得了良好效果

4，通过视觉图灵测试证明，生成的图像同真实图像已难以区分

5，在ImageNet上训练，模型学习到了原图的显著特征

We present a variety of new architectural features and training procedures that we apply to the generative adversarial networks (GANs) framework. We focus on two applications of GANs: semi-supervised learning, and the generation of images that humans find visually realistic. Unlike most work on generative models, our primary goal is not to train a model that assigns high likelihood to test data, nor do we require the model to be able to learn well without using any labels. Using our new techniques, we achieve state-of-the-art results in semi-supervised classification on MNÍST, CIFAR-10 and SVHN. The generated images are of high quality as confirmed by a (visual Turing test: our model generates MNIST samples that humans cannot distinguish from real data, and CIFAR-10 samples that yield a human error rate of 21.3%. We also present ImageNet samples with unprecedented resolution and show that our methods enable the model to learn recognizable features of ImageNet classes.

用于图像翻译的条件生成式对抗网络pix to pix

pix to pix的提出 Phillip lsola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros

pix2pix的摘要

1，研究条件生成式对抗网络在图像翻译任务中的通用解决方案
2，网络不仅学习从输入图像到输出图像的映射，还学习了用于训练该映射的损失函数

条件gan不同于loss是可以学习的，以及理论上可以惩罚输入和输出的任何结构上的不同

The conditional GAN is different in that the loss is learned,and can,in theory,penalize any possible structure that differs between output and target.

3，证明了这种方法可以有效应用在图像合成、图像上色等多种图像翻译任务中

4，使用作者发布的pix2pix软件，大量用户已经成功进行了自己的实验，进一步证明了此方法的泛化性

5，这项工作表明可以在不手工设计损失函数的情况下，也能获得理想的结果

We investigate conditional adversarial networks as a general-purpose solution to image-to-image translation problems. These nerworks not only learn the mapping from input image to ouput image, but also learn a loss function to train this mapping. This makes it possible to apply the same generic approach to problems thar traditionally would require very different loss formulations. We demonstrate that this approach is effective at synthesizing photos from label maps, reconstructing objects from edge maps, and colorizing images, among other tasks. Indeed, since the release of the pix2pix sofiware associated with this paper, a large number of internet users (many of them artists)have posted their own experiments with our system, further demonstrating is wide applicabiliry and ease of adoption without the need for parameter rweaking. As a community, we no longer hand-engineer our mapping functions, and this work suggests we can achieve reasonable results without hand-engineering our loss functions either

用于非配对图像翻译的循环一致性对抗网络Cyclegan

Cyclegan的提出Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros

Cyclegan的摘要

1，图像翻译任务需要对齐的图像对，但很多场景下无法获得这样的训练数据
2，提出了一个基于非配对数据的方法，仍然可以学习到不同domain图像问的映射

3.CycleGAN是在GAN loss的基础上加入循环一致性损失，使得F（G（X））尽量接近x（反之亦然）
4，在训练集没有配对图像的情况下，对CycleGAN在风格迁移、物体变形、季节转换、图像增强等多个图像翻译任务中的生成结果做了定性展示
5，与此前一些方法的定量比较，进一步显示了CycleGAN的优势

提升生成质量、稳定性和多样性的渐进式增长生成讨抗网络（ProGAN）

ProGAN的提出Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen

ProGAN的摘要

1，使用渐进的方式来训练生成器和判别器：先从生成低分辨率图像开始，然后不断增加模型层数来是升生成图像的细节
2，这个方法能加速模型训练并大幅提升训练稳定性，生成前所未有的的高质量图像（1024*1024）
3，提出了一种简单的方法来增加生成图像的多样性
4，介绍了几种限制生成器和判别器之间不健康竞争的技巧

5，提出了一种评价GAN生成效果的新方法，包括对生成质量和多样性的衡量

6，构建了一个CELEBA数据集的高清版本

We describe a new training methodology for generative adversarial networks. The key idea is to grow both the generator and discriminator progressively: startingfrom a low resolution, we add new layers that model increasingly fine details as training progresses. This both speeds the training up and greatly stabilizes it, allowing us to produce images of unprecedented quality, e.g., CELEBA images at 1024^2. We also propose a simple way to increase the variation in generated images, and achieve a record inception score of 8.80 in unsupervised CIFAR10, Additionally we describe several implementation details that are important for discouraging unhealthy competition between the generator and discriminator. Finally, we suggest a new metric for evaluating GAN results, both in terms of image quality and variation. As an additional contribution, we construct a higher-quality version of the CELEBA dataset.

使用堆叠的生成式对抗网络进行文本到照片级图像的合成（StackGAN）

StackGAN的提出 Han Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang, et.

StackGAN的摘要

1，现有文本到图像方法生成的样本，可以大致表达出给定的文本含义，但是图像细节和质量不佳
2.StackGAN能基于文本描述，生成256"256分辨率的照片级图像

3，把问题进行了分解，采用草图绘制-精细绘制两阶段过程

4·阶段1的GAN根据给定的文本描述，来绘制对象的原始形状和颜色；阶段2的GAN使用文本描述和阶段1的输出来作为输入，通过纠正草图中的缺陷和细节生成，来最终得到更高分辨率的图像

5，还提出了一种条件增强方法，能够增强潜在条件流形的平滑性

6，大量实验表明，以上方法在以文本描述为条件的照片级图像生成上取得了显著进步

Synthesizing high-qualiry images from text descriptions is a challenging problem in computer vision and has many practical applications. Samples generated by existing text-to-image approaches can roughly reflect the meaning of the given descriptions, but they fail to contäin necessary details and vivid object Paris. In this paper, we propose Stacked Generative Adversarial Networks (StackGAN) to generate 256x256 photo-realistic images conditioned on text descriptions. We decompose the hard problem into more manageable sub-problems through a sketch-refinement process.
The Stage-l GAN sketches the primitive shape and colors of the object based on the given text description, yield. ing Stage-l low-resolution images. The Stage-ll GAN takes Stage-I results and text descriptions as inputs and generates high-resolution images with photo-realistic details. In is able to rectify defects in Stage-l results and add comp33elling details with the refinement process. To improve the diversity of the synthesized images and stabilize the training of the conditional-GAN, we introduce a novel Conditioning Augmentation technique that encourages smoothness in the latent conditioning manifold. Extensive experiments and comparisons with state-of-the-art on benchmark datasets demonstrate that the proposed method achieves significant

训练大规模生成式对抗网络用于高保真自然图像合成(big gan)

big gan的提出 Andrew Brock, Jeff Donahue & Karen Simonyan

biggan的摘要

1，基于复杂数据集（如lmageNet）生成高分辨率的多类别图像仍旧是一个非常困难的目标

2，为此，我们训练了现有最大规模的GAN，并研究了这种规模下GAN训练的不稳定性

3.在生成器上应用正交正则化使得它能够进行隐空间的截断，从而可以调节生成器输入的方差，实现了对生成图像保真度和多样性之间平衡的良好控制
4.BigGAN成为了目前类别条件图像生成领域的新SOA模型

5，使用ImageNet进行128× 128分辨率的训练时，BigGAN的1S得分为166.5，FID得分为7.4

Despite recent progress in generative image modeling, successfully generating high-resolution, diverse samples from complex datasets such as ImageNet remains an elusive goal. To this end, we train Generative Adversarial Networks at the largest scale yet attempted, and study the instabilities specific to such scale. We find that applying orthogonal regularization to the generator renders it amenableto a simple "truncation trick.,"allowing fine control over the trade-off between sample fidelity and variety by reducing the variance of the Generator's input. Our modifications lead to models which set the new state of the art in class-conditional image synthesis. When trained on ImageNet at 128 x 128 resolution, our models(BigGANs) achieve an Inception Score (IS) of 166.5 and Fréchet Inception Distance (FID) of 7.4, improving over the previous best IS of 52.52 and FID of 18.65.

生成对抗网络中一种基于样式的生成器架构（StyleGAN）

StyleGAN的提出： Generative Adversarial Networks>Tero Karras, Samuli Laine, Timo Aila

stylegan的摘要：

1，从风格迁移的研究中进行借鉴，提出了GAN的新生成器架构

2，可以自动对图像的高级属性（姿态）和随机变化的图像细节（头发）进行无监督的分离

3，可以直观的、按照特定的尺度来控制生成效果

4，在SOA的基础上提升了生成质量，并拥有更好的插值性能，还对隐变量进行了更好的解耦

5，提出了两种新方法来对插值质量和隐变量解耦程度进行定量评价

6，提出了一个新的高多样性高分辨率人脸图像数据集

We propose an alternative generator architecture for generative adversarial nervorks, borrowing from style transfer literature. The new anhitecture leads to an an tomatically learned, unsupervised separation of high-level atributes (e.g. pose and identiry when trained on huuman faces) and stochastic variation in the generated images
(e.g. freckles, hair), and it enables intuitive, scale-specific control of the synthesis. The new generator improves the state-of-the-ar in terns of traditional distribution qualiry metrics, leads to demonstrably better interpolation properties, and also better disentangles the laten factors of variation. To quantify interpolation qualiry and disentanglement, we propose rwo new; automated methods that are applicable to any generator architecture. Finally, we introduce anew; higly varied and high-qualiry dataset of human faces.

网络结构的设计：

1.把隐向量通过卷积神经网络映射到高维向量输入主干网络生成可编辑的图像，每层都加入了随机噪声

图表解读

对输入噪声进行线性变换，输出也会发生改变，用于图像融合

模型的问题

gan的模式崩溃：每次生成器生成一样的样本

gan没有显示表示的Pg(x)

模型的应用

gan的应用

图像生成，图像转换，图像编辑

模型的发展

gan来自于自编码器

latent vector是包含图像表征的向量

涉及的公式

generation_loss 就是生成图像和实际图像的均方误差

latent_loss是生成数据和实际数据分布的KL散度

gan和cgan价值函数对比

pix2pix的目标函数

L1 loss的求法： |ground truth-生成的图像|求期望

模型结构

CGAN

在生成器和判别器分别加入相同的条件输入y

y是什么？条件输入，可以是标签，也可以是来自于其他模块的数据

这种设计有什么用？ cgan可以作为模块插入任意网络

y怎么用？将y作为额外的输入同时输入生成器和判别器

y could be any kind of auxiliary information,such as class labels or data from                         other modalities.We can perform the conditioniing by feeding y into the both the                         discriminator and generator as additional input layer.
                CGAN的网络相对于原始GAN网络并没有变化
                CGAN可以作为一种通用策略嵌入到其它的GAN网络中

模型训练技巧

gan的训练技巧

pix2pix的训练技巧

gan的改进

模型评价方法

1.在相同数据集上训练一个自编码器，然后利用自编码器提取的语义哈希值评价dcgan的生成效果，假如dcgan的生成的语义哈希值和自编码器提取的一样，则视为重复

method 合集

pix2pix推断保留dropout

For our final models,we provide noise only in the form of dropout,applied on several layers of our generator at both training and test time.

有什么用：保证生成图像的随机性

因为初始层的随机噪声z在训练过程中会被忽略，导致网络的条件输入只对应固定的输出

一些经验与发现

1.previous approaches have found it beneficial to mix GAN objective with a more traditional loss,such as L2 distance 一些前人研究已经发现GAN loss和L2 loss结合可以达到一些好的效果

We also explore ths option,using L1 distance rather than L2 as L1 encourages less blurring

我们也探索了这一选项，使用L1 loss比 L2 loss更有利于减少图像的模糊

2.像素级的l1 loss可以很好的捕捉到图像的低频信息，gan的判别器只需要关注高频信息

一些假设与条件近似

如何把图像建模成马尔可夫随机场？

假设在大于一定距离时，像素之间是相互独立的

应用实例：patchgan把图像切成n*n的patch，当像素处于不同的patch的时候，可以假设像素之间是相互独立的

一些模型设计的思路

patch的思想

做法：将N*N的图片分成若干个patch

缺陷：丢失图片的语义信息

应用：pix2pix;patchgan

优势：解除了输入图像大小的限制

一些图像质量评价方式（IQA）

Amazon Mechanical Turk（AMT）
任务：地图生成，航拍照片生成，图像上色

限制观看时间，每张图像停留一秒钟，答题时间不限每次评测只针对一个算法，包含50张图像前10张图像为练习题，答题后提供反馈，后40张为正式标注每批评测数据由50个标注者标注，每个评测者只能参与一次评测评测不包含测验环节

FCN-score
判断图像的类别是否能被模型识别出来，Inception Score
使用应用于语义分割任务的流行网络结构FCN-8s，并在cityscapes数据集上进行
根据网络分类的精度，来对图像的质量进，由于图像翻译不太关注生成图像的多样性不需要像Inception Score一样关注总体像的分布

recent works have tried using pre-trained semantic classifiers to measure the discriminability of the generated stimuli as a pseudo-metric

我们使用FCN 8s 观察图像的分类精度来评价图像的生成质量

we adopt the popilar FCN-8s architecture for semantiic segmentation,and train it on the cityscapes dataset.We then score synthesized photos by the classification accuracy against

the labels these photos werre synthesized from.

研究成果及意义

涉及的数据集

LSUN（Large-scale Scene Understanding）
加州大学伯克利分校发布，包含10个场景类别和20个对象类别，主要包含了卧室、客厅、教室等场景图像，共计约100万张标记图像
http://lsun.cs.princeton.edu/2017/
SVHN（Street View House Numbers）
街景门牌号码数据集，与MNIST数据集类似，但具有更多标签数据（超过600，000个图像）
从谷歌街景中收集得到
http://ufldl.stanford.edu/housenumbers/

CMP Facade Database由捷克理工大学的机器感知中心（CMP）发布，包含606张建筑正面的校正图像，来自世界各地的不同城市，包含12类语义分割标注
http://cmp.felk.cvut.cz/-tylecr1/facade/
Paris StreetView Dataset由牛津大学发布，包含6412张从Flickr上下载的包含巴黎标志性建筑的街景图像http://wwww.robots.ox.ac.uk/-vgg/data/parisbuildings/
Cityscapes Dataset由德国三个研究机构联合发布的城市景观数据集，拥有5000张带语义理解标注的城市街景图像httos://www.citvyscapes-dataset.com/

FACES数据集

从DBpedia上获取人名，并保证他们都是当代人用这些人名在网络上搜索，收集其中包含人脸的图像，得到了来自1万人的300万张图像使用OpenCV的人脸检测算法，截取筛选出较高分辨率的人脸，最终得到了大约35万张人脸图像

你可能感兴趣的:(gan3小时速成,计算机视觉,图像处理,opencv)

【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
20.XLD轮廓 Echo`` Halcon系统化学习计算机视觉人工智能算法
目录1.xld概念2.画轮廓3.区域转轮廓4.边缘提取算子5.xld特征提取6.提取任意线条7.提取最长的线条8.xld分割10.xld合并11.xld拟合12.xld几何变换13.xld变换14.xld集合运算15.区域和轮廓精度16.轮廓的保存读取17.halcon操作CAD文件18.轮廓测量算子19.同心度计算1.xld概念*图像处理*1.处理对象HObject*1.图像-image*2.区
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分蚝油菜花每日 AI 项目与应用实例 AI编程 git 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花⌨️“每个CLI爱好者都该试试的AI编程革命：对着终端说话自动生成Gitcommit是怎样的体验？”大家好，我是蚝油菜花。如果你也经历过——在vim里卡了半小时，只为给函
【HarmonyOS】鸿蒙应用开发Text控件常见错误
【HarmonyOS】鸿蒙应用开发Text控件常见错误一、前言Text文本控件，是我们应用开发中最为基本和常见使用的控件之一。很多人觉得对于控件的使用已经非常熟悉，一个文本控件，能有什么使用错误呢？其实不然，今天本文，就对于Text常用会导致问题的点进行阐述。二、Text设置字体大小是否可用于百分号？对于初学者最常见的问题之一，就是使用Text的fontSize属性设置字体大小时，传入百分比字符串
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
SOC的工作原理和架构 hao_wujing 安全
大家读完觉得有帮助记得关注和点赞！！！SOC（安全运营中心）是企业安全防御体系的**神经中枢**，通过整合技术、流程和人员，实现**7×24小时安全监控、威胁检测、事件响应及持续改进**。其核心目标是**缩短攻击驻留时间（MTTD/MTTR）**，将碎片化的安全数据转化为可行动的防御策略。以下是SOC的工作原理与架构深度解析：---###**一、SOC的核心工作原理**####**1.安全数据全域
Pillow 安装使用教程小奇JAVA面试安装使用教程 pillow microsoft 深度学习
一、Pillow简介Pillow是Python图像处理库PIL（PythonImagingLibrary）的友好分支，是图像处理的事实标准。它支持打开、编辑、转换、保存多种图像格式，常用于图像批量处理、验证码识别、缩略图生成等应用场景。二、安装Pillow2.1使用pip安装（推荐）pipinstallPillow2.2验证安装importPILprint(PIL.__version__)若无报错
Coze智能体开发：如何批量生成和处理图片王国平 Coze AI Agent智能体开发语言模型人工智能开发语言智能体 Agent
在绘本制作、图片后期制作等场景中，往往需要使用模型来批量生成和处理图片。扣子提供了多个图像处理类节点，支持图像生成、添加水印、画质优化等多种常见的图片处理方式，你可以在批处理节点中嵌套图像生成等图像处理节点，实现图片的批量操作。本文档以绘本制作工作流为例，演示如何通过批处理节点和图像节点实现图像的批量生成和批量处理。效果演示通过绘本制作工作流，你可以批量生成类似以下风格的图片。搭建过程中你也可以根
相机位姿估计：基于四个特征点的精准姿态解算童嘉航Denley
相机位姿估计：基于四个特征点的精准姿态解算【下载地址】相机位姿估计1根据四个特征点估计相机姿态随文Demo本资源文件提供了一个基于OpenCV的相机位姿估计Demo，主要功能是根据四个特征点来估计相机的姿态。通过该Demo，您可以学习如何使用OpenCV库中的相关函数来实现相机位姿的估计项目地址:https://gitcode.com/open-source-toolkit/df72a项目介绍在计
OpenCV教程——图像模糊。均值模糊，高斯模糊，中值模糊，双边模糊，高斯分布
1.图像模糊图像模糊是图像处理中最简单和常用的操作之一。⚠️使用该操作的原因之一是为了给图像预处理时降低噪声。图像模糊操作背后是数学的卷积计算。卷积操作的原理：常用的图像模糊的方法：均值模糊高斯模糊中值模糊双边模糊这四种模糊方式有时也被称为：均值滤波、高斯滤波、中值滤波和双边滤波。因为模糊属于一种滤波操作，具体关系可参照下图：其中，均值滤波、高斯滤波和中值滤波属于线性滤波；而双边滤波属于非线性滤波
垂起固定翼无人机应用及技术分析云卓SKYDROID 无人机云卓科技科技科普高科技
一、主要应用行业1.能源基础设施巡检电力巡检：适用于超高压输电线路通道的快速巡查，实时回传数据提升智能运检效率。油田管道监测：利用长航时特性（1.5-2小时）对大范围管道进行隐患排查，减少人力巡查成本。2.测绘与地理信息在山区、丘陵等复杂地形实现高精度航测，克服传统固定翼需跑道的限制。单架次可完成200平方公里区域的测绘任务，效率较旋翼机提升3倍以上。3.森林与生态监管通过热红外载荷监测林火隐患，
Angular v20版本正式发布 xiangzhihong8 前端 angular.js 前端 javascript
过去几年对Angular来说很具变革性，我们推出了像Signals这样的反应性功能和Zoneless应用的强大能力。我们希望这些功能可以帮助Angular社区构建下一代的Web应用，实现快速上市和强大的性能。我们的旅程才刚刚开始！Angularv20是最新的发布版本，我们花费了无数个小时打磨一些正在进行中的功能，以便于为你提供健壮的开发体验。其中，值得关注的亮点包括：稳定API，如effect、l
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
五天速成C++-----第五天别睡了. 五天速成C++c++开发语言算法
面向对象核心1.继承定义：在已存在类的基础上，创建新的类。会拥有原有类的一些特性。通常会在原有类基础上做修改和增加操作。已经存在的类成为父类或基类新创建的类称为子类或派生类#includeusingnamespacestd;classFather{public:stringfirst_name="李";voidwork(){coutusingnamespacestd;classFather{pub
创客匠人视角下：创始人 IP 如何通过内容运营实现知识变现的冷启动创小匠 tcp/ip 内容运营网络协议
知识付费创业的冷启动阶段，如何快速建立IP影响力并实现用户积累，是创业者面临的首要挑战。创客匠人服务的慈航德教育从0-1入局家庭教育赛道，单月拓客1.6万+的实践，揭示了创始人IP通过内容运营驱动知识变现的底层逻辑。视频号作为IP冷启动的核心阵地，其运营本质是价值观的持续输出。陈向杰老师通过840期连续直播（日均2小时），将“慈祥之心+明确方向+立德树人”的IP理念拆解为具体的育儿干货、案例解析与
二、OpenCV的第一个程序
文章目录一、第一个程序：显示图片1.1cv::imread1.2cv::namedWindow1.3cv::imshow二、第二个程序：视频2.1cv::VideoCapture三、加入了滑动条的基本浏览窗口一、第一个程序：显示图片示例：一个简单的加载并显示图像的OpenCV程序#include#include"./opencv2/opencv.hpp"intmain(){cv::Matimage
20个高级DeepSeek指令，帮助你提升200%工作效率，建议收藏！资源客 DeepSeek指令
前两天我帮一个做产品的朋友优化了几个提示词，结果花2小时就完成了原本需要一整天的竞品分析报告。他当时就愣了，说："我之前怎么没想到可以这样用？"其实DeepSeek最大的价值不是给你标准答案，而是成为你的思维伙伴。关键就在于你怎么"提问"。今天我把这段时间总结的20个高效提示词分享出来，都是我在实际工作中反复验证过的。如果你能熟练运用其中的5-6个，保证你的工作效率至少提升2倍。深度思考场景：让A
线性代数在图像处理中的应用 --- 纳尼? 2D的高斯核可以通过1D的高斯核直接生成？（秩为1的矩阵）松下J27 Linear Algebra 线性代数图像处理人工智能
二维高斯核，Rank秩等于一的矩阵之前，我在学习图像处理的时候，会经常用到Gaussianblur，也就是二维高斯低通滤波。当时用的都是Matlab中，现成的图像处理库。只需要输入sigma和kernelsize这些参数就行了，完全不需要考虑高斯核中的每个点长啥样。虽然教科书里面也会有一些配图，例如：直到后来，我学习高斯图像金字塔的时候发现，在别人的代码里面，他在生成二维高斯核的时候，并不是直接写
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
当我的代码评审开始 “AI 打工”：聊聊这个让我摸鱼更心安的神器 Honesty861024 ci/cd ai git
作为一个每天和代码打交道的打工人，最头疼的莫过于提完MR后漫长的等待——reviewer可能在开会、可能在改bug、可能在摸鱼，而你的代码只能在“进行中”状态里默默吃灰。更惨的是偶尔遇到“人工漏检”，上线后发现奇奇怪怪的bug，只能对着屏幕疯狂道歉：“这锅我背，下次一定仔细查！”直到我发现了这个藏在云效里的神器——yunxiao-LLM-reviewer，现在我的MR终于有了一个24小时在线的“A
Apple SoC 图像 ISP 与 Neural Engine 联合优化案例分析：性能与质量平衡的实战经验观熵影像技术全景图谱：架构调优与实战接口隔离原则影像 Camera
AppleSoC图像ISP与NeuralEngine联合优化案例分析：性能与质量平衡的实战经验关键词：AppleSoC、ISP优化、NeuralEngine协同、图像处理性能、DeepFusion、SmartHDR、实时推理、多核异构计算、功耗管理摘要：随着图像计算复杂度的不断提升，AppleSoC中的ISP与NeuralEngine（NE）联合优化成为提升拍照性能和图像质量的关键路径。本文结合最
Chapter6: ISP架构和处理模块-之-ISP模块 ifuleyou1668 Camera QC android
高通（Qualcomm）图像信号处理器（ISP）是摄像头系统中的核心组件，用于实时处理从摄像头传感器获取的图像数据。高通ISP包含多个模块，每个模块负责一部分图像处理任务。以下是高通CameraISP中常见的一些关键模块：1.RawDataInputInterfaceSensorInterface:接受来自摄像头传感器的原始数据，一般通过MIPICSI-2接口。2.LensShadingCorre
hive中2种常用的join方式潘达斯奈基~ 大数据 hive hadoop 数据仓库
在最近的项目代码review中，发现之前代码小表关联大表的业务，小表经过过滤后，数据只有400多条，而大表有1600万条，之前的逻辑是使用的是小表join大表，运行时间1小时12分钟；经过优化后，使用了mapjoin的方式，将小表放到内存中，运行时间7分钟。借此机会回顾下hive中2种常用的join方式：MapJoin、ReduceJoin（也叫CommonJoin）应对场景：MapJoin：适用
内嵌式触摸显示器在工业视觉设备中的应用 Jwest2021 计算机外设
内嵌式触摸显示器在工业视觉设备中的应用日益广泛，其重要性不容忽视。以下是对内嵌式触摸显示器在工业视觉设备中应用的具体分析：一、应用背景工业视觉设备是智能制造的重要组成部分，它依赖于先进的图像处理和机器视觉技术，实现对生产线上产品质量的自动化检测和控制。随着工业4.0和智能制造的推进，工业视觉设备在生产线上的作用愈发关键。而内嵌式触摸显示器作为人机交互的重要界面，为工业视觉设备提供了直观、便捷的操作
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
加载properties文件username取不到值 bigStone. 问题总结 properties username properties配置文件
今天把Git上的项目（SSH整合）换台电脑Pull下来。竟然启动不了。在自己本上可以跑，换台电脑就不行了？各种报错，反正就是启动不来。错误信息不做展示了，三个小时后定位到错误位置为applicationContext.xml中加载外部jdbc.properties文件出错。jdbc.properties文件：jdbcUrl=jdbc:mysql://localhost:3306/hello
渲染到天亮？你的电脑在哭泣！告别卡顿，RenderG 让你下班自由！ Bar_artist 图形渲染云渲染
还记得屏幕右下角那个缓慢蠕动的进度条吗？它吞噬的不仅是时间，更是你的精力、灵感，甚至是对这份热爱的耐心。当窗外天色渐亮，机箱风扇还在发出不堪重负的嘶吼，仿佛在无声地抗议——它真的快撑不住了。而你，盯着屏幕上那还差“最后一点点”的渲染帧，揉着发酸的眼睛，心里盘算着：是再等一小时，还是干脆睡在公司？这场景，是不是熟悉得令人心酸？我们懂，每一个深夜的渲染等待，都是一次与耐心和效率的拉锯战。本地电脑，是我
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少