PandaDreamer

【阅读笔记】In-Domain GAN Inversion for Real Image Editing

论文名称：In-Domain GAN Inversion for Real Image Editing

论文作者：Jiapeng Zhu, Yujun Shen, Deli Zhao, Bolei Zhou

发行时间：Submitted on 31 Mar 2020, last revised 11 May 2020

论文地址：https://arxiv.org/abs/2004.00049

代码开源：https://github.com/genforce/idinvert

一. 概要
二. In-Domain GAN Inversion
- 2.1. 模型说明
  - 2.1.1. 符号说明
  - 2.1.2. 潜在空间的选择
- 2.2. Domain-Guided Encoder
- 2.3. Domain-Regularized Optimization
三. 实验
- 3.1. 反演图像的质量和速度
- 3.2. 真实图像编辑
  - 3.2.1. Image Interpolation
  - 3.2.2. Semantic Manipulation
  - 3.2.3. Semantic Diffusion
- 3.3. 消融实验

一. 概要

本文首次提出同时对重构图像的潜在空间的语义级和目标函数的像素级进行考虑，而不像传统方法那样（只关注像素级）无法将反演的潜码定位到原始潜在空间的语义域上。即提出了 in-domain GAN inversion 的方法，具体实现如下：

首先对 domain-guided encoder 进行训练，来将输入图像映射成 GANs 潜在空间的潜在编码。
再使用 domain-regularized optimization 来对编码器得到的潜在编码进行微调来确保产生的潜在编码在语义域内。

二. In-Domain GAN Inversion

【阅读笔记】In-Domain GAN Inversion for Real Image Editing_第1张图片

2.1. 模型说明

2.1.1. 符号说明

GAN 模型：

生成器 $G(\cdot):\mathcal{Z}\to\mathcal{X}$ ，将潜在编码生成为高分辨率的图像。
辨别器 $D(\cdot)$ ，判断合成图像的真伪。

GAN inversion 方法是学习生成器 $G(\cdot)$ 的逆映射，即能找到一个最佳潜在编码 $z^{inv}$ 来恢复给定的真实图像 $x^{real}$ 。文中将 GAN 学到的语义空间定义为 $\mathcal{S}$ 。期望 $z^{inv}$ 能通预训练好的 GAN 的先验知识 $S$ 保持一致。

2.1.2. 潜在空间的选择

本文选择的是在 StyleGAN 中的 $\mathcal{W}$ 空间，只是为了方便起见，后续仍然使用 $z$ 来表示潜在编码。

选择的理由：

更加关注语义信息。
性能更佳。
引入比较简单。

2.2. Domain-Guided Encoder

上图便是传统的编码器架构，从潜在空间 $\mathcal{Z}$ 中随机采样出一些潜在编码 $z^{sam}$ ，然后将其输入生成器 $G(\cdot)$ 中来得到相对应的合成图像 $x^{syn}$ 。之后编码器就会采用 $x^{syn}$ 作为输入，在 $z^{sam}$ 的监督下进行训练来得到最终的潜在编码 $z^{enc}$ 。损失函数如下所示：
$\mathop{\min}\limits_{\Theta_E}\mathcal{L}_{E}=||z^{sam}-E(G(z^{sam}))||_2$

其中， $||\cdot||_2$ 表示 $l_2$ 距离， $\Theta_E$ 表示编码器 $E(\cdot)$ 的参数。文中认为，仅仅对 $z^{sam}$ 进行监督来实现的重构五注意得到一个准确的编码器，而且这种方法并没有考虑生成器 $G(\cdot)$ 的梯度，相当于生成器的内部知识没有被考虑进去，无法提供生成器的领域知识来指导编码器的训练。作者提出的解决方法如下图所示。

区别于传统编码器：

编码器的输出将作为生成器的输入，这样我们的目标函数的参数将来源于图像空间而不是潜在空间。其涉及到在训练阶段中生成器的语义知识，并提供准确的监督和更多的信息，保证输出编码与生成器的语义域保持一致。
我们的编码器直接使用真实图像进行训练，而不是传统的使用合成图像训练。因为通常都是对真实图像进行图像操纵，显然我们的这种方法更加适用。
在训练过程中固定预训练好的生成器，而让判别器和编码器同时进行对抗式训练。这样可以从 GAN 模型中获取更多的信息，同时确保输入的编码在语义上尽可能和生成器一致。

对应，我们训练过程中的目标函数如下所示：
$\mathop{\min}\limits_{\Theta_E}\mathcal{L}_{E} = ||x^{real}-G(E(x^{real}))||_2+\lambda_1||F(x^{real})-F(G(E(x^{real})))||_2-\lambda_2\mathop{\mathbb{E}}\limits_{x^{real}\sim P_{data}}[D(G(E(x^{real})))]$

$\mathop{\min}\limits_{\Theta_D}\mathcal{L}_{D} = \mathop{\mathbb{E}}\limits_{x^{real}\sim P_{data}}[D(G(E(x^{real})))]-\mathop{\mathbb{E}}\limits_{x^{real}\sim P_{data}}[D(x^{real})]+\frac{\gamma}{2}\mathop{\mathbb{E}}\limits_{x^{real}\sim P_{data}}[||\triangledown _xD(x^{real})||_2^2]$

其中， $P_{data}$ 表示真实数据的概率分布。 $\gamma$ 表示梯度正则化的超参数，实验里取值为 $10$ 。 $\lambda_1$ 和 $\lambda_2$ 为损失权重来平衡不同函数部分，实验中对应的取值为 $5e^{-5}$ 和 $0.1$ 。 $F(\cdot)$ 表示 VGG 特征提取模块（conv4_3），这通常用来计算 perceptual-loss。这一训练步骤主要是对编码器和辨别器的参数进行更新，训练完毕后，编码器就能直接将输入的图像编码成较合适的潜在编码。

2.3. Domain-Regularized Optimization

尽管我们提出的编码器产生的潜在编码能够很好的重构目标图像，也确保了其编码语义性是有意义的，但仍然需要用 Domain-Regularized Optimization 来微调编码使其更好拟合目标函数的像素值。简而言之，本文提出一种优化方案来对编码器产生的潜在编码再次进行微调，来使得重构的结果更加精准。

如上图所示，不同于传统的自由地优化方案，文中提出的优化方案对潜在编码的反推进行了限制。Domain-Regularized Optimization 主要有两个改进点：

使用本文提出的编码器的输出的潜在编码作为优化起点，这样可以避免潜在编码陷入局部最小值，并且显著缩短优化过程。
将 Domain-Guided Encoder 作为正则化器，将潜在编码保留在生成器的语义域内。

对应目标函数为：
$z^{inv}=\arg\mathop{\min}\limits_{z}||x-G(z)||_2+\lambda_3||F(x)-F(G(z))||_2+\lambda_4||z-E(G(z))||_2$
其中， $x$ 表示待反转的目标函数， $\lambda_3$ 和 $\lambda_4$ 为损失权重，实验中对应的取值为 $5e^{-5}$ 和 $2$ 。

三. 实验

3.1. 反演图像的质量和速度

将文中提出的方法同一些其他的 GAN inversion 进行比较。具体比对有：

传统：
- traditional encoder
- MSE-based optimization：Image2StyleGAN
本文提出的方法：
- Domain-Guided Encoder（不包含Domain-Regularized Optimization）
- In-Domain Inversion（包含Domain-Regularized Optimization）

定性结果如下图所示，可见本文提出的编码器在映射有较大的优势，同时，完整的算法(e)的效果最好：

定量分析如下表所示，可见我们的方法不但快速，而且具有更好的重建结果：

3.2. 真实图像编辑

文中分别对3种图像编辑任务进行了评估：

image interpolation：两种图像之间插值得到新图像
semantic image manipulation：通过操纵图像的某一种或多种语义来得到新的图像
semantic image diffusion：将目标图中最具代表性的区域扩散到另一幅图像的上下文中，并保持对应区域不变。

3.2.1. Image Interpolation

图像插值的本质是对潜在编码进行语义插值：
$\lambda z_1 + (1-\lambda)z_2$
显然，这种插值产生的语义变换是连续的。文中将之前的 SOTA：Image2StyleGAN 和作者提出的 in-domain inversion 方法进行了比较，如下图所示，显然作者提出的方法产生的人脸图像更加的平滑，产生的塔图像更加的清晰也没有那么多的伪影。

定量分析结果如下表所示，新方法的效果远远超过了之前的SOTA方法：

【阅读笔记】In-Domain GAN Inversion for Real Image Editing_第6张图片

3.2.2. Semantic Manipulation

从 InterFaceGAN中可得知，二元语义之间存在一边界，详细介绍可见链接。重点是可以利用线性变换来对潜码进行处理。即：
$x^{edit}=G(z^{inv}+\alpha n)$
这里的 $n$ 其实就是潜在空间中特定语义所对应的法向量，具体是通过 SVM 对样本进行分类来得到对应的边界，然后就能得到一法向量，再对其归一化便得到了 $n$ 。而 $\alpha$ 便是操纵的程度。换句话说，如果潜在代码向这个方向移动，则输出图像中包含的语义应该相应地有所变化。

首先看对人脸的定性分析，如上图所示。Image2StyleGAN 在操纵眼镜属性时并没有成功添加眼镜，反而影响了头发，而作者提供的方法则成功了。Image2StyleGAN 处理后女演员的脖子变得较模糊。

再看对塔的定性分析，如上图所示，作者提出的 in-domain 方法在减少或增加语义上，产生的效果都超过了基于 MSE 优化的方法。这里还有一个有趣的现象，在上图的最后一行，in-domain 方法产生的结果忽略了红色的巴士，这很好的说明了我们模型的语义性，即巴士这一对象不在塔合成模型的语义域中，所以不会生成它。

定量分析结果如下表所示，从所有的评估指标来看作者提出的方法都优于 Image2StyleGAN：

【阅读笔记】In-Domain GAN Inversion for Real Image Editing_第7张图片

3.2.3. Semantic Diffusion

语义扩散的目标是将目标图中最具代表性的区域扩散到另一幅图像的上下文中。即融合结果在适应上下文变化的同时还能保持目标图像的特征不变。

【阅读笔记】In-Domain GAN Inversion for Real Image Editing_第8张图片

上图展示了一些成功语义扩散的效果图，可以看到该算法较好地保持了目标人脸的身份，即图像的中心区域同目标图像完全相同，而且合理地融合了不同的环境。

【阅读笔记】In-Domain GAN Inversion for Real Image Editing_第9张图片

为了更好的理解语义扩散，文中还展示了这一操作的中间结果，如上图所示。进行语义扩散的实现步骤如下所示：

从目标图像中crop出所需要的部分，将这部分patch粘贴到对应的上下文图像上。
将粘贴后的图像输入 In-Domain 编码器中得到潜在编码，便完成了潜在编码的初始化。
使用 Masked Optimization 对潜在编码进行refine，即只使用目标图像的前景区域进行重构损失 $L=||Mask(x)-Mask(G(z))||_2+\lambda_3||F(Mask(x))-F(Mask(G(z)))||_2$ 的计算：
- $x$ 是真实图像
- $z$ 是前一阶段得到的潜码
- 这里的 $Mask(\cdot)$ 指仅保留patch中的内容，其他位置上像素的值则用 $0$ 填充。

从上图的中间结果可得知如下三点：

In-Domain 编码器的输出总是会重建一个有意义的脸，并保持大多数语义的输入(例如，性别和头发)。这是因为我们的编码器产生的所有编码都在语义域内。
掩码优化这一方法能够保留目标人脸的身份信息，并进一步将其风格(如肤色)运用到周围环境中，实现无缝融合。其不改变中间 patch的内容，仅仅影响从编码器初始化所继承的上下文样式(例如发型)。换句话说，只使用前景patch作为参考，周围环境将自编码器初始化开始自适应地改变
Image2StyleGAN 在语义扩散任务中无法生成语义上有意义的脸部（脸部边界不平滑），因为其只关注像素值而不在意语义信息。

【阅读笔记】In-Domain GAN Inversion for Real Image Editing_第11张图片

影响语义扩散任务的一个重要因素是 patch 的大小。作者做了一系列大小的实验，实验结果如上图所示。显然，patch块越大，身份信息保存的更好。

3.3. 消融实验

【阅读笔记】In-Domain GAN Inversion for Real Image Editing_第12张图片

本文在这一部分对 in-domain inversion 进行了分析。即通过更改 $\lambda_4$ 的取值来研究 Domain-Guided 编码器在优化过程中起到的作用。

上图便是 $\lambda_4=0,2,40$ 所产生的效果：重构图像的质量和编辑图像的质量之间的权衡。**较大的 $\lambda_4$ 会使优化偏向于域约束，从而使得得到的潜在编码在语义上更有意义。不过过大的代价是目标图像不能理想地恢复每个像素上的值。**因此，实验中 $\lambda_4=2$ 。

vue3中el-table中点击图片放大时，被表格覆盖叫我小鹏呀 vue.js javascript 前端
问题：vue3中el-table中点击图片放大时，被表格覆盖。解决方法：el-image添加preview-teleported
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
matlab mle 优化,MLE+: Matlab Toolbox for Integrated Modeling, Control and Optimization for Buildings... Simon Zhong matlab mle 优化
摘要：FollowingunilateralopticnervesectioninadultPVGhoodedrat,theaxonguidancecueephrin-A2isup-regulatedincaudalbutnotrostralsuperiorcolliculus(SC)andtheEphA5receptorisdown-regulatedinaxotomisedretinalgan
详解：如何设计出健壮的秒杀系统？夜空_2cd3
作者：Yrion博客园：cnblogs.com/wyq178/p/11261711.html前言：秒杀系统相信很多人见过，比如京东或者淘宝的秒杀，小米手机的秒杀。那么秒杀系统的后台是如何实现的呢？我们如何设计一个秒杀系统呢？对于秒杀系统应该考虑哪些问题？如何设计出健壮的秒杀系统？本期我们就来探讨一下这个问题：image目录一：****秒杀系统应该考虑的问题二：****秒杀系统的设计和技术方案三：*
2020年学习什么知识比较好？互联网行业依然是发展较佳编程仔
2019年余额已不足，不少职场人心里也在盘点这一年的工作得失，琢磨新一年的奋斗策略，是继续冲刺还是换个跑道？今年跳槽更难吗？image互联网行业一直以相对较丰厚的薪酬和广阔的发展前景吸引着各界人才。但最近，互联网行业寒冬、互联网企业裁员等话题再次引起热议。正在从前些年的高速发展期转向发展调整期的互联网行业真的步入了“寒冬”？该行业依旧具有吸引力吗？什么职位又最热门呢？image互联网行业仍保持较高
[Swift]LeetCode767. 重构字符串 | Reorganize String weixin_30591551 swift runtime
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号：山青咏芝（shanqingyongzhi）➤博客园地址：山青咏芝（https://www.cnblogs.com/strengthen/）➤GitHub地址：https://github.com/strengthen/LeetCode➤原文地址：https://www.cnblogs.com/streng
uniapp使用内置地图选择插件，实现地址选择并在地图上标点神夜大侠 Uniapp vue.js uniapp
uniapp使用内置地图选择插件，实现地址选择并在地图上标点代码如下：page{background:#F4F5F6;}::-webkit-scrollbar{width:0;height:0;color:transparent;}page{height:100%;width:100%;font-size:24rpx;}image,view,input,textarea,label,text,na
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
idea使用自定义checkstyle.xml配置文件 Gemkey
1.下载插件image.png2.插件安装完后,找到设置中的checkstyle,点击"+",新增自定义规则image.png3.输入描述信息,点击Browse找到对应的文件image.pngimage.png4.可以把active勾上,则使用默认校验规则,点击OK,则可以开始使用自定义规则检测单个文件了image.png
Ubuntu Juju 与 Ansible的区别 xidianjiapei001 #Kubernetes ubuntu ansible linux 云原生 Juju
JujuandAnsiblearebothpowerfultoolsusedformanagingandorchestratingITinfrastructureandapplications,buttheyhavedifferentapproachesandusecases.Here’sabreakdownofthekeydifferencesbetweenthem:1.ConceptualFo
使用input[type=file]遇上的一些问题刘圣凯
项目遇到一个需要，如下image.png功能大致就是添加图片，展示出来，然后在用户点击提交的时候把图片传给后台，在和后台交涉之后，决定在用户选择图片之后转成formdata传给后台，后台返回一个url，提交的时候将url返回给后台/**转formdata*/varformdata=newFormData();formdata.append("file1",$("#pic")[0].files[0]
2005年高考英语北京卷 - 阅读理解C 让文字更美
Howcouldwepossiblythinkthatkeepinganimalsincagesinunnaturalenvironments-mostlyforentertainmentpurposes-isfairandrespectful?我们怎么可能认为把动物关在非自然环境的笼子里——主要是为了娱乐目的——是公平和尊重的呢？Zooofficialssaytheyareconcernedab
ComfyUI AnimateDiff-Lightning 教程 jayli517 ComfyUI AIGC
介绍项目主页：https://huggingface.co/ByteDance/AnimateDiff-Lightning在线测试（有墙）：https://huggingface.co/spaces/ByteDance/AnimateDiff-Lightning国内镜像：https://hf-mirror.com/ByteDance/AnimateDiff-LightningAnimateDiff
【代码模板】可视化 xuanyu22 SOP opencv 计算机视觉人工智能
PillowDocumentdataformat-(H,W,C),RGBdatadtype-np.uint8valuerange-(0,255)fromPILimportImage#Readimagesimg=Image.open("img.png").convert('RGB')#读取RGB图像img=Image.open("img.png").convert('L')#读取灰度图像(H,W)u
uniapp实现IM即时通讯仿微信聊天功能即构开发者
本文介绍如何基于UNIAPP使用即时通讯SDKZIMSDK快速实现基本的消息收发功能。1uniappim即时通讯功能方案介绍即时通讯SDKZIMSDK提供了如下接入方案：image.png在此方案中，您需要通过您自己的业务系统实现以下业务逻辑：搭建客户端的用户管理逻辑，并下发用户ID用于客户端登录。鉴权Token，建议由您的业务后台自行实现，保证鉴权数据安全。uni-appSDK是一个基于原生iO
利用Python+OpenCV实现截图匹配图像，支持自适应缩放、灰度匹配、区域匹配、匹配多个结果 xu-jssy Python自动化脚本 python opencv 开发语言图像处理自动化
可以直接通过pip获取，无需手动安装其他依赖pipinstallxug示例：importxugxug.find_image_on_screen(,,,)=========================================================================一、依赖安装pipinstallopencv-pythonpipinstallpyautogui二、获
VITS 源码解析2-模型概述迪三 #NN_Audio 音频人工智能
VITs是文本到语音(Text-to-Speech,TTS)任务中最流行的技术之一，其实现思路是将文本语音信息融合到了HiFiGAN潜空间内,通过文本控制HiFiGAN的生成器，输出含文本语义的声音。VITs主要以GAN的方式训练,其生成器G是SynthesizerTrn，判别器D是MPD。VITS的判别器几乎和HiFiGAN一样，生成器则融合了文本、时序、声音三大类模型1.文件概述模型部分包含三
解决BERT模型bert-base-chinese报错（无法自动联网下载）搬砖修狗 bert 人工智能深度学习 python
一、下载问题hugging-face是访问BERT模型的最初网站，但是目前hugging-face在中国多地不可达，在代码中涉及到该网站的模型都会报错，本文我们就以bert-base-chinese报错为例，提供一个下载到本地的方法来解决问题。二、网站google-bert(BERTcommunity)Thisorganizationismaintainedbythetransformerstea
测试平台系列(24) 编写成员管理功能米洛丶
回顾上一节我们编写了项目设置相关功能，还剩下2个tab没有编写，分别是:用例列表和成员管理.编写成员列表及部分接口添加成员搜索成员编辑成员删除成员今天因为时间关系就不展示删除成员了，只编写编辑/新增成员接口和页面。编写新增/编辑角色的方法由于之前我们已经编辑过新增角色的方法了，但是需要修改一点:image这里角色的筛选条件不能加上，为什么呢？因为加上的话，我可以创建同一个user_id的不同角色，
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
Swift4.0: 利用图形上下文画基础图? Dayu大鱼
步骤:开启图片上下文获取上下文配置上下文3.1填充颜色cgColor3.2填充尺寸从图形上下文中获取图片关闭上下文返回图片importFoundationimportUIKitextensionUIImage{///画一个白色背景的图片classfuncimageWithWhiteBackGroundColor()->UIImage{//开始图形上下文UIGraphicsBeginImageCon
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
python-opencv cv2.findContours()函数 fjswcjswzy opencv python笔记 python opencv
示例代码：image,contours,hierarchy=cv2.findContours(contour,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)输入：contour：带有轮廓信息的图像；cv2.RETR_TREE：提取轮廓后，输出轮廓信息的组织形式，除了cv2.RETR_TREE还有以下几种选项：cv2.RETR_EXTERNAL：输出轮廓中只有外侧轮廓信
Quartus II SDC文件建立流程 cattao1989 verilog
QuartusIISDC文件编写教程第一步：打开TimeQuestTimingAnalyzer，也可以点击图中1所示图标。第二步：点击Netlist,点击CreateTimingNetlist第三步：按照下图所示选择。
Quartus sdc UI界面设置（二）落雨无风 IC设计 fpga fpga开发
Quartussdc设置根据一配置quartus综合简单流程（一）上次文章中，说了自己写sdc需要配置的分类点，这次将说明在UI界面配置sdc。1.在Quartus软件中，导入verilog设计之后，打开Tools/TimeQuestTimingAnalyzer界面大致分为上下两部分，上半部分左侧显示Report、Tasks，右侧显示欢迎界面；下半部分显示Console和History，此处缺图，
react里的index.js是怎么跟index.html结合起来的? SherrinfordL
image.pngcreate-react-app把webpack、babel等配置都封装到了依赖项目react-script中，所以你无法直观的看到这些配置。你可以在项目下运行npmruneject，被隐藏的配置文件就会暴露到项目根路径下。把请求转发到index.html原因是，你执行npmrunstart时，启动的webpack-dev-server，会加载react-script项目conf
【拖拽】自定义拖拽图标风露_
一、知识点设置被拖拽的元素draggable为true(HTML5新特性)关键方法：voiddataTransfer.setDragImage(img,xOffset,yOffset);注意点：Note:Ifthe[Element]isanexisting[HTMLElement],itneedstobevisibleintheviewportinordertobeshownasadragfeed
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts