一蓑烟雨渡平生

EraseNet: End-to-End Text Removal in the Wild 端到端的文本删除网络

EraseNet: End-to-End Text Removal in the Wild
端到端的文本删除网络：EraseNet

环境配置:

pip3 install torch===1.3.1 torchvision===0.4.2 -f https://download.pytorch.org/whl/torch_stable.html

摘要：
场景文本擦除技术在隐私保护、基于摄像头的虚拟显示翻译和图像编辑等方面的应用越来越受到人们的关注。然而，现有的方法在实际应用中存在不足，主要是因为它们是在合成或非代表性数据集上进行评估的，为了填补这一空白，促进这一研究方向，本文提出了一个名为SCUT-EnsText的真实数据集，该数据集由公共场景文本阅读基准中3562幅不同的图像组成，每幅图像都经过严格的注释，提供了视觉上可信的擦除目标。利用SCUT-EnsText，作者设计了一种新的基于gan的模型，称为EraseNet，它可以自动的删除位于自然图像上的文本。该模型是一个由coarse-erasure sub-network和refinement sub-network组成的两阶段网络。refinement sub-network的目标是改进特征表示和refinement of the coarse outputs，以提高擦除性能。此外，EraseNet还包含一个用于文本感知的分割头和一个在生成器和判别器上都具有光谱归一化（SN）的local-global SN-Patch-GAN，以保持训练的稳定性和被擦除区域的一致性。在之前的公共数据集和全新的SCUT-EnsText上进行了足够数量的实验。作者的EraseNet在所有指标上都显著优于现有的最先进的方法，具有显著的更高质量的结果。

索引术语：场景文本擦除，隐私保护，GAN

一、介绍：
场景文本是信息传播最重要的媒介之一，包含了大量的个人、私人或者敏感信息，包括地址、身份证号、电话号码。车牌号码等，这些信息经常在场景图像中暴露。这些私人信息很容易被从事欺诈、营销或者其他非法活动的及其获取。为了防止场景文本图像侵犯隐私，可以熟练的使用PS简单地从图片中删除文本。然而，由于场景文本出现的形状【引用论文1】、颜色、字体、方向和背景干扰等多种多样的情况，人工擦除或者涂刷过程可能需要大量的时间。此外，场景文本删除是场景文本编辑【引用论文2】的第一步，如对自然图像进行文本翻译和替换。因此，自然图像中文本的自动擦除成为近年来新兴的研究课题。基本上，端到端场景文本删除方法有三个挑战：
1、这个方法应该能够正确地定位文本内容。不像常见的图像填充方法，提供了一个二值笔划级别的掩码（真值）来指导恢复的位置，端到端场景文本删除方法应该直接对整个图像进行操作，而不需要额外的位置信息。
2、文本内容应该被合理地删除，并以合理的背景填充
3、非文本区域和背景应该保持原来的外观不变。
近几年，许多文本删除方法【引用论文3-8】都取得了显著的进展，然而，它们都是在合成的或小型且不具代表性的真实数据集上训练或验证的。这样的评估结果可能不能正确的反映它们在真实应用程序中的性能。在实际场景中，这些方法可能更糟糕。
为了更好地对场景文本删除方法进行基准测试，作者提出了一个全面的真实世界数据集：SCUT-EnsText。它包含了从公共场景文本读取基准数据集中选择的各种真实图像，包括ICDAR-2013 [9], ICDAR-2015 [10], MS COCO-Text [11],SVT [12], MLT-2017 [13], MLT-2019 [14], and ArTs [15],这些都是由SCUT-CTW1500【16】和Total-Text【17】组成。因此，作者的数据集包含了3562张真实图片，超过21000个文本实例注释。SCUT-EnsText数据集的收集考虑了不同文本类型的多样性，因此包含了所有的现有文本形状、文本方向、文字字体和背景在数据集中有很高的突出度。此外，基于MLT-2019【14】和ArTs【15】，作者考虑了中文和英文。在这些条件下，SCUT-EnsText有足够的信息进行全面的场景文本擦除。对于图像中的文本实例，作者仔细的擦除文本，并用视觉上可信的背景填充文本区域。真值经过注释者的双重检查，以保证其质量。示例如图1所示：

虽然以前的方法【引用论文3-6,8】在这一领域已经取得了显著的进展，但大多数都依赖于文本位置的注释。EnsNet【引用论文17】是在整个图像级别上执行端到端删除文本的第一个方法。然而，仍然存在一些挑战，包括失败的、错误的和不完全的删除。鉴于上述问题，作者受到GAN【18】的启发，提出了一个端到端可训练的框架，称为EraseNet，他可以有效的提高场景文本删除过程的性能。生成网络是一个由粗到精的两阶段网络，带有一个额外的分割头。首先，假设一级U-Net【19】可能缺乏足够的感受野和监督，作者在第一阶段之后级联一个优化子网络来进一步细化之前的输出。这个子网络也是由【20】改进得到的编码器结构，它通过扩大卷积【21】来扩大感受野。为了解决监督不足的问题，作者对这个两阶段的输出都进行了奖惩机制，以符合真值。其次，基于端到端场景文本擦除模型应该感知整个图像中的文本区域的直觉，作者引入了一个分割头来学习表示文本和非文本区域的掩码。此外，在门控卷积（GateConv）【22】的激励下，作者还引入了具有光谱归一化（SN）【23】的local-global SN-Patch-GAN来优化EraseNet,目的是即稳定GAN的训练过程，生成高质量的文本擦除图像。
作者在SCUT-EnsText和【7】中提出的公共合成数据集上进行了充分的实验。定性和定量结果都表明，EraseNet可以超越之前所有的最先进方法。
从直观上来看，场景文本擦除有点类似于图像填充【24-27】，因为两者都要考虑目标区域的恢复。然而，一些差异仍然存在。首先，图像填充在训练和推理阶段输入缺失hole的图像和表示hole位置的掩码，而端到端场景文本擦除在推理阶段只将整个图像作为输入，没有任何位置信息。因此，一个端到端的场景文本擦除网络需要感知文本区域，并决定在哪里擦除自己。其次，图像填充中缺失hole的恢复主要基于周围的纹理，而场景文本擦除中，文本区域的背景是主要目标。为了说明这两个任务的实际差异，作者用最新的图像填充方法进行了对比实验，已验证作者的模型的有效性。
综上所述，本文的贡献如下：
1、作者提出了一个真实的数据集SCUT-EnsText，用于具有高质量注释的场景文本删除。
2、作者提出一个由粗到精的两阶段网络，称为EraseNet，它由一个粗擦除网络和一个精优化网络组成，以提高性能。提出了一个附加的分割头，以帮助更准确地擦除文本区域。
3、作者使用SN-GAN和propose a local-global SN-Patch-GAN 损失来稳定GAN的训练，并加强最终输出的全局和局部一致性。
4、作者统一的生成网络在SCUT-EnsText和之前的合成数据集上获得高质量的文本删除结果。
本文其余部分如下。第二部分介绍场景文本读取基准数据集的相关工作，以及图像绘制和文本擦书技术的发展。第三节描述了拟议的SCUT-EnsText的细节和特点。第四节介绍了作者提出的方法EraseNet。第五节给出了实验结果。最后再第六节得出结论。

二、相关工作
A、场景文本阅读基准
B、自动文本擦除
C、图像填充

三、SCUT-EnsText 数据集
这里面的文本擦除是用PS做的，整个注释过程每张图像花费时间5min-10min。

四、场景文本擦除网络
在本节中，作者介绍提出的端到端场景文本擦除网络，称为EraseNet。首先，作者给出了该方法的整个网络体系结构和整个流程。然后详细介绍了框架的各个部分。最后定义了模型训练的目标函数。整个框架的概述如图6所示。

A、总体架构
FCNs在语义分割领域取得了巨大的成功，而GAN在图像生成和图像翻译中得到广泛的应用。受到这两种模型成功的启发，作者之前的工作EnsNet【7】从cGAN【33】和FCN-ResNet18主干网络修改而来，在端到端场景文本擦除方面取得了相当好的性能。但是，仍然存在一些错误，包括失败的、错误的和不完整的擦除，如图10（e）所示。鉴于上述问题，作者的模型受到传统GAN管道的启发，采用两阶段由粗到精生成网络和全局-局部判别网络设计。该生成器包含粗擦除网络和精擦除网络，使得文本删除过程更加彻底。此外，一个额外的分割头无缝连接，以帮助网络感知文本区域。接下来，将生成的带有文本的图像输入鉴别器网络，然后与真实图像进行区分。此外，作者还引入VGG网络【40】来提取假样本和真值的特征，以惩罚高级语义的差异，作者的网络的整体管道如图6所示。
由于一般GAN的训练不稳定性，【23】中提出一种新的权值归一化技术，称为spectral normalization（SN）。文本提出了一种快速逼近算法（SN-GAN），在判别器中加强Lipschitz约束，并提出了一种新的目标损失训练方法。场景文本擦除的目的是去除文本并在背景以相似且合理的区域内进行绘制，因此作者大致上将场景文本的擦除看做是一个图像到图像的翻译任务和图像的绘制任务的结合。基于SN和之前图像平移和填充【20,22,32】的研究，作者提出一个SN-GAN的改进版本，即local-global SN-Patch-GAN，通过对生成器和判别器进行SN，1）加强最终输出的一致性，2）生成最终的高质量文本擦除图像，3）稳定GAN训练，因此，将卷积层后的批处理归一化替换为SN。最后，作者使用相同的SN-GAN【23】的对抗损失做为作者的对抗损失，定义为公式1和公式2.

B、粗擦除子网络（Coarse-Erasure Sub-Network）
粗擦除网络继承了EnsNet【7】中生成器的结构，他也是一个类似U-net的FCN，有几个残差块和横向连接，如图6所示，它以自然图像作为输入，产生粗输出。图7显示了作者的横向连接，其目的是增强从不同层的特征提取和集成。对EnsNet中横向连接进行修改，从11卷积层开始进行非线性变换。然后，分别通过两个相同大小（33）卷积和另一个1*1卷积层实现特征通道的扩展和收缩操作。此外，通过横向连接从浅层得到的最终特征将与高层特征相结合，而在作者的模型中，将它们连接在一起，以提高恢复的非文本区域的质量。

C、优化子网络
如前所述，用于场景文本删除的单阶段网络遇到的问题是，文本没有完全删除，因此最终图像包括草图或者部分文本的残留。导致这种情况的因素可以分为两类，感受野相对较小和缺乏足够的监督。为了解决这一问题，提高擦除性能，作者级联了一个额外的优化子网络作为第二阶段。粗擦除输出被送入优化子网络，可以用于预测更高质量的最终结果。首先，对于较大的感受野，作者将dilated卷积【21】引入到作者的网络设计中。他可以在不增加冗余计算代价的情况下扩大卷积核的大小；因此，感受野可以被有效的扩大，【20】采用空洞卷积，提出了一种有效的图像绘制模型，如图6所示，作者修改了这样的架构，使之称为优化子网络，再应用skip 连接来集成更高层次的语义和来自两个阶段较低层次的细节。第二，由于缺乏足够的监督，作者不仅要求最终的优化结果与相应的真值匹配重构和对抗损失的优化，而且还要考虑粗擦除的输出。
粗擦除和优化输出分别表示为Icount和Rcount，优化函数可以表示为公式3：

优化子网络以粗略擦除文本的图像作为输入，感受野比粗擦除子网络大，因此其编码器比粗擦除子网络更能有效的学习特征表示，因此，他可以有效地。完整、准确地去除文本。

D、分割头（Segmentation Head）
在图像填充过程中，提供了一个表示确实hole位置的二值掩码，这样就不会出现区域修复的遗漏。对于端到端场景文本擦除，作者纯粹输入整幅图像，目的是在推理过程中实现有效的文本擦除，不需要任何注释，便于文本定位。因此，模型应该能够在删除文本之前感知文本，避免出现文本误擦除或错误与文本相似的背景情况。直观地，作者设计了一个用于学习掩码（P1,P2,…,Pn）的文本和非文本区域的输入图像。由于文本擦除的过程是从粗擦除子网络开始的，所以在这个阶段添加了作者的分割头，图6的左下角表示其体系结构的详细信息。它是另一种编码器-解码器架构，解码器部分在粗擦除子网络的卷积层之后级联，编码器部分与骨干网络共享权重。
对于分割头的学习，为了解决样本不平衡的情况，文本区域往往占据整个图像的一小部分，作者将mask学习的损失定义为【45，46】中提出的dice 损失函数。他考虑了预测与真值之间的轮廓相似性。dice损失函数计算公式如下：

掩码学习损失是设计用来辅助训练的。通过这样的优化，作者的网络可以自动感知一般的文本区域。在实际应用中，输出的分割结果并没有应用于推理阶段。有了分割头，作者的模型可以更合适地定位和去除自然图像上的文本。

E、判别器
proposed EraseNet是一种local-global的GAN框架，用来判别生成器的全局输出和局部输出（基于表示文本位置的掩码真值）是真还是假的。为了保证最终优化输出的一致性和高质量。局部-全局判别器的结构如图8所示。通过叠加7个44的2步长卷积层来构造作者的局部-全局判别器，从而捕获Markovian patches【引用论文32,44】。判别器的最终输出是形状为HW*C的patch特征，其中c为通道数。然后，作者使用公式1中定义的hing loss对这些patches进行惩罚机制，以获得输入是真实还是虚假的文本擦除图像概率。

F、训练策略
为了训练EraseNet，作者将原始图像、去除文本的真值Igt和基于位置注释的二进制掩码M（0为非文本区域，1为文本区域）作为输入。依据之前的工作启发，EnsNet和图像修复，作者结合了对抗损失、dice损失、重建损失以及perceptial 损失【47】和风格损失【48】作为作者的内容损失和风格损失，改善擦除的文本区域和背景纹理细节的恢复和语义。作者的重建损失和内容损失函数如下：
I)Local-Aware Reconstruction Loss：
作者采用粗-精两阶段生成网络，需要考虑不同阶段的结果。由于作者的目标是在擦除文本的同时保持原始的背景纹理，所以作者在计算时根据二进制掩码将输出的相应文本区域乘以更高的权重。因此，粗擦除阶段Lrc和精优化阶段Lrf损失分别定义如公式6,7.最终的局部感知重构损失由公式8给出。

a)内容损失函数（Content Loss）：
受到之前图像填充的工作【27,39,49-51】，作者修改了Content Loss，包括perceptual Loss【47】和风格损失【48】去惩罚视觉质量和特征一致性。首先，作者通过ImageNet【52】上预先训练的VGG-16网络【40】提取输出的特征和对应的真值。Perceptual Loss促使卷积神经网络（CNN）中预定层的两类特征具有相似的表征。为了减轻文本擦除区域与背景之间的差异，将原始输出Irout和带有文本擦除Icom的原始图像作为损失项。感知损失可定义为公式10：

风格损失的重点是通过从每个高级特征图构建Gram矩阵来恢复文本删除区域的视觉表示。与perceptual loss类似，风格损失可以定义为公式11：

b)对象函数（Objective Function）
最后，作者将这些损失与掩码损失和对抗损失相加，形成最终的目标函数，定义为公式13：

五、实验
A、数据集和评估标准
1）
在作者提出的SCUT-EnsText和【7】中先前的合成数据集上评估EraseNet。该合成数据集基于【53】的文本合成技术，包括8000幅训练图像和800幅测试图像。他还包含从ICDAR-2013【9】和ICDAR MLT-2017【13】收集的一些真实世界的数据。在下面的实验中，作者将这个合成数据称为SCUT-Syn。
2）
评估指标：【4】中提出了场景文本擦除的评估方法。利用一个辅助文本检测器对擦除文本的图像获取检测结果，然后根据文本定位的真值对ICDAR-2013【9】和ICDAR-2015【10】方法进行precision、recall、F-score评估，这个指标只关注删除了多少文本；然而忽略了输出图像的质量，这是不合理的。因此，为了综合评价最终的结果，作者还采用了它们之前的工作【7】中提出的各种备选度量指标：1）L2误差:即为均方误差MSE；2）两幅图像的峰值信噪比（PSNR）；3）MMSIM【54】，计算两幅图像之间的多尺度结构相似度；4）AGE，计算两幅图像灰度级绝对差的平均值；5）eps，表示两幅图像之间的误差像素百分比；6）pCEPS：表示聚类误差像素（像素与相邻的4个像素不匹配）的百分比。MMSIM和PSNR越高，AGE、pEPs，pCEPS和MSE越低，表示结果越好。
在作者的实验中，作者使用上述两个度量（即【4】和【7】中使用的度量，在接下来的实验中分别表示为Detection-Eval和Image-Eval）来评估最终输出的完整性和质量。由于SCUT-EnsText包含弯曲文本，CRAFT【55】作为辅助场景文本检测器。作者直接在已提供的SynText、ICDAR-2013和MLT-2017数据集上预先训练好的模型进行测试。在作者对文本检测的统一评估中，作者利用off-the-shell OpenCV函数获取弯曲文本的最小外接矩形真值，并采用ICDAR-2015【10】和T-IoU【56】度量。注意，在所有实验中，作者分别采用R、P、F表示召回率、精准度、综合评价指标，用TR、TP、TF表示 TIoU-Recall, TIoU-Precision, and TIoU-F-score。

B实现细节
作者在SCUT-EnsText和SCUT-Syn上训练EraseNet，并分别在相应的测试集上对他进行评估。对于SCUT-Syn，没有提供用于文本定位坐标的注释，对于EraseNet的训练，作者通过输入图像及其对应的标签相减来生成mask标签。作者应用随机旋转的最大程度10°和随机水平翻转的概率0.3为数据增强期间训练。采用Adam算法对模型进行优化。在生成器网络中，学习率设置为0.0001，默认β设置为（0.5,0.9），判别器网络学习率设置为0.00001β设置为（0.0,0.9）。不同损失韩式超参数设置如之前说的一样。采用pytorch实现了该方法。所有实验都是在单个NVIDIA 2080TiGPU的工作站进行的，patch size为4.
Lcontent = 120 Lsi + 0.05Lperc
在损失函数Lrc中{λi, βi} 分别设置为{5, 0.8}, {6, 0.8} and {8, 0.8}
粗擦除输出是输入图片的1,1/2,1/4.
在Lrf中，{λR, βR} 设置为10 和 2,
Lcontent，λs and λp are set to 120 and 0.05

C结果分析
这部分，作者将讨论他们的方法在SCUT-EnsText和SCUT-Syn数据集上的文本擦除性能。作者直接用这两个数据集训练EnsNet【7】作为他们的baseline。基于上述两个评价指标的SCUT-EnsText结果如表2所示。定性结果如图9所示。

对于合成数据集SCUT-Syn，作者也进行了相同的消融实验。没有为公共的SCUT-Syn提供准确的文本定位基础，因此定量结果仅基于Image-Eval【7】，表3和图11展示了在SCUT-Syn上定性分析的结果。通过对这两个数据集进行对比实验，作者验证了EraseNet不同组件的贡献：精优化网络、分割头、风格损失。

1）精优化子网络：
如表2和表3所示，与baseline EnsNet【7】相比，所提出的精优化子网络在image-Eval的所有度量指标上都取得了更好的结果。此外，根据表2，在SCUT-Text上，精优化网络得到的P、R和F都比EnsNet低的多。这表明，作者的RN（精优化子网络）可以显著缓解不完全文本擦除的问题，获得更高的质量输出。图9中的定性结果显示了精优化子网络的效果。
2）分割头：
通过在作者的生成器网络的第一个粗擦除阶段增加另一个分割头，作者的模型性能可以进一步提高，如表2和表3中Image-Eval所示。和不带分割头SH（Segmentation Head）的模型相比，作者的模型PSNR提高了1.1，MSSIM提高了0.12。此外，他还可以在其他指标方面获得更高的结果。但是，根据表2对SCUT-EnsText的Detection-Eval，作者的模型中有SH和RN的P、R、F都没有比没有SH的模型略高。原因是作者采用分割头学习文本区域分割的同时，由于基于分割的文本检测算法【45】的复杂性，作者没有对其进行建模，这有助于文本区域的粗擦除预测。在这种情况下，文本区域的某些部分可能不会被删除。但是，它仍然是一个有效的模型，因为它可以避免更多的错误和过度的擦除，取得更好的结果。图9中显示了一些直观的示例。此外，当作者应用数据增强（DA）进行训练时，最终模型（RN+SH+DA）w SL（Style Loss）的所有结果都得到了极大的改进，并超越了以往的最先进的模型。
3）风格损失：
风格损失【48】表示输出的全局风格和它相对应的真值。根据表2和表3的结果，在相同的实验设置下，伴有风格损失的EraseNet（w SL）比没有风格损失（w/0 SL）在图像质量和文本擦除程度都能达到更高的性能。这表明，虽然图像的不同区域可能有不同的风格，但是在像素级监督下，风格的丢失仍然对场景文本的擦除有很大的positive影响。它明显的提高了输出质量。图9还显示了一些定性结果和比较。

D、对比于当前最高性能的方法
为了验证提出的EraseNet的有效性，作者还在SCUT-EnsText和SCUT-Syn数据集上进行了实验，将其与那些相关的和最新的最先进的方法进行了性能比较。所有这些方法都是作者自己重新实现的。SCUT-EnsText的结果如表4所示，SCUT-Syn如表5所示。

这些结果表明，所提出的EraseNet在Image-Eval的所有指标上都优于现有的先进方法，表明所提出的EraseNet的最终输出具有更高的恢复和擦除质量。此外，ICDAR-2015评估【10】和T-IoU度量【56】的结果如表4的Detection-Eval所示，表明作者的方法（EraseNet）可以在F-score和TF-score达到一个显著低于现在场景文本擦除【4】外的其他方法。场景文本擦除也可以获得比作者提出模型更低的P和TP。该模型以图像上步长为32的滑动窗口生成的6464个小块作为输入。因此这个模型只侧重于擦除和修复小规模区域，但是作者的模型专注于整个图像。在像素级监督之后，破坏文本笔划的完整性更实际有效，从而降低预测边界框和真值之间的IoU。因此，在场景文本擦除中，P和TP的值更低，但是该模型仅适用于6464个patch，最终输出的是这些patch的积分，导致输出的图像混乱，图像质量较低，如图10d和11d所示。

在表4和表5的场景文本擦除的图像评估中，PSNR、MSSIM等指标的结果也低。当作者使用数据增强（DA）进行训练时，作者模型的F和TF可以超过以往所有的方法。两种不同度量类别的结果证明了所提出的EraseNet的鲁棒性和有效性。
此外，作者定性地比较了SCUT-EnsText上不同方法的结果，如图10所示。从图10中可以看出，pix2pix【32】只擦除了部分文本区域，留下了工作。对于场景文本擦除器【4】，恢复得到的文本区域包含明显的混乱，文本不能被完美地删除。EnsNet【7】可以有效的解决上述问题，但部分文本可能会留在图像上，文本的粗糙仍然可见。作者的方法几乎可以完美的删除文本区域，同时保持文本与背景之间的连续性和背景的完整性。此外，图11显示了所提出的EraseNet在SCUT-Syn上也可以获得高质量的输出，并优于其他模型。

E、与最先进的图像填充方法比较
图像填充的目的是根据周围的纹理来恢复缺失的hole（洞），而场景文本删除的目的是将文本从原始文本区域删除。在本节中，作者将场景文本擦除作为图像填充的任务，并将结果与作者提出的EraseNet进行比较。作者根据SCUT-EnsText中的二进制掩码擦除图像的文本区域，并将其作为图像填充模型的输入，得到最终的恢复输出。采用门控卷积（GatedConv）【22】和LBAM【39】进行图像填充。因为图像填充的输出总是保持缺失hole之外的原始区域，因此作者也将EraseNet输出的非文本区域替换为原始图像，以便进行公平比较。表4给出了定量结果，图12给出了一些定性结果，如表4所示，虽然LBAM【39】模型的MSSIM高于作者的模型，但是作者的模型在其他的指标方面表现的更好。此外，根据图12所示的可视化结果，LBAM【39】和GatedConv【22】的输出比作者的输出包含更多的混乱和不连续。这可能是因为缺失hole的恢复实际上是基于周围的纹理，而文本及其背景往往只占图像的一小部分，因此在图像填充任务中很难完全推断出文本区域的纹理。然而，在场景文本擦除任务中，恢复主要是基于输入的原始文本区域。因此，这两个任务虽然有一些相似之处，但本质是不同的。专门为场景文本擦除设计的模型更有效。

F、对比于弱监督方法的比较
通过像素监控，EraseNet在场景文本擦除方面取得了非常好的性能。为了公平评价作者方法的有效性，作者进一步进行了两个实验，将EraseNet与一些弱监督方法进行了比较。在第一个实验中，作者遵循文本检测然后着色的流程。作者首先使用场景文本检测器获取文本区域，然后根据检测结果对图像进行掩码，并将其带入预先训练的最先进的图像填充网络。在作者的实验中，作者使用CRAFT【55】作为探测器，LBAM【39】作为作者填充模型，LBAM模型现在Paris StreetView Dataset【37】上进行预训练，其中包含15000张户外场景的图像，是作者数据集的5倍。因此，在这个实验中，作者没有使用SCUT-EnsText中任何像素级注释，而是使用掩码或者文本区域的边界框。这个方法被表示为D/I（弱监督）。在定量和定性结果见表7和图3.注意LBAM中，最终输出有恢复的文本区域及其原始背景图像组成。为了公平比较，作者遵循本节中提到的相同程序。评估绩效。这两个结果都表明，与弱监督方法相比，EraseNet可以获得更好的性能。

在第二个实验中，作者使用Cycle-GAN【57】进行图像级和文字级的比较。循环GAN可以将一个图像转换为另一种不同风格的图像，而无需像素级的监督。对于图像级的实现，作者将整个图像和它们的地面真值作为输入。对于字符级实现，作者裁剪注释或检测的文本区域。输入图像和真值分别随机输入网络。因此，在训练过程中没有成对的图像。主标签也是字符级别的掩码或文本边界框，而带有或不带有文本的未配对图像则是图像级。两个模型都训练了200epochs，表7给出了定量结果，在两个级别的定性结果如图14所示。

为了公平比较，作者直接比较了Cycle-GAN在图像级别上的输出与EraseNet的输出，对于字符级别实现，作者遵循与D/I（弱监督）相同的计算过程。根据实验结果，作者总结了ErseNet优势的原因如下。首先，在图像级别，背景比文本多得多，导致正负样本的不平衡。在这种情况下，Cycle-GAN更倾向于对非文本区域进行变换，因此可能局限于擦除图像中的文本，如图14a所示。其次，对于字符级实现来说，不同文本的背景样式比较复杂。如果没有像素化的监督，Cycle-GAN在训练阶段容易混淆，模型也可能无法转换图像。虽然文本可以被删除，但是背景并不能完全保持原来的风格，所以再根据边界框将其粘贴回原来的图像是，会造成最终输出的混乱。一些定性结果如图14b所示。

六、总结
在本文中，作者提出了一种新的综合场景文本擦除基准，称为SCUT-EnsText，它包含3562张不同文本特征高度多样化的图像。该数据集精心构建，具有较高的标注质量，每幅图像中的所有文本都被仔细地删除，并使用可信背景来实现，以保持文本擦除区域以及周围纹理的一致性。利用SCUT-EnsText，作者提出了一种新的场景文本删除方法，称为EraseNet，它是一个两阶段的SN-GAN模型。将基于U-Net的细化子网络级联到生成器网络的编码器-解码器结构后，可以增强特征表示，有效地细化粗输出，提高场景文本擦除的性能，另外还引入了一个分割头，以帮助更好的感知文本区域，避免错误，过度的擦除非文本区域。此外，为了保持训练的稳定性和被擦除区域的一致性，作者还提出了一种新的局部-全局SN-Pathch-GAN。广泛的实验证明作者模型的优越性，他可以在SCUT-EnsText和现有的合成数据集SCUT-Syn上取得最先进的结果。
端到端场景文本擦除是计算机视觉领域的一项具有挑战性的任务。许多问题还没有得到很好的解决，包括样品的不平衡，复杂的背景和纹理。因此，这仍然是一个有待研究的问题，值得更多的关注和进一步的研究。

你可能感兴趣的:(NLP,python,opencv,机器学习)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_