莫叶何竹

【论文翻译】PSENet：Shape Robust Text Detection with Progressive Scale Expansion Network

手动翻译仅供参考。
原文地址： https://arxiv.org/pdf/1806.02559.pdf
论文代码的开源地址：https://github.com/whai362/PSENet

Shape Robust Text Detection with Progressive Scale Expansion Network

0 摘要

目前文本框检测的鲁棒性面临两个挑战：一是大多数基于四边形边界的检测器很难将任意形状的文本包围在矩形中；二是大多数基于语义分割的检测器可能不会分离彼此非常接近的文本实例。为了解决这两者问题，我们提出了一种新颖的网络架构——渐进式规模扩展网络(progressive scale expansion network, psenet)。Psenet也是一种基于语义分割的检测器，但它对每个文本实例有多个不同尺度的预测。这些预测相当于通过将原始文本实例缩小为各种比例而产生的不同“内核”。由于这些最小内核之间存在很大的几何边缘，因此我们的方法可有效区分相邻的文本实例，并且对任意形状均具有鲁棒性。PseNet在ICDAR2015与ICDAR2017数据集中取得了目前最好的结果。值得注意的是，PSENet在曲线文本数据集(SCURT-CTW-1500)上的表现比之前的最佳记录高出绝对6.37％。

1 引言

近年来，自然场景文本检测因其具有大量的应用场景(场景理解、产品识别、自动驾驶、目标地理位置)得到了广泛的关注。然而由于自然场景的文本情况非常复杂，如光照、腐蚀、背景不同、角度差异、尺度不同，这些因素导致了自然场景下的文本识别面临着非常大的挑战。

随着卷积神经网络的发展，目前自然场景下的文本识别取得了长足的进步。目前基于边界框回归的一系列方法(如fast rcnn， faster rcnn， ssd等)虽然能够通过特定方向的矩形与四边形来定位文本目标，但它们对任意形状的文本实例检测能力较差，而然场景下的本文往往是不规则的(fig.b)。自然而然的，考虑将语义分割的方法用于曲线文本实例的检测问题中。虽然基于像素级分割的语义分割方法能够提取任意形状的文本实例边界，但它无法分离两个相距很近的文本实例(fig1.c)。为了解决这些问题，本文提出了一种渐进式规模扩展网络PSE-net.该网络有以下两个优势：

首先，Pse-net作为一种基于语义分割的算法是能够对任意形状的文本进行检测。
其次，我们提出了一种基于渐进式尺度扩展算法来解决临近文本实例的识别问题。(fig1.d)。具体来说，我们分配每个文本实例具有多个预测的分割区域。为了方便起见，我们在本文中将这些分割区域称为“内核”(kernel)，对于一个文本实例，有几个对应的内核。每个内核与原始整个文本实例具有同样的尺寸，且位于同一中心点，但是尺度不同。(这部分具体可见标签生成部分)。为了获得最终的检测，我们采用渐进式尺度扩展算法，主要有以下三个步骤：
- 从最小尺度的kernel开始
- 逐步在更大的kernel中包含的像素来扩展其区域
- 直至扩展到最大尺度的kernel

采用这种渐进式尺度扩展主要基于以下四个方面的考虑：

最小尺度的kernel非常容易分离不同文本实例的边界，因此能够克服之前基于语义分割实现目标检测的无法分离相邻两个文本实例的弊端；
最大尺度的kernel能够提高检测的精度；
kernel的尺度从小到大平滑增大，能够让网络更容易学习；
渐进式尺度扩展算法可确保文本实例的边界以仔细且渐进的方式扩展时准确定位。

为了量化PSE-net的检测效果，我们采用了3个基准数据集： ICDAR 2015 , ICDAR 2017 MLT 和 SCUTCTW1500。

这篇文章的主要贡献：

提出了PSE-net,基于这个算法能够对于任意边界的文本实例进行有效分割；
基于渐进式尺度扩展算法能够准确的对临近文本实例的分别分割；
提出的PSE-net在SCUTCTW1500数据集上取得了最好的预测效果，同时在 ICDAR 2015 ,和ICDAR 2017 MLT数据集上也取得了不错的效果。

2 相关工作（related work）

文本检测在计算机视觉领域很长时间都是一个研究的热点方向。…。稍微简要讲了目前的研究现状。

3 提出方法

在这个部分，我们首先介绍PSE-net整体的架构。随后我们详细论述了渐进式尺度扩展算法的实施细节，并且展示它是如何有效的区分非常临近的文本实例。随后我们介绍了标签数据的生成方法和损失函数的构建。最后我们对PSE-net的实施细节进行了阐述。

3.1 整体架构(overall pileline)

PSE-net的总体架构如图fig2所示。基于FPN网络的启发，我们将低水平的特征与高水平的特征合并到一起，从而得到四个不同水平的特征映射。这些蕴含不同感受野的特征映射（feature map）通过F进一步融合。直觉来看，这些特征融合和不同尺度kernel的形成非常类似。随后从特征映射F出发展开多个分支(S1,S2,…,Sn)，每个分支都是一个语义分割的结果。分支选取的数量是超参数，将在3，3节中详细讨论。在这么多的分割结果中，S1是文本实例最小尺度的预测结果，Sn是最大尺度(没有缩放)的预测结果。在获得这些预测结果后，我们采用渐进式尺度扩展算法来获得最终的预测结果。

3.2 渐进尺度扩展算法

正如图fig1.c中所示，基于语义分割的文本检测算法很难分离相距非常近的文本实例。为了解决这个问题，我们提出了渐进式尺度拓展算法。

fig3是一个形象的例子来解释这个算法是如何工作的，它的核心思想是广度优先算法(breadth first search)。在这个例子中我们有三个分割的结果S={S1，S2, S3}。首先从最小尺度kernel的映射结果S1(fig3.a)开始，伴随四个不同的连接组件 C={c1,c2,c3,c4}。fig3.(b)中不同颜色的区域各自代表了这些不同的连接组件。现在我们可以看到所有文本实例的中心部分。随后我们采用渐进式尺度扩展算法来合并周围的像素到S2最后到S3。最终我们将用不同颜色标注本文实例的连接组件提取出来作为对文本实例最终的预测结果。

尺度扩展的过程在图fig.3(g)中有阐明。这个方法基于广度优先搜索算法，从不同尺度kernel像素开始逐步合并相邻的文本像素。可以预见的是，这样合并会发生像素分类的冲突（如fig3.g中红色框中所示），我们实际的解决方案是“先到先得”原则，即谁先合并到该像素就归谁所有。得益于渐进式尺度扩展的优势，这些边界上的冲突(conflict)并不会影响最终的检测效果。这个算法的细节实现方案见Algorithm1。

Algorithm符号说明：

T，P: 中间结果(相对最终结果)即 intermediate results
Q: 是一个队列
Neighbor(·): 代表p的邻接像素
GroupByLabel(·)： 基于标签grouping中间结果
Si[q] = True：表示Si中的像素q属于文本实例

3.3 标签生成

如Fig.2中的说明，PSE-net基于不同尺度的kernel产生了一系列的分割结果（S1,S2,…,Sn）。因此在数据集上也需要不同尺度的label对应（S1,S2,…,Sn)。通过实践我们发现，这些不同尺度的label可以通过缩小初始的文本实例来生成。fig4.b中的蓝色多边形代表初始的文本实例，它对应最大尺度的label(fig4.c中最里面的一张)。基于Vatti裁剪算法（Vatti clipping algorithm）生成不同尺度的label，最后进行二值化处理。将这一系列不同尺度的label用（G1,G2,…,Gn）表示。数值上，我如果要计算放缩比ri或pn到pi边缘之间的距离可以通过下式进行：

式中：

Area(·)：表示多边形的面积
Perimeter(·)：表示多边形的参数（is the function of computing the polygon perimeter）

式中：

m:表示最小尺度的放缩比，【0，1】
n:选用多少个不同的尺度

放缩率（r1,r2,…,rn）由m,n两个超参数决定，线性m到1增加。

3.4 损失函数设置

为了学习PSE-net网络，损失函数设置如下：

可以看到损失函数由完整文本实例和放缩文本实例两部分组成，λ是超参数，用于平衡这两个损失。

我们知道，在自然图片中文本实例往往只占很小的区域(小目标检测)，因此当使用交叉熵损失时，网络往往更加偏向非目标区域。因此我们采用dice系数，他的计算式如下：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ydnokral-1592011441911)(C:\Users\13068\AppData\Roaming\Typora\typora-user-images\1592008913194.png)]$

此外自然图像中也有很多类似文字笔画的图案会带来干扰，如栅栏、格子等。因此我们对Lc损失中采用Online Hard Example Mining(OHEM)来更好的区分两者。

Lc损失关注分割结果中的文本和非文本区域，，我们将训练过程中基于OHEM得到的样本记为M，则Lc损失可以表述为：

Ls是压缩文本实例的损失。由于压缩文本实例被完整文本实例的原始区域包围，因此我们忽略了分割结果Sn中非文本区域的像素，以避免了某些冗余。因此，Ls可以表示如下：

式中：

W：是一个标签，用于忽略Sn中非文本区域的像素
S(n,x,y)指的是Sn中在(x,y)位置的像素值。

3.5 实现细节

PSENet的主干是从FPN [16]实现的。我们首先从主干(backbone)中获得四个256通道特征图（P2,P3, P4, P5）（参考fig2）。将P3,P4,P5上采样到P2的尺寸，然后基于深度方向拼接。随后将拼接得到的feature map送入到conv（3，3）+BN+RELU的卷积层中（通道256）.最终输入到conv(1,1)+sigmoid(通道数是超参数，却决于采用多少个尺度)卷积层中作为最后的预测结果。

我们将n（采用尺度的个数）设置为6，将m(最小的放缩比例)设置为0：5，以生成标签。在训练期间，我们将忽略所有数据集中标记为“请勿关注”的模糊文本区域。损失函数的λ设置为0：7。 OHEM的负正比设置为3。

训练数据的数据增强如下：1）以（0.5,1,2,3）比例随机缩放图像；2）图像水平翻转并在（-10°，10°）范围内随机旋转；； 3）从变换后的图片随机裁剪640×640； 4）图片使用通道均值和标准差进行标准化。

对于四边形文本数据集，我们计算最小面积矩形以提取边界框作为最终预测。对于曲线文本数据集，应用Ramer-Douglas-Peucker算法生成具有任意形状的边界框。

4 试验

在本节中，我们首先对PSE-Net进行消融研究。然后，基于三个公开基准：ICDAR 2015，ICDAR 2017 MLT和SCUT-CTW1500将PSE-Net与许多最新方法进行比较。

4.1 基准数据集

介绍了下数据集的情况（有多少训练数据，测试数据之类）

4.2 训练

我们使用在ImageNet数据集上预先训练过的带有ResNet 的FPN作为我们的主干。通过使用随机梯度下降（SGD）训练所有网络。在ICDAR数据集的实验中，我们使用1000张IC15训练图像，7200张IC17-MLT训练图像和1800张IC17-MLT验证图像来训练模型，并在这两个数据集的测试集上计算精度，召回率和F指标。训练结束。我们使用批处理大小16，并训练模型300个epochs。初始学习率设置为10×（-3），并每100个epochs除以10。在SCUTCTW1500上，我们使用1000个训练图像从训练后的模型中微调模型训练400个epoch。批量大小设置为16。初始学习率设置为10-4，然后在200个epoch除以10。在微调结束后，我们在测试集上计算精度，召回率和F指标。我们使用5×10×（-4）的权重衰减和0.99的Nesterov动量。我们采用[5]引入的权重初始化。

4.3 消融研究

( 去掉提出的结构的网络与加上该结构的网络所得到的结果进行对比 )

Why are the multiple kernel scales necessary?

对比单核和多核的结果说明多核好。
How minimal can these kernels be?

基于跑的结果。

4.4 与最先进方法的对比

4.5 在SCUT-CTW1500数据集的对比

4.6 在ICDAR 2015 and ICDAR 2017 MLT更多的检测例子

5 结论与展望

我们提出了一种新颖的渐进式尺度扩展网络（PSE-net），以成功检测文本自然场景图像中具有任意形状的实例。通过逐渐扩大检测范围通过多个语义分割图，从小内核到大内核实现文本实例的分割。我们的该方法对形状具有鲁棒性，可以轻松地区分非常接近或部分相交的文本实例。

未来有多个方向可以探索。首先，我们将研究尺度扩展算法是否可以端到端地与网络一起训练。其次，可以将渐进式尺度扩展算法引入一般的实例分割任务中，尤其是在那些拥挤的对象实例众多的标记中。

GAN开山之作--Generative Adversarial Nets 星空彡深度学习机器学习神经网络
GAN开山之作–GenerativeAdversarialNets最近对GAN比较有兴趣，所以开个坑记录一下读论文学习的知识。这是本专栏的第一篇论文，所以笔者认为解析GAN的开山之作——GenerativeAdversarialNets[1]是非常有必要的。有关数学推导部分本文借鉴了深度之眼的b站发布的视频[2]。本文并不是逐字翻译，主要是写笔者对这篇论文的见解思考，其中难免会有错的地方，欢迎讨论
论文学习3：深度学习增强的光声成像（PAI）的最新进展（综述） superace7911 基于机器学习的光声图像处理机器学习图像处理
原文链接有空可以细看，这里中列出了文中提到的部分研究结果写作大纲1.引言光声成像（PAI）的介绍，它结合了光学和超声成像的优点，为生物医学成像提供了一种有前景的模态。深度学习（DL）在解决PAI中存在的技术限制（如硬件限制、生物特征信息缺乏等）方面的潜力。2.DL方法的原理介绍DL的子集：监督学习、无监督学习和强化学习。详细说明代表性DL架构：卷积神经网络（CNN）、U-形神经网络（U-Net）和
论文学习笔记 VMamba: Visual State Space Model Wils0nEdwards 学习笔记
概览这篇论文的动机源于在计算机视觉领域设计计算高效的网络架构的持续需求。当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。特别是，ViTs尽管在处理大规模数据上具有优势，但其自注意力机制的二次复杂度对高分辨率图像处理时的计算成本极高。因此，研究者希望通过引入新的架构来降低这种复杂度，并提高视觉任务的效率。现
论文学习1----理解深度学习需要重新思考泛化Understanding deep learning requires rethinking generalization 夏洛的网机器学习深度学习论文深度学习神经网络
——论文地址：Understandingdeeplearningrequiresrethinkinggeneralization1、有关新闻1.1新闻一：参考1：机器之心尽管深度人工神经网络规模庞大，但它们的训练表现和测试表现之间可以表现出非常小的差异。传统的思考是将小的泛化误差要么归结为模型族的特性，要么就认为与训练过程中的正则化技术有关。通过广泛的系统性实验，我们表明这些传统的方法并不能解释大
半监督语义分割论文学习记录西瓜真的很皮啊半监督语义分割深度学习机器学习人工智能
Semi-SupervisedSemanticSegmentationwithCross-ConsistencyTraining1.1motivation一致性训练的目的是在应用于输入的小扰动上增强模型预测的不变性。因此，学习的模型将对这样的小变化具有鲁棒性。一致性训练的有效性在很大程度上取决于数据分布的行为，即集群假设，其中类必须由低密度区域分隔。在语义分割中，在输入中，我们没有观察到低密度区域
2019-1-27晨间日记紫薇忘了水葫芦
在柳州的第二天起床：八点半左右天气：晴心情：好像很复杂，一会儿开心一会儿不开心纪念日：参加了晗大姐的婚礼任务清单昨日完成的任务，最重要的三件事：⒈把之前的论文题目整理了一遍⒉参加了婚礼⒊送了礼物改进：要静下来多看些书做些运动，多思考。习惯养成：早睡早起，饮食清淡周目标·完成进度开始读论文学习·信息·阅读阅读健康·饮食·锻炼饮食清淡，多锻炼人际·家人·朋友多联系工作·思考怎么把自己的工作做得更好最美
语义分割系列之FCN、DeeplabV1、V2、V3、V3Plus论文学习 Diros1g 学习深度学习计算机视觉
FCNFullyConvolutionalNetworks论文：FullyConvolutionalNetworksforSemanticSegmentation地址:https://openaccess.thecvf.com/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf特点：用全卷积替
论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning JiangChSo 论文学习深度学习机器学习神经网络算法分布式
论文学习笔记POSEIDON:Privacy-PreservingFederatedNeuralNetworkLearningNDSS2021录用文章目录论文学习笔记POSEIDON:Privacy-PreservingFederatedNeuralNetworkLearning一、机器学习1.机器学习(ML)中的挑战2.隐私保护机器学习(PPML)二、POSEIDON方案1.系统和威胁模型2.方
论文学习——Vector Quantized Diffusion Model for Text-to-Image Synthesis 客院载论音频生成学习
文章目录引言正文Abstract文章的核心VQ潜在空间适合文本转图片生成VQDiffusion的比起自回归和GAN的其他模型的成果IntroductionNLP的成功给图片生成的启发自回归模型的单向误差解释预测误差累积VQDiffusion能够解决预测误差累计和单向误差两个问题解决单向误差的方式——每一次预测都是考虑所有token的上下文信息解决错误累积的方式——使用基于掩码和替换的扩散策略模型测
Python论文学习 -- 第二章 --- Python基础知识 Metallic Cat 学习
1.cmd命令器中如果想终止命令的话可以在终止行输入exit()函数调用停止命令一.字面量二.注释---对代码进行解释说明1.在print函数中：print(a,"asd",c)输出的结果为a变量对应的值+asd+c变量对应的值如：则输出的结果为：往type()函数中输入数据，它会返回数据的类型给我们，然后我们可以用print()函数将数据类型打出来1.值得注意的是变量本身是没有类型的，它只是一个
论文学习笔记：PoseFix: Model-agnostic General Human Pose Refinement Network wangyc1208 姿态估计
论文：https://arxiv.org/abs/1812.03595代码：https://github.com/mks0601/PoseFix_RELEASE—————————————————————————————————————————————————目标：多人姿态估计：本篇论文主要工作是利用一个人体姿势优化网络，从输入图像和姿势中对人体姿态进行优化。大概的效果如下图：———————————
2021-9-23晨间日记言二yaner
今天是什么日子起床：7：40就寝：23：00天气：美好心情：美好纪念日：无任务清单昨日完成的任务，最重要的三件事：投稿改进：想到就做到习惯养成：专注自己，提升自己周目标·完成进度准备再写一篇论文学习·信息·阅读多阅读，多学习健康·饮食·锻炼早饭：小米粥，鸡蛋，烧麦中饭：真味卤，杨枝甘露晚饭：黑米粥锻炼：一小时左右人际·家人·朋友一切都是最好的安排，虽然没有过去，但也有属于自己的收获工作·思考凡事早
论文学习记录之Deep-learning seismic full-waveform inversion for realistic structuralmodels 摘星星的屋顶论文深度学习人工智能
一、ABSTRACT—摘要标题：Deep-learningseismicfull-waveforminversionforrealisticstructuralmodels（用于真实结构模型的深度学习地震全波形反演）作者：BinLiu1,SenlinYang2,YuxiaoRen2,XinjiXu3,PengJiang2,andYangkangChen4（和SeisInvNet有共同作者，应该是同
论文学习记录之SeisInvNet（Deep-Learning Inversion of Seismic Data）摘星星的屋顶论文人工智能
目录1INTRODUCTION—介绍2RELATEDWORKS—相关作品3METHODOLOGYANDIMPLEMENTATION—方法和执行3.1方法3.2执行4EXPERIMENTS—实验4.1数据集准备4.2实验设置4.3基线模型4.4定向比较4.5定量比较4.6机理研究5CONCLUSION—结论1INTRODUCTION—介绍地震勘探是根据地震波在大地中的传播规律来确定地下地层结构的一种
基于变长频带选择的JPEG图像可逆数据隐藏-文献学习凌峰的博客学习算法计算机视觉
论文学习原文题目：ReversibleDataHidingofJPEGImageBasedonAdaptiveFrequencyBandLength发表期刊：TCSVT2023（中科院1区）作者：NingxiongMao,HongjieHe,FanChen,YuanYuan,LingfengQu摘要JPEG图像在互联网上被广泛使用。基于quantifieddiscretecosinetransfo
BASNet：Boundary-aware salient object detection Kun Li 应用算法目标检测计算机视觉
CVPR2019开源论文|BASNet：关注边界的显著性检测本文提出一种基于深度监督学习的前景提取构架BASNet，其在边缘感知上有优异的表现。https://mp.weixin.qq.com/s/fjq4UyDMN9Z9lvNZ7aNLWABASNet:Boundary-AwareSalientObjectDetection论文学习_basnet:boundary-awaresalientobj
Nerf-Wild神经辐射场论文学习笔记 Neural Radiance Fields for Unconstrained Photo Collections 出门吃三碗饭 Nerf学习记录三维重建学习笔记
前言：本文为记录自己在Nerf学习道路的一些笔记，包括对论文以及其代码的思考内容。公众号：AI知识物语B站后续同步更新讲解本篇文章主要针对其数学公式来学习其内容，欢迎批评指正！！！（代码下篇出）1：摘要提出基于学习（learning-based）方法，使用野外照片的非结构化集合（unstructuredcollectionsofin-the-wildphotographs）来合成复杂场景。之前的N
GroupMixFormer：Advancing Vision Transformers with Group-Mix Attention论文学习笔记 athrunsunny Transformer 学习笔记深度学习计算机视觉 transformer
论文地址：https://arxiv.org/pdf/2311.15157.pdf代码地址：https://github.com/AILab-CVC/GroupMixFormer摘要：ViT已被证明可以通过使用多头自注意力（MHSA）对远程依赖关系进行建模来增强视觉识别，这通常被表述为Query-Key-Value计算。但是，从“Query”和“Key”生成的注意力图仅捕获单个粒度的token-t
论文学习——基于查询的workload预测（CMU） _zhj 机器学习数据库
一、简介论文题目：Query-basedWorkloadForecastingforSelf-DrivingDatabaseManagementSystems发表在2018SIGMOD，来自cmu的数据库组（这个组真的很厉害）这篇论文主要讲数据库workload预测的问题。因为要实现数据库self-driving（如选择合适的时机在合适的列上自动创建索引），应该根据将要到来的查询对数据库进行优化，
第六十八周周报童、一周报深度学习
学习目标：项目论文学习时间：2023.12.23-2023.12.29学习产出：一、项目这周后两天在根据吉安方面的需求优化SQL，提升性能二、论文这周周六在杨老师的带领下仔细改了论文前两段，后面几天自己把剩下的改完了，目前还在给杨老师看。实验方面，由于LSUN一直跑不出好的效果，已经转为STL10和CelebA，预计得下周才能出结果。其他时间都在搞开题报告的东西。
DN-DETR论文学习彭祥. DETR系列学习深度学习计算机视觉
摘要本文提出了一种新颖的去噪训练方法，以加快DETR（DEtectionTRansformer）训练，并加深了对类DETR方法的慢收敛问题的理解。我们表明，缓慢收敛是由于二分图匹配的不稳定性导致早期训练阶段的优化目标不一致。为了解决这个问题，除了匈牙利损失之外，我们的方法还向Transformer解码器馈送了带有噪声的GT边界框，并训练模型重建原始框，从而有效地降低了二分图匹配难度，并加快了收敛速
MS-DETR: Efficient DETR Training with Mixed Supervision论文学习笔记 athrunsunny Transformer 学习笔记 transformer 深度学习算法
论文地址：https://arxiv.org/pdf/2401.03989.pdf代码地址（中稿后开源）：GitHub-Atten4Vis/MS-DETR:Theofficialimplementationfor"MS-DETR:EfficientDETRTrainingwithMixedSupervision"摘要DETR通过迭代生成多个基于图像特征的目标候选者，并为每个真实目标分配一个候选者，
经典论文学习：Attention Is All You Need（Transformer）才能我浪费 AI应用深度学习机器学习人工智能
1，概述《AttentionIsAllYouNeed》是一篇由GoogleDeepMind团队在2017年发表的论文，该论文提出了一种新的神经网络模型，称为Transformer模型，用于自然语言处理任务。该模型的创新点在于使用了一种称为“自注意力机制（self-attentionmechanism）”的技术，以取代传统的循环神经网络（RNN）和卷积神经网络（CNN）等结构，这使得模型在处理序列数
2022-6-17晨间日记七翎
今天是什么日子起床：7.30(因为今天考科四，好困啊！！！)就寝：科四成功考过，熬个小夜(嘻嘻)天气：昨天下雨了，今天超凉快！心情：开心更多一点纪念日：纪念我拿上驾照的日子任务清单昨日完成的任务，最重要的三件事：刷完10套科四卷子✔习惯养成：早睡早起(尽量吧)周目标·完成进度1.完成编程课程2.看完导师论文学习·信息·阅读看了网文(嘻嘻)放纵一下健康·饮食·锻炼吃了很多不健康的食物，但很快乐！人际
ChatGPT可以帮你做什么？ SiKi学院 chatgpt 人工智能
学习利用ChatGPT学习有很多，比如：语言学习、编程学习、论文学习拆解、推荐学习资源等，使用方法大同小异，这里以语言学习为例。在开始前先给GPT充分的信息：（举例）【角色】充当一名有丰富经验的英语老师【背景】我是一名英语雅思备考的学生，想进行英语相关学习（这里最好说明是帮助你做什么练习，如口语）【任务】你要和我进行对话，根据我输入的内容，去进行讲解和说明【要求】我希望你首先可以列举出雅思备
【论文学习】SOLVING INVERSE PROBLEMS IN MEDICAL IMAGING WITH SCORE-BASED GENERATIVE MODELS Lyrig~ 神经网络图像修复（Image Restoration）学习机器学习算法
【论文学习】SOLVINGINVERSEPROBLEMSINMEDICALIMAGINGWITHSCORE-BASEDGENERATIVEMODELS前言相关概念线性逆问题基于分数的生成模型扰动过程逆过程采样利用基于分数的生成模型求解逆问题一种简便的线性测量过程形式将给定的观测结果融合进无条件采样过程前言好不容易写完了这么长的一篇，整体看来，这篇文章更像是对去噪过程的一个改进。通过在不同时间步引入
论文学习使用基于NeRF的精炼特征从3D感知Diffusion模型下实现单视点下的人工重建 Lyrig~ 学习 3d 人工智能
论文学习使用基于NeRF的精炼特征从3D感知Diffusion模型下实现单视点下的人工重建论文连接前言摘要介绍相关工作2.13D生成的扩散模型2.2单视点下的新视点生成神经场（NeRF）以外的方法基于神经场（NeRF）的方法背景3.1图片条件NeRF3.2无几何视图合成NerfDiff论文连接NerfDiff:Single-imageViewSynthesiswithNeRF-guidedDist
【论文学习】InstructGPT：Training language models to follow instructions with human feedback Shackles Lay 学习语言模型自然语言处理
前言：语言模型的输出依赖于预训练的数据集，研究者想要探索无监督领域的模型，使其仅仅依赖无标签的数据就可以实现不错的效果，为了让模型的泛化性能尽可能的强，研究者会提供尽可能大的数据集。但这样的训练方法存在两个问题：一、有效性。模型的性能依赖于训练时使用的文本，但是研究者并不知道无标签的大批量的数据集是否可以使模型学习到解决指定任务的能力，可能对于特定领域来说，模型根本没见过这样的数据；二、安全性，模
畸变矫正-深度学习相关论文学习六个核桃Lu 畸变矫正深度学习学习人工智能
目录DocTr:DocumentImageTransformerforGeometricUnwarpingandIlluminationCorrectionSimFIR:ASimpleFrameworkforFisheyeImageRectificationwithSelf-supervisedRepresentationLearningModel-FreeDistortionRectificat
A Fast Learning Algorithm for Deep Belief Nets - 论文学习 Mr，yu 论文笔记论文笔记 Machine Learning DeepLearning
文章目录摘要介绍互补先验一个带约束权的无限有向模型限制玻尔兹曼机和对比散度学习一种转换表示的贪婪学习算法SomeIdeasBasedonDBNNonlinearDimensionalityReductionLearningSemanticAddressSpace(SAS)forFastDocumentRetrievalLearningNonlinearEmbeddings参考文献摘要explain
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的