HaoTianYan

【论文笔记1_超分辨】（RDN）Residual Dense Network for Image Super-Resolution

文章目录

Abstract
1. Introduction
- 1.1 部分现有方法：
- 1.2 存在的问题：
- 1.3 解决方法
- 1.4 主要贡献
2. Related Work
- 2.1 插值LR作为输入的网络
- 2.2 直接将LR作为输入的网络
- 2.3 引入Dense
3. Residual Dense Network
- 1. 浅层特征提取网络（SFENet）
- 2. 残差密集块（RDBs）
- 3. 密集特征融合（DFF）
- 4. 上采样网络（UPNet）
4. Discussion
- 4.1 RDN与DenseNet的区别
- 4.2 RDN与SRDenseNet的区别
- 4.3 RDN与MemNet的区别
5 数据集
6 Conclusions
- - 【其他超分辨方向论文】

文章链接：（CVPR 2018）Residual Dense Network for Image Super-Resolution

代码链接：
https://github.com/yulunzhang/RDN（torch）
https://github.com/hengchuan/RDN-TensorFlow

Abstract

深层CNN拥有提取多层次特征的能力，最近在图像超分辨（SR）领域取得了不错的进展。然而，大多数CNN-based的SR模型不能很好地利用这些来自LR的各级特征，导致相对较低的性能。在本篇文章中，我们提出了一种全新的残差密集网络（Residual Dense Network，RDN）以解决图像SR中的这一问题。RDN能够充分利用所有卷积层中的各个层次信息。

具体地，我们提出了残差密集块（Residual Dense Block，RDB），通过将卷积层密集连接的方式提取丰富的局部特征。RDB还允许从先前所有RDB的状态直接连接到当前RDB中的所有层，从而形成了连续记忆（contiguous memory，CM）机制。

RDB中的局部特征融合的使用可以减少多余的特征，使网络训练更稳定。在充分得到稠密的局部特征后，采用全局特征融合的方法对全局多层次特征进行联合自适应学习。在具有不同退化模型的基准数据集上的实验表明，与现有的state-of-the art方法相比，RDN取得了更佳的性能。

1. Introduction

单图像超分辨（SISR）旨在通过低分辨图像（LR）生成视觉效果更好的高分辨图像（HR）。SISR能用在安防、监控图像、医学影像、图像生成等计算机视觉任务。实际上SR是一个病态的问题，因为对于任何LR输入都有多种解决方案（一对多）。

已有的SR方法主要有三种：

基于插值[40]
基于重建[37]
基于学习[28, 29, 20, 2, 21, 8, 10, 31, 39]

1.1 部分现有方法：

Dong 等人在ECCV2014提出的SRCNN（DL应用在SR领域的开山之作）；
Kim 等人根据SRCNN的不足在CVPR2016分别提出了VDSR（增大感受野、残差学习和高学习率、mutil-scale）和DRCN（递归），使网络更好训练；
Lim 等人在CVPR2017中，使用残差块（图1(a)）构建了EDSR（very wide）和MDSR（very deep），该方法还赢得了当年CVPR Workshops的超分辨比赛——NTIRE2017的冠军；
Tai 等人提出了包含递归单元和门控单元的记忆模块，构建了MemNet。

1.2 存在的问题：

问题1：这些方法都没有充分利用每一个卷积层中的信息。

尽管MemNet中的门控单元可以提供短期记忆，但是局部卷积层不能直接访问后续层，很难说记忆模块充分利用了里面所有层的信息。

问题2：忽视了多层次特征（hierarchical features）。

图像中的物体有不同的尺寸、视角、纵横比，一个非常深的网络的多层次特征（hierarchical features）能为重建提供更多线索。然而，大多数当前的DL方法（VDSR、LapSRN、EDSR等）都忽视了这种多层次特征。

尽管记忆模块能够从之前的记忆块中获得信息，但这些多级信息不是从原始LR中得到的——MemNet将LR插值到目标SR的尺寸作为输入，而不是直接输入LR。这一步骤使得：

增加了计算复杂度——计算量是直接输入LR的四倍；
丢失了LR中的一些细节。

Tong等人在图像 SR 中引入了密集块（图1(b)），并采用了相对较低的增长率。根据实验，更高的增长率能更进一步提升网络的性能。

1.3 解决方法

为了解决以上问题，本文提出了残差密集网络（Residual Dense Network, DRN）。通过残差密集块RDB （图1(c)），RDN网络能够充分利用所有的多级特征。

1.4 主要贡献

文章的主要贡献如下：

提出了统一的框架RDN，以解决不同退化模型下的高分辨SR任务。该网络能够充分利用原始LR的所有多级特征。
提出了残差密集块（RDB），不仅可以通过连续记忆（CM）机制获取先前的RDB的状态，还可以通过局部密集连接充分利用所有的卷积层。最后，通过局部特征融合（LFF）自适应地保留累积的特征。
采用全局特征融合（GFF），将所有RDB块的输出（ $F_1$ ~ $F_d$ ）都与经浅层特征提取的LR（即 $F_{-1}$ ）进行融合。

2. Related Work

2.1 插值LR作为输入的网络

SRCNN（2014）： Dong 等人在ECCV2014提出的SRCNN（DL应用在SR领域的开山之作），在经过插值的LR和对应的HR之间建立了一个端到端的映射。该网络通过增加网络的深度、共享权重从而提升了效果；
VDSR（2016）、IRCNN（2017）： Kim 等人在CVPR2016提出的VDSR、Zhang等人在CVPR2017提出的IRCNN，通过堆叠更多带有残差学习的卷积层提升了网络的深度；
DRCN（2016）： Kim等人（也就是上面VDSR的作者）在CVPR2016提出的DRCN，首次在SR问题中引入了递归学习，用于深度网络中的参数共享；
DRRN（2017）、MemNet（2017）： Tai等人分别在CVPR2017和ICCV2017提出的DRRN和MemNet，同样使用了递归块用于构建更深的网络。

以上的网络都是将LR插值到目标HR的尺寸作为网络输入的，这种预处理步骤：

一方面增加了计算复杂度（×4）；
另一方面使原始输入过度光滑、模糊，丢失了一些细节信息。

2.2 直接将LR作为输入的网络

FSRCNN（2016）： Dong等人在ECCV2016提出的SRCNN，直接将原始LR作为网络的输入，并且引入了反卷积层，用于上采样到目标分辨率。（SRCNN的作者，香港中文大学Dong Chao本人对SRCNN进行的改进）。
ESPCN（2016）： She等人在CVPR2016提出的ESPCN，使用子像素卷积（sub-pixel convolution） upscale到HR。
SRResNet（2017）、EDSR（2017）： Ledig等在CVPR2017提出的SRResNet（也就是SRGAN）、Lim等人在CVPR Workshops 2017提出的EDSR（NTIRE2017冠军），也都使用了子像素卷积以及残差学习；

上面的方法都是在LR空间内提取特征，然后将最终的LR特征经反卷积或子像素卷积上采样到目标分辨率的。这样一来这些网络具有了实时SR（例如FSRCNN、ESPCN）的能力，或者能够构建更深/更宽的网络（例如SRGAN、EDSR）。

2.3 引入Dense

以上的网络都都是线性地堆叠Conv层或Res块，没有充分利用每个Conv层中的信息（因为仅采用LR空间中最后一层的Conv进行上采样）。

DenseNet（2017）： Huang等人在CVPR2017上提出了DenseNet，允许同一个密集块内的任意两个卷积层直接进行连接。

以上的DL-based SR方法都取得的成果都十分重要，但是它们都没有从LR中充分获得有用的多层级特征（Hierarchical features）。本文提出的residual dense network（RDN）能够高效地提取并自适应地融合LR空间中所有层的特征。

3. Residual Dense Network

网络结构：

RDN主要由四部分组成：

1. 浅层特征提取网络（SFENet）

这部分没什么好说的，就是网络最开始的那两个卷积层。

2. 残差密集块（RDBs）

【残差密集块RDB = 密集连接层 + 局部特征融合（LFF）+ 局部残差】，形成了连续记忆机制（Contiguous Memory）。

Dense： 所谓连续记忆机制，个人理解其实就是可以将第 $d - 1$ 个RDB块的输出直接输入到第 $d$ 个RDB块中的每一层去（见上图dense部分的红线所示），经过dense的作用，可以将 $F_{d-1}$ ， $F_{d,1}$ ， $F_{d,c}$ ， $F_{d,C}$ 的特征都利用起来。

局部特征融合（Local feature fusion） 即RDB中的那个concat，能够将前一个RDB的输出 $F_{d-1}$ 、当前RDB $F_{d}$ 中每一层得到的状态融合通过concat在一起。然后，再利用 $1 \times 1$ 卷积对concat降低通道数，简化数据。

局部残差学习（Local residual learning） 由于RDB中存在多个卷积层，因此引入局部残差学习以进一步改善信息流。

3. 密集特征融合（DFF）

通过一系列RDBs提取了局部密集特征后，进一步提出密集特征融合（DFF），从全局的角度挖掘多层次特征（hierarchical features）。
DFF由全局特征融合（GFF）和全局残差学习（GRL）两部分组成。

全局特征融合（Global Feature Fusion）
如上面Figure 2. 所示，全局特征融合即：

把多个RDBs的输出（ $F_1, F_d, \dots, F_D$ ）concat在一起；
再经过一个 $1\times1$ Conv层，将这一系列不同level的特征自适应地融合在一起；
再通过 $3\times3$ Conv层，进一步提取特征得到 $F_{GF}$ ，用接下来的全局残差学习（GRL）。

全局残差学习（Global Residual Learning）
全局残差学习就是上面的Figure 2. 中，将通过第一个Conv层得到的浅层特征图 $F_{-1}$ ，与上面全局特征融合GFF得到的 $F_{GF}$ 作element-wise的相加，得到 $F_{DF}$ 。

4. 上采样网络（UPNet）

这部分就没什么好说的了，就是一个上采样+卷积操作，最终输出HR结果 $I_{HR}$ 。

4. Discussion

4.1 RDN与DenseNet的区别

DenseNet主要应用在目标检测等high-level的CV任务中，而RDN是专为相对low-level的SR任务设计的。所以相比于DenseNet，RDN拿掉了batch nomalization (BN) 层，降低了计算量；
RDN同样拿掉了DenseNet中的pooling层，因为池化会丢失一些像素级的信息；
在DenseNet中，相邻的两个Dense Block之间是有Conv+Pooling组成的过渡层的，而在RDN中，则是利用局部残差学习将dense连接层与LFF结合在一起。

4.2 RDN与SRDenseNet的区别

SRDenseNet使用的是DenseNet中的传统dense block，而RDB从3个方面进行了改进： ①连续记忆机制（CM）可以使先前的状态直接与当前RDB中的所有层直接连接；②得益于局部特征融合（LFF），RDB可以使用更大的学习率；③局部残差学习（LRL）的应用增大了信息和梯度的流动。
在RDB之间没有密集连接。 由于RDBs已经很好地提取了局部特征，所以没有在块直接采用密集连接，取而代之的是全局特征融合（GFF）和全局残差学习（GRL）。
SRDenseNet使用的是 $L_2$ loss，而RDN使用的是 $L_1$ loss。

4.3 RDN与MemNet的区别

（MemNet用的 $L_2$ loss。）
MemNet需要将bicubic 插值后的LR作为输入，而RDN不用，降低了计算量，提升了性能；
MemNet中的记忆block由递归和门控单元组成。记忆block中的大多数层都不能接收先前block的输出信息，而RDBs之间则有信息流交互；
MemNet中的记忆block不能充分利用中间block的信息。

5 数据集

训练：

采用的数据集为2K的高清RGB图像数据集——DIV2K，该数据集的训练集有800张图片，验证集有100张图片，测试集有100张图片。

测试：
使用了5组标准benchmark数据集：Set5，Set14，B100，Urban100，Manga109。

Degradation Models
分别使用了3种降阶模型对HR的DIV2K进行处理，来模拟LR图片。

BI： 用Matlab的imresize函数进行bicubic下采样，缩小比例为x2，x3，x4；
BD： 采用高斯核大小为 $7\times7$ 、标准差为1.6的高斯滤波处理，下采样的比例为x3；
BN： 先bicubic下采样，再加30%的高斯噪声。

6 Conclusions

DRN在SR任务上取得了很好的效果，性能超越了目前（2018）的state-of-the-art方法。

【其他超分辨方向论文】

【1】（RCAN）Image Super-Resolution Using Very Deep Residual Channel Attention Networks

【2】（IDN）Fast and Accurate Single Image Super-Resolution via Information Distillation Network

【3】（DRN）Closed-loop Matters: Dual Regression Networks for Single Image Super-Resolution

2018.05.02 每日念好
日念一好，加持幸福!念老公好，现在每天老公坚持6.30分叫孩子起床，送孩子上学，接孩子放学，老公真的是越来越关爱孩子了，我特别开心。念孩子好，今天孩子开始模拟考试，孩子说第一场考试考的比较好，回家也很开心的样子，其实孩子真的是想好好学习的，妈妈相信你只要你付出了就一定会有收获的。念自己好，今天上第七次课了，感觉收获越来越多，我想我一定会继续不断的学习，慢慢提升自己
2018-08-05 执笔写_青春
不要感觉自己很悲哀但至少，你在伤心的时候，可以仰望星空，和你最好的朋友，躺在草地上，听着小草的呢喃细语，月亮姐姐和星星的对话，那种感觉是妙不可言的!偶尔会有调皮的小虫子，在你身旁飞来飞去，那时，你也不会害怕，因为那是到给你光亮和希望的萤火虫在这么美丽的夏夜，有着让人无限的遐想，留下最浪漫的回忆。
每日一拍/# 043 抽象茶叶蛋的Cha
文/摄:茶叶蛋器材：苹果6s时间:2018.10.27抽象我喜欢抽象，因为抽象的概念就是可以天马行空，任由你想象，是一种创意的游走，所表达的作品就是代表着你自己的世界。黑白，彩色，无所不能！抽象的世界规蹈距也好，扑簌迷离也罢，都将为人带来更多的不一样体验与探索！这张是自拍时，从镜头里看到的办公室的天花板，就拍了下来，也是偶然所得！
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
Python Code Acceleration（Python代码加速）李伯爵的指间沙 Python
对于Python的代码执行效率较低的问题，参考博客：https://developer.51cto.com/art/201809/583695.htm进行相应的测试。参考代码如下：fromnumbaimportjitimporttimedeffoo(x,y):tt=time.time()s=0foriinrange(x,y):s+=iprint('Timeused:{}sec'.format(ti
FastAPI 实用教程：构建高性能 Python Web API 的终极指南熊猫钓鱼>_> 大数据 hadoop 分布式
本文为原创实战教程，涵盖FastAPI核心特性、路由设计、数据验证、数据库集成、认证授权、测试部署全流程，4000+字助你快速掌握现代PythonWeb开发利器。一、FastAPI为何成为开发者新宠？在PythonWeb框架领域，Flask和Django长期占据主导地位。但FastAPI自2018年发布以来迅速崛起，其魅力在于：极致的性能：基于Starlette（异步Web框架）和Pydantic
jmeter的时间戳函数使用 flower_1111 代码 jmeter jmeter
原文：https://blog.csdn.net/jocleyn/article/details/834144331、__time：获取时间戳、格式化时间（1）、${__time(yyyy-MM-ddHH:mm:ss:SSS,time)}：格式化生成时间格式2018-10-2611:08:23:635（2）、${__time(,)}：默认该公式精确到毫秒级别，13位数1527822855323（3
【译】2018 前端性能优化清单 —— 第一部分 qq_36320160 前端前端
原文地址：Front-EndPerformanceChecklist2018-Part1原文作者：VitalyFriedman译文出自：掘金翻译计划本文永久链接：https://github.com/xitu/gold-miner/blob/master/TODO/front-end-performance-checklist-2018-1.md译者：tvChan校对者：mysterytonyry
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
学习记录-第二阶段-定时任务-用户管理-用户密码-sudo-20181026-21：00前 chuyun0176 操作系统 java shell
#企业故障案例###################################################################linux定时任务crondexport变量问题群友案例来自网友兄弟北京@Grady(254553457)的总结。1）我写了一个重启resin的脚本，由于业务原因，需要定时在某一个时间重启下resin服务器，于是就在crontab里配置了如下内容：50
python 函数参数self_Python 类self 详解 weixin_39762464 python 函数参数self
Python中的self是学习类的一个难点，很多初学者学到Pythonself的时候，都会出现难以理解的情况，下面，蜗牛博客就为您进行讲解一下Python中的self。UpdatedonNov-02-2018:一、首先要明确几个概念：1.self代表类的实例，而非类。例：classPerson:defpri(self):print(self)a=Person()a.pri()print(id(a)
基于SIFT-POCS的超分辨率图像重建技术研究与实现神经网络15044 算法深度学习仿真模型人工智能计算机视觉深度学习算法大数据机器学习
基于SIFT-POCS的超分辨率图像重建技术研究与实现摘要本文详细研究了基于SIFT特征匹配和POCS(ProjectionOntoConvexSets)算法的超分辨率图像重建方法，并完整实现了文献"Super-ResolutionImageReconstructionBasedonSIFT-POCS"中提出的算法。首先介绍了超分辨率重建的基本原理和研究意义，然后深入分析了SIFT特征提取与匹配、
GIT漏洞详解
Git漏洞主要分为两类：Git软件本身的安全漏洞和因配置不当导致的Git仓库泄露。以下是详细解析及防御方案：一、Git软件自身漏洞（CVE漏洞）Git客户端或服务端（如GitLab、GitHub）的代码缺陷可能被利用，导致远程代码执行（RCE）、权限提升等风险。典型案例CVE-2018-11235漏洞类型：远程代码执行（RCE）。触发条件：攻击者构造恶意Git子模块名称，当受害者执行gitclon
【人工智能面经第五期：模型训练与优化核心面试深度问答】码上有前 Pytorch Python 深度学习人工智能面试职场和发展
作者：“码上有前”文章简介：人工智能面经欢迎小伙伴们点赞、收藏⭐、留言模型训练与优化核心面试深度问答摘要围绕模型训练与优化的训练技巧（正则化、迁移学习）和数据工程（数据增强、标注质量）展开，通过20个关键问题，解析正则化协同策略、迁移学习适配场景、数据增强实践等核心要点，助力读者掌握人工智能与计算机视觉岗位面试中模型训练优化的知识体系，明晰技术原理与实际应用的关联。目录训练技巧-正则化策略相关问题
【免费下载】 Windows Server 2019 中文版、英文版下载 (updated Jun 2024) 郦舟苓Melvin
WindowsServer2019中文版、英文版下载(updatedJun2024)【下载地址】WindowsServer2019中文版英文版下载updatedJun2024本资源文件提供了WindowsServer2019的中文版和英文版下载。WindowsServer2019是微软于2018年发布的服务器操作系统，基于Windows101809内核开发，具有强大的性能和安全性项目地址:http
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
安科瑞 EMS3.0 赋能零碳园区：能耗管控 + 绿电消纳，解锁碳中和 “最优解” 简婷18701998775 能源
简婷安科瑞电气股份有限公司上海嘉定2018011、引言随着全球工业化和城市化进程的加速，能源消耗和碳排放问题日益严峻。为应对气候变化，世界各国纷纷提出碳中和目标，我国也明确提出力争2030年前实现碳达峰、2060年前实现碳中和的“双碳”战略目标。在这一背景下，零碳园区作为实现区域碳中和的重要突破口，成为推动产业绿色转型和可持续发展的关键路径。然而，零碳园区的建设面临着能源管理复杂、绿电消纳困难、减
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文笔记ing】Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem Booksort online笔记论文论文阅读 transformer 深度学习
论文中使用一个PointerFormer模型编码器部分：可逆残差模型堆叠解码器部分：指针网络自回归对于一次任务而言，推理阶段：编码器部分：一次解码器部分：循环N次，直至任务结束在训练阶段，使用强化学习，对于一个N个节点的TSP实例，算法中会以不同的起点，跑N次，得到N个轨迹，以满足TSP的对称特性，表示这都是属于一个TSP问题的（真实）解然后会计算这样表示归一化奖励，得到一个advantage,然
【论文笔记】GaussianFusion: Gaussian-Based Multi-Sensor Fusion for End-to-End Autonomous Driving
原文链接：https://arxiv.org/abs/2506.00034v1简介：现有的多传感器融合方法多使用基于注意力的拉直(flatten)融合或通过几何变换的BEV融合，但前者可解释性差，后者计算开销大（如下图(a)(b)所示）。本文提出GaussianFusion（下图(c)），一种基于高斯的多传感器融合框架，用于端到端自动驾驶。使用直观而紧凑的高斯表达，聚合不同传感器的信息。具体来说，
扩散模型（Diffusion Model）简介
参考：Diffusionmodel—扩散模型-CSDN博客；由浅入深了解DiffusionModel-知乎；https://arxiv.org/abs/2308.093881.概述扩散模型是一种生成模型。可用在视觉生成任务上，如图像超分辨率、去模糊、JPEG伪影移除、阴影移除、去雾/霾/雨等等。扩散模型分为前向（扩散）过程和逆过程。前向过程逐步为图像增加逐像素噪声，直到图像满足高斯噪声；逆
Spring 进阶-第三十篇：Spring 框架的未来发展与前沿技术融合程序员勇哥 Java全套教程 spring java 后端 SpringBoot spring cloud
Spring进阶-第三十篇：Spring框架的未来发展与前沿技术融合一、云原生技术与Spring1.1Spring对云原生的支持演进Spring与云原生技术的融合经历了从适配到深度整合的过程：早期探索（2015-2018）：通过spring-boot-starter-container等模块初步支持容器化部署，简化Docker镜像构建；推出SpringCloud生态，提供服务注册与发现（Eurek
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
python抓取汇率_09 使用Python爬取中国银行网站选择汇率最坑的一天
爬取2018年8月27日~9月2日的欧元汇率。先说结论：如果是现汇卖出价，可以选择2018-08-3109:19:26，现钞卖出价805.28。我刚问了报销过的人她说任选都行，可以不是中行折算价。最近出差，学校可以以人民币的形式报销路费、住宿费，汇率，可以任选出差期间的任何一天任何时候的中国银行的汇率，中国银行网站上的汇率长这样：如果想要合理利用规则，多回一点本，不妨选择汇率最坑的一天(默默给财务
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS