hitrjj

【CVPR2020】计算机视觉与模式识别会议论文完全清单_Part2

CVPR 2020 的论文已经于6月10号放出
由于篇幅限制分两部分发出—>part1

Todo：word-cloud

Relative Interior Rule in Block-Coordinate Descent
Author: Tomas Werner,Daniel Prusa,Tomas Dlask

Learning Combinatorial Solver for Graph Matching
Author: Tao Wang,He Liu,Yidong Li,Yi Jin,Xiaohui Hou,Haibin Ling

SampleNet: Differentiable Point Cloud Sampling
Author: Itai Lang,Asaf Manor,Shai Avidan

Can We Learn Heuristics for Graphical Model Inference Using Reinforcement Learning?
Author: Safa Messaoud,Maghav Kumar,Alexander G. Schwing

Quasi-Newton Solver for Robust Non-Rigid Registration
Author: Yuxin Yao,Bailin Deng,Weiwei Xu,Juyong Zhang

Rethinking Class-Balanced Methods for Long-Tailed Visual Recognition From a Domain Adaptation Perspective
Author: Muhammad Abdullah Jamal,Matthew Brown,Ming-Hsuan Yang,Liqiang Wang,Boqing Gong

Optimizing Rank-Based Metrics With Blackbox Differentiation
Author: Michal Rolinek,Vit Musil,Anselm Paulus,Marin Vlastelica,Claudio Michaelis,Georg Martius

DualSDF: Semantic Shape Manipulation Using a Two-Level Representation
Author: Zekun Hao,Hadar Averbuch-Elor,Noah Snavely,Serge Belongie

Dynamic Hierarchical Mimicking Towards Consistent Optimization Objectives
Author: Duo Li,Qifeng Chen

Deep Homography Estimation for Dynamic Scenes
Author: Hoang Le,Feng Liu,Shu Zhang,Aseem Agarwala

PF-Net: Point Fractal Network for 3D Point Cloud Completion
Author: Zitian Huang,Yikuan Yu,Jiawen Xu,Feng Ni,Xinyi Le

On the Regularization Properties of Structured Dropout
Author: Ambar Pal,Connor Lane,Rene Vidal,Benjamin D. Haeffele

Learning Oracle Attention for High-Fidelity Face Completion
Author: Tong Zhou,Changxing Ding,Shaowen Lin,Xinchao Wang,Dacheng Tao

Deep Image Spatial Transformation for Person Image Generation
Author: Yurui Ren,Xiaoming Yu,Junming Chen,Thomas H. Li,Ge Li

Learning to Optimize on SPD Manifolds
Author: Zhi Gao,Yuwei Wu,Yunde Jia,Mehrtash Harandi

Deep 3D Portrait From a Single Image
Author: Sicheng Xu,Jiaolong Yang,Dong Chen,Fang Wen,Yu Deng,Yunde Jia,Xin Tong

RDCFace: Radial Distortion Correction for Face Recognition
Author: He Zhao,Xianghua Ying,Yongjie Shi,Xin Tong,Jingsi Wen,Hongbin Zha

Global-Local GCN: Large-Scale Label Noise Cleansing for Face Recognition
Author: Yaobin Zhang,Weihong Deng,Mei Wang,Jiani Hu,Xian Li,Dongyue Zhao,Dongchao Wen

MISC: Multi-Condition Injection and Spatially-Adaptive Compositing for Conditional Person Image Synthesis
Author: Shuchen Weng,Wenbo Li,Dawei Li,Hongxia Jin,Boxin Shi

SAINT: Spatially Aware Interpolation NeTwork for Medical Slice Synthesis
Author: Cheng Peng,Wei-An Lin,Haofu Liao,Rama Chellappa,S. Kevin Zhou

Recurrent Feature Reasoning for Image Inpainting
Author: Jingyuan Li,Ning Wang,Lefei Zhang,Bo Du,Dacheng Tao

Structure-Preserving Super Resolution With Gradient Guidance
Author: Cheng Ma,Yongming Rao,Yean Cheng,Ce Chen,Jiwen Lu,Jie Zhou

Epipolar Transformers
Author: Yihui He,Rui Yan,Katerina Fragkiadaki,Shoou-I Yu

Diversified Arbitrary Style Transfer via Deep Feature Perturbation
Author: Zhizhong Wang,Lei Zhao,Haibo Chen,Lihong Qiu,Qihang Mo,Sihuan Lin,Wei Xing,Dongming Lu

MSG-GAN: Multi-Scale Gradients for Generative Adversarial Networks
Author: Animesh Karnewar,Oliver Wang

Overcoming Multi-Model Forgetting in One-Shot NAS With Diversity Maximization
Author: Miao Zhang,Huiqi Li,Shirui Pan,Xiaojun Chang,Steven Su

Select to Better Learn: Fast and Accurate Deep Learning Using Data Selection From Nonlinear Manifolds
Author: Mohsen Joneidi,Saeed Vahidian,Ashkan Esmaeili,Weijia Wang,Nazanin Rahnavard,Bill Lin,Mubarak Shah

Neural Point Cloud Rendering via Multi-Plane Projection
Author: Peng Dai,Yinda Zhang,Zhuwen Li,Shuaicheng Liu,Bing Zeng

Wish You Were Here: Context-Aware Human Generation
Author: Oran Gafni,Lior Wolf

Towards Photo-Realistic Virtual Try-On by Adaptively Generating-Preserving Image Content
Author: Han Yang,Ruimao Zhang,Xiaobao Guo,Wei Liu,Wangmeng Zuo,Ping Luo

Breaking the Cycle - Colleagues Are All You Need
Author: Ori Nizan,Ayellet Tal

Local Class-Specific and Global Image-Level Generative Adversarial Networks for Semantic-Guided Scene Generation
Author: Hao Tang,Dan Xu,Yan Yan,Philip H.S. Torr,Nicu Sebe

ManiGAN: Text-Guided Image Manipulation
Author: Bowen Li,Xiaojuan Qi,Thomas Lukasiewicz,Philip H.S. Torr

Watch Your Up-Convolution: CNN Based Generative Deep Neural Networks Are Failing to Reproduce Spectral Distributions
Author: Ricard Durall,Margret Keuper,Janis Keuper

Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems
Author: Patrick Knobelreiter,Christian Sormann,Alexander Shekhovtsov,Friedrich Fraundorfer,Thomas Pock

Barycenters of Natural Images Constrained Wasserstein Barycenters for Image Morphing
Author: Dror Simon,Aviad Aberdam

Guided Variational Autoencoder for Disentanglement Learning
Author: Zheng Ding,Yifan Xu,Weijian Xu,Gaurav Parmar,Yang Yang,Max Welling,Zhuowen Tu

Cross-Spectral Face Hallucination via Disentangling Independent Factors
Author: Boyan Duan,Chaoyou Fu,Yi Li,Xingguang Song,Ran He

Learned Image Compression With Discretized Gaussian Mixture Likelihoods and Attention Modules
Author: Zhengxue Cheng,Heming Sun,Masaru Takeuchi,Jiro Katto

C-Flow: Conditional Generative Flow Models for Images and 3D Point Clouds
Author: Albert Pumarola,Stefan Popov,Francesc Moreno-Noguer,Vittorio Ferrari

Cogradient Descent for Bilinear Optimization
Author: Li’an Zhuo,Baochang Zhang,Linlin Yang,Hanlin Chen,Qixiang Ye,David Doermann,Rongrong Ji,Guodong Guo

Instance-Aware Image Colorization
Author: Jheng-Wei Su,Hung-Kuo Chu,Jia-Bin Huang

Joint Training of Variational Auto-Encoder and Latent Energy-Based Model
Author: Tian Han,Erik Nijkamp,Linqi Zhou,Bo Pang,Song-Chun Zhu,Ying Nian Wu

Adaptive Loss-Aware Quantization for Multi-Bit Networks
Author: Zhongnan Qu,Zimu Zhou,Yun Cheng,Lothar Thiele

ScopeFlow: Dynamic Scene Scoping for Optical Flow
Author: Aviram Bar-Haim,Lior Wolf

Video Super-Resolution With Temporal Group Attention
Author: Takashi Isobe,Songjiang Li,Xu Jia,Shanxin Yuan,Gregory Slabaugh,Chunjing Xu,Ya-Li Li,Shengjin Wang,Qi Tian

Group Sparsity: The Hinge Between Filter Pruning and Decomposition for Network Compression
Author: Yawei Li,Shuhang Gu,Christoph Mayer,Luc Van Gool,Radu Timofte

3D Photography Using Context-Aware Layered Depth Inpainting
Author: Meng-Li Shih,Shih-Yang Su,Johannes Kopf,Jia-Bin Huang

MixNMatch: Multifactor Disentanglement and Encoding for Conditional Image Generation
Author: Yuheng Li,Krishna Kumar Singh,Utkarsh Ojha,Yong Jae Lee

Low-Rank Compression of Neural Nets: Learning the Rank of Each Layer
Author: Yerlan Idelbayev,Miguel A. Carreira-Perpinan

Global Texture Enhancement for Fake Face Detection in the Wild
Author: Zhengzhe Liu,Xiaojuan Qi,Philip H.S. Torr

Panoptic-Based Image Synthesis
Author: Aysegul Dundar,Karan Sapra,Guilin Liu,Andrew Tao,Bryan Catanzaro

Lighthouse: Predicting Lighting Volumes for Spatially-Coherent Illumination
Author: Pratul P. Srinivasan,Ben Mildenhall,Matthew Tancik,Jonathan T. Barron,Richard Tucker,Noah Snavely

Learning to Cartoonize Using White-Box Cartoon Representations
Author: Xinrui Wang,Jinze Yu

End-to-End Learnable Geometric Vision by Backpropagating PnP Optimization
Author: Bo Chen,Alvaro Parra,Jiewei Cao,Nan Li,Tat-Jun Chin

Analyzing and Improving the Image Quality of StyleGAN
Author: Tero Karras,Samuli Laine,Miika Aittala,Janne Hellsten,Jaakko Lehtinen,Timo Aila

Fashion Editing With Adversarial Parsing Learning
Author: Haoye Dong,Xiaodan Liang,Yixuan Zhang,Xujie Zhang,Xiaohui Shen,Zhenyu Xie,Bowen Wu,Jian Yin

Augment Your Batch: Improving Generalization Through Instance Repetition
Author: Elad Hoffer,Tal Ben-Nun,Itay Hubara,Niv Giladi,Torsten Hoefler,Daniel Soudry

ARShadowGAN: Shadow Generative Adversarial Network for Augmented Reality in Single Light Scenes
Author: Daquan Liu,Chengjiang Long,Hongpan Zhang,Hanning Yu,Xinzhi Dong,Chunxia Xiao

An End-to-End Edge Aggregation Network for Moving Object Segmentation
Author: Prashant W. Patil,Kuldeep M. Biradar,Akshay Dudhane,Subrahmanyam Murala

Learning Video Stabilization Using Optical Flow
Author: Jiyang Yu,Ravi Ramamoorthi

Reusing Discriminators for Encoding: Towards Unsupervised Image-to-Image Translation
Author: Runfa Chen,Wenbing Huang,Binghui Huang,Fuchun Sun,Bin Fang

Robust Design of Deep Neural Networks Against Adversarial Attacks Based on Lyapunov Theory
Author: Arash Rahnama,Andre T. Nguyen,Edward Raff

StarGAN v2: Diverse Image Synthesis for Multiple Domains
Author: Yunjey Choi,Youngjung Uh,Jaejun Yoo,Jung-Woo Ha

Warping Residual Based Image Stitching for Large Parallax
Author: Kyu-Yul Lee,Jae-Young Sim

A U-Net Based Discriminator for Generative Adversarial Networks
Author: Edgar Schonfeld,Bernt Schiele,Anna Khoreva

Unpaired Portrait Drawing Generation via Asymmetric Cycle Mapping
Author: Ran Yi,Yong-Jin Liu,Yu-Kun Lai,Paul L. Rosin

When to Use Convolutional Neural Networks for Inverse Problems
Author: Nathaniel Chodosh,Simon Lucey

LUVLi Face Alignment: Estimating Landmarks’ Location, Uncertainty, and Visibility Likelihood
Author: Abhinav Kumar,Tim K. Marks,Wenxuan Mou,Ye Wang,Michael Jones,Anoop Cherian,Toshiaki Koike-Akino,Xiaoming Liu,Chen Feng

Affinity Graph Supervision for Visual Recognition
Author: Chu Wang,Babak Samari,Vladimir G. Kim,Siddhartha Chaudhuri,Kaleem Siddiqi

Unsupervised Magnification of Posture Deviations Across Subjects
Author: Michael Dorkenwald,Uta Buchler,Bjorn Ommer

Accurate Estimation of Body Height From a Single Depth Image via a Four-Stage Developing Network
Author: Fukun Yin,Shizhe Zhou

Fast Soft Color Segmentation
Author: Naofumi Akimoto,Huachun Zhu,Yanghua Jin,Yoshimitsu Aoki

Global Optimality for Point Set Registration Using Semidefinite Programming
Author: Jose Pedro Iglesias,Carl Olsson,Fredrik Kahl

Image2StyleGAN++: How to Edit the Embedded Images?
Author: Rameen Abdal,Yipeng Qin,Peter Wonka

SQE: a Self Quality Evaluation Metric for Parameters Optimization in Multi-Object Tracking
Author: Yanru Huang,Feiyu Zhu,Zheni Zeng,Xi Qiu,Yuan Shen,Jianan Wu

EventSR: From Asynchronous Events to Image Reconstruction, Restoration, and Super-Resolution via End-to-End Adversarial Learning
Author: Lin Wang,Tae-Kyun Kim,Kuk-Jin Yoon

Hierarchical Pyramid Diverse Attention Networks for Face Recognition
Author: Qiangchang Wang,Tianyi Wu,He Zheng,Guodong Guo

RGBD-Dog: Predicting Canine Pose from RGBD Sensors
Author: Sinead Kearney,Wenbin Li,Martin Parsons,Kwang In Kim,Darren Cosker

Multi-Scale Progressive Fusion Network for Single Image Deraining
Author: Kui Jiang,Zhongyuan Wang,Peng Yi,Chen Chen,Baojin Huang,Yimin Luo,Jiayi Ma,Junjun Jiang

Learning a Neural 3D Texture Space From 2D Exemplars
Author: Philipp Henzler,Niloy J. Mitra,Tobias Ritschel

BachGAN: High-Resolution Image Synthesis From Salient Object Layout
Author: Yandong Li,Yu Cheng,Zhe Gan,Licheng Yu,Liqiang Wang,Jingjing Liu

Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New Strategy
Author: Jaejun Yoo,Namhyuk Ahn,Kyung-Ah Sohn

On Positive-Unlabeled Classification in GAN
Author: Tianyu Guo,Chang Xu,Jiajun Huang,Yunhe Wang,Boxin Shi,Chao Xu,Dacheng Tao

DoveNet: Deep Image Harmonization via Domain Verification
Author: Wenyan Cong,Jianfu Zhang,Li Niu,Liu Liu,Zhixin Ling,Weiyuan Li,Liqing Zhang

Noise Robust Generative Adversarial Networks
Author: Takuhiro Kaneko,Tatsuya Harada

Normalizing Flows With Multi-Scale Autoregressive Priors
Author: Apratim Bhattacharyya,Shweta Mahajan,Mario Fritz,Bernt Schiele,Stefan Roth

Robust Reference-Based Super-Resolution With Similarity-Aware Deformable Convolution
Author: Gyumin Shim,Jinsun Park,In So Kweon

Painting Many Pasts: Synthesizing Time Lapse Videos of Paintings
Author: Amy Zhao,Guha Balakrishnan,Kathleen M. Lewis,Fredo Durand,John V. Guttag,Adrian V. Dalca

GeoDA: A Geometric Framework for Black-Box Adversarial Attacks
Author: Ali Rahmati,Seyed-Mohsen Moosavi-Dezfooli,Pascal Frossard,Huaiyu Dai

GAMIN: Generative Adversarial Multiple Imputation Network for Highly Missing Data
Author: Seongwook Yoon,Sanghoon Sull

An Internal Covariate Shift Bounding Algorithm for Deep Neural Networks by Unitizing Layers’ Outputs
Author: You Huang,Yuanlong Yu

A Unified Optimization Framework for Low-Rank Inducing Penalties
Author: Marcus Valtonen Ornhag,Carl Olsson

Single-Side Domain Generalization for Face Anti-Spoofing
Author: Yunpei Jia,Jie Zhang,Shiguang Shan,Xilin Chen

The Knowledge Within: Methods for Data-Free Model Compression
Author: Matan Haroush,Itay Hubara,Elad Hoffer,Daniel Soudry

Scale-Space Flow for End-to-End Optimized Video Compression
Author: Eirikur Agustsson,David Minnen,Nick Johnston,Johannes Balle,Sung Jin Hwang,George Toderici

Dynamic Neural Relational Inference
Author: Colin Graber,Alexander G. Schwing

Real-Time Panoptic Segmentation From Dense Detections
Author: Rui Hou,Jie Li,Arjun Bhargava,Allan Raventos,Vitor Guizilini,Chao Fang,Jerome Lynch,Adrien Gaidon

Deep Snake for Real-Time Instance Segmentation
Author: Sida Peng,Wen Jiang,Huaijin Pi,Xiuli Li,Hujun Bao,Xiaowei Zhou

AdaCoSeg: Adaptive Shape Co-Segmentation With Group Consistency Loss
Author: Chenyang Zhu,Kai Xu,Siddhartha Chaudhuri,Li Yi,Leonidas J. Guibas,Hao Zhang

Learning Dynamic Routing for Semantic Segmentation
Author: Yanwei Li,Lin Song,Yukang Chen,Zeming Li,Xiangyu Zhang,Xingang Wang,Jian Sun

Boosting Semantic Human Matting With Coarse Annotations
Author: Jinlin Liu,Yuan Yao,Wendi Hou,Miaomiao Cui,Xuansong Xie,Changshui Zhang,Xian-Sheng Hua

BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation
Author: Hao Chen,Kunyang Sun,Zhi Tian,Chunhua Shen,Yongming Huang,Youliang Yan

UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional Variational Autoencoders
Author: Jing Zhang,Deng-Ping Fan,Yuchao Dai,Saeed Anwar,Fatemeh Sadat Saleh,Tong Zhang,Nick Barnes

Deep Geometric Functional Maps: Robust Feature Learning for Shape Correspondence
Author: Nicolas Donati,Abhishek Sharma,Maks Ovsjanikov

Deep Polarization Cues for Transparent Object Segmentation
Author: Agastya Kalra,Vage Taamazyan,Supreeth Krishna Rao,Kartik Venkataraman,Ramesh Raskar,Achuta Kadambi

DualConvMesh-Net: Joint Geodesic and Euclidean Convolutions on 3D Meshes
Author: Jonas Schult,Francis Engelmann,Theodora Kontogianni,Bastian Leibe

F-BRS: Rethinking Backpropagating Refinement for Interactive Segmentation
Author: Konstantin Sofiiuk,Ilia Petrov,Olga Barinova,Anton Konushin

Approximating shapes in images with low-complexity polygons
Author: Muxingzi Li,Florent Lafarge,Renaud Marlet

Towards Visually Explaining Variational Autoencoders
Author: Wenqian Liu,Runze Li,Meng Zheng,Srikrishna Karanam,Ziyan Wu,Bir Bhanu,Richard J. Radke,Octavia Camps

Towards Global Explanations of Convolutional Neural Networks With Concept Attribution
Author: Weibin Wu,Yuxin Su,Xixian Chen,Shenglin Zhao,Irwin King,Michael R. Lyu,Yu-Wing Tai

Interpretable and Accurate Fine-grained Recognition via Region Grouping
Author: Zixuan Huang,Yin Li

SAM: The Sensitivity of Attribution Methods to Hyperparameters
Author: Naman Bansal,Chirag Agarwal,Anh Nguyen

High-Frequency Component Helps Explain the Generalization of Convolutional Neural Networks
Author: Haohan Wang,Xindi Wu,Zeyi Huang,Eric P. Xing

CNN-Generated Images Are Surprisingly Easy to Spot… for Now
Author: Sheng-Yu Wang,Oliver Wang,Richard Zhang,Andrew Owens,Alexei A. Efros

FALCON: A Fourier Transform Based Approach for Fast and Secure Convolutional Neural Network Predictions
Author: Shaohua Li,Kaiping Xue,Bin Zhu,Chenkai Ding,Xindi Gao,David Wei,Tao Wan

Dreaming to Distill: Data-Free Knowledge Transfer via DeepInversion
Author: Hongxu Yin,Pavlo Molchanov,Jose M. Alvarez,Zhizhong Li,Arun Mallya,Derek Hoiem,Niraj K. Jha,Jan Kautz

Unsupervised Domain Adaptation via Structurally Regularized Deep Clustering
Author: Hui Tang,Ke Chen,Kui Jia

HyperSTAR: Task-Aware Hyperparameters for Deep Networks
Author: Gaurav Mittal,Chang Liu,Nikolaos Karianakis,Victor Fragoso,Mei Chen,Yun Fu

ActBERT: Learning Global-Local Video-Text Representations
Author: Linchao Zhu,Yi Yang

State-Relabeling Adversarial Active Learning
Author: Beichen Zhang,Liang Li,Shijie Yang,Shuhui Wang,Zheng-Jun Zha,Qingming Huang

Erasing Integrated Learning: A Simple Yet Effective Approach for Weakly Supervised Object Localization
Author: Jinjie Mai,Meng Yang,Wenfeng Luo

A Shared Multi-Attention Framework for Multi-Label Zero-Shot Learning
Author: Dat Huynh,Ehsan Elhamifar

Self-Supervised Learning of Interpretable Keypoints From Unlabelled Videos
Author: Tomas Jakab,Ankush Gupta,Hakan Bilen,Andrea Vedaldi

Few-Shot Open-Set Recognition Using Meta-Learning
Author: Bo Liu,Hao Kang,Haoxiang Li,Gang Hua,Nuno Vasconcelos

Few-Shot Learning via Embedding Adaptation With Set-to-Set Functions
Author: Han-Jia Ye,Hexiang Hu,De-Chuan Zhan,Fei Sha

Temporally Distributed Networks for Fast Video Semantic Segmentation
Author: Ping Hu,Fabian Caba,Oliver Wang,Zhe Lin,Stan Sclaroff,Federico Perazzi

Benchmarking the Robustness of Semantic Segmentation Models
Author: Christoph Kamann,Carsten Rother

There and Back Again: Revisiting Backpropagation Saliency Methods
Author: Sylvestre-Alvise Rebuffi,Ruth Fong,Xu Ji,Andrea Vedaldi

Deep Semantic Clustering by Partition Confidence Maximisation
Author: Jiabo Huang,Shaogang Gong,Xiatian Zhu

StructEdit: Learning Structural Shape Variations
Author: Kaichun Mo,Paul Guerrero,Li Yi,Hao Su,Peter Wonka,Niloy J. Mitra,Leonidas J. Guibas

Harmonizing Transferability and Discriminability for Adapting Object Detectors
Author: Chaoqi Chen,Zebiao Zheng,Xinghao Ding,Yue Huang,Qi Dou

Fast Video Object Segmentation With Temporal Aggregation Network and Dynamic Template Matching
Author: Xuhua Huang,Jiarui Xu,Yu-Wing Tai,Chi-Keung Tang

CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation via Global and Local Refinement
Author: Ho Kei Cheng,Jihoon Chung,Yu-Wing Tai,Chi-Keung Tang

Correlating Edge, Pose With Parsing
Author: Ziwei Zhang,Chi Su,Liang Zheng,Xiaodong Xie

VecRoad: Point-Based Iterative Graph Exploration for Road Graphs Extraction
Author: Yong-Qiang Tan,Shang-Hua Gao,Xuan-Yi Li,Ming-Ming Cheng,Bo Ren

Towards Fairness in Visual Recognition: Effective Strategies for Bias Mitigation
Author: Zeyu Wang,Klint Qinami,Ioannis Christos Karakozis,Kyle Genova,Prem Nair,Kenji Hata,Olga Russakovsky

Hierarchical Human Parsing With Typed Part-Relation Reasoning
Author: Wenguan Wang,Hailong Zhu,Jifeng Dai,Yanwei Pang,Jianbing Shen,Ling Shao

Compositional Convolutional Neural Networks: A Deep Architecture With Innate Robustness to Partial Occlusion
Author: Adam Kortylewski,Ju He,Qing Liu,Alan L. Yuille

Spatial Pyramid Based Graph Reasoning for Semantic Segmentation
Author: Xia Li,Yibo Yang,Qijie Zhao,Tiancheng Shen,Zhouchen Lin,Hong Liu

Learning Video Object Segmentation From Unlabeled Videos
Author: Xiankai Lu,Wenguan Wang,Jianbing Shen,Yu-Wing Tai,David J. Crandall,Steven C. H. Hoi

Part-Aware Context Network for Human Parsing
Author: Xiaomei Zhang,Yingying Chen,Bingke Zhu,Jinqiao Wang,Ming Tang

SCOUT: Self-Aware Discriminant Counterfactual Explanations
Author: Pei Wang,Nuno Vasconcelos

Weakly-Supervised Semantic Segmentation via Sub-Category Exploration
Author: Yu-Ting Chang,Qiaosong Wang,Wei-Chih Hung,Robinson Piramuthu,Yi-Hsuan Tsai,Ming-Hsuan Yang

Continual Learning With Extended Kronecker-Factored Approximate Curvature
Author: Janghyeon Lee,Hyeong Gwon Hong,Donggyu Joo,Junmo Kim

Phase Consistent Ecological Domain Adaptation
Author: Yanchao Yang,Dong Lao,Ganesh Sundaramoorthi,Stefano Soatto

AD-Cluster: Augmented Discriminative Clustering for Domain Adaptive Person Re-Identification
Author: Yunpeng Zhai,Shijian Lu,Qixiang Ye,Xuebo Shan,Jie Chen,Rongrong Ji,Yonghong Tian

3D-MPA: Multi-Proposal Aggregation for 3D Semantic Instance Segmentation
Author: Francis Engelmann,Martin Bokeloh,Alireza Fathi,Bastian Leibe,Matthias Niessner

Deep Active Learning for Biased Datasets via Fisher Kernel Self-Supervision
Author: Denis Gudovskiy,Alec Hodgkinson,Takuya Yamaguchi,Sotaro Tsukizawa

Adaptive Graph Convolutional Network With Attention Graph Clustering for Co-Saliency Detection
Author: Kaihua Zhang,Tengpeng Li,Shiwen Shen,Bo Liu,Jin Chen,Qingshan Liu

A2dele: Adaptive and Attentive Depth Distiller for Efficient RGB-D Salient Object Detection
Author: Yongri Piao,Zhengkun Rong,Miao Zhang,Weisong Ren,Huchuan Lu

Deep Fair Clustering for Visual Learning
Author: Peizhao Li,Han Zhao,Hongfu Liu

Bidirectional Graph Reasoning Network for Panoptic Segmentation
Author: Yangxin Wu,Gengwei Zhang,Yiming Gao,Xiajun Deng,Ke Gong,Xiaodan Liang,Liang Lin

Exploit Clues From Views: Self-Supervised and Regularized Learning for Multiview Object Recognition
Author: Chih-Hui Ho,Bo Liu,Tz-Ying Wu,Nuno Vasconcelos

Spherical Space Domain Adaptation With Robust Pseudo-Label Loss
Author: Xiang Gu,Jian Sun,Zongben Xu

Stochastic Classifiers for Unsupervised Domain Adaptation
Author: Zhihe Lu,Yongxin Yang,Xiatian Zhu,Cong Liu,Yi-Zhe Song,Tao Xiang

Unsupervised Learning of Intrinsic Structural Representation Points
Author: Nenglun Chen,Lingjie Liu,Zhiming Cui,Runnan Chen,Duygu Ceylan,Changhe Tu,Wenping Wang

PolyTransform: Deep Polygon Transformer for Instance Segmentation
Author: Justin Liang,Namdar Homayounfar,Wei-Chiu Ma,Yuwen Xiong,Rui Hu,Raquel Urtasun

Interactive Two-Stream Decoder for Accurate and Fast Saliency Detection
Author: Huajun Zhou,Xiaohua Xie,Jian-Huang Lai,Zixuan Chen,Lingxiao Yang

Towards Better Generalization: Joint Depth-Pose Learning Without PoseNet
Author: Wang Zhao,Shaohui Liu,Yezhi Shu,Yong-Jin Liu

LT-Net: Label Transfer by Learning Reversible Voxel-Wise Correspondence for One-Shot Medical Image Segmentation
Author: Shuxin Wang,Shilei Cao,Dong Wei,Renzhen Wang,Kai Ma,Liansheng Wang,Deyu Meng,Yefeng Zheng

FGN: Fully Guided Network for Few-Shot Instance Segmentation
Author: Zhibo Fan,Jin-Gang Yu,Zhihao Liang,Jiarong Ou,Changxin Gao,Gui-Song Xia,Yuanqing Li

A Quantum Computational Approach to Correspondence Problems on Point Sets
Author: Vladislav Golyanik,Christian Theobalt

Data-Efficient Semi-Supervised Learning by Reliable Edge Mining
Author: Peibin Chen,Tao Ma,Xu Qin,Weidi Xu,Shuchang Zhou

NestedVAE: Isolating Common Factors via Weak Supervision
Author: Matthew J. Vowels,Necati Cihan Camgoz,Richard Bowden

Progressive Adversarial Networks for Fine-Grained Domain Adaptation
Author: Sinan Wang,Xinyang Chen,Yunbo Wang,Mingsheng Long,Jianmin Wang

A Disentangling Invertible Interpretation Network for Explaining Latent Representations
Author: Patrick Esser,Robin Rombach,Bjorn Ommer

Modeling the Background for Incremental Learning in Semantic Segmentation
Author: Fabio Cermelli,Massimiliano Mancini,Samuel Rota Bulo,Elisa Ricci,Barbara Caputo

Interpreting the Latent Space of GANs for Semantic Face Editing
Author: Yujun Shen,Jinjin Gu,Xiaoou Tang,Bolei Zhou

Super-BPD: Super Boundary-to-Pixel Direction for Fast Image Segmentation
Author: Jianqiang Wan,Yang Liu,Donglai Wei,Xiang Bai,Yongchao Xu

Self-Learning With Rectification Strategy for Human Parsing
Author: Tao Li,Zhiyuan Liang,Sanyuan Zhao,Jiahao Gong,Jianbing Shen

Hyperbolic Visual Embedding Learning for Zero-Shot Recognition
Author: Shaoteng Liu,Jingjing Chen,Liangming Pan,Chong-Wah Ngo,Tat-Seng Chua,Yu-Gang Jiang

Sequential Mastery of Multiple Visual Tasks: Networks Naturally Learn to Learn and Forget to Forget
Author: Guy Davidson,Michael C. Mozer

Distilling Effective Supervision From Severe Label Noise
Author: Zizhao Zhang,Han Zhang,Sercan O. Arik,Honglak Lee,Tomas Pfister

Eternal Sunshine of the Spotless Net: Selective Forgetting in Deep Networks
Author: Aditya Golatkar,Alessandro Achille,Stefano Soatto

CenterMask: Single Shot Instance Segmentation With Point Representation
Author: Yuqing Wang,Zhaoliang Xu,Hao Shen,Baoshan Cheng,Lirong Yang

Mitigating Bias in Face Recognition Using Skewness-Aware Reinforcement Learning
Author: Mei Wang,Weihong Deng

MineGAN: Effective Knowledge Transfer From GANs to Target Domains With Few Images
Author: Yaxing Wang,Abel Gonzalez-Garcia,David Berga,Luis Herranz,Fahad Shahbaz Khan,Joost van de Weijer

DLWL: Improving Detection for Lowshot Classes With Weakly Labelled Data
Author: Vignesh Ramanathan,Rui Wang,Dhruv Mahajan

Unsupervised Deep Shape Descriptor With Point Distribution Learning
Author: Yi Shi,Mengchen Xu,Shuaihang Yuan,Yi Fang

Stylization-Based Architecture for Fast Deep Exemplar Colorization
Author: Zhongyou Xu,Tingting Wang,Faming Fang,Yun Sheng,Guixu Zhang

Cars Can’t Fly Up in the Sky: Improving Urban-Scene Segmentation via Height-Driven Attention Networks
Author: Sungha Choi,Joanne T. Kim,Jaegul Choo

State-Aware Tracker for Real-Time Video Object Segmentation
Author: Xi Chen,Zuoxin Li,Ye Yuan,Gang Yu,Jianxin Shen,Donglian Qi

Iteratively-Refined Interactive 3D Medical Image Segmentation With Multi-Agent Reinforcement Learning
Author: Xuan Liao,Wenhao Li,Qisen Xu,Xiangfeng Wang,Bo Jin,Xiaoyun Zhang,Yanfeng Wang,Ya Zhang

ENSEI: Efficient Secure Inference via Frequency-Domain Homomorphic Convolution for Privacy-Preserving Visual Recognition
Author: Song Bian,Tianchen Wang,Masayuki Hiromoto,Yiyu Shi,Takashi Sato

Multi-Scale Interactive Network for Salient Object Detection
Author: Youwei Pang,Xiaoqi Zhao,Lihe Zhang,Huchuan Lu

Interactive Multi-Label CNN Learning With Partial Labels
Author: Dat Huynh,Ehsan Elhamifar

ViewAL: Active Learning With Viewpoint Entropy for Semantic Segmentation
Author: Yawar Siddiqui,Julien Valentin,Matthias Niessner

Scene-Adaptive Video Frame Interpolation via Meta-Learning
Author: Myungsub Choi,Janghoon Choi,Sungyong Baik,Tae Hyun Kim,Kyoung Mu Lee

Action Segmentation With Joint Self-Supervised Temporal Domain Adaptation
Author: Min-Hung Chen,Baopu Li,Yingze Bao,Ghassan AlRegib,Zsolt Kira

Pixel Consensus Voting for Panoptic Segmentation
Author: Haochen Wang,Ruotian Luo,Michael Maire,Greg Shakhnarovich

Minimizing Discrete Total Curvature for Image Processing
Author: Qiuxiang Zhong,Yutong Li,Yijie Yang,Yuping Duan

Towards Robust Image Classification Using Sequential Attention Models
Author: Daniel Zoran,Mike Chrzanowski,Po-Sen Huang,Sven Gowal,Alex Mott,Pushmeet Kohli

Discovering Synchronized Subsets of Sequences: A Large Scale Solution
Author: Evangelos Sariyanidi,Casey J. Zampella,Keith G. Bartley,John D. Herrington,Theodore D. Satterthwaite,Robert T. Schultz,Birkan Tunc

Going Deeper With Lean Point Networks
Author: Eric-Tuan Le,Iasonas Kokkinos,Niloy J. Mitra

Efficient and Robust Shape Correspondence via Sparsity-Enforced Quadratic Assignment
Author: Rui Xiang,Rongjie Lai,Hongkai Zhao

Explainable Object-Induced Action Decision for Autonomous Vehicles
Author: Yiran Xu,Xiaoyin Yang,Lihang Gong,Hsuan-Chu Lin,Tz-Ying Wu,Yunsheng Li,Nuno Vasconcelos

Spatially Attentive Output Layer for Image Classification
Author: Ildoo Kim,Woonhyuk Baek,Sungwoong Kim

Attack to Explain Deep Representation
Author: Mohammad A. A. K. Jalwana,Naveed Akhtar,Mohammed Bennamoun,Ajmal Mian

Computing Valid P-Values for Image Segmentation by Selective Inference
Author: Kosuke Tanizaki,Noriaki Hashimoto,Yu Inatsu,Hidekata Hontani,Ichiro Takeuchi

Unsupervised Learning From Video With Deep Neural Embeddings
Author: Chengxu Zhuang,Tianwei She,Alex Andonian,Max Sobol Mark,Daniel Yamins

Partial Weight Adaptation for Robust DNN Inference
Author: Xiufeng Xie,Kyu-Han Kim

Probability Weighted Compact Feature for Domain Adaptive Retrieval
Author: Fuxiang Huang,Lei Zhang,Yang Yang,Xichuan Zhou

Where Does It End? - Reasoning About Hidden Surfaces by Object Intersection Constraints
Author: Michael Strecke,Jorg Stuckler

PolarNet: An Improved Grid Representation for Online LiDAR Point Clouds Semantic Segmentation
Author: Yang Zhang,Zixiang Zhou,Philip David,Xiangyu Yue,Zerong Xi,Boqing Gong,Hassan Foroosh

Pathological Retinal Region Segmentation From OCT Images Using Geometric Relation Based Augmentation
Author: Dwarikanath Mahapatra,Behzad Bozorgtabar,Ling Shao

Transferring and Regularizing Prediction for Semantic Segmentation
Author: Yiheng Zhang,Zhaofan Qiu,Ting Yao,Chong-Wah Ngo,Dong Liu,Tao Mei

PREDICT & CLUSTER: Unsupervised Skeleton Based Action Recognition
Author: Kun Su,Xiulong Liu,Eli Shlizerman

Model Adaptation: Unsupervised Domain Adaptation Without Source Data
Author: Rui Li,Qianfen Jiao,Wenming Cao,Hau-San Wong,Si Wu

Evade Deep Image Retrieval by Stashing Private Images in the Hash Space
Author: Yanru Xiao,Cong Wang,Xing Gao

Advisable Learning for Self-Driving Vehicles by Internalizing Observation-to-Action Rules
Author: Jinkyu Kim,Suhong Moon,Anna Rohrbach,Trevor Darrell,John Canny

ProAlignNet: Unsupervised Learning for Progressively Aligning Noisy Contours
Author: VSR Veeravasarapu,Abhishek Goel,Deepak Mittal,Maneesh Singh

Attribution in Scale and Space
Author: Shawn Xu,Subhashini Venugopalan,Mukund Sundararajan

Towards Causal VQA: Revealing and Reducing Spurious Correlations by Invariant and Covariant Semantic Editing
Author: Vedika Agarwal,Rakshith Shetty,Mario Fritz

Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection
Author: Shi-Xue Zhang,Xiaobin Zhu,Jie-Bo Hou,Chang Liu,Chun Yang,Hongfa Wang,Xu-Cheng Yin

Large-Scale Object Detection in the Wild From Imbalanced Multi-Labels
Author: Junran Peng,Xingyuan Bu,Ming Sun,Zhaoxiang Zhang,Tieniu Tan,Junjie Yan

BBN: Bilateral-Branch Network With Cumulative Learning for Long-Tailed Visual Recognition
Author: Boyan Zhou,Quan Cui,Xiu-Shen Wei,Zhao-Min Chen

Momentum Contrast for Unsupervised Visual Representation Learning
Author: Kaiming He,Haoqi Fan,Yuxin Wu,Saining Xie,Ross Girshick

Classifying, Segmenting, and Tracking Object Instances in Video with Mask Propagation
Author: Gedas Bertasius,Lorenzo Torresani

Weakly Supervised Fine-Grained Image Classification via Guassian Mixture Model Oriented Discriminative Learning
Author: Zhihui Wang,Shijie Wang,Shuhui Yang,Haojie Li,Jianjun Li,Zezhou Li

Bridging the Gap Between Anchor-Based and Anchor-Free Detection via Adaptive Training Sample Selection
Author: Shifeng Zhang,Cheng Chi,Yongqiang Yao,Zhen Lei,Stan Z. Li

Learning User Representations for Open Vocabulary Image Hashtag Prediction
Author: Thibaut Durand

Sketch Less for More: On-the-Fly Fine-Grained Sketch-Based Image Retrieval
Author: Ayan Kumar Bhunia,Yongxin Yang,Timothy M. Hospedales,Tao Xiang,Yi-Zhe Song

Few-Shot Pill Recognition
Author: Suiyi Ling,Andreas Pastor,Jing Li,Zhaohui Che,Junle Wang,Jieun Kim,Patrick Le Callet

PointRend: Image Segmentation As Rendering
Author: Alexander Kirillov,Yuxin Wu,Kaiming He,Ross Girshick

ABCNet: Real-Time Scene Text Spotting With Adaptive Bezier-Curve Network
Author: Yuliang Liu,Hao Chen,Chunhua Shen,Tong He,Lianwen Jin,Liangwei Wang

Learning Temporal Co-Attention Models for Unsupervised Video Action Localization
Author: Guoqiang Gong,Xinghan Wang,Yadong Mu,Qi Tian

Spatiotemporal Fusion in 3D CNNs: A Probabilistic View
Author: Yizhou Zhou,Xiaoyan Sun,Chong Luo,Zheng-Jun Zha,Wenjun Zeng

Uncertainty-Aware Score Distribution Learning for Action Quality Assessment
Author: Yansong Tang,Zanlin Ni,Jiahuan Zhou,Danyang Zhang,Jiwen Lu,Ying Wu,Jie Zhou

Learning Interactions and Relationships Between Movie Characters
Author: Anna Kukleva,Makarand Tapaswi,Ivan Laptev

Video Panoptic Segmentation
Author: Dahun Kim,Sanghyun Woo,Joon-Young Lee,In So Kweon

Understanding Human Hands in Contact at Internet Scale
Author: Dandan Shan,Jiaqi Geng,Michelle Shu,David F. Fouhey

End-to-End Learning of Visual Representations From Uncurated Instructional Videos
Author: Antoine Miech,Jean-Baptiste Alayrac,Lucas Smaira,Ivan Laptev,Josef Sivic,Andrew Zisserman

You2Me: Inferring Body Pose in Egocentric Video via First and Second Person Interactions
Author: Evonne Ng,Donglai Xiang,Hanbyul Joo,Kristen Grauman

Learning a Weakly-Supervised Video Actor-Action Segmentation Model With a Wise Selection
Author: Jie Chen,Zhiheng Li,Jiebo Luo,Chenliang Xu

Learning to Measure the Static Friction Coefficient in Cloth Contact
Author: Abdullah Haroon Rasheed,Victor Romero,Florence Bertails-Descoubes,Stefanie Wuhrer,Jean-Sebastien Franco,Arnaud Lazarus

SpeedNet: Learning the Speediness in Videos
Author: Sagie Benaim,Ariel Ephrat,Oran Lang,Inbar Mosseri,William T. Freeman,Michael Rubinstein,Michal Irani,Tali Dekel

Telling Left From Right: Learning Spatial Correspondence of Sight and Sound
Author: Karren Yang,Bryan Russell,Justin Salamon

Visual-Textual Capsule Routing for Text-Based Video Segmentation
Author: Bruce McIntosh,Kevin Duarte,Yogesh S Rawat,Mubarak Shah

Graph-Structured Referring Expression Reasoning in the Wild
Author: Sibei Yang,Guanbin Li,Yizhou Yu

Say As You Wish: Fine-Grained Control of Image Caption Generation With Abstract Scene Graphs
Author: Shizhe Chen,Qin Jin,Peng Wang,Qi Wu

Hierarchical Conditional Relation Networks for Video Question Answering
Author: Thao Minh Le,Vuong Le,Svetha Venkatesh,Truyen Tran

REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments
Author: Yuankai Qi,Qi Wu,Peter Anderson,Xin Wang,William Yang Wang,Chunhua Shen,Anton van den Hengel

Iterative Answer Prediction With Pointer-Augmented Multimodal Transformers for TextVQA
Author: Ronghang Hu,Amanpreet Singh,Trevor Darrell,Marcus Rohrbach

SQuINTing at VQA Models: Introspecting VQA Models With Sub-Questions
Author: Ramprasaath R. Selvaraju,Purva Tendulkar,Devi Parikh,Eric Horvitz,Marco Tulio Ribeiro,Besmira Nushi,Ece Kamar

Vision-Language Navigation With Self-Supervised Auxiliary Reasoning Tasks
Author: Fengda Zhu,Yi Zhu,Xiaojun Chang,Xiaodan Liang

Sign Language Transformers: Joint End-to-End Sign Language Recognition and Translation
Author: Necati Cihan Camgoz,Oscar Koller,Simon Hadfield,Richard Bowden

Multi-Task Collaborative Network for Joint Referring Expression Comprehension and Segmentation
Author: Gen Luo,Yiyi Zhou,Xiaoshuai Sun,Liujuan Cao,Chenglin Wu,Cheng Deng,Rongrong Ji

Counterfactual Vision and Language Learning
Author: Ehsan Abbasnejad,Damien Teney,Amin Parvaneh,Javen Shi,Anton van den Hengel

Iterative Context-Aware Graph Inference for Visual Dialog
Author: Dan Guo,Hui Wang,Hanwang Zhang,Zheng-Jun Zha,Meng Wang

TA-Student VQA: Multi-Agents Training by Self-Questioning
Author: Peixi Xiong,Ying Wu

Exploring Self-Attention for Image Recognition
Author: Hengshuang Zhao,Jiaya Jia,Vladlen Koltun

Cops-Ref: A New Dataset and Task on Compositional Referring Expression Comprehension
Author: Zhenfang Chen,Peng Wang,Lin Ma,Kwan-Yee K. Wong,Qi Wu

Improving Convolutional Networks With Self-Calibrated Convolutions
Author: Jiang-Jiang Liu,Qibin Hou,Ming-Ming Cheng,Changhu Wang,Jiashi Feng

Modality Shifting Attention Network for Multi-Modal Video Question Answering
Author: Junyeong Kim,Minuk Ma,Trung Pham,Kyungsu Kim,Chang D. Yoo

Learning to Structure an Image With Few Colors
Author: Yunzhong Hou,Liang Zheng,Stephen Gould

On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering
Author: Xinyu Wang,Yuliang Liu,Chunhua Shen,Chun Chet Ng,Canjie Luo,Lianwen Jin,Chee Seng Chan,Anton van den Hengel,Liangwei Wang

From Paris to Berlin: Discovering Fashion Style Influences Around the World
Author: Ziad Al-Halah,Kristen Grauman

A Local-to-Global Approach to Multi-Modal Movie Scene Segmentation
Author: Anyi Rao,Linning Xu,Yu Xiong,Guodong Xu,Qingqiu Huang,Bolei Zhou,Dahua Lin

G-TAD: Sub-Graph Localization for Temporal Action Detection
Author: Mengmeng Xu,Chen Zhao,David S. Rojas,Ali Thabet,Bernard Ghanem

Detailed 2D-3D Joint Representation for Human-Object Interaction
Author: Yong-Lu Li,Xinpeng Liu,Han Lu,Shiyi Wang,Junqi Liu,Jiefeng Li,Cewu Lu

One-Shot Adversarial Attacks on Visual Tracking With Dual Attention
Author: Xuesong Chen,Xiyu Yan,Feng Zheng,Yong Jiang,Shu-Tao Xia,Yong Zhao,Rongrong Ji

Rethinking Classification and Localization for Object Detection
Author: Yue Wu,Yinpeng Chen,Lu Yuan,Zicheng Liu,Lijuan Wang,Hongzhi Li,Yun Fu

Correspondence Networks With Adaptive Neighbourhood Consensus
Author: Shuda Li,Kai Han,Theo W. Costain,Henry Howard-Jenkins,Victor Prisacariu

Multiple Anchor Learning for Visual Object Detection
Author: Wei Ke,Tianliang Zhang,Zeyi Huang,Qixiang Ye,Jianzhuang Liu,Dong Huang

PhraseCut: Language-Based Image Segmentation in the Wild
Author: Chenyun Wu,Zhe Lin,Scott Cohen,Trung Bui,Subhransu Maji

Mask Encoding for Single Shot Instance Segmentation
Author: Rufeng Zhang,Zhi Tian,Chunhua Shen,Mingyu You,Youliang Yan

Action Genome: Actions As Compositions of Spatio-Temporal Scene Graphs
Author: Jingwei Ji,Ranjay Krishna,Li Fei-Fei,Juan Carlos Niebles

Learning Unseen Concepts via Hierarchical Decomposition and Composition
Author: Muli Yang,Cheng Deng,Junchi Yan,Xianglong Liu,Dacheng Tao

Hi-CMD: Hierarchical Cross-Modality Disentanglement for Visible-Infrared Person Re-Identification
Author: Seokeon Choi,Sumin Lee,Youngeun Kim,Taekyung Kim,Changick Kim

In Defense of Grid Features for Visual Question Answering
Author: Huaizu Jiang,Ishan Misra,Marcus Rohrbach,Erik Learned-Miller,Xinlei Chen

Multi-Mutual Consistency Induced Transfer Subspace Learning for Human Motion Segmentation
Author: Tao Zhou,Huazhu Fu,Chen Gong,Jianbing Shen,Ling Shao,Fatih Porikli

Dense Regression Network for Video Grounding
Author: Runhao Zeng,Haoming Xu,Wenbing Huang,Peihao Chen,Mingkui Tan,Chuang Gan

Neural Architecture Search for Lightweight Non-Local Networks
Author: Yingwei Li,Xiaojie Jin,Jieru Mei,Xiaochen Lian,Linjie Yang,Cihang Xie,Qihang Yu,Yuyin Zhou,Song Bai,Alan L. Yuille

Learning Saliency Propagation for Semi-Supervised Instance Segmentation
Author: Yanzhao Zhou,Xin Wang,Jianbin Jiao,Trevor Darrell,Fisher Yu

Speech2Action: Cross-Modal Supervision for Action Recognition
Author: Arsha Nagrani,Chen Sun,David Ross,Rahul Sukthankar,Cordelia Schmid,Andrew Zisserman

Normalized and Geometry-Aware Self-Attention Network for Image Captioning
Author: Longteng Guo,Jing Liu,Xinxin Zhu,Peng Yao,Shichen Lu,Hanqing Lu

Memory Enhanced Global-Local Aggregation for Video Object Detection
Author: Yihong Chen,Yue Cao,Han Hu,Liwei Wang

Solving Mixed-Modal Jigsaw Puzzle for Fine-Grained Sketch-Based Image Retrieval
Author: Kaiyue Pang,Yongxin Yang,Timothy M. Hospedales,Tao Xiang,Yi-Zhe Song

LG-GAN: Label Guided Adversarial Network for Flexible Targeted Attack of Point Cloud Based Deep Networks
Author: Hang Zhou,Dongdong Chen,Jing Liao,Kejiang Chen,Xiaoyi Dong,Kunlin Liu,Weiming Zhang,Gang Hua,Nenghai Yu

Memory Aggregation Networks for Efficient Interactive Video Object Segmentation
Author: Jiaxu Miao,Yunchao Wei,Yi Yang

VQA With No Questions-Answers Training
Author: Ben-Zion Vatashsky,Shimon Ullman

Counting Out Time: Class Agnostic Video Repetition Counting in the Wild
Author: Debidatta Dwibedi,Yusuf Aytar,Jonathan Tompson,Pierre Sermanet,Andrew Zisserman

SaccadeNet: A Fast and Accurate Object Detector
Author: Shiyi Lan,Zhou Ren,Yi Wu,Larry S. Davis,Gang Hua

Multi-Granularity Reference-Aided Attentive Feature Aggregation for Video-Based Person Re-Identification
Author: Zhizheng Zhang,Cuiling Lan,Wenjun Zeng,Zhibo Chen

Video Object Grounding Using Semantic Roles in Language Description
Author: Arka Sadhu,Kan Chen,Ram Nevatia

Designing Network Design Spaces
Author: Ilija Radosavovic,Raj Prateek Kosaraju,Ross Girshick,Kaiming He,Piotr Dollar

12-in-1: Multi-Task Vision and Language Representation Learning
Author: Jiasen Lu,Vedanuj Goswami,Marcus Rohrbach,Devi Parikh,Stefan Lee

MLCVNet: Multi-Level Context VoteNet for 3D Object Detection
Author: Qian Xie,Yu-Kun Lai,Jing Wu,Zhoutao Wang,Yiming Zhang,Kai Xu,Jun Wang

Listen to Look: Action Recognition by Previewing Audio
Author: Ruohan Gao,Tae-Hyun Oh,Kristen Grauman,Lorenzo Torresani

Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization
Author: Ruyi Ji,Longyin Wen,Libo Zhang,Dawei Du,Yanjun Wu,Chen Zhao,Xianglong Liu,Feiyue Huang

Music Gesture for Visual Sound Separation
Author: Chuang Gan,Deng Huang,Hang Zhao,Joshua B. Tenenbaum,Antonio Torralba

Referring Image Segmentation via Cross-Modal Progressive Comprehension
Author: Shaofei Huang,Tianrui Hui,Si Liu,Guanbin Li,Yunchao Wei,Jizhong Han,Luoqi Liu,Bo Li

Cloth in the Wind: A Case Study of Physical Measurement Through Simulation
Author: Tom F. H. Runia,Kirill Gavrilyuk,Cees G. M. Snoek,Arnold W. M. Smeulders

The Garden of Forking Paths: Towards Multi-Future Trajectory Prediction
Author: Junwei Liang,Lu Jiang,Kevin Murphy,Ting Yu,Alexander Hauptmann

CentripetalNet: Pursuing High-Quality Keypoint Pairs for Object Detection
Author: Zhiwei Dong,Guoxuan Li,Yue Liao,Fei Wang,Pengju Ren,Chen Qian

PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection
Author: Shaoshuai Shi,Chaoxu Guo,Li Jiang,Zhe Wang,Jianping Shi,Xiaogang Wang,Hongsheng Li

Graph Embedded Pose Clustering for Anomaly Detection
Author: Amir Markovitz,Gilad Sharir,Itamar Friedman,Lihi Zelnik-Manor,Shai Avidan

Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance Disparity Estimation
Author: Jiaming Sun,Linghao Chen,Yiming Xie,Siyu Zhang,Qinhong Jiang,Xiaowei Zhou,Hujun Bao

Deepstrip: High-Resolution Boundary Refinement
Author: Peng Zhou,Brian Price,Scott Cohen,Gregg Wilensky,Larry S. Davis

Smoothing Adversarial Domain Attack and P-Memory Reconsolidation for Cross-Domain Person Re-Identification
Author: Guangcong Wang,Jian-Huang Lai,Wenqi Liang,Guangrun Wang

Meshed-Memory Transformer for Image Captioning
Author: Marcella Cornia,Matteo Stefanini,Lorenzo Baraldi,Rita Cucchiara

Learning From Noisy Anchors for One-Stage Object Detection
Author: Hengduo Li,Zuxuan Wu,Chen Zhu,Caiming Xiong,Richard Socher,Larry S. Davis

Instance-Aware, Context-Focused, and Memory-Efficient Weakly Supervised Object Detection
Author: Zhongzheng Ren,Zhiding Yu,Xiaodong Yang,Ming-Yu Liu,Yong Jae Lee,Alexander G. Schwing,Jan Kautz

Density-Based Clustering for 3D Object Detection in Point Clouds
Author: Syeda Mariam Ahmed,Chee Meng Chew

Few-Shot Video Classification via Temporal Alignment
Author: Kaidi Cao,Jingwei Ji,Zhangjie Cao,Chien-Yi Chang,Juan Carlos Niebles

Densely Connected Search Space for More Flexible Neural Architecture Search
Author: Jiemin Fang,Yuzhu Sun,Qian Zhang,Yuan Li,Wenyu Liu,Xinggang Wang

Fine-Grained Video-Text Retrieval With Hierarchical Graph Reasoning
Author: Shizhe Chen,Yida Zhao,Qin Jin,Qi Wu

Warp to the Future: Joint Forecasting of Features and Feature Motion
Author: Josip Saric,Marin Orsic,Tonci Antunovic,Sacha Vrazic,Sinisa Segvic

Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio
Author: Zhengsu Chen,Jianwei Niu,Lingxi Xie,Xuefeng Liu,Longhui Wei,Qi Tian

Where Does It Exist: Spatio-Temporal Video Grounding for Multi-Form Sentences
Author: Zhu Zhang,Zhou Zhao,Yang Zhao,Qi Wang,Huasheng Liu,Lianli Gao

Cross-Modal Cross-Domain Moment Alignment Network for Person Search
Author: Ya Jing,Wei Wang,Liang Wang,Tieniu Tan

Self-Training With Noisy Student Improves ImageNet Classification
Author: Qizhe Xie,Minh-Thang Luong,Eduard Hovy,Quoc V. Le

Learning Longterm Representations for Person Re-Identification Using Radio Signals
Author: Lijie Fan,Tianhong Li,Rongyao Fang,Rumen Hristov,Yuan Yuan,Dina Katabi

LatentFusion: End-to-End Differentiable Reconstruction and Rendering for Unseen Object Pose Estimation
Author: Keunhong Park,Arsalan Mousavian,Yu Xiang,Dieter Fox

Learning Instance Occlusion for Panoptic Segmentation
Author: Justin Lazarow,Kwonjoon Lee,Kunyu Shi,Zhuowen Tu

Vision-Dialog Navigation by Exploring Cross-Modal Memory
Author: Yi Zhu,Fengda Zhu,Zhaohuan Zhan,Bingqian Lin,Jianbin Jiao,Xiaojun Chang,Xiaodan Liang

ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks
Author: Mohit Shridhar,Jesse Thomason,Daniel Gordon,Yonatan Bisk,Winson Han,Roozbeh Mottaghi,Luke Zettlemoyer,Dieter Fox

NMS by Representative Region: Towards Crowded Pedestrian Detection by Proposal Pairing
Author: Xin Huang,Zheng Ge,Zequn Jie,Osamu Yoshie

Visual Commonsense R-CNN
Author: Tan Wang,Jianqiang Huang,Hanwang Zhang,Qianru Sun

What Deep CNNs Benefit From Global Covariance Pooling: An Optimization Perspective
Author: Qilong Wang,Li Zhang,Banggu Wu,Dongwei Ren,Peihua Li,Wangmeng Zuo,Qinghua Hu

EfficientDet: Scalable and Efficient Object Detection
Author: Mingxing Tan,Ruoming Pang,Quoc V. Le

Fast Template Matching and Update for Video Object Tracking and Segmentation
Author: Mingjie Sun,Jimin Xiao,Eng Gee Lim,Bingfeng Zhang,Yao Zhao

Counterfactual Samples Synthesizing for Robust Visual Question Answering
Author: Long Chen,Xin Yan,Jun Xiao,Hanwang Zhang,Shiliang Pu,Yueting Zhuang

Local-Global Video-Text Interactions for Temporal Grounding
Author: Jonghwan Mun,Minsu Cho,Bohyung Han

Set-Constrained Viterbi for Set-Supervised Action Segmentation
Author: Jun Li,Sinisa Todorovic

Probabilistic Video Prediction From Noisy Data With a Posterior Confidence
Author: Yunbo Wang,Jiajun Wu,Mingsheng Long,Joshua B. Tenenbaum

Beyond Short-Term Snippet: Video Relation Detection With Spatio-Temporal Global Context
Author: Chenchen Liu,Yang Jin,Kehan Xu,Guoqiang Gong,Yadong Mu

Visual Grounding in Video for Unsupervised Word Translation
Author: Gunnar A. Sigurdsson,Jean-Baptiste Alayrac,Aida Nematzadeh,Lucas Smaira,Mateusz Malinowski,Joao Carreira,Phil Blunsom,Andrew Zisserman

Two Causal Principles for Improving Visual Dialog
Author: Jiaxin Qi,Yulei Niu,Jianqiang Huang,Hanwang Zhang

Spatio-Temporal Graph for Video Captioning With Knowledge Distillation
Author: Boxiao Pan,Haoye Cai,De-An Huang,Kuan-Hui Lee,Adrien Gaidon,Ehsan Adeli,Juan Carlos Niebles

A Real-Time Cross-Modality Correlation Filtering Method for Referring Expression Comprehension
Author: Yue Liao,Si Liu,Guanbin Li,Fei Wang,Yanjie Chen,Chen Qian,Bo Li

Better Captioning With Sequence-Level Exploration
Author: Jia Chen,Qin Jin

Violin: A Large-Scale Dataset for Video-and-Language Inference
Author: Jingzhou Liu,Wenhu Chen,Yu Cheng,Zhe Gan,Licheng Yu,Yiming Yang,Jingjing Liu

RiFeGAN: Rich Feature Generation for Text-to-Image Synthesis From Prior Knowledge
Author: Jun Cheng,Fuxiang Wu,Yanling Tian,Lei Wang,Dapeng Tao

Graph Structured Network for Image-Text Matching
Author: Chunxiao Liu,Zhendong Mao,Tianzhu Zhang,Hongtao Xie,Bin Wang,Yongdong Zhang

Straight to the Point: Fast-Forwarding Videos via Reinforcement Learning Using Textual Data
Author: Washington Ramos,Michel Silva,Edson Araujo,Leandro Soriano Marcolino,Erickson Nascimento

Multi-Modality Cross Attention Network for Image and Sentence Matching
Author: Xi Wei,Tianzhu Zhang,Yan Li,Yongdong Zhang,Feng Wu

Generalized ODIN: Detecting Out-of-Distribution Image Without Learning From Out-of-Distribution Data
Author: Yen-Chang Hsu,Yilin Shen,Hongxia Jin,Zsolt Kira

Learning Augmentation Network via Influence Functions
Author: Donghoon Lee,Hyunsin Park,Trung Pham,Chang D. Yoo

X-Linear Attention Networks for Image Captioning
Author: Yingwei Pan,Ting Yao,Yehao Li,Tao Mei

Unsupervised Person Re-Identification via Multi-Label Classification
Author: Dongkai Wang,Shiliang Zhang

Overcoming Classifier Imbalance for Long-Tail Object Detection With Balanced Group Softmax
Author: Yu Li,Tao Wang,Bingyi Kang,Sheng Tang,Chunfeng Wang,Jintao Li,Jiashi Feng

What You See is What You Get: Exploiting Visibility for 3D Object Detection
Author: Peiyun Hu,Jason Ziglar,David Held,Deva Ramanan

Deep Structure-Revealed Network for Texture Recognition
Author: Wei Zhai,Yang Cao,Zheng-Jun Zha,HaiYong Xie,Feng Wu

Online Knowledge Distillation via Collaborative Learning
Author: Qiushan Guo,Xinjiang Wang,Yichao Wu,Zhipeng Yu,Ding Liang,Xiaolin Hu,Ping Luo

Dynamic Convolution: Attention Over Convolution Kernels
Author: Yinpeng Chen,Xiyang Dai,Mengchen Liu,Dongdong Chen,Lu Yuan,Zicheng Liu

3DSSD: Point-Based 3D Single Stage Object Detector
Author: Zetong Yang,Yanan Sun,Shu Liu,Jiaya Jia

Deep Degradation Prior for Low-Quality Image Classification
Author: Yang Wang,Yang Cao,Zheng-Jun Zha,Jing Zhang,Zhiwei Xiong

ViBE: Dressing for Diverse Body Shapes
Author: Wei-Lin Hsiao,Kristen Grauman

Don’t Judge an Object by Its Context: Learning to Overcome Contextual Bias
Author: Krishna Kumar Singh,Dhruv Mahajan,Kristen Grauman,Yong Jae Lee,Matt Feiszli,Deepti Ghadiyaram

SESS: Self-Ensembling Semi-Supervised 3D Object Detection
Author: Na Zhao,Tat-Seng Chua,Gim Hee Lee

Combining Detection and Tracking for Human Pose Estimation in Videos
Author: Manchen Wang,Joseph Tighe,Davide Modolo

SAPIEN: A SimulAted Part-Based Interactive ENvironment
Author: Fanbo Xiang,Yuzhe Qin,Kaichun Mo,Yikuan Xia,Hao Zhu,Fangchen Liu,Minghua Liu,Hanxiao Jiang,Yifu Yuan,He Wang,Li Yi,Angel X. Chang,Leonidas J. Guibas,Hao Su

RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds
Author: Qingyong Hu,Bo Yang,Linhai Xie,Stefano Rosa,Yulan Guo,Zhihua Wang,Niki Trigoni,Andrew Markham

SurfelGAN: Synthesizing Realistic Sensor Data for Autonomous Driving
Author: Zhenpei Yang,Yuning Chai,Dragomir Anguelov,Yin Zhou,Pei Sun,Dumitru Erhan,Sean Rafferty,Henrik Kretzschmar

A Programmatic and Semantic Approach to Explaining and Debugging Neural Network Based Object Detectors
Author: Edward Kim,Divya Gopinath,Corina Pasareanu,Sanjit A. Seshia

Predicting Semantic Map Representations From Images Using Pyramid Occupancy Networks
Author: Thomas Roddick,Roberto Cipolla

Efficient Derivative Computation for Cumulative B-Splines on Lie Groups
Author: Christiane Sommer,Vladyslav Usenko,David Schubert,Nikolaus Demmel,Daniel Cremers

RL-CycleGAN: Reinforcement Learning Aware Simulation-to-Real
Author: Kanishka Rao,Chris Harris,Alex Irpan,Sergey Levine,Julian Ibarz,Mohi Khansari

LiDARsim: Realistic LiDAR Simulation by Leveraging the Real World
Author: Sivabalan Manivasagam,Shenlong Wang,Kelvin Wong,Wenyuan Zeng,Mikita Sazanovich,Shuhan Tan,Bin Yang,Wei-Chiu Ma,Raquel Urtasun

Just Go With the Flow: Self-Supervised Scene Flow Estimation
Author: Himangi Mittal,Brian Okorn,David Held

TITAN: Future Forecast Using Action Priors
Author: Srikanth Malla,Behzad Dariush,Chiho Choi

Robust Learning Through Cross-Task Consistency
Author: Amir R. Zamir,Alexander Sax,Nikhil Cheerla,Rohan Suri,Zhangjie Cao,Jitendra Malik,Leonidas J. Guibas

Dynamic Refinement Network for Oriented and Densely Packed Object Detection
Author: Xingjia Pan,Yuqiang Ren,Kekai Sheng,Weiming Dong,Haolei Yuan,Xiaowei Guo,Chongyang Ma,Changsheng Xu

AOWS: Adaptive and Optimal Network Width Search With Latency Constraints
Author: Maxim Berman,Leonid Pishchulin,Ning Xu,Matthew B. Blaschko,Gerard Medioni

High-Dimensional Convolutional Networks for Geometric Pattern Recognition
Author: Christopher Choy,Junha Lee,Rene Ranftl,Jaesik Park,Vladlen Koltun

Filter Response Normalization Layer: Eliminating Batch Dependence in the Training of Deep Neural Networks
Author: Saurabh Singh,Shankar Krishnan

Deep Iterative Surface Normal Estimation
Author: Jan Eric Lenssen,Christian Osendorfer,Jonathan Masci

Dataless Model Selection With the Deep Frame Potential
Author: Calvin Murdock,Simon Lucey

UNAS: Differentiable Architecture Search Meets Reinforcement Learning
Author: Arash Vahdat,Arun Mallya,Ming-Yu Liu,Jan Kautz

Local Context Normalization: Revisiting Local Normalization
Author: Anthony Ortiz,Caleb Robinson,Dan Morris,Olac Fuentes,Christopher Kiekintveld,Md Mahmudulla Hassan,Nebojsa Jojic

ACNe: Attentive Context Normalization for Robust Permutation-Equivariant Learning
Author: Weiwei Sun,Wei Jiang,Eduard Trulls,Andrea Tagliasacchi,Kwang Moo Yi

Learning Situational Driving
Author: Eshed Ohn-Bar,Aditya Prakash,Aseem Behl,Kashyap Chitta,Andreas Geiger

From Depth What Can You See? Depth Completion via Auxiliary Image Reconstruction
Author: Kaiyue Lu,Nick Barnes,Saeed Anwar,Liang Zheng

Symmetry and Group in Attribute-Object Compositions
Author: Yong-Lu Li,Yue Xu,Xiaohan Mao,Cewu Lu

Noise-Aware Fully Webly Supervised Object Detection
Author: Yunhang Shen,Rongrong Ji,Zhiwei Chen,Xiaopeng Hong,Feng Zheng,Jianzhuang Liu,Mingliang Xu,Qi Tian

3D Part Guided Image Editing for Fine-Grained Object Understanding
Author: Zongdai Liu,Feixiang Lu,Peng Wang,Hui Miao,Liangjun Zhang,Ruigang Yang,Bin Zhou

STINet: Spatio-Temporal-Interactive Network for Pedestrian Detection and Trajectory Prediction
Author: Zhishuai Zhang,Jiyang Gao,Junhua Mao,Yukai Liu,Dragomir Anguelov,Congcong Li

Rethinking Performance Estimation in Neural Architecture Search
Author: Xiawu Zheng,Rongrong Ji,Qiang Wang,Qixiang Ye,Zhenguo Li,Yonghong Tian,Qi Tian

Feature-Metric Registration: A Fast Semi-Supervised Approach for Robust Point Cloud Registration Without Correspondences
Author: Xiaoshui Huang,Guofeng Mei,Jian Zhang

Learning Multi-View Camera Relocalization With Graph Neural Networks
Author: Fei Xue,Xin Wu,Shaojun Cai,Junqiu Wang

MotionNet: Joint Perception and Motion Prediction for Autonomous Driving Based on Bird’s Eye View Maps
Author: Pengxiang Wu,Siheng Chen,Dimitris N. Metaxas

EcoNAS: Finding Proxies for Economical Neural Architecture Search
Author: Dongzhan Zhou,Xinchi Zhou,Wenwei Zhang,Chen Change Loy,Shuai Yi,Xuesen Zhang,Wanli Ouyang

Hit-Detector: Hierarchical Trinity Architecture Search for Object Detection
Author: Jianyuan Guo,Kai Han,Yunhe Wang,Chao Zhang,Zhaohui Yang,Han Wu,Xinghao Chen,Chang Xu

Geometrically Principled Connections in Graph Neural Networks
Author: Shunwang Gong,Mehdi Bahri,Michael M. Bronstein,Stefanos Zafeiriou

On Vocabulary Reliance in Scene Text Recognition
Author: Zhaoyi Wan,Jielei Zhang,Liang Zhang,Jiebo Luo,Cong Yao

Generating Accurate Pseudo-Labels in Semi-Supervised Learning and Avoiding Overconfident Predictions via Hermite Polynomial Activations
Author: Vishnu Suresh Lokhande,Songwong Tasneeyapant,Abhay Venkatesh,Sathya N. Ravi,Vikas Singh

GraspNet-1Billion: A Large-Scale Benchmark for General Object Grasping
Author: Hao-Shu Fang,Chenxi Wang,Minghao Gou,Cewu Lu

PFRL: Pose-Free Reinforcement Learning for 6D Pose Estimation
Author: Jianzhun Shao,Yuhang Jiang,Gu Wang,Zhigang Li,Xiangyang Ji

Through Fog High-Resolution Imaging Using Millimeter Wave Radar
Author: Junfeng Guan,Sohrab Madani,Suraj Jog,Saurabh Gupta,Haitham Hassanieh

Disentangling Physical Dynamics From Unknown Factors for Unsupervised Video Prediction
Author: Vincent Le Guen,Nicolas Thome

D2Det: Towards High Quality Object Detection and Instance Segmentation
Author: Jiale Cao,Hisham Cholakkal,Rao Muhammad Anwer,Fahad Shahbaz Khan,Yanwei Pang,Ling Shao

LiDAR-Based Online 3D Video Object Detection With Graph-Based Message Passing and Spatiotemporal Transformer Attention
Author: Junbo Yin,Jianbing Shen,Chenye Guan,Dingfu Zhou,Ruigang Yang

Orthogonal Convolutional Neural Networks
Author: Jiayun Wang,Yubei Chen,Rudrasis Chakraborty,Stella X. Yu

Self-Robust 3D Point Recognition via Gather-Vector Guidance
Author: Xiaoyi Dong,Dongdong Chen,Hang Zhou,Gang Hua,Weiming Zhang,Nenghai Yu

VectorNet: Encoding HD Maps and Agent Dynamics From Vectorized Representation
Author: Jiyang Gao,Chen Sun,Hang Zhao,Yi Shen,Dragomir Anguelov,Congcong Li,Cordelia Schmid

ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks
Author: Qilong Wang,Banggu Wu,Pengfei Zhu,Peihua Li,Wangmeng Zuo,Qinghua Hu

MTL-NAS: Task-Agnostic Neural Architecture Search Towards General-Purpose Multi-Task Learning
Author: Yuan Gao,Haoping Bai,Zequn Jie,Jiayi Ma,Kui Jia,Wei Liu

PnPNet: End-to-End Perception and Prediction With Tracking in the Loop
Author: Ming Liang,Bin Yang,Wenyuan Zeng,Yun Chen,Rui Hu,Sergio Casas,Raquel Urtasun

Revisiting the Sibling Head in Object Detector
Author: Guanglu Song,Yu Liu,Xiaogang Wang

Visual Reaction: Learning to Play Catch With Your Drone
Author: Kuo-Hao Zeng,Roozbeh Mottaghi,Luca Weihs,Ali Farhadi

Prime Sample Attention in Object Detection
Author: Yuhang Cao,Kai Chen,Chen Change Loy,Dahua Lin

SpineNet: Learning Scale-Permuted Backbone for Recognition and Localization
Author: Xianzhi Du,Tsung-Yi Lin,Pengchong Jin,Golnaz Ghiasi,Mingxing Tan,Yin Cui,Quoc V. Le,Xiaodan Song

KeyPose: Multi-View 3D Labeling and Keypoint Estimation for Transparent Objects
Author: Xingyu Liu,Rico Jonschkowski,Anelia Angelova,Kurt Konolige

SegGCN: Efficient 3D Point Cloud Segmentation With Fuzzy Spherical Kernel
Author: Huan Lei,Naveed Akhtar,Ajmal Mian

nuScenes: A Multimodal Dataset for Autonomous Driving
Author: Holger Caesar,Varun Bankiti,Alex H. Lang,Sourabh Vora,Venice Erin Liong,Qiang Xu,Anush Krishnan,Yu Pan,Giancarlo Baldan,Oscar Beijbom

PVN3D: A Deep Point-Wise 3D Keypoints Voting Network for 6DoF Pose Estimation
Author: Yisheng He,Wei Sun,Haibin Huang,Jianran Liu,Haoqiang Fan,Jian Sun

Probabilistic Pixel-Adaptive Refinement Networks
Author: Anne S. Wannenwetsch,Stefan Roth

Discovering Human Interactions With Novel Objects via Zero-Shot Learning
Author: Suchen Wang,Kim-Hui Yap,Junsong Yuan,Yap-Peng Tan

Equalization Loss for Long-Tailed Object Recognition
Author: Jingru Tan,Changbao Wang,Buyu Li,Quanquan Li,Wanli Ouyang,Changqing Yin,Junjie Yan

Learning Depth-Guided Convolutions for Monocular 3D Object Detection
Author: Mingyu Ding,Yuqi Huo,Hongwei Yi,Zhe Wang,Jianping Shi,Zhiwu Lu,Ping Luo

Seeing Through Fog Without Seeing Fog: Deep Multimodal Sensor Fusion in Unseen Adverse Weather
Author: Mario Bijelic,Tobias Gruber,Fahim Mannan,Florian Kraus,Werner Ritter,Klaus Dietmayer,Felix Heide

Don’t Even Look Once: Synthesizing Features for Zero-Shot Detection
Author: Pengkai Zhu,Hanxiao Wang,Venkatesh Saligrama

EPOS: Estimating 6D Pose of Objects With Symmetries
Author: Tomas Hodan,Daniel Barath,Jiri Matas

Train in Germany, Test in the USA: Making 3D Object Detectors Generalize
Author: Yan Wang,Xiangyu Chen,Yurong You,Li Erran Li,Bharath Hariharan,Mark Campbell,Kilian Q. Weinberger,Wei-Lun Chao

Exploring Categorical Regularization for Domain Adaptive Object Detection
Author: Chang-Dong Xu,Xing-Ran Zhao,Xin Jin,Xiu-Shen Wei

Neural Implicit Embedding for Point Cloud Analysis
Author: Kent Fujiwara,Taiichi Hashimoto

Pose-Guided Visible Part Matching for Occluded Person ReID
Author: Shang Gao,Jingya Wang,Huchuan Lu,Zimo Liu

ContourNet: Taking a Further Step Toward Accurate Arbitrary-Shaped Scene Text Detection
Author: Yuxin Wang,Hongtao Xie,Zheng-Jun Zha,Mengting Xing,Zilong Fu,Yongdong Zhang

Exploring Data Aggregation in Policy Learning for Vision-Based Urban Autonomous Driving
Author: Aditya Prakash,Aseem Behl,Eshed Ohn-Bar,Kashyap Chitta,Andreas Geiger

Look-Into-Object: Self-Supervised Structure Modeling for Object Recognition
Author: Mohan Zhou,Yalong Bai,Wei Zhang,Tiejun Zhao,Tao Mei

Recognizing Objects From Any View With Object and Viewer-Centered Representations
Author: Sainan Liu,Vincent Nguyen,Isaac Rehg,Zhuowen Tu

Gated Channel Transformation for Visual Recognition
Author: Zongxin Yang,Linchao Zhu,Yu Wu,Yi Yang

Non-Local Neural Networks With Grouped Bilinear Attentional Transforms
Author: Lu Chi,Zehuan Yuan,Yadong Mu,Changhu Wang

Generative-Discriminative Feature Representations for Open-Set Recognition
Author: Pramuditha Perera,Vlad I. Morariu,Rajiv Jain,Varun Manjunatha,Curtis Wigington,Vicente Ordonez,Vishal M. Patel

RPM-Net: Robust Point Matching Using Learned Features
Author: Zi Jian Yew,Gim Hee Lee

Sideways: Depth-Parallel Training of Video Models
Author: Mateusz Malinowski,Grzegorz Swirszcz,Joao Carreira,Viorica Patraucean

Basis Prediction Networks for Effective Burst Denoising With Large Kernels
Author: Zhihao Xia,Federico Perazzi,Michael Gharbi,Kalyan Sunkavalli,Ayan Chakrabarti

Private-kNN: Practical Differential Privacy for Computer Vision
Author: Yuqing Zhu,Xiang Yu,Manmohan Chandraker,Yu-Xiang Wang

SP-NAS: Serial-to-Parallel Backbone Search for Object Detection
Author: Chenhan Jiang,Hang Xu,Wei Zhang,Xiaodan Liang,Zhenguo Li

Structure Aware Single-Stage 3D Object Detection From Point Cloud
Author: Chenhang He,Hui Zeng,Jianqiang Huang,Xian-Sheng Hua,Lei Zhang

“Looking at the Right Stuff” - Guided Semantic-Gaze for Autonomous Driving
Author: Anwesan Pal,Sayan Mondal,Henrik I. Christensen

What’s Hidden in a Randomly Weighted Neural Network?
Author: Vivek Ramanujan,Mitchell Wortsman,Aniruddha Kembhavi,Ali Farhadi,Mohammad Rastegari

Structured Multi-Hashing for Model Compression
Author: Elad Eban,Yair Movshovitz-Attias,Hao Wu,Mark Sandler,Andrew Poon,Yerlan Idelbayev,Miguel A. Carreira-Perpinan

DOPS: Learning to Detect 3D Objects and Predict Their 3D Shapes
Author: Mahyar Najibi,Guangda Lai,Abhijit Kundu,Zhichao Lu,Vivek Rathod,Thomas Funkhouser,Caroline Pantofaru,David Ross,Larry S. Davis,Alireza Fathi

AutoTrack: Towards High-Performance Visual Tracking for UAV With Automatic Spatio-Temporal Regularization
Author: Yiming Li,Changhong Fu,Fangqiang Ding,Ziyuan Huang,Geng Lu

GP-NAS: Gaussian Process Based Neural Architecture Search
Author: Zhihang Li,Teng Xi,Jiankang Deng,Gang Zhang,Shengzhao Wen,Ran He

NAS-FCOS: Fast Neural Architecture Search for Object Detection
Author: Ning Wang,Yang Gao,Hao Chen,Peng Wang,Zhi Tian,Chunhua Shen,Yanning Zhang

TCTS: A Task-Consistent Two-Stage Framework for Person Search
Author: Cheng Wang,Bingpeng Ma,Hong Chang,Shiguang Shan,Xilin Chen

SCATTER: Selective Context Attentional Scene Text Recognizer
Author: Ron Litman,Oron Anschel,Shahar Tsiper,Roee Litman,Shai Mazor,R. Manmatha

Learning Canonical Shape Space for Category-Level 6D Object Pose and Size Estimation
Author: Dengsheng Chen,Jun Li,Zheng Wang,Kai Xu

Hierarchical Scene Coordinate Classification and Regression for Visual Localization
Author: Xiaotian Li,Shuzhe Wang,Yi Zhao,Jakob Verbeek,Juho Kannala

MiLeNAS: Efficient Neural Architecture Search via Mixed-Level Reformulation
Author: Chaoyang He,Haishan Ye,Li Shen,Tong Zhang

Scalable Uncertainty for Computer Vision With Functional Variational Inference
Author: Eduardo D. C. Carvalho,Ronald Clark,Andrea Nicastro,Paul H. J. Kelly

Uncertainty-Aware CNNs for Depth Completion: Uncertainty from Beginning to End
Author: Abdelrahman Eldesokey,Michael Felsberg,Karl Holmquist,Michael Persson

Butterfly Transform: An Efficient FFT Based Neural Architecture Design
Author: Keivan Alizadeh vahid,Anish Prabhu,Ali Farhadi,Mohammad Rastegari

A Certifiably Globally Optimal Solution to Generalized Essential Matrix Estimation
Author: Ji Zhao,Wanting Xu,Laurent Kneip

MUXConv: Information Multiplexing in Convolutional Neural Networks
Author: Zhichao Lu,Kalyanmoy Deb,Vishnu Naresh Boddeti

PointGMM: A Neural GMM Network for Point Clouds
Author: Amir Hertz,Rana Hanocka,Raja Giryes,Daniel Cohen-Or

Noisier2Noise: Learning to Denoise From Unpaired Noisy Data
Author: Nick Moran,Dan Schmidt,Yu Zhong,Patrick Coady

TRPLP - Trifocal Relative Pose From Lines at Points
Author: Ricardo Fabbri,Timothy Duff,Hongyi Fan,Margaret H. Regan,David da Costa de Pinho,Elias Tsigaridas,Charles W. Wampler,Jonathan D. Hauenstein,Peter J. Giblin,Benjamin Kimia,Anton Leykin,Tomas Pajdla

DSNAS: Direct Neural Architecture Search Without Parameter Retraining
Author: Shoukang Hu,Sirui Xie,Hehui Zheng,Chunxiao Liu,Jianping Shi,Xunying Liu,Dahua Lin

MonoPair: Monocular 3D Object Detection Using Pairwise Spatial Relationships
Author: Yongjian Chen,Lei Tai,Kai Sun,Mingyang Li

Regularization on Spatio-Temporally Smoothed Feature for Action Recognition
Author: Jinhyung Kim,Seunghwan Cha,Dongyoon Wee,Soonmin Bae,Junmo Kim

Towards Accurate Scene Text Recognition With Semantic Reasoning Networks
Author: Deli Yu,Xuan Li,Chengquan Zhang,Tao Liu,Junyu Han,Jingtuo Liu,Errui Ding

Unsupervised Reinforcement Learning of Transferable Meta-Skills for Embodied Navigation
Author: Juncheng Li,Xin Wang,Siliang Tang,Haizhou Shi,Fei Wu,Yueting Zhuang,William Yang Wang

Inferring Attention Shift Ranks of Objects for Image Saliency
Author: Avishek Siris,Jianbo Jiao,Gary K.L. Tam,Xianghua Xie,Rynson W.H. Lau

Camera On-Boarding for Person Re-Identification Using Hypothesis Transfer Learning
Author: Sk Miraj Ahmed,Aske R. Lejbolle,Rameswar Panda,Amit K. Roy-Chowdhury

Joint Graph-Based Depth Refinement and Normal Estimation
Author: Mattia Rossi,Mireille El Gheche,Andreas Kuhn,Pascal Frossard

DR Loss: Improving Object Detection by Distributional Ranking
Author: Qi Qian,Lei Chen,Hao Li,Rong Jin

Self-Trained Deep Ordinal Regression for End-to-End Video Anomaly Detection
Author: Guansong Pang,Cheng Yan,Chunhua Shen,Anton van den Hengel,Xiao Bai

Few-Shot Class-Incremental Learning
Author: Xiaoyu Tao,Xiaopeng Hong,Xinyuan Chang,Songlin Dong,Xing Wei,Yihong Gong

PolarMask: Single Shot Instance Segmentation With Polar Representation
Author: Enze Xie,Peize Sun,Xiaoge Song,Wenhai Wang,Xuebo Liu,Ding Liang,Chunhua Shen,Ping Luo

DeepEMD: Few-Shot Image Classification With Differentiable Earth Mover’s Distance and Structured Classifiers
Author: Chi Zhang,Yujun Cai,Guosheng Lin,Chunhua Shen

Detection in Crowded Scenes: One Proposal, Multiple Predictions
Author: Xuangeng Chu,Anlin Zheng,Xiangyu Zhang,Jian Sun

Autolabeling 3D Objects With Differentiable Rendering of SDF Shape Priors
Author: Sergey Zakharov,Wadim Kehl,Arjun Bhargava,Adrien Gaidon

Interactive Object Segmentation With Inside-Outside Guidance
Author: Shiyin Zhang,Jun Hao Liew,Yunchao Wei,Shikui Wei,Yao Zhao

Mnemonics Training: Multi-Class Incremental Learning Without Forgetting
Author: Yaoyao Liu,Yuting Su,An-An Liu,Bernt Schiele,Qianru Sun

Learning to Segment 3D Point Clouds in 2D Image Space
Author: Yecheng Lyu,Xinming Huang,Ziming Zhang

Smooth Shells: Multi-Scale Shape Registration With Functional Maps
Author: Marvin Eisenberger,Zorah Lahner,Daniel Cremers

Self-Supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation
Author: Yude Wang,Jie Zhang,Meina Kan,Shiguang Shan,Xilin Chen

Efficient Neural Vision Systems Based on Convolutional Image Acquisition
Author: Pedram Pad,Simon Narduzzi,Clement Kundig,Engin Turetken,Siavash A. Bigdeli,L. Andrea Dunbar

Visual Chirality
Author: Zhiqiu Lin,Jin Sun,Abe Davis,Noah Snavely

What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images
Author: Xing Xu,Jiefu Chen,Jinhui Xiao,Lianli Gao,Fumin Shen,Heng Tao Shen

Dynamic Traffic Modeling From Overhead Imagery
Author: Scott Workman,Nathan Jacobs

Satellite Image Time Series Classification With Pixel-Set Encoders and Temporal Self-Attention
Author: Vivien Sainte Fare Garnot,Loic Landrieu,Sebastien Giordano,Nesrine Chehata

DAVD-Net: Deep Audio-Aided Video Decompression of Talking Heads
Author: Xi Zhang,Xiaolin Wu,Xinliang Zhai,Xianye Ben,Chengjie Tu

Learning When and Where to Zoom With Deep Reinforcement Learning
Author: Burak Uzkent,Stefano Ermon

Cross-Domain Detection via Graph-Induced Prototype Alignment
Author: Minghao Xu,Hang Wang,Bingbing Ni,Qi Tian,Wenjun Zhang

Meta-Learning of Neural Architectures for Few-Shot Learning
Author: Thomas Elsken,Benedikt Staffler,Jan Hendrik Metzen,Frank Hutter

Towards Inheritable Models for Open-Set Domain Adaptation
Author: Jogendra Nath Kundu,Naveen Venkat,Ambareesh Revanur,Rahul M V,R. Venkatesh Babu

Learning From Synthetic Animals
Author: Jiteng Mu,Weichao Qiu,Gregory D. Hager,Alan L. Yuille

Distilling Cross-Task Knowledge via Relationship Matching
Author: Han-Jia Ye,Su Lu,De-Chuan Zhan

Open Compound Domain Adaptation
Author: Ziwei Liu,Zhongqi Miao,Xingang Pan,Xiaohang Zhan,Dahua Lin,Stella X. Yu,Boqing Gong

Context Prior for Scene Segmentation
Author: Changqian Yu,Jingbo Wang,Changxin Gao,Gang Yu,Chunhua Shen,Nong Sang

Tangent Images for Mitigating Spherical Distortion
Author: Marc Eder,Mykhailo Shvets,John Lim,Jan-Michael Frahm

Learning a Dynamic Map of Visual Appearance
Author: Tawfiq Salem,Scott Workman,Nathan Jacobs

Webly Supervised Knowledge Embedding Model for Visual Reasoning
Author: Wenbo Zheng,Lan Yan,Chao Gou,Fei-Yue Wang

Gradually Vanishing Bridge for Adversarial Domain Adaptation
Author: Shuhao Cui,Shuhui Wang,Junbao Zhuo,Chi Su,Qingming Huang,Qi Tian

Active Speakers in Context
Author: Juan Leon Alcazar,Fabian Caba,Long Mai,Federico Perazzi,Joon-Young Lee,Pablo Arbelaez,Bernard Ghanem

Panoptic-DeepLab: A Simple, Strong, and Fast Baseline for Bottom-Up Panoptic Segmentation
Author: Bowen Cheng,Maxwell D. Collins,Yukun Zhu,Ting Liu,Thomas S. Huang,Hartwig Adam,Liang-Chieh Chen

Inter-Region Affinity Distillation for Road Marking Segmentation
Author: Yuenan Hou,Zheng Ma,Chunxiao Liu,Tak-Wai Hui,Chen Change Loy

Unified Dynamic Convolutional Network for Super-Resolution With Variational Degradations
Author: Yu-Syuan Xu,Shou-Yao Roy Tseng,Yu Tseng,Hsien-Kai Kuo,Yi-Min Tsai

Making Better Mistakes: Leveraging Class Hierarchies With Deep Networks
Author: Luca Bertinetto,Romain Mueller,Konstantinos Tertikas,Sina Samangooei,Nicholas A. Lord

Data-Free Knowledge Amalgamation via Group-Stack Dual-GAN
Author: Jingwen Ye,Yixin Ji,Xinchao Wang,Xin Gao,Mingli Song

Screencast Tutorial Video Understanding
Author: Kunpeng Li,Chen Fang,Zhaowen Wang,Seokhwan Kim,Hailin Jin,Yun Fu

DSGN: Deep Stereo Geometry Network for 3D Object Detection
Author: Yilun Chen,Shu Liu,Xiaoyong Shen,Jiaya Jia

Weakly-Supervised Salient Object Detection via Scribble Annotations
Author: Jing Zhang,Xin Yu,Aixuan Li,Peipei Song,Bowen Liu,Yuchao Dai

Learning to Learn Single Domain Generalization
Author: Fengchun Qiao,Long Zhao,Xi Peng

Severity-Aware Semantic Segmentation With Reinforced Wasserstein Training
Author: Xiaofeng Liu,Wenxuan Ji,Jane You,Georges El Fakhri,Jonghye Woo

Boosting Few-Shot Learning With Adaptive Margin Loss
Author: Aoxue Li,Weiran Huang,Xu Lan,Jiashi Feng,Zhenguo Li,Liwei Wang

JA-POLS: A Moving-Camera Background Model via Joint Alignment and Partially-Overlapping Local Subspaces
Author: Irit Chelly,Vlad Winter,Dor Litvak,David Rosen,Oren Freifeld

AugFPN: Improving Multi-Scale Feature Learning for Object Detection
Author: Chaoxu Guo,Bin Fan,Qian Zhang,Shiming Xiang,Chunhong Pan

xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation
Author: Maximilian Jaritz,Tuan-Hung Vu,Raoul de Charette,Emilie Wirbel,Patrick Perez

Norm-Aware Embedding for Efficient Person Search
Author: Di Chen,Shanshan Zhang,Jian Yang,Bernt Schiele

Intelligent Home 3D: Automatic 3D-House Design From Linguistic Descriptions Only
Author: Qi Chen,Qi Wu,Rui Tang,Yuhan Wang,Shuai Wang,Mingkui Tan

Differential Treatment for Stuff and Things: A Simple Unsupervised Domain Adaptation Method for Semantic Segmentation
Author: Zhonghao Wang,Mo Yu,Yunchao Wei,Rogerio Feris,Jinjun Xiong,Wen-mei Hwu,Thomas S. Huang,Honghui Shi

Robust Object Detection Under Occlusion With Context-Aware CompositionalNets
Author: Angtian Wang,Yihong Sun,Adam Kortylewski,Alan L. Yuille

IMRAM: Iterative Matching With Recurrent Attention Memory for Cross-Modal Image-Text Retrieval
Author: Hui Chen,Guiguang Ding,Xudong Liu,Zijia Lin,Ji Liu,Jungong Han

Domain-Aware Visual Bias Eliminating for Generalized Zero-Shot Learning
Author: Shaobo Min,Hantao Yao,Hongtao Xie,Chaoqun Wang,Zheng-Jun Zha,Yongdong Zhang

Semi-Supervised Semantic Segmentation With Cross-Consistency Training
Author: Yassine Ouali,Celine Hudelot,Myriam Tami

Learning to Learn Cropping Models for Different Aspect Ratio Requirements
Author: Debang Li,Junge Zhang,Kaiqi Huang

What Makes Training Multi-Modal Classification Networks Hard?
Author: Weiyao Wang,Du Tran,Matt Feiszli

Selective Transfer With Reinforced Transfer Network for Partial Domain Adaptation
Author: Zhihong Chen,Chao Chen,Zhaowei Cheng,Boyuan Jiang,Ke Fang,Xinyu Jin

Semi-Supervised Semantic Image Segmentation With Self-Correcting Networks
Author: Mostafa S. Ibrahim,Arash Vahdat,Mani Ranjbar,William G. Macready

Exemplar Normalization for Learning Deep Representation
Author: Ruimao Zhang,Zhanglin Peng,Lingyun Wu,Zhen Li,Ping Luo

Imitative Non-Autoregressive Modeling for Trajectory Forecasting and Imputation
Author: Mengshi Qi,Jie Qin,Yu Wu,Yi Yang

Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text
Author: Difei Gao,Ke Li,Ruiping Wang,Shiguang Shan,Xilin Chen

StereoGAN: Bridging Synthetic-to-Real Domain Gap by Joint Optimization of Domain Translation and Stereo Matching
Author: Rui Liu,Chengxi Yang,Wenxiu Sun,Xiaogang Wang,Hongsheng Li

Self-Supervised Domain-Aware Generative Network for Generalized Zero-Shot Learning
Author: Jiamin Wu,Tianzhu Zhang,Zheng-Jun Zha,Jiebo Luo,Yongdong Zhang,Feng Wu

Sparse Layered Graphs for Multi-Object Segmentation
Author: Niels Jeppesen,Anders N. Christensen,Vedrana A. Dahl,Anders B. Dahl

Visual-Semantic Matching by Exploring High-Order Attention and Distraction
Author: Yongzhi Li,Duo Zhang,Yadong Mu

End-to-End 3D Point Cloud Instance Segmentation Without Detection
Author: Haiyong Jiang,Feilong Yan,Jianfei Cai,Jianmin Zheng,Jun Xiao

Deep Adversarial Decomposition: A Unified Framework for Separating Superimposed Images
Author: Zhengxia Zou,Sen Lei,Tianyang Shi,Zhenwei Shi,Jieping Ye

Differentiable Adaptive Computation Time for Visual Reasoning
Author: Cristobal Eyzaguirre,Alvaro Soto

DeepLPF: Deep Local Parametric Filters for Image Enhancement
Author: Sean Moran,Pierre Marza,Steven McDonagh,Sarah Parisot,Gregory Slabaugh

Instance Credibility Inference for Few-Shot Learning
Author: Yikai Wang,Chengming Xu,Chen Liu,Li Zhang,Yanwei Fu

Learning From Web Data With Self-Organizing Memory Module
Author: Yi Tu,Li Niu,Junjie Chen,Dawei Cheng,Liqing Zhang

TransMatch: A Transfer-Learning Scheme for Semi-Supervised Few-Shot Learning
Author: Zhongjie Yu,Lin Chen,Zhongwei Cheng,Jiebo Luo

Learning the Redundancy-Free Features for Generalized Zero-Shot Object Recognition
Author: Zongyan Han,Zhenyong Fu,Jian Yang

Neural Topological SLAM for Visual Navigation
Author: Devendra Singh Chaplot,Ruslan Salakhutdinov,Abhinav Gupta,Saurabh Gupta

WaveletStereo: Learning Wavelet Coefficients of Disparity Map in Stereo Matching
Author: Menglong Yang,Fangrui Wu,Wei Li

Robust Superpixel-Guided Attentional Adversarial Attack
Author: Xiaoyi Dong,Jiangfan Han,Dongdong Chen,Jiayang Liu,Huanyu Bian,Zehua Ma,Hongsheng Li,Xiaogang Wang,Weiming Zhang,Nenghai Yu

BEDSR-Net: A Deep Shadow Removal Network From a Single Document Image
Author: Yun-Hsuan Lin,Wen-Chin Chen,Yung-Yu Chuang

Cross-Domain Document Object Detection: Benchmark Suite and Method
Author: Kai Li,Curtis Wigington,Chris Tensmeyer,Handong Zhao,Nikolaos Barmpalios,Vlad I. Morariu,Varun Manjunatha,Tong Sun,Yun Fu

Explaining Knowledge Distillation by Quantifying the Knowledge
Author: Xu Cheng,Zhefan Rao,Yilan Chen,Quanshi Zhang

Exploring Bottom-Up and Top-Down Cues With Attentive Learning for Webly Supervised Object Detection
Author: Zhonghua Wu,Qingyi Tao,Guosheng Lin,Jianfei Cai

Enhancing Generic Segmentation With Learned Region Representations
Author: Or Isaacs,Oran Shayer,Michael Lindenbaum

Adaptive Hierarchical Down-Sampling for Point Cloud Classification
Author: Ehsan Nezhadarya,Ehsan Taghavi,Ryan Razani,Bingbing Liu,Jun Luo

FBNetV2: Differentiable Neural Architecture Search for Spatial and Channel Dimensions
Author: Alvin Wan,Xiaoliang Dai,Peizhao Zhang,Zijian He,Yuandong Tian,Saining Xie,Bichen Wu,Matthew Yu,Tao Xu,Kan Chen,Peter Vajda,Joseph E. Gonzalez

Learning Texture Invariant Representation for Domain Adaptation of Semantic Segmentation
Author: Myeongjin Kim,Hyeran Byun

Putting Visual Object Recognition in Context
Author: Mengmi Zhang,Claire Tseng,Gabriel Kreiman

SLV: Spatial Likelihood Voting for Weakly Supervised Object Detection
Author: Ze Chen,Zhihang Fu,Rongxin Jiang,Yaowu Chen,Xian-Sheng Hua

Universal Weighting Metric Learning for Cross-Modal Matching
Author: Jiwei Wei,Xing Xu,Yang Yang,Yanli Ji,Zheng Wang,Heng Tao Shen

IDA-3D: Instance-Depth-Aware 3D Object Detection From Stereo Vision for Autonomous Driving
Author: Wanli Peng,Hao Pan,He Liu,Yi Sun

Label Decoupling Framework for Salient Object Detection
Author: Jun Wei,Shuhui Wang,Zhe Wu,Chi Su,Qingming Huang,Qi Tian

Transform and Tell: Entity-Aware News Image Captioning
Author: Alasdair Tran,Alexander Mathews,Lexing Xie

HAMBox: Delving Into Mining High-Quality Anchors on Face Detection
Author: Yang Liu,Xu Tang,Junyu Han,Jingtuo Liu,Dinger Rui,Xiang Wu

Hierarchical Feature Embedding for Attribute Recognition
Author: Jie Yang,Jiarou Fan,Yiru Wang,Yige Wang,Weihao Gan,Lin Liu,Wei Wu

Squeeze-and-Attention Networks for Semantic Segmentation
Author: Zilong Zhong,Zhong Qiu Lin,Rene Bidart,Xiaodan Hu,Ibrahim Ben Daya,Zhifeng Li,Wei-Shi Zheng,Jonathan Li,Alexander Wong

Context R-CNN: Long Term Temporal Context for Per-Camera Object Detection
Author: Sara Beery,Guanhang Wu,Vivek Rathod,Ronny Votel,Jonathan Huang

Mixture Dense Regression for Object Detection and Human Pose Estimation
Author: Ali Varamesh,Tinne Tuytelaars

Syntax-Aware Action Targeting for Video Captioning
Author: Qi Zheng,Chaoyue Wang,Dacheng Tao

Learning Visual Emotion Representations From Web Data
Author: Zijun Wei,Jianming Zhang,Zhe Lin,Joon-Young Lee,Niranjan Balasubramanian,Minh Hoai,Dimitris Samaras

The Edge of Depth: Explicit Constraints Between Segmentation and Depth
Author: Shengjie Zhu,Garrick Brazil,Xiaoming Liu

A Context-Aware Loss Function for Action Spotting in Soccer Videos
Author: Anthony Cioppa,Adrien Deliege,Silvio Giancola,Bernard Ghanem,Marc Van Droogenbroeck,Rikke Gade,Thomas B. Moeslund

Towards Learning a Generic Agent for Vision-and-Language Navigation via Pre-Training
Author: Weituo Hao,Chunyuan Li,Xiujun Li,Lawrence Carin,Jianfeng Gao

Video Instance Segmentation Tracking With a Modified VAE Architecture
Author: Chung-Ching Lin,Ying Hung,Rogerio Feris,Linglin He

Deformation-Aware Unpaired Image Translation for Pose Estimation on Laboratory Animals
Author: Siyuan Li,Semih Gunel,Mirela Ostrek,Pavan Ramdya,Pascal Fua,Helge Rhodin

ZeroQ: A Novel Zero Shot Quantization Framework
Author: Yaohui Cai,Zhewei Yao,Zhen Dong,Amir Gholami,Michael W. Mahoney,Kurt Keutzer

Disparity-Aware Domain Adaptation in Stereo Image Restoration
Author: Bo Yan,Chenxi Ma,Bahetiyaer Bare,Weimin Tan,Steven C. H. Hoi

Offset Bin Classification Network for Accurate Object Detection
Author: Heqian Qiu,Hongliang Li,Qingbo Wu,Hengcan Shi

TBT: Targeted Neural Network Attack With Bit Trojan
Author: Adnan Siraj Rakin,Zhezhi He,Deliang Fan

Maintaining Discrimination and Fairness in Class Incremental Learning
Author: Bowen Zhao,Xi Xiao,Guojun Gan,Bin Zhang,Shu-Tao Xia

Background Data Resampling for Outlier-Aware Classification
Author: Yi Li,Nuno Vasconcelos

STEFANN: Scene Text Editor Using Font Adaptive Neural Network
Author: Prasun Roy,Saumik Bhattacharya,Subhankar Ghosh,Umapada Pal

Geometry and Learning Co-Supported Normal Estimation for Unstructured Point Cloud
Author: Haoran Zhou,Honghua Chen,Yidan Feng,Qiong Wang,Jing Qin,Haoran Xie,Fu Lee Wang,Mingqiang Wei,Jun Wang

Sequential Motif Profiles and Topological Plots for Offline Signature Verification
Author: Elias N. Zois,Evangelos Zervas,Dimitrios Tsourounis,George Economou

Optical Flow in Dense Foggy Scenes Using Semi-Supervised Learning
Author: Wending Yan,Aashish Sharma,Robby T. Tan

A Spatial RNN Codec for End-to-End Image Compression
Author: Chaoyi Lin,Jiabao Yao,Fangdong Chen,Li Wang

Object Relational Graph With Teacher-Recommended Learning for Video Captioning
Author: Ziqi Zhang,Yaya Shi,Chunfeng Yuan,Bing Li,Peijin Wang,Weiming Hu,Zheng-Jun Zha

MMTM: Multimodal Transfer Module for CNN Fusion
Author: Hamid Reza Vaezi Joze,Amirreza Shaban,Michael L. Iuzzolino,Kazuhito Koishida

Generalized Zero-Shot Learning via Over-Complete Distribution
Author: Rohit Keshari,Richa Singh,Mayank Vatsa

Gait Recognition via Semi-supervised Disentangled Representation Learning to Identity and Covariate Features
Author: Xiang Li,Yasushi Makihara,Chi Xu,Yasushi Yagi,Mingwu Ren

Unifying Training and Inference for Panoptic Segmentation
Author: Qizhu Li,Xiaojuan Qi,Philip H.S. Torr

Associate-3Ddet: Perceptual-to-Conceptual Association for 3D Point Cloud Object Detection
Author: Liang Du,Xiaoqing Ye,Xiao Tan,Jianfeng Feng,Zhenbo Xu,Errui Ding,Shilei Wen

Interactive Image Segmentation With First Click Attention
Author: Zheng Lin,Zhao Zhang,Lin-Zhuo Chen,Ming-Ming Cheng,Shao-Ping Lu

NETNet: Neighbor Erasing and Transferring Network for Better Single Shot Object Detection
Author: Yazhao Li,Yanwei Pang,Jianbing Shen,Jiale Cao,Ling Shao

Scale-Equalizing Pyramid Convolution for Object Detection
Author: Xinjiang Wang,Shilong Zhang,Zhuoran Yu,Litong Feng,Wayne Zhang

Learning to Cluster Faces via Confidence and Connectivity Estimation
Author: Lei Yang,Dapeng Chen,Xiaohang Zhan,Rui Zhao,Chen Change Loy,Dahua Lin

Cross-Modality Person Re-Identification With Shared-Specific Feature Transfer
Author: Yan Lu,Yue Wu,Bin Liu,Tianzhu Zhang,Baopu Li,Qi Chu,Nenghai Yu

DPGN: Distribution Propagation Graph Network for Few-Shot Learning
Author: Ling Yang,Liangliang Li,Zilun Zhang,Xinyu Zhou,Erjin Zhou,Yu Liu

Density-Aware Graph for Deep Semi-Supervised Visual Recognition
Author: Suichan Li,Bin Liu,Dongdong Chen,Qi Chu,Lu Yuan,Nenghai Yu

Unsupervised Multi-Modal Image Registration via Geometry Preserving Image-to-Image Translation
Author: Moab Arar,Yiftach Ginger,Dov Danon,Amit H. Bermano,Daniel Cohen-Or

Binarizing MobileNet via Evolution-Based Searching
Author: Hai Phan,Zechun Liu,Dang Huynh,Marios Savvides,Kwang-Ting Cheng,Zhiqiang Shen

Temporal-Context Enhanced Detection of Heavily Occluded Pedestrians
Author: Jialian Wu,Chunluan Zhou,Ming Yang,Qian Zhang,Yuan Li,Junsong Yuan

Orderless Recurrent Models for Multi-Label Classification
Author: Vacit Oguz Yazici,Abel Gonzalez-Garcia,Arnau Ramisa,Bartlomiej Twardowski,Joost van de Weijer

Gold Seeker: Information Gain From Policy Distributions for Goal-Oriented Vision-and-Langauge Reasoning
Author: Ehsan Abbasnejad,Iman Abbasnejad,Qi Wu,Javen Shi,Anton van den Hengel

Rethinking the Route Towards Weakly Supervised Object Localization
Author: Chen-Lin Zhang,Yun-Hao Cao,Jianxin Wu

Adversarial Feature Hallucination Networks for Few-Shot Learning
Author: Kai Li,Yulun Zhang,Kunpeng Li,Yun Fu

Conditional Gaussian Distribution Learning for Open Set Recognition
Author: Xin Sun,Zhenning Yang,Chi Zhang,Keck-Voon Ling,Guohao Peng

Connect-and-Slice: An Hybrid Approach for Reconstructing 3D Objects
Author: Hao Fang,Florent Lafarge

Attentive Weights Generation for Few Shot Learning via Information Maximization
Author: Yiluan Guo,Ngai-Man Cheung

Assessing Eye Aesthetics for Automatic Multi-Reference Eye In-Painting
Author: Bo Yan,Qing Lin,Weimin Tan,Shili Zhou

PuppeteerGAN: Arbitrary Portrait Animation With Semantic-Aware Appearance Transformation
Author: Zhuo Chen,Chaoyue Wang,Bo Yuan,Dacheng Tao

SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition
Author: Zhi Qiao,Yu Zhou,Dongbao Yang,Yucan Zhou,Weiping Wang

Texture and Shape Biased Two-Stream Networks for Clothing Classification and Attribute Recognition
Author: Yuwei Zhang,Peng Zhang,Chun Yuan,Zhi Wang

Distortion Agnostic Deep Watermarking
Author: Xiyang Luo,Ruohan Zhan,Huiwen Chang,Feng Yang,Peyman Milanfar

RMP-SNN: Residual Membrane Potential Neuron for Enabling Deeper High-Accuracy and Low-Latency Spiking Neural Network
Author: Bing Han,Gopalakrishnan Srinivasan,Kaushik Roy

BFBox: Searching Face-Appropriate Backbone and Feature Pyramid Network for Face Detector
Author: Yang Liu,Xu Tang

PFCNN: Convolutional Neural Networks on 3D Surfaces Using Parallel Frames
Author: Yuqi Yang,Shilin Liu,Hao Pan,Yang Liu,Xin Tong

iTAML: An Incremental Task-Agnostic Meta-learning Approach
Author: Jathushan Rajasegaran,Salman Khan,Munawar Hayat,Fahad Shahbaz Khan,Mubarak Shah

Optimal least-squares solution to the hand-eye calibration problem
Author: Amit Dekel,Linus Harenstam-Nielsen,Sergio Caccamo

MnasFPN: Learning Latency-Aware Pyramid Architecture for Object Detection on Mobile Devices
Author: Bo Chen,Golnaz Ghiasi,Hanxiao Liu,Tsung-Yi Lin,Dmitry Kalenichenko,Hartwig Adam,Quoc V. Le

VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions
Author: Oytun Ulutan,A S M Iftekhar,B. S. Manjunath

End-to-End Camera Calibration for Broadcast Videos
Author: Long Sha,Jennifer Hobbs,Panna Felsen,Xinyu Wei,Patrick Lucey,Sujoy Ganguly

Regularizing CNN Transfer Learning With Randomised Regression
Author: Yang Zhong,Atsuto Maki

KeypointNet: A Large-Scale 3D Keypoint Dataset Aggregated From Numerous Human Annotations
Author: Yang You,Yujing Lou,Chengkun Li,Zhoujun Cheng,Liangwei Li,Lizhuang Ma,Cewu Lu,Weiming Wang

Hierarchical Clustering With Hard-Batch Triplet Loss for Person Re-Identification
Author: Kaiwei Zeng,Munan Ning,Yaohua Wang,Yang Guo

Joint Semantic Segmentation and Boundary Detection Using Iterative Pyramid Contexts
Author: Mingmin Zhen,Jinglu Wang,Lei Zhou,Shiwei Li,Tianwei Shen,Jiaxiang Shang,Tian Fang,Long Quan

Attention-Guided Hierarchical Structure Aggregation for Image Matting
Author: Yu Qiao,Yuhao Liu,Xin Yang,Dongsheng Zhou,Mingliang Xu,Qiang Zhang,Xiaopeng Wei

MetaFuse: A Pre-trained Fusion Model for Human Pose Estimation
Author: Rongchang Xie,Chunyu Wang,Yizhou Wang

Prior Guided GAN Based Semantic Inpainting
Author: Avisek Lahiri,Arnav Kumar Jain,Sanskar Agrawal,Pabitra Mitra,Prabir Kumar Biswas

Weakly Supervised Semantic Point Cloud Segmentation: Towards 10x Fewer Labels
Author: Xun Xu,Gim Hee Lee

Physically Realizable Adversarial Examples for LiDAR Object Detection
Author: James Tu,Mengye Ren,Sivabalan Manivasagam,Ming Liang,Bin Yang,Richard Du,Frank Cheng,Raquel Urtasun

Combating Noisy Labels by Agreement: A Joint Training Method with Co-Regularization
Author: Hongxin Wei,Lei Feng,Xiangyu Chen,Bo An

Light-weight Calibrator: A Separable Component for Unsupervised Domain Adaptation
Author: Shaokai Ye,Kailu Wu,Mu Zhou,Yunfei Yang,Sia Huat Tan,Kaidi Xu,Jiebo Song,Chenglong Bao,Kaisheng Ma

Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition
Author: Canjie Luo,Yuanzhi Zhu,Lianwen Jin,Yongpan Wang

Learning Selective Self-Mutual Attention for RGB-D Saliency Detection
Author: Nian Liu,Ni Zhang,Junwei Han

Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation
Author: Yangtao Zheng,Di Huang,Songtao Liu,Yunhong Wang

Estimating Low-Rank Region Likelihood Maps
Author: Gabriela Csurka,Zoltan Kato,Andor Juhasz,Martin Humenberger

Neural Head Reenactment with Latent Pose Descriptors
Author: Egor Burkov,Igor Pasechnik,Artur Grigorev,Victor Lempitsky

Learning Individual Speaking Styles for Accurate Lip to Speech Synthesis
Author: K R Prajwal,Rudrabha Mukhopadhyay,Vinay P. Namboodiri,C.V. Jawahar

Self-Supervised Learning of Video-Induced Visual Invariances
Author: Michael Tschannen,Josip Djolonga,Marvin Ritter,Aravindh Mahendran,Neil Houlsby,Sylvain Gelly,Mario Lucic

Two-Stage Peer-Regularized Feature Recombination for Arbitrary Image Style Transfer
Author: Jan Svoboda,Asha Anoosheh,Christian Osendorfer,Jonathan Masci

MINA: Convex Mixed-Integer Programming for Non-Rigid Shape Alignment
Author: Florian Bernard,Zeeshan Khan Suri,Christian Theobalt

Improving One-Shot NAS by Suppressing the Posterior Fading
Author: Xiang Li,Chen Lin,Chuming Li,Ming Sun,Wei Wu,Junjie Yan,Wanli Ouyang

Incremental Few-Shot Object Detection
Author: Juan-Manuel Perez-Rua,Xiatian Zhu,Timothy M. Hospedales,Tao Xiang

Synthetic Learning: Learn From Distributed Asynchronized Discriminator GAN Without Sharing Medical Image Data
Author: Qi Chang,Hui Qu,Yikai Zhang,Mert Sabuncu,Chao Chen,Tong Zhang,Dimitris N. Metaxas

Exploring Category-Agnostic Clusters for Open-Set Domain Adaptation
Author: Yingwei Pan,Ting Yao,Yehao Li,Chong-Wah Ngo,Tao Mei

Regularizing Class-Wise Predictions via Self-Knowledge Distillation
Author: Sukmin Yun,Jongjin Park,Kimin Lee,Jinwoo Shin

Hierarchical Graph Attention Network for Visual Relationship Detection
Author: Li Mi,Zhenzhong Chen

M2m: Imbalanced Classification via Major-to-Minor Translation
Author: Jaehyung Kim,Jongheon Jeong,Jinwoo Shin

CenterMask: Real-Time Anchor-Free Instance Segmentation
Author: Youngwan Lee,Jongyoul Park

Multi-Path Learning for Object Pose Estimation Across Domains
Author: Martin Sundermeyer,Maximilian Durner,En Yen Puang,Zoltan-Csaba Marton,Narunas Vaskevicius,Kai O. Arras,Rudolph Triebel

Incremental Learning in Online Scenario
Author: Jiangpeng He,Runyu Mao,Zeman Shao,Fengqing Zhu

Enhanced Transport Distance for Unsupervised Domain Adaptation
Author: Mengxue Li,Yi-Ming Zhai,You-Wei Luo,Peng-Fei Ge,Chuan-Xian Ren

TESA: Tensor Element Self-Attention via Matricization
Author: Francesca Babiloni,Ioannis Marras,Gregory Slabaugh,Stefanos Zafeiriou

Training a Steerable CNN for Guidewire Detection
Author: Donghang Li,Adrian Barbu

Superpixel Segmentation With Fully Convolutional Networks
Author: Fengting Yang,Qian Sun,Hailin Jin,Zihan Zhou

SharinGAN: Combining Synthetic and Real Data for Unsupervised Geometry Estimation
Author: Koutilya PNVR,Hao Zhou,David Jacobs

Label Distribution Learning on Auxiliary Label Space Graphs for Facial Expression Recognition
Author: Shikai Chen,Jianfeng Wang,Yuedong Chen,Zhongchao Shi,Xin Geng,Yong Rui

Deep Residual Flow for Out of Distribution Detection
Author: Ev Zisselman,Aviv Tamar

FeatureFlow: Robust Video Interpolation via Structure-to-Texture Generation
Author: Shurui Gui,Chaoyue Wang,Qihua Chen,Dacheng Tao

Learning Nanoscale Motion Patterns of Vesicles in Living Cells
Author: Arif Ahmed Sekh,Ida Sundvor Opstad,Asa Birna Birgisdottir,Truls Myrmel,Balpreet Singh Ahluwalia,Krishna Agarwal,Dilip K. Prasad

Improving Action Segmentation via Graph-Based Temporal Reasoning
Author: Yifei Huang,Yusuke Sugano,Yoichi Sato

Episode-Based Prototype Generating Network for Zero-Shot Learning
Author: Yunlong Yu,Zhong Ji,Jungong Han,Zhongfei Zhang

Learning to Segment the Tail
Author: Xinting Hu,Yi Jiang,Kaihua Tang,Jingyuan Chen,Chunyan Miao,Hanwang Zhang

Learning to Evaluate Perception Models Using Planner-Centric Metrics
Author: Jonah Philion,Amlan Kar,Sanja Fidler

Where, What, Whether: Multi-Modal Learning Meets Pedestrian Detection
Author: Yan Luo,Chongyang Zhang,Muming Zhao,Hao Zhou,Jun Sun

CoverNet: Multimodal Behavior Prediction Using Trajectory Sets
Author: Tung Phan-Minh,Elena Corina Grigore,Freddy A. Boulton,Oscar Beijbom,Eric M. Wolff

Real-World Person Re-Identification via Degradation Invariance Learning
Author: Yukun Huang,Zheng-Jun Zha,Xueyang Fu,Richang Hong,Liang Li

Defending and Harnessing the Bit-Flip Based Adversarial Weight Attack
Author: Zhezhi He,Adnan Siraj Rakin,Jingtao Li,Chaitali Chakrabarti,Deliang Fan

Adversarial Latent Autoencoders
Author: Stanislav Pidhorskyi,Donald A. Adjeroh,Gianfranco Doretto

Adaptive Fractional Dilated Convolution Network for Image Aesthetics Assessment
Author: Qiuyu Chen,Wei Zhang,Ning Zhou,Peng Lei,Yi Xu,Yu Zheng,Jianping Fan

Deep Generative Model for Robust Imbalance Classification
Author: Xinyue Wang,Yilin Lyu,Liping Jing

Learning Deep Network for Detecting 3D Object Keypoints and 6D Poses
Author: Wanqing Zhao,Shaobo Zhang,Ziyu Guan,Wei Zhao,Jinye Peng,Jianping Fan

MetaIQA: Deep Meta-Learning for No-Reference Image Quality Assessment
Author: Hancheng Zhu,Leida Li,Jinjian Wu,Weisheng Dong,Guangming Shi

Sketchformer: Transformer-Based Representation for Sketched Structure
Author: Leo Sampaio Ferraz Ribeiro,Tu Bui,John Collomosse,Moacir Ponti

Cylindrical Convolutional Networks for Joint Object Detection and Viewpoint Estimation
Author: Sunghun Joung,Seungryong Kim,Hanjae Kim,Minsu Kim,Ig-Jae Kim,Junghyun Cho,Kwanghoon Sohn

Learning a Unified Sample Weighting Network for Object Detection
Author: Qi Cai,Yingwei Pan,Yu Wang,Jingen Liu,Ting Yao,Tao Mei

Old Is Gold: Redefining the Adversarially Learned One-Class Classifier Training Paradigm
Author: Muhammad Zaigham Zaheer,Jin-Ha Lee,Marcella Astrid,Seung-Ik Lee

An Adaptive Neural Network for Unsupervised Mosaic Consistency Analysis in Image Forensics
Author: Quentin Bammey,Rafael Grompone von Gioi,Jean-Michel Morel

McFlow: Monte Carlo Flow Models for Data Imputation
Author: Trevor W. Richardson,Wencheng Wu,Lei Lin,Beilei Xu,Edgar A. Bernal

Learning to See Through Obstructions
Author: Yu-Lun Liu,Wei-Sheng Lai,Ming-Hsuan Yang,Yung-Yu Chuang,Jia-Bin Huang

GaitPart: Temporal Part-Based Model for Gait Recognition
Author: Chao Fan,Yunjie Peng,Chunshui Cao,Xu Liu,Saihui Hou,Jiannan Chi,Yongzhen Huang,Qing Li,Zhiqiang He

EmotiCon: Context-Aware Multimodal Emotion Recognition Using Frege’s Principle
Author: Trisha Mittal,Pooja Guhan,Uttaran Bhattacharya,Rohan Chandra,Aniket Bera,Dinesh Manocha

Can Deep Learning Recognize Subtle Human Activities?
Author: Vincent Jacquot,Zhuofan Ying,Gabriel Kreiman

PhysGAN: Generating Physical-World-Resilient Adversarial Examples for Autonomous Driving
Author: Zelun Kong,Junfeng Guo,Ang Li,Cong Liu

ILFO: Adversarial Attack on Adaptive Neural Networks
Author: Mirazul Haque,Anki Chauhan,Cong Liu,Wei Yang

On Translation Invariance in CNNs: Convolutional Layers Can Exploit Absolute Spatial Location
Author: Osman Semih Kayhan,Jan C. van Gemert

Diverse Image Generation via Self-Conditioned GANs
Author: Steven Liu,Tongzhou Wang,David Bau,Jun-Yan Zhu,Antonio Torralba

Inducing Hierarchical Compositional Model by Sparsifying Generator Network
Author: Xianglei Xing,Tianfu Wu,Song-Chun Zhu,Ying Nian Wu

CARP: Compression Through Adaptive Recursive Partitioning for Multi-Dimensional Images
Author: Rongjie Liu,Meng Li,Li Ma

GrappaNet: Combining Parallel Imaging With Deep Learning for Multi-Coil MRI Reconstruction
Author: Anuroop Sriram,Jure Zbontar,Tullie Murrell,C. Lawrence Zitnick,Aaron Defazio,Daniel K. Sodickson

Can Weight Sharing Outperform Random Architecture Search? An Investigation With TuNAS
Author: Gabriel Bender,Hanxiao Liu,Bo Chen,Grace Chu,Shuyang Cheng,Pieter-Jan Kindermans,Quoc V. Le

Context Aware Graph Convolution for Skeleton-Based Action Recognition
Author: Xikun Zhang,Chang Xu,Dacheng Tao

Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised Deep Asymmetric Metric Learning
Author: Thiago M. Paixao,Rodrigo F. Berriel,Maria C. S. Boeres,Alessandro L. Koerich,Claudine Badue,Alberto F. De Souza,Thiago Oliveira-Santos

Revisiting Pose-Normalization for Fine-Grained Few-Shot Recognition
Author: Luming Tang,Davis Wertheimer,Bharath Hariharan

RankMI: A Mutual Information Maximizing Ranking Loss
Author: Mete Kemertas,Leila Pishdad,Konstantinos G. Derpanis,Afsaneh Fazly

Learning Memory-Guided Normality for Anomaly Detection
Author: Hyunjong Park,Jongyoun Noh,Bumsub Ham

Appearance Shock Grammar for Fast Medial Axis Extraction From Real Images
Author: Charles-Olivier Dufresne Camaro,Morteza Rezanejad,Stavros Tsogkas,Kaleem Siddiqi,Sven Dickinson

Generalizing Hand Segmentation in Egocentric Videos With Uncertainty-Guided Model Adaptation
Author: Minjie Cai,Feng Lu,Yoichi Sato

DeFeat-Net: General Monocular Depth via Simultaneous Unsupervised Representation Learning
Author: Jaime Spencer,Richard Bowden,Simon Hadfield

Learning Visual Motion Segmentation Using Event Surfaces
Author: Anton Mitrokhin,Zhiyuan Hua,Cornelia Fermuller,Yiannis Aloimonos

Social-STGCNN: A Social Spatio-Temporal Graph Convolutional Neural Network for Human Trajectory Prediction
Author: Abduallah Mohamed,Kun Qian,Mohamed Elhoseiny,Christian Claudel

Discriminative Multi-Modality Speech Recognition
Author: Bo Xu,Cheng Lu,Yandong Guo,Jacob Wang

Clean-Label Backdoor Attacks on Video Recognition Models
Author: Shihao Zhao,Xingjun Ma,Xiang Zheng,James Bailey,Jingjing Chen,Yu-Gang Jiang

Detecting Adversarial Samples Using Influence Functions and Nearest Neighbors
Author: Gilad Cohen,Guillermo Sapiro,Raja Giryes

Unsupervised Model Personalization While Preserving Privacy and Scalability: An Open Problem
Author: Matthias De Lange,Xu Jia,Sarah Parisot,Ales Leonardis,Gregory Slabaugh,Tinne Tuytelaars

GIFnets: Differentiable GIF Encoding Framework
Author: Innfarn Yoo,Xiyang Luo,Yilin Wang,Feng Yang,Peyman Milanfar

Learning Invariant Representation for Unsupervised Image Restoration
Author: Wenchao Du,Hu Chen,Hongyu Yang

Improved Few-Shot Visual Classification
Author: Peyman Bateni,Raghav Goyal,Vaden Masrani,Frank Wood,Leonid Sigal

Learning Weighted Submanifolds With Variational Autoencoders and Riemannian Variational Autoencoders
Author: Author: Nina Miolane,Susan Holmes

Learning Geocentric Object Pose in Oblique Monocular Images
Author: Gordon Christie,Rodrigo Rene Rai Munoz Abujder,Kevin Foster,Shea Hagstrom,Gregory D. Hager,Myron Z. Brown

Understanding Adversarial Examples From the Mutual Influence of Images and Perturbations
Author: Chaoning Zhang,Philipp Benz,Tooba Imtiaz,In So Kweon

Your Local GAN: Designing Two Dimensional Local Attention Mechanisms for Generative Models
Author: Giannis Daras,Augustus Odena,Han Zhang,Alexandros G. Dimakis

MoreFusion: Multi-object Reasoning for 6D Pose Estimation from Volumetric Fusion
Author: Kentaro Wada,Edgar Sucar,Stephen James,Daniel Lenton,Andrew J. Davison

HCNAF: Hyper-Conditioned Neural Autoregressive Flow and its Application for Probabilistic Occupancy Map Forecasting
Author: Geunseob Oh,Jean-Sebastien Valois

Detail-recovery Image Deraining via Context Aggregation Networks
Author: Sen Deng,Mingqiang Wei,Jun Wang,Yidan Feng,Luming Liang,Haoran Xie,Fu Lee Wang,Meng Wang

MCEN: Bridging Cross-Modal Gap between Cooking Recipes and Dish Images with Latent Variable Model
Author: Han Fu,Rui Wu,Chenghao Liu,Jianling Sun

Hypergraph Attention Networks for Multimodal Learning
Author: Eun-Sol Kim,Woo Young Kang,Kyoung-Woon On,Yu-Jung Heo,Byoung-Tak Zhang

Moving in the Right Direction: A Regularization for Deep Metric Learning
Author: Deen Dayal Mohan,Nishant Sankaran,Dennis Fedorishin,Srirangaraj Setlur,Venu Govindaraju

Rethinking Depthwise Separable Convolutions: How Intra-Kernel Correlations Lead to Improved MobileNets
Author: Daniel Haase,Manuel Amthor

Seeing without Looking: Contextual Rescoring of Object Detections for AP Maximization
Author: Lourenco V. Pato,Renato Negrinho,Pedro M. Q. Aguiar

End-to-End Adversarial-Attention Network for Multi-Modal Clustering
Author: Runwu Zhou,Yi-Dong Shen

Fast Sparse ConvNets
Author: Erich Elsen,Marat Dukhan,Trevor Gale,Karen Simonyan

Few Sample Knowledge Distillation for Efficient Network Compression
Author: Tianhong Li,Jianguo Li,Zhuang Liu,Changshui Zhang

Predicting Sharp and Accurate Occlusion Boundaries in Monocular Depth Estimation Using Displacement Fields
Author: Michael Ramamonjisoa,Yuming Du,Vincent Lepetit

Shape correspondence using anisotropic Chebyshev spectral CNNs
Author: Qinsong Li,Shengjun Liu,Ling Hu,Xinru Liu

RetinaTrack: Online Single Stage Joint Detection and Tracking
Author: Zhichao Lu,Vivek Rathod,Ronny Votel,Jonathan Huang

Multimodal Categorization of Crisis Events in Social Media
Author: Mahdi Abavisani,Liwei Wu,Shengli Hu,Joel Tetreault,Alejandro Jaimes

SPARE3D: A Dataset for SPAtial REasoning on Three-View Line Drawings
Author: Wenyu Han,Siyuan Xiang,Chenhui Liu,Ruoyu Wang,Chen Feng

SwapText: Image Based Texts Transfer in Scenes
Author: Qiangpeng Yang,Jun Huang,Wei Lin

OrigamiNet: Weakly-Supervised, Segmentation-Free, One-Step, Full Page Text Recognition by learning to unfold
Author: Mohamed Yousef,Tom E. Bishop

FroDO: From Detections to 3D Objects
Author: Martin Runz,Kejie Li,Meng Tang,Lingni Ma,Chen Kong,Tanner Schmidt,Ian Reid,Lourdes Agapito,Julian Straub,Steven Lovegrove,Richard Newcombe

你可能感兴趣的:(Papers,计算机视觉,视觉)

AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
国庆节的一天安心雨
昨晚朋友间就转发国庆阅兵时间安排细节。今早，六点起床，到公园散步，一路上国旗招展，浓浓喜庆味。图片发自App准时坐到电脑前，拉上窗帘，关了房门，一个人静静感受，视觉和心灵的震撼。怕大脑内存不足，想要永远留存住那些属于这个时代，属于这个国家的骄傲。于是，拿出手机，对着屏幕拍了一张一张又一张。下午，朋友圈各种关于国庆的想法、评论、图片刷屏，翻了一遍一遍又一遍，每一遍都是骄傲和自豪。为生在这个伟大的时代
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
你会读书吗阿杰说澄长
一上学那会，朋友W报名了一个快速阅读培训课。出于好奇，我拿着他的培训资料进行了一个月的自我训练，并一度深陷其中。材料主要是无规则的符号以及横跨A4纸的连线，通过视线快速移动，扩大视幅来提升信息的接受速度，又通过图案和符号锻炼大脑的视觉记忆，摆脱音读习惯。那一个月，我沉溺其中，每天用很多的时间练习。一个月后，我确实做到了快速阅读，以句群接受信息，一目一行。只是速度虽快，却读过无痕，该知道的全忘记了。
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
Python和MATLAB及C++信噪比导图(算法模型) 亚图跨际算法交叉知识 Python 视频图像修复模数转换信号链噪音频谱计算量化周期性视觉刺激高斯噪声的矩形脉冲心率失常检测算法
要点视频图像修复模数转换中混合信号链噪音测量频谱计算和量化周期性视觉刺激脑电图高斯噪声的矩形脉冲总谐波失真周期图功率谱密度各种心率失常检测算法胶体悬浮液跟踪检测计算交通监控摄像头图像噪音计算Python信噪比信噪比是科学和工程中使用的一种测量方法，用于比较所需信号水平与背景噪声水平。信噪比定义为信号功率与噪声功率之比，通常以分贝表示。高于1:1（大于0dB）的比率表示信号大于噪声。信噪比是影响处理
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
题解 | #完全数计算#不知道为什么没超时的暴力解法 huaxinjiayou java
兄弟们，坚持就是胜利啊，找工作从去年秋招就开始找，到五月底才收到第一个offer星环的，然后六月初t咋六月了还有面试啊，有兄弟了解这个部门吗面完了家人们，纯纯kpi啊，上来就是一道题是打印多个字符串的华为接头人话术指南：欲投华为，必看此贴!引流华为招聘提前批【奖】这个夏天，和牛牛一起打卡刷题~Java面试实战项目25届本科找暑期实习的历程飞猪旅行运营岗面经百度视觉算法一面面经感谢牛友们，腾子pcg
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
微信小程序常用开发框架有哪些？ +码农快讯+ 分享微信小程序小程序开发
想要开发出一套高质量的小程序，运用框架，组件库是省时省力省心必不可少一部分，随着小程序日渐火爆，各种不同类型的小程序也渐渐更新，其中不乏一些优秀好用的框架/组件库。1：WeUI小程序–使用教程https://weui.io/官方介绍：WeUI是一套同微信原生视觉体验一致的基础样式库，由微信官方设计团队为微信内网页和微信小程序量身设计，令用户的使用感知更加统一。小程序开发中最常用到的一款框架，受广大
js的书写位置和css的书写位置的区别？为什么要这样写？李是啥也不会 javascript css 开发语言
JavaScript和CSS的书写位置有以下区别：CSS通常写在标签中，或者在外部样式表文件中（）。CSS主要用于控制页面的视觉样式和布局，通常在HTML文件的部分引入，以确保在页面渲染时样式已经加载完毕，从而避免样式闪烁。JavaScript通常写在标签中，或者在外部脚本文件中（）。JavaScript用于添加页面的动态行为和交互。一般建议将JavaScript放在HTML文件的末尾（标签之前）
云南印象一玉龙雪山把日子过成诗吧
一顿饱眠后，兴冲冲前往玉龙雪山，为了预防高反，提前数日已服红景天，又买了氧气瓶，心理上安心多了。第一站，观看印象丽江，满满的男子汉气息扑面而来，谁说现在的男人越来越娘，这里的男子个个演的豪情万丈，满足了女性视觉感受。节目是否精彩，因人而异，看懂了等于了解了少数民族的风土人情，看不懂就是一帮群众演员在闹腾。这种表演风格，场面壮观，红色情怀，老谋子的最爱，不深评。图片发自App表演毕，前往玉龙雪山，人
掌握这些思维、习惯，让你在职业生涯中受益匪浅伽马有话说
有哪些对职业生涯有益的思维和习惯呢？这里有四个建议：一、收集各行各业人类失败与灾难的反面案例我们总是高估自己，小瞧别人。有一个有趣的例子。据统计，瑞典有百分之九十的司机都认为他们的驾驶技术在平均水平之上。让我们看看抖音上那些失败的案例吧。有多少视频都是骑着单车到货车的视觉盲区被碾伤碾死；有多少视频都是醉酒开车撞伤路人、撞坏栅栏；有多少视频都是相互赌气，相互别车，最后大打出手。人类失败与灾难案例从来
Unreal Engine——AI生成高精度的虚拟人物和环境（虚拟世界构建、电影场景生成）（二）（技术分析）爱研究的小牛 AIGC—虚拟现实人工智能虚幻游戏引擎 AIGC
UnrealEngine（虚幻引擎）是业界领先的3D实时渲染引擎，广泛应用于游戏开发、影视制作、建筑可视化和虚拟现实等领域。其核心技术实现涵盖了多项复杂的功能模块，包括图形渲染、物理引擎、动画系统、音效系统和网络系统等。1.图形渲染技术UnrealEngine的图形渲染系统非常强大，支持实时渲染复杂的3D场景，生成高品质的视觉效果。虚幻引擎使用先进的渲染管线，主要分为以下几个方面：1.1渲染管线虚
录像与录像装置的区别 wjq77
录像装置是20世纪晚期艺术的一个多元界面。它糅合了艺术与科技、私人空间与公共场所、主观视觉与机器的非透明表面、高雅文化与大众文化、博物馆艺术品的严肃性与卫星电视的数字狂欢，这是一个身体消失的时刻与身体再度被发现的时刻。录像装置不能以信件形式发送或拍成视频。它不能成为原始录像的拷贝或是拷贝的拷贝。没有人能将其买来放在客厅的角落，艺术家也不能靠自己口袋里的小钱来创作它。录像装置拥有它自己的历史，受制于
视频也能分割？！在云服务器上部署最新视觉大模型SAM2教程、详细代码注释和视频演示 Hanley_Yeung 图像处理人工智能 python 人工智能 python 深度学习 SAM2 计算机视觉图像分割
使用SAM2进行视频分割本笔记本展示了如何使用SAM2在视频中进行交互式分割。它将涵盖以下内容：在帧上添加点击以获取和细化masklets（时空掩码）在整个视频中传播点击以获取_masklets同时分割和跟踪多个目标我们使用术语_segment_或_mask_来指代单个帧上对象的模型预测，_masklet_指代整个视频中的时空掩码。如果使用Jupyter在本地运行，请首先根据安装说明在您的环境中安
万里素食行是一场巅峰体验吉林长春张耀辉
2020年5月24日，全家周日观影日，是N师学院的一次特别精神大餐，感谢互加计划吴虹校长的推荐和邀约，徐立导演的素食题材电影《巅峰体验》，这是一部超过瘾的影片，全程视觉享受，影片中体验人生巅峰为了寻找人生的终极意义，为了挖掘自己未知的潜能，记录了一群人63天的素食雷达骑行者从繁华似锦的大上海万里到达宁静致远的拉萨圣地，预计骑行1万里的故事。这是一部真人真事的纪录片，没有任何情节设计，也没有预设台词
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
《秒速五厘米》：经历过异地恋的人才懂的心酸，因为爱，所以坚持好姑娘黄黄啊
《秒速五厘米》应该是新海诚在国内出名的第一部作品了，《秒速五厘米》虽然故事情节简单，却获得好评一片，除了给人在视觉上的享受以外，更多的是给心灵带来的动容。简单一点来说，《秒速五厘米》主要讲诉了两个青梅竹马、相互喜欢的小孩明里和贵树的故事，因为父母工作的原因导致分隔两地，两个人在不同的城市读完了高中、大学，随着时间的推移走到了人生的分叉路口，最后相忘于江湖的故事。有人说，宁愿在电影院多看十次《你的名
微软 Azure AI 服务免费试用及申请：语音识别、文本转语音、基于视觉、语言处理、文档分析等10大场景全云在线allcloudonline microsoft azure 人工智能
为方便企业认识和快速上手AzureAI服务，我们总结了一套包括语音识别、文本转语音、基于视觉、语言处理场景、文档分析场景等全面的预构建模型和演示，旨在解决各种用例。这些模型易于访问，可帮助企业无缝实施AI驱动的解决方案，如下是已整理并编录的AzureAI服务中提供的预构建演示，希望这可以帮助您将AI无缝融入您的产品和服务中。微软AzureAI服务可以合规、稳定地提供企业用户使用ChatGPT的可能
可对画面进行平台传输，实时查看监控的智慧交通开源了。 ai产品老杨人工智能音视频安全开源 vue.js
智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。项目搭建地址项目开源地址：yihecode-server本项目基于ai场景而开发，提供算法模型管理、摄像头管理、告警管理、数
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
给大家介绍一下全国排名前三的小说网站历史说书人
众所周知，现在是网络小说横行的时代，随便拿出来手机一点，便是好多个网络小说和网站跳跃了出来。但是根据我的一番亲身体验，真正有水平的小说网站不多，主要可以分为俩大派系。第一大小说网站便要数企鹅系的起点中文网了。中国第一大小说网站，可谓是小说界里面的航母了，里面各种各类的正版图书应有尽有，小神大神无数，简直就是看小说的最后网站，无论是历史军事还是都市玄幻，都能让你一饱眼福，欲罢不能的视觉和脑觉爽感。第
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
计算机视觉—照相机（下） zidea
封面焦距(FieldofView)同一位置相机用不同焦距，28mmFieldofView就变小，85mm时候的Fieldofview也就是只有28度视野，每一个物体在通常尺寸的胶片上像素也就是越多，chromaticAberration焦距和是波长相关，不同颜色光聚焦在不同位置。这种现象在物体边缘尤为明显。颜色颜色说简单也简单，说复杂也复杂，我们在高中物理已经知道可见光是电磁波，不同颜色对应不同波
视频语言规划硅谷秋水大模型智能体机器学习音视频人工智能计算机视觉机器学习
23年10月来自谷歌、MIT和伯克利分校的论文“videolanguageplanning”。讨论如何利用在互联网规模数据上预训练大型生成模型，在生成的视频和语言空间中实现复杂长范围任务的视觉规划。为此，提出视频语言规划(VLP)，一种由树搜索过程组成的算法，训练(i)视觉-语言模型作为策略和价值函数，以及(ii)文本-到-视频模型作为动态模型。VLP将长范围任务指令和当前图像观察作为输入，并输出
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>