xiamentingtao

语义分割深度学习方法集锦

转载：https://github.com/handong1587/handong1587.github.io/edit/master/_posts/deep_learning/2015-10-09-segmentation.md

Papers

Deep Joint Task Learning for Generic Object Extraction

intro: NIPS 2014
homepage: http://vision.sysu.edu.cn/projects/deep-joint-task-learning/
paper: http://ss.sysu.edu.cn/~ll/files/NIPS2014_JointTask.pdf
github: https://github.com/xiaolonw/nips14_loc_seg_testonly
dataset: http://objectextraction.github.io/

Highly Efficient Forward and Backward Propagation of Convolutional Neural Networks for Pixelwise Classification

arxiv: https://arxiv.org/abs/1412.4526
code(Caffe): https://dl.dropboxusercontent.com/u/6448899/caffe.zip
author page: http://www.ee.cuhk.edu.hk/~hsli/

Segmentation from Natural Language Expressions

intro: ECCV 2016
project page: http://ronghanghu.com/text_objseg/
arxiv: http://arxiv.org/abs/1603.06180
github(TensorFlow): https://github.com/ronghanghu/text_objseg
gtihub(Caffe): https://github.com/Seth-Park/text_objseg_caffe

Semantic Object Parsing with Graph LSTM

arxiv: http://arxiv.org/abs/1603.07063

Fine Hand Segmentation using Convolutional Neural Networks

arxiv: http://arxiv.org/abs/1608.07454

Feedback Neural Network for Weakly Supervised Geo-Semantic Segmentation

intro: Facebook Connectivity Lab & Facebook Core Data Science & University of Illinois
arxiv: https://arxiv.org/abs/1612.02766

FusionNet: A deep fully residual convolutional neural network for image segmentation in connectomics

arxiv: https://arxiv.org/abs/1612.05360

A deep learning model integrating FCNNs and CRFs for brain tumor segmentation

arxiv: https://arxiv.org/abs/1702.04528

Texture segmentation with Fully Convolutional Networks

intro: Dublin City University
arxiv: https://arxiv.org/abs/1703.05230

Fast LIDAR-based Road Detection Using Convolutional Neural Networks

https://arxiv.org/abs/1703.03613

Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs

arxiv: https://arxiv.org/abs/1703.04363
demo: https://gyglim.github.io/deep-value-net/

Annotating Object Instances with a Polygon-RNN

intro: CVPR 2017. CVPR Best Paper Honorable Mention Award. University of Toronto
project page: http://www.cs.toronto.edu/polyrnn/
arxiv: https://arxiv.org/abs/1704.05548

Semantic Segmentation via Structured Patch Prediction, Context CRF and Guidance CRF

intro: CVPR 2017
paper: http://openaccess.thecvf.com/content_cvpr_2017/papers/Shen_Semantic_Segmentation_via_CVPR_2017_paper.pdf
github(Caffe): https://github.com//FalongShen/SegModel

Nighttime sky/cloud image segmentation

intro: ICIP 2017
arxiv: https://arxiv.org/abs/1705.10583

Distantly Supervised Road Segmentation

intro: ICCV workshop CVRSUAD2017. Indiana University & Preferred Networks
arxiv: https://arxiv.org/abs/1708.06118

Superpixel clustering with deep features for unsupervised road segmentation

intro: Preferred Networks, Inc & Indiana University
arxiv: https://arxiv.org/abs/1711.05998

Learning to Segment Human by Watching YouTube

intro: TPAMI 2017
arxiv: https://arxiv.org/abs/1710.01457

W-Net: A Deep Model for Fully Unsupervised Image Segmentation

https://arxiv.org/abs/1711.08506

End-to-end detection-segmentation network with ROI convolution

intro: ISBI 2018
arxiv: https://arxiv.org/abs/1801.02722

U-Net

U-Net: Convolutional Networks for Biomedical Image Segmentation

intro: conditionally accepted at MICCAI 2015
project page: http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/
arxiv: http://arxiv.org/abs/1505.04597
code+data: http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/u-net-release-2015-10-02.tar.gz
github: https://github.com/orobix/retina-unet
github: https://github.com/jakeret/tf_unet
notes: http://zongwei.leanote.com/post/Pa

DeepUNet: A Deep Fully Convolutional Network for Pixel-level Sea-Land Segmentation

https://arxiv.org/abs/1709.00201

TernausNet: U-Net with VGG11 Encoder Pre-Trained on ImageNet for Image Segmentation

intro: Lyft Inc. & MIT
intro: part of the winning solution (1st out of 735) in the Kaggle: Carvana Image Masking Challenge
arxiv: https://arxiv.org/abs/1801.05746
github: https://github.com/ternaus/TernausNet

Foreground Object Segmentation

Pixel Objectness

project page: http://vision.cs.utexas.edu/projects/pixelobjectness/
arxiv: https://arxiv.org/abs/1701.05349
github: https://github.com/suyogduttjain/pixelobjectness

A Deep Convolutional Neural Network for Background Subtraction

arxiv: https://arxiv.org/abs/1702.01731

Semantic Segmentation

Fully Convolutional Networks for Semantic Segmentation

intro: CVPR 2015, PAMI 2016
keywords: deconvolutional layer, crop layer
arxiv: http://arxiv.org/abs/1411.4038
arxiv(PAMI 2016): http://arxiv.org/abs/1605.06211
slides: https://docs.google.com/presentation/d/1VeWFMpZ8XN7OC3URZP4WdXvOGYckoFWGVN7hApoXVnc
slides: http://tutorial.caffe.berkeleyvision.org/caffe-cvpr15-pixels.pdf
talk: http://techtalks.tv/talks/fully-convolutional-networks-for-semantic-segmentation/61606/
github(official): https://github.com/shelhamer/fcn.berkeleyvision.org
github: https://github.com/BVLC/caffe/wiki/Model-Zoo#fcn
github: https://github.com/MarvinTeichmann/tensorflow-fcn
github(Chainer): https://github.com/wkentaro/fcn
github(PyTorch): https://github.com/wkentaro/pytorch-fcn
github(Tensorflow): https://github.com/shekkizh/FCN.tensorflow
notes: http://zhangliliang.com/2014/11/28/paper-note-fcn-segment/

From Image-level to Pixel-level Labeling with Convolutional Networks

intro: CVPR 2015
intro: “Weakly Supervised Semantic Segmentation with Convolutional Networks”
intro: performs semantic segmentation based only on image-level annotations in a multiple instance learning framework
arxiv: http://arxiv.org/abs/1411.6228
paper: http://ronan.collobert.com/pub/matos/2015_semisupsemseg_cvpr.pdf

Feedforward semantic segmentation with zoom-out features

intro: CVPR 2015. Toyota Technological Institute at Chicago
paper: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Mostajabi_Feedforward_Semantic_Segmentation_2015_CVPR_paper.pdf
bitbuckt: https://bitbucket.org/m_mostajabi/zoom-out-release
video: https://www.youtube.com/watch?v=HvgvX1LXQa8

DeepLab

Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs

intro: ICLR 2015. DeepLab
arxiv: http://arxiv.org/abs/1412.7062
bitbucket: https://bitbucket.org/deeplab/deeplab-public/
github: https://github.com/TheLegendAli/DeepLab-Context

Weakly- and Semi-Supervised Learning of a DCNN for Semantic Image Segmentation

intro: DeepLab
arxiv: http://arxiv.org/abs/1502.02734
bitbucket: https://bitbucket.org/deeplab/deeplab-public/
github: https://github.com/TheLegendAli/DeepLab-Context

DeepLab v2

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

intro: TPAMI
intro: 79.7% mIOU in the test set, PASCAL VOC-2012 semantic image segmentation task
intro: Updated version of our previous ICLR 2015 paper
project page: http://liangchiehchen.com/projects/DeepLab.html
arxiv: https://arxiv.org/abs/1606.00915
bitbucket: https://bitbucket.org/aquariusjay/deeplab-public-ver2
github: https://github.com/DrSleep/tensorflow-deeplab-resnet
github: https://github.com/isht7/pytorch-deeplab-resnet

DeepLabv2 (ResNet-101)

http://liangchiehchen.com/projects/DeepLabv2_resnet.html

DeepLab v3

Rethinking Atrous Convolution for Semantic Image Segmentation

intro: Google. DeepLabv3
arxiv: https://arxiv.org/abs/1706.05587

CRF-RNN

Conditional Random Fields as Recurrent Neural Networks

intro: ICCV 2015. Oxford / Stanford / Baidu
project page: http://www.robots.ox.ac.uk/~szheng/CRFasRNN.html
arxiv: http://arxiv.org/abs/1502.03240
github: https://github.com/torrvision/crfasrnn
demo: http://www.robots.ox.ac.uk/~szheng/crfasrnndemo
github: https://github.com/martinkersner/train-CRF-RNN

BoxSup

BoxSup: Exploiting Bounding Boxes to Supervise Convolutional Networks for Semantic Segmentation

arxiv: http://arxiv.org/abs/1503.01640

Efficient piecewise training of deep structured models for semantic segmentation

intro: CVPR 2016
arxiv: http://arxiv.org/abs/1504.01013

DeconvNet

Learning Deconvolution Network for Semantic Segmentation

intro: ICCV 2015. DeconvNet
intro: two-stage training: train the network with easy examples first and
fine-tune the trained network with more challenging examples later
project page: http://cvlab.postech.ac.kr/research/deconvnet/
arxiv: http://arxiv.org/abs/1505.04366
slides: http://web.cs.hacettepe.edu.tr/~aykut/classes/spring2016/bil722/slides/w06-deconvnet.pdf
gitxiv: http://gitxiv.com/posts/9tpJKNTYksN5eWcHz/learning-deconvolution-network-for-semantic-segmentation
github: https://github.com/HyeonwooNoh/DeconvNet
github: https://github.com/HyeonwooNoh/caffe

SegNet

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust Semantic Pixel-Wise Labelling

arxiv: http://arxiv.org/abs/1505.07293
github: https://github.com/alexgkendall/caffe-segnet
github: https://github.com/pfnet-research/chainer-segnet

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

homepage: http://mi.eng.cam.ac.uk/projects/segnet/
arxiv: http://arxiv.org/abs/1511.00561
github: https://github.com/alexgkendall/caffe-segnet
tutorial: http://mi.eng.cam.ac.uk/projects/segnet/tutorial.html

SegNet: Pixel-Wise Semantic Labelling Using a Deep Networks

youtube: https://www.youtube.com/watch?v=xfNYAly1iXo
mirror: http://pan.baidu.com/s/1gdUzDlD

Getting Started with SegNet

blog: http://mi.eng.cam.ac.uk/projects/segnet/tutorial.html
github: https://github.com/alexgkendall/SegNet-Tutorial

ParseNet

ParseNet: Looking Wider to See Better

intro:ICLR 2016
arxiv: http://arxiv.org/abs/1506.04579
github: https://github.com/weiliu89/caffe/tree/fcn
caffe model zoo: https://github.com/BVLC/caffe/wiki/Model-Zoo#parsenet-looking-wider-to-see-better

DecoupledNet

Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation

intro: ICLR 2016
project(paper+code): http://cvlab.postech.ac.kr/research/decouplednet/
arxiv: http://arxiv.org/abs/1506.04924
github: https://github.com/HyeonwooNoh/DecoupledNet

Semantic Image Segmentation via Deep Parsing Network

intro: ICCV 2015. CUHK
keywords: Deep Parsing Network (DPN), Markov Random Field (MRF)
homepage: http://personal.ie.cuhk.edu.hk/~lz013/projects/DPN.html
arxiv.org: http://arxiv.org/abs/1509.02634
paper: http://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Liu_Semantic_Image_Segmentation_ICCV_2015_paper.pdf
slides: http://personal.ie.cuhk.edu.hk/~pluo/pdf/presentation_dpn.pdf

Multi-Scale Context Aggregation by Dilated Convolutions

intro: ICLR 2016.
intro: Dilated Convolution for Semantic Image Segmentation
homepage: http://vladlen.info/publications/multi-scale-context-aggregation-by-dilated-convolutions/
arxiv: http://arxiv.org/abs/1511.07122
github: https://github.com/fyu/dilation
github: https://github.com/nicolov/segmentation_keras
notes: http://www.inference.vc/dilated-convolutions-and-kronecker-factorisation/

Instance-aware Semantic Segmentation via Multi-task Network Cascades

intro: CVPR 2016 oral. 1st-place winner of MS COCO 2015 segmentation competition
keywords: RoI warping layer, Multi-task Network Cascades (MNC)
arxiv: http://arxiv.org/abs/1512.04412
github: https://github.com/daijifeng001/MNC

Object Segmentation on SpaceNet via Multi-task Network Cascades (MNC)

blog: https://medium.com/the-downlinq/object-segmentation-on-spacenet-via-multi-task-network-cascades-mnc-f1c89d790b42
github: https://github.com/lncohn/pascal_to_spacenet

Learning Transferrable Knowledge for Semantic Segmentation with Deep Convolutional Neural Network

intro: TransferNet
project page: http://cvlab.postech.ac.kr/research/transfernet/
arxiv: http://arxiv.org/abs/1512.07928
github: https://github.com/maga33/TransferNet

Combining the Best of Convolutional Layers and Recurrent Layers: A Hybrid Network for Semantic Segmentation

arxiv: http://arxiv.org/abs/1603.04871

Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image Segmentation

intro: ECCV 2016
arxiv: https://arxiv.org/abs/1603.06098
github: https://github.com/kolesman/SEC

ScribbleSup

ScribbleSup: Scribble-Supervised Convolutional Networks for Semantic Segmentation

project page: http://research.microsoft.com/en-us/um/people/jifdai/downloads/scribble_sup/
arxiv: http://arxiv.org/abs/1604.05144

Laplacian Reconstruction and Refinement for Semantic Segmentation

Laplacian Pyramid Reconstruction and Refinement for Semantic Segmentation

intro: ECCV 2016
arxiv: https://arxiv.org/abs/1605.02264
paper: https://www.ics.uci.edu/~fowlkes/papers/gf-eccv16.pdf
github(MatConvNet): https://github.com/golnazghiasi/LRR

Natural Scene Image Segmentation Based on Multi-Layer Feature Extraction

arxiv: http://arxiv.org/abs/1605.07586

Convolutional Random Walk Networks for Semantic Image Segmentation

arxiv: http://arxiv.org/abs/1605.07681

ENet

ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

arxiv: http://arxiv.org/abs/1606.02147
github: https://github.com/e-lab/ENet-training
github(Caffe): https://github.com/TimoSaemann/ENet
github: https://github.com/PavlosMelissinos/enet-keras
github: https://github.com/kwotsin/TensorFlow-ENet
blog: http://culurciello.github.io/tech/2016/06/20/training-enet.html

Fully Convolutional Networks for Dense Semantic Labelling of High-Resolution Aerial Imagery

arxiv: http://arxiv.org/abs/1606.02585

Deep Learning Markov Random Field for Semantic Segmentation

arxiv: http://arxiv.org/abs/1606.07230

Region-based semantic segmentation with end-to-end training

intro: ECCV 2016
arxiv: http://arxiv.org/abs/1607.07671
githun: https://github.com/nightrome/matconvnet-calvin

Built-in Foreground/Background Prior for Weakly-Supervised Semantic Segmentation

intro: ECCV 2016
arxiv: http://arxiv.org/abs/1609.00446

PixelNet

PixelNet: Towards a General Pixel-level Architecture

intro: semantic segmentation, edge detection
arxiv: http://arxiv.org/abs/1609.06694

Exploiting Depth from Single Monocular Images for Object Detection and Semantic Segmentation

intro: IEEE T. Image Processing
intro: propose an RGB-D semantic segmentation method which applies a multi-task training scheme: semantic label prediction and depth value regression
arxiv: https://arxiv.org/abs/1610.01706

PixelNet: Representation of the pixels, by the pixels, and for the pixels

intro: CMU & Adobe Research
project page: http://www.cs.cmu.edu/~aayushb/pixelNet/
arxiv: https://arxiv.org/abs/1702.06506
github(Caffe): https://github.com/aayushbansal/PixelNet

Semantic Segmentation of Earth Observation Data Using Multimodal and Multi-scale Deep Networks

arxiv: http://arxiv.org/abs/1609.06846

Deep Structured Features for Semantic Segmentation

arxiv: http://arxiv.org/abs/1609.07916

CNN-aware Binary Map for General Semantic Segmentation

intro: ICIP 2016 Best Paper / Student Paper Finalist
arxiv: https://arxiv.org/abs/1609.09220

Efficient Convolutional Neural Network with Binary Quantization Layer

arxiv: https://arxiv.org/abs/1611.06764

Mixed context networks for semantic segmentation

intro: Hikvision Research Institute
arxiv: https://arxiv.org/abs/1610.05854

High-Resolution Semantic Labeling with Convolutional Neural Networks

arxiv: https://arxiv.org/abs/1611.01962

Gated Feedback Refinement Network for Dense Image Labeling

intro: CVPR 2017
paper: http://www.cs.umanitoba.ca/~ywang/papers/cvpr17.pdf

RefineNet

RefineNet: Multi-Path Refinement Networks with Identity Mappings for High-Resolution Semantic Segmentation

RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation

intro: CVPR 2017. IoU 83.4% on PASCAL VOC 2012
arxiv: https://arxiv.org/abs/1611.06612
github: https://github.com/guosheng/refinenet
leaderboard: http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=6#KEY_Multipath-RefineNet-Res152

Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes

keywords: Full-Resolution Residual Units (FRRU), Full-Resolution Residual Networks (FRRNs)
arxiv: https://arxiv.org/abs/1611.08323
github(Theano/Lasagne): https://github.com/TobyPDE/FRRN
youtube: https://www.youtube.com/watch?v=PNzQ4PNZSzc

Semantic Segmentation using Adversarial Networks

intro: Facebook AI Research & INRIA. NIPS Workshop on Adversarial Training, Dec 2016, Barcelona, Spain
arxiv: https://arxiv.org/abs/1611.08408
github(Chainer): https://github.com/oyam/Semantic-Segmentation-using-Adversarial-Networks

Improving Fully Convolution Network for Semantic Segmentation

arxiv: https://arxiv.org/abs/1611.08986

The One Hundred Layers Tiramisu: Fully Convolutional DenseNets for Semantic Segmentation

intro: Montreal Institute for Learning Algorithms & Ecole Polytechnique de Montreal
arxiv: https://arxiv.org/abs/1611.09326
github: https://github.com/SimJeg/FC-DenseNet
github: https://github.com/titu1994/Fully-Connected-DenseNets-Semantic-Segmentation
github(Keras): https://github.com/0bserver07/One-Hundred-Layers-Tiramisu

Training Bit Fully Convolutional Network for Fast Semantic Segmentation

intro: Megvii
arxiv: https://arxiv.org/abs/1612.00212

Classification With an Edge: Improving Semantic Image Segmentation with Boundary Detection

intro: “an end-to-end trainable deep convolutional neural network (DCNN) for semantic segmentation
with built-in awareness of semantically meaningful boundaries. “
arxiv: https://arxiv.org/abs/1612.01337

Diverse Sampling for Self-Supervised Learning of Semantic Segmentation

arxiv: https://arxiv.org/abs/1612.01991

Mining Pixels: Weakly Supervised Semantic Segmentation Using Image Labels

intro: Nankai University & University of Oxford & NUS
arxiv: https://arxiv.org/abs/1612.02101

FCNs in the Wild: Pixel-level Adversarial and Constraint-based Adaptation

arxiv: https://arxiv.org/abs/1612.02649

Understanding Convolution for Semantic Segmentation

intro: UCSD & CMU & UIUC & TuSimple
arxiv: https://arxiv.org/abs/1702.08502
github(MXNet): [https://github.com/TuSimple/TuSimple-DUC]https://github.com/TuSimple/TuSimple-DUC
pretrained-models: https://drive.google.com/drive/folders/0B72xLTlRb0SoREhISlhibFZTRmM

Label Refinement Network for Coarse-to-Fine Semantic Segmentation

https://www.arxiv.org/abs/1703.00551

Predicting Deeper into the Future of Semantic Segmentation

intro: Facebook AI Research
arxiv: https://arxiv.org/abs/1703.07684

Guided Perturbations: Self Corrective Behavior in Convolutional Neural Networks

intro: University of Maryland & GE Global Research Center
arxiv: https://arxiv.org/abs/1703.07928

Not All Pixels Are Equal: Difficulty-aware Semantic Segmentation via Deep Layer Cascade

intro: CVPR 2017 spotlight paper
arxxiv: https://arxiv.org/abs/1704.01344

Large Kernel Matters – Improve Semantic Segmentation by Global Convolutional Network

https://arxiv.org/abs/1703.02719

Loss Max-Pooling for Semantic Image Segmentation

intro: CVPR 2017
arxiv: https://arxiv.org/abs/1704.02966

Reformulating Level Sets as Deep Recurrent Neural Network Approach to Semantic Segmentation

https://arxiv.org/abs/1704.03593

A Review on Deep Learning Techniques Applied to Semantic Segmentation

https://arxiv.org/abs/1704.06857

Joint Semantic and Motion Segmentation for dynamic scenes using Deep Convolutional Networks

intro: [International Institute of Information Technology & Max Planck Institute For Intelligent Systems
arxiv: https://arxiv.org/abs/1704.08331

ICNet

ICNet for Real-Time Semantic Segmentation on High-Resolution Images

intro: CUHK & Sensetime
project page: https://hszhao.github.io/projects/icnet/
arxiv: https://arxiv.org/abs/1704.08545
github: https://github.com/hszhao/ICNet
video: https://www.youtube.com/watch?v=qWl9idsCuLQ

LinkNet

Feature Forwarding: Exploiting Encoder Representations for Efficient Semantic Segmentation

LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation

project page: https://codeac29.github.io/projects/linknet/
arxiv: https://arxiv.org/abs/1707.03718
github: https://github.com/e-lab/LinkNet

Pixel Deconvolutional Networks

intro: Washington State University
arxiv: https://arxiv.org/abs/1705.06820

Incorporating Network Built-in Priors in Weakly-supervised Semantic Segmentation

intro: IEEE TPAMI
arxiv: https://arxiv.org/abs/1706.02189

Deep Semantic Segmentation for Automated Driving: Taxonomy, Roadmap and Challenges

intro: IEEE ITSC 2017
arxiv: https://arxiv.org/abs/1707.02432

Semantic Segmentation with Reverse Attention

intro: BMVC 2017 oral. University of Southern California
arxiv: https://arxiv.org/abs/1707.06426

Stacked Deconvolutional Network for Semantic Segmentation

https://arxiv.org/abs/1708.04943

Learning Dilation Factors for Semantic Segmentation of Street Scenes

intro: GCPR 2017
arxiv: https://arxiv.org/abs/1709.01956

A Self-aware Sampling Scheme to Efficiently Train Fully Convolutional Networks for Semantic Segmentation

https://arxiv.org/abs/1709.02764

One-Shot Learning for Semantic Segmentation

intro: BMWC 2017
arcxiv: https://arxiv.org/abs/1709.03410
github: https://github.com/lzzcd001/OSLSM

An Adaptive Sampling Scheme to Efficiently Train Fully Convolutional Networks for Semantic Segmentation

https://arxiv.org/abs/1709.02764

Semantic Segmentation from Limited Training Data

https://arxiv.org/abs/1709.07665

Unsupervised Domain Adaptation for Semantic Segmentation with GANs

https://arxiv.org/abs/1711.06969

Neuron-level Selective Context Aggregation for Scene Segmentation

https://arxiv.org/abs/1711.08278

Road Extraction by Deep Residual U-Net

https://arxiv.org/abs/1711.10684

Mix-and-Match Tuning for Self-Supervised Semantic Segmentation

intro: AAAI 2018
project page: http://mmlab.ie.cuhk.edu.hk/projects/M&M/
arxiv: https://arxiv.org/abs/1712.00661
github: https://github.com/XiaohangZhan/mix-and-match/
github: https://github.com//liuziwei7/mix-and-match

Error Correction for Dense Semantic Image Labeling

https://arxiv.org/abs/1712.03812

Semantic Segmentation via Highly Fused Convolutional Network with Multiple Soft Cost Functions

https://arxiv.org/abs/1801.01317

Instance Segmentation

Simultaneous Detection and Segmentation

intro: ECCV 2014
author: Bharath Hariharan, Pablo Arbelaez, Ross Girshick, Jitendra Malik
arxiv: http://arxiv.org/abs/1407.1808
github(Matlab): https://github.com/bharath272/sds_eccv2014

Convolutional Feature Masking for Joint Object and Stuff Segmentation

intro: CVPR 2015
keywords: masking layers
arxiv: https://arxiv.org/abs/1412.1283
paper: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Dai_Convolutional_Feature_Masking_2015_CVPR_paper.pdf

Proposal-free Network for Instance-level Object Segmentation

paper: http://arxiv.org/abs/1509.02636

Hypercolumns for object segmentation and fine-grained localization

intro: CVPR 2015
arxiv: https://arxiv.org/abs/1411.5752
paper: http://www.cs.berkeley.edu/~bharath2/pubs/pdfs/BharathCVPR2015.pdf

SDS using hypercolumns

github: https://github.com/bharath272/sds

Learning to decompose for object detection and instance segmentation

intro: ICLR 2016 Workshop
keyword: CNN / RNN, MNIST, KITTI
arxiv: http://arxiv.org/abs/1511.06449

Recurrent Instance Segmentation

intro: ECCV 2016
porject page: http://romera-paredes.com/ris
arxiv: http://arxiv.org/abs/1511.08250
github(Torch): https://github.com/bernard24/ris
poster: http://www.eccv2016.org/files/posters/P-4B-46.pdf
youtube: https://www.youtube.com/watch?v=l_WD2OWOqBk

Instance-sensitive Fully Convolutional Networks

intro: ECCV 2016. instance segment proposal
arxiv: http://arxiv.org/abs/1603.08678

Amodal Instance Segmentation

intro: ECCV 2016
arxiv: http://arxiv.org/abs/1604.08202

Bridging Category-level and Instance-level Semantic Image Segmentation

keywords: online bootstrapping
arxiv: http://arxiv.org/abs/1605.06885

Bottom-up Instance Segmentation using Deep Higher-Order CRFs

intro: BMVC 2016
arxiv: http://arxiv.org/abs/1609.02583

DeepCut: Object Segmentation from Bounding Box Annotations using Convolutional Neural Networks

arxiv: http://arxiv.org/abs/1605.07866

End-to-End Instance Segmentation and Counting with Recurrent Attention

intro: ReInspect
arxiv: http://arxiv.org/abs/1605.09410

TA-FCN / FCIS

Translation-aware Fully Convolutional Instance Segmentation

Fully Convolutional Instance-aware Semantic Segmentation

intro: CVPR 2017 Spotlight paper. winning entry of COCO segmentation challenge 2016
arxiv: https://arxiv.org/abs/1611.07709
github: https://github.com/msracver/FCIS
slides: https://onedrive.live.com/?cid=f371d9563727b96f&id=F371D9563727B96F%2197213&authkey=%21AEYOyOirjIutSVk

InstanceCut: from Edges to Instances with MultiCut

arxiv: https://arxiv.org/abs/1611.08272

Deep Watershed Transform for Instance Segmentation

arxiv: https://arxiv.org/abs/1611.08303

Object Detection Free Instance Segmentation With Labeling Transformations

arxiv: https://arxiv.org/abs/1611.08991

Shape-aware Instance Segmentation

arxiv: https://arxiv.org/abs/1612.03129

Interpretable Structure-Evolving LSTM

intro: CMU & Sun Yat-sen University & National University of Singapore & Adobe Research
intro: CVPR 2017 spotlight paper
arxiv: https://arxiv.org/abs/1703.03055

Mask R-CNN

intro: ICCV 2017 Best paper award. Facebook AI Research
arxiv: https://arxiv.org/abs/1703.06870
github: https://github.com/TuSimple/mx-maskrcnn
github(Keras+TensorFlow): https://github.com/matterport/Mask_RCNN

Semantic Instance Segmentation via Deep Metric Learning

https://arxiv.org/abs/1703.10277

Pose2Instance: Harnessing Keypoints for Person Instance Segmentation

https://arxiv.org/abs/1704.01152

Pixelwise Instance Segmentation with a Dynamically Instantiated Network

intro: CVPR 2017
arxiv: https://arxiv.org/abs/1704.02386

Instance-Level Salient Object Segmentation

intro: CVPR 2017
arxiv: https://arxiv.org/abs/1704.03604

Semantic Instance Segmentation with a Discriminative Loss Function

intro: Published at “Deep Learning for Robotic Vision”, workshop at CVPR 2017. KU Leuven
arxiv: https://arxiv.org/abs/1708.02551

SceneCut: Joint Geometric and Object Segmentation for Indoor Scenes

https://arxiv.org/abs/1709.07158

S4 Net: Single Stage Salient-Instance Segmentation

arxiv: https://arxiv.org/abs/1711.07618
github: https://github.com/RuochenFan/S4Net

Deep Extreme Cut: From Extreme Points to Object Segmentation

https://arxiv.org/abs/1711.09081

Learning to Segment Every Thing

intro: UC Berkeley & Facebook AI Research
keywords: MaskX R-CNN
arxiv: https://arxiv.org/abs/1711.10370

Recurrent Neural Networks for Semantic Instance Segmentation

project page: https://imatge-upc.github.io/rsis/
arxiv: https://arxiv.org/abs/1712.00617
github: https://github.com/imatge-upc/rsis

MaskLab

MaskLab: Instance Segmentation by Refining Object Detection with Semantic and Direction Features

https://arxiv.org/abs/1712.04837

Recurrent Pixel Embedding for Instance Grouping

intro: learning to embed pixels and group them into boundaries, object proposals, semantic segments and instances.
project page: http://www.ics.uci.edu/~skong2/SMMMSG.html
arxiv: https://arxiv.org/abs/1712.08273
github: https://github.com/aimerykong/Recurrent-Pixel-Embedding-for-Instance-Grouping
slides: http://www.ics.uci.edu/~skong2/slides/pixel_embedding_for_grouping_public_version.pdf
poster: http://www.ics.uci.edu/~skong2/slides/pixel_embedding_for_grouping_poster.pdf

Specific Segmentation

A CNN Cascade for Landmark Guided Semantic Part Segmentation

project page: http://aaronsplace.co.uk/
paper: https://aaronsplace.co.uk/papers/jackson2016guided/jackson2016guided.pdf

End-to-end semantic face segmentation with conditional random fields as convolutional, recurrent and adversarial networks

arxiv: https://arxiv.org/abs/1703.03305

Face Parsing via Recurrent Propagation

intro: BMVC 2017
arxiv: https://arxiv.org/abs/1708.01936

Face Parsing via a Fully-Convolutional Continuous CRF Neural Network

https://arxiv.org/abs/1708.03736

Boundary-sensitive Network for Portrait Segmentation

https://arxiv.org/abs/1712.08675

Segment Proposal

Learning to Segment Object Candidates

intro: Facebook AI Research (FAIR)
intro: DeepMask. learning segmentation proposals
arxiv: http://arxiv.org/abs/1506.06204
github: https://github.com/facebookresearch/deepmask
github: https://github.com/abbypa/NNProject_DeepMask

Learning to Refine Object Segments

intro: ECCV 2016. Facebook AI Research (FAIR)
intro: SharpMask. an extension of DeepMask which generates higher-fidelity masks using an additional top-down refinement step.
arxiv: http://arxiv.org/abs/1603.08695
github: https://github.com/facebookresearch/deepmask

FastMask: Segment Object Multi-scale Candidates in One Shot

intro: CVPR 2017. University of California & Fudan University & Megvii Inc.
arxiv: https://arxiv.org/abs/1612.08843
github: https://github.com/voidrank/FastMask

Scene Labeling / Scene Parsing

Indoor Semantic Segmentation using depth information

arxiv: http://arxiv.org/abs/1301.3572

Recurrent Convolutional Neural Networks for Scene Parsing

arxiv: http://arxiv.org/abs/1306.2795
slides: http://people.ee.duke.edu/~lcarin/Yizhe8.14.2015.pdf
github: https://github.com/NP-coder/CLPS1520Project
github: https://github.com/rkargon/Scene-Labeling

Learning hierarchical features for scene labeling

paper: http://yann.lecun.com/exdb/publis/pdf/farabet-pami-13.pdf

Multi-modal unsupervised feature learning for rgb-d scene labeling

intro: ECCV 2014
paper: http://www3.ntu.edu.sg/home/wanggang/WangECCV2014.pdf

Scene Labeling with LSTM Recurrent Neural Networks

paper: http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Byeon_Scene_Labeling_With_2015_CVPR_paper.pdf

Attend, Infer, Repeat: Fast Scene Understanding with Generative Models

arxiv: http://arxiv.org/abs/1603.08575
notes: http://www.shortscience.org/paper?bibtexKey=journals/corr/EslamiHWTKH16

“Semantic Segmentation for Scene Understanding: Algorithms and Implementations” tutorial

intro: 2016 Embedded Vision Summit
youtube: https://www.youtube.com/watch?v=pQ318oCGJGY

Semantic Understanding of Scenes through the ADE20K Dataset

arxiv: https://arxiv.org/abs/1608.05442

Learning Deep Representations for Scene Labeling with Guided Supervision

Learning Deep Representations for Scene Labeling with Semantic Context Guided Supervision

intro: CUHK
arxiv: https://arxiv.org/abs/1706.02493

Spatial As Deep: Spatial CNN for Traffic Scene Understanding

intro: AAAI 2018
arxiv: https://arxiv.org/abs/1712.06080

MPF-RNN

Multi-Path Feedback Recurrent Neural Network for Scene Parsing

arxiv: http://arxiv.org/abs/1608.07706

Scene Labeling using Recurrent Neural Networks with Explicit Long Range Contextual Dependency

arxiv: https://arxiv.org/abs/1611.07485

PSPNet

Pyramid Scene Parsing Network

intro: CVPR 2017
intro: mIoU score as 85.4% on PASCAL VOC 2012 and 80.2% on Cityscapes,
ranked 1st place in ImageNet Scene Parsing Challenge 2016
project page: http://appsrv.cse.cuhk.edu.hk/~hszhao/projects/pspnet/index.html
arxiv: https://arxiv.org/abs/1612.01105
slides: http://image-net.org/challenges/talks/2016/SenseCUSceneParsing.pdf
github: https://github.com/hszhao/PSPNet
github: https://github.com/Vladkryvoruchko/PSPNet-Keras-tensorflow

Open Vocabulary Scene Parsing

https://arxiv.org/abs/1703.08769

Deep Contextual Recurrent Residual Networks for Scene Labeling

https://arxiv.org/abs/1704.03594

Fast Scene Understanding for Autonomous Driving

intro: Published at “Deep Learning for Vehicle Perception”, workshop at the IEEE Symposium on Intelligent Vehicles 2017
arxiv: https://arxiv.org/abs/1708.02550

FoveaNet: Perspective-aware Urban Scene Parsing

https://arxiv.org/abs/1708.02421

BlitzNet: A Real-Time Deep Network for Scene Understanding

intro: INRIA
arxiv: https://arxiv.org/abs/1708.02813

Semantic Foggy Scene Understanding with Synthetic Data

https://arxiv.org/abs/1708.07819

Restricted Deformable Convolution based Road Scene Semantic Segmentation Using Surround View Cameras

https://arxiv.org/abs/1801.00708

Benchmarks

MIT Scene Parsing Benchmark

homepage: http://sceneparsing.csail.mit.edu/
github(devkit): https://github.com/CSAILVision/sceneparsing

Semantic Understanding of Urban Street Scenes: Benchmark Suite

https://www.cityscapes-dataset.com/benchmarks/

Challenges

Large-scale Scene Understanding Challenge

homepage: http://lsun.cs.princeton.edu/

Places2 Challenge

http://places2.csail.mit.edu/challenge.html

Human Parsing

Human Parsing with Contextualized Convolutional Neural Network

intro: ICCV 2015
paper: http://www.cv-foundation.org/openaccess/content_iccv_2015/html/Liang_Human_Parsing_With_ICCV_2015_paper.html

Look into Person: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing

intro: CVPr 2017. SYSU & CMU
keywords: Look Into Person (LIP)
project page: http://hcp.sysu.edu.cn/lip/
arxiv: https://arxiv.org/abs/1703.05446
github: https://github.com/Engineering-Course/LIP_SSL

Cross-domain Human Parsing via Adversarial Feature and Label Adaptation

intro: AAAI 2018
arxiv: https://arxiv.org/abs/1801.01260

Video Object Segmentation

Fast object segmentation in unconstrained video

project page: http://calvin.inf.ed.ac.uk/software/fast-video-segmentation/
paper: http://calvin.inf.ed.ac.uk/wp-content/uploads/Publications/papazoglouICCV2013-camera-ready.pdf

Recurrent Fully Convolutional Networks for Video Segmentation

arxiv: https://arxiv.org/abs/1606.00487

Object Detection, Tracking, and Motion Segmentation for Object-level Video Segmentation

arxiv: http://arxiv.org/abs/1608.03066

Clockwork Convnets for Video Semantic Segmentation

intro: ECCV 2016 Workshops
intro: evaluated on the Youtube-Objects, NYUD, and Cityscapes video datasets
arxiv: http://arxiv.org/abs/1608.03609
github: https://github.com/shelhamer/clockwork-fcn

STFCN: Spatio-Temporal FCN for Semantic Video Segmentation

arxiv: http://arxiv.org/abs/1608.05971

One-Shot Video Object Segmentation

intro: OSVOS
project: http://www.vision.ee.ethz.ch/~cvlsegmentation/osvos/
arxiv: https://arxiv.org/abs/1611.05198
github: https://github.com/kmaninis/OSVOS-caffe
github: https://github.com/scaelles/OSVOS-TensorFlow

Video Object Segmentation Without Temporal Information

https://arxiv.org/abs/1709.06031

Convolutional Gated Recurrent Networks for Video Segmentation

arxiv: https://arxiv.org/abs/1611.05435

Learning Video Object Segmentation from Static Images

arxiv: https://arxiv.org/abs/1612.02646

Semantic Video Segmentation by Gated Recurrent Flow Propagation

arxiv: https://arxiv.org/abs/1612.08871

FusionSeg: Learning to combine motion and appearance for fully automatic segmention of generic objects in videos

project page: http://vision.cs.utexas.edu/projects/fusionseg/
arxiv: https://arxiv.org/abs/1701.05384
github: https://github.com/suyogduttjain/fusionseg

Unsupervised learning from video to detect foreground objects in single images

https://arxiv.org/abs/1703.10901

Semantically-Guided Video Object Segmentation

https://arxiv.org/abs/1704.01926

Learning Video Object Segmentation with Visual Memory

https://arxiv.org/abs/1704.05737

Flow-free Video Object Segmentation

https://arxiv.org/abs/1706.09544

Online Adaptation of Convolutional Neural Networks for Video Object Segmentation

https://arxiv.org/abs/1706.09364

Video Object Segmentation using Tracked Object Proposals

intro: CVPR-2017 workshop, DAVIS-2017 Challenge
arxiv: https://arxiv.org/abs/1707.06545

Video Object Segmentation with Re-identification

intro: CVPR 2017 Workshop, DAVIS Challenge on Video Object Segmentation 2017 (Winning Entry)
arxiv: https://arxiv.org/abs/1708.00197

Pixel-Level Matching for Video Object Segmentation using Convolutional Neural Networks

intro: ICCV 2017
arxiv: https://arxiv.org/abs/1708.05137

SegFlow: Joint Learning for Video Object Segmentation and Optical Flow

project page: https://sites.google.com/site/yihsuantsai/research/iccv17-segflow
arxiv: https://arxiv.org/abs/1709.06750
github: https://github.com/JingchunCheng/SegFlow

Video Semantic Object Segmentation by Self-Adaptation of DCNN

https://arxiv.org/abs/1711.08180

Learning to Segment Moving Objects

https://arxiv.org/abs/1712.01127

Instance Embedding Transfer to Unsupervised Video Object Segmentation

intro: University of Southern California & Google Inc
arxiv: https://arxiv.org/abs/1801.00908

Panoptic Segmentation

intro: Facebook AI Research (FAIR) & Heidelberg University
arxiv: https://arxiv.org/abs/1801.00868

Challenge

DAVIS: Densely Annotated VIdeo Segmentation

homepage: http://davischallenge.org/
arxiv: https://arxiv.org/abs/1704.00675

DAVIS Challenge on Video Object Segmentation 2017

http://davischallenge.org/challenge2017/publications.html

Projects

TF Image Segmentation: Image Segmentation framework

intro: Image Segmentation framework based on Tensorflow and TF-Slim library
github: https://github.com/warmspringwinds/tf-image-segmentation

KittiSeg: A Kitti Road Segmentation model implemented in tensorflow.

keywords: MultiNet
intro: KittiSeg performs segmentation of roads by utilizing an FCN based model.
github: https://github.com/MarvinTeichmann/KittiBox

Semantic Segmentation Architectures Implemented in PyTorch

intro: Segnet/FCN/U-Net/Link-Net
github: https://github.com/meetshah1995/pytorch-semseg

PyTorch for Semantic Segmentation

https://github.com/ZijunDeng/pytorch-semantic-segmentation

3D Segmentation

PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

intro: Stanford University
project page: http://stanford.edu/~rqi/pointnet/
arxiv: https://arxiv.org/abs/1612.00593
github: https://github.com/charlesq34/pointnet

DA-RNN: Semantic Mapping with Data Associated Recurrent Neural Networks

https://arxiv.org/abs/1703.03098

SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud

intro: UC Berkeley
arxiv: https://arxiv.org/abs/1710.07368

SEGCloud: Semantic Segmentation of 3D Point Clouds

intro: International Conference of 3D Vision (3DV) 2017 (Spotlight). Stanford University
homepage: http://segcloud.stanford.edu/
arxiv: https://arxiv.org/abs/1710.07563

Leaderboard

Segmentation Results: VOC2012 BETA: Competition “comp6” (train on own data)

http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?cls=mean&challengeid=11&compid=6

Blogs

Deep Learning for Natural Image Segmentation Priors

http://cs.brown.edu/courses/csci2951-t/finals/ghope/

Image Segmentation Using DIGITS 5

https://devblogs.nvidia.com/parallelforall/image-segmentation-using-digits-5/

Image Segmentation with Tensorflow using CNNs and Conditional Random Fields
http://warmspringwinds.github.io/tensorflow/tf-slim/2016/12/18/image-segmentation-with-tensorflow-using-cnns-and-conditional-random-fields/

Fully Convolutional Networks (FCNs) for Image Segmentation

blog: http://warmspringwinds.github.io/tensorflow/tf-slim/2017/01/23/fully-convolutional-networks-(fcns)-for-image-segmentation/
ipn: https://github.com/warmspringwinds/tensorflow_notes/blob/master/fully_convolutional_networks.ipynb

Image segmentation with Neural Net

blog: https://medium.com/@m.zaradzki/image-segmentation-with-neural-net-d5094d571b1e#.s5f711g1q
github: https://github.com/mzaradzki/neuralnets/tree/master/vgg_segmentation_keras

A 2017 Guide to Semantic Segmentation with Deep Learning

http://blog.qure.ai/notes/semantic-segmentation-deep-learning-review

Talks

Deep learning for image segmentation

intro: PyData Warsaw - Mateusz Opala & Michał Jamroż
youtube: https://www.youtube.com/watch?v=W6r_a5crqGI

你可能感兴趣的:(深度学习)

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践
在深度学习的背景下，NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性，导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群，实现对所有可用GPU资源的充分调度，不受制于供应商限制。本文将深入探讨如何混合AMD/NVIDIAGPU集群以支持PyTorch分布式训
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
深度学习框架PyTorch——从入门到精通（5）构建神经网络 Fansv587 Torch框架学习深度学习 pytorch 神经网络经验分享
构建神经网络获取训练设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的，这些层和模块会对数据进行各种操作。在PyTorch里，torch.nn这个命名空间提供了你搭建自己神经网络所需要的所有基础组件。PyTorch里的每一个模块都是nn.Module类的子类。一个神经网络本身
深度学习框架PyTorch——从入门到精通（5）自动微分 Fansv587 深度学习 pytorch 人工智能
使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在训练神经网络时，最常用的算法是反向传播。在该算法中，参数（模型权重）根据损失函数的梯度相对于给定参数进行调整。为了计算这些梯度，PyTorch有一个内置的微分引擎，名为torch.autograd。它支持为任何计算图自动计算梯度。考虑最简单的一层神经网络，具有输入x、参数w和b以
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
数据集格式转换——json2txt、xml2txt、txt2json【复制就能用】 kay_545 YOLO11改进有效涨点 python 人工智能机器学习
秋招面试专栏推荐：深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转本专栏所有程序均经过测试，可成功执行专栏地址：YOLO11入门+改进涨点——点击即可跳转欢迎订阅目录json2txt脚本xml2txttxt2json
AI人工智能深度学习算法：在量子计算中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着科技的不断发展，人工智能和量子计算成为了当今世界的热门话题。人工智能的深度学习算法在处理大规模数据和复杂任务方面取得了显著的成果，而量子计算则具有强大的并行计算能力和高效的信息处理能力。将人工智能与量子计算相结合，为解决一些具有挑战性的问题提供了新的思路和方法。本文将探讨人工智能深度学习算法在量子计算中的应用，包括其背景、意义和应用场景。2.核心概念与联系在人工智能中，深度学习是一
还在为找图发愁？图生生AI以图生图，一键生成专属风格！图生生人工智能 ai AI作画图生生
你是否也遇到过这样的烦恼：想为文章配图，却找不到风格合适的图片？设计海报时，灵感枯竭，不知从何下手？看到喜欢的图片风格，却无法应用到自己的作品中？别担心，图生生AI生图来帮你！只需上传一张图片，AI就能自动生成相似风格的图片，让你轻松拥有专属图库！图生生AI生图是一款基于人工智能技术的图片生成工具，它能够深度学习和理解图片的风格、色彩、构图等元素，并以此为基础生成全新的图片。无论你是设计师、自媒体
深度学习中的Channel，通道数是什么？ %KT% 深度学习深度学习人工智能
参考文章：直观理解深度学习的卷积操作，超赞！-CSDN博客如何理解卷积神经网络中的通道（channel）_神经网络通道数-CSDN博客深度学习-卷积神经网络—卷积操作详细介绍_深度卷积的作用-CSDN博客正文：在跑深度学习代码的过程中，经常遇到的一个报错是：模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是：torch.size([16,3,24,24])。这四个参数的含义如下：16
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
远程调试Python脚本之ptvsd 工头阿乐 PyTorch 深度学习 python 开发语言
深度学习文章目录深度学习前言前言有时候需要远程调试Python脚本，怎么办呢…以下这段代码用于远程调试Python脚本，特别是通过VisualStudioCode（VSCode）的远程调试功能。它会在指定的服务器IP和端口上等待调试器的连接。#检查是否提供了服务器IP和端口ifargs.server_ipandargs.server_port:#远程调试-参见https://code.visual
yolo模型coco数据集详解工头阿乐深度学习 YOLO
深度学习文章目录深度学习前言前言instances_train2017.json和instances_val2017.json文件均分为五大部分，这五部分对应的关键字分别为info、licenses、images、annotations、categories。{"info":info,"licenses":[license1,license2,license3,...],"images":[ima
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
NLP高频面试题（四）——BN和LN的区别与联系，为什么attention要用LN Chaos_Wang_ NLP常见面试题自然语言处理人工智能
在深度学习模型中，Normalization是一种极为重要的技巧，BatchNormalization（BN）和LayerNormalization（LN）是其中最为常用的两种方法。然而，二者在实际应用中有着明显的区别与联系，尤其在Transformer的Attention机制中，LN有着独特的优势。一、BN与LN的核心区别与联系1.BatchNormalization(BN)BN的思想源于一个叫
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
PyTorch 深度学习实战（12）：Actor-Critic 算法与策略优化进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们介绍了强化学习的基本概念，并使用深度Q网络（DQN）解决了CartPole问题。本文将深入探讨Actor-Critic算法，这是一种结合了策略梯度（PolicyGradient）和值函数（ValueFunction）的强化学习方法。我们将使用PyTorch实现Actor-Critic算法，并应用于经典的CartPole问题。一、Actor-Critic算法基础Actor-Cri
PyTorch 深度学习实战（17）：Asynchronous Advantage Actor-Critic (A3C) 算法与并行训练进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们深入探讨了SoftActor-Critic(SAC)算法及其在平衡探索与利用方面的优势。本文将介绍强化学习领域的重要里程碑——AsynchronousAdvantageActor-Critic(A3C)算法，并展示如何利用PyTorch实现并行化训练来加速学习过程。一、A3C算法原理A3C算法由DeepMind于2016年提出，通过异步并行的多个智能体（Worker）与环境交互
李开复：AI 2.0 时代的机遇 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，应用场景，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从语音识别、图像识别到自然语言处理等领域取得了突破性进展。其中，深度学习作为人工智能的核心技术之一，推动了AI技术的飞速发展。然而，深度学习模型的训练成本高、数据依赖性强、可解释性差等问题仍然制约着AI技术的进一步发展。李开复先生在《AI2.0时代的机遇》
C#学习笔记（3）：调用YOLOv8 playerofIE c#学习笔记 YOLO python
最近做的项目需要C#编写上位机程序，同时也要使用yolo进行深度学习检测。使用pythonnet调用写好的py文件，C#代码如下:Runtime.PythonDLL="python310.dll";PythonEngine.Initialize();using(Py.GIL()){dynamicsys=Py.Import("sys");dynamictorch=Py.Import("torch")
YOLOv8 的简介及C#中如何简单应用YOLOv8 码上有潜 YOLOv8 YOLO
YOLOv8是YOLO（YouOnlyLookOnce）系列中的最新版本，是一种用于目标检测和图像分割的深度学习模型。YOLO模型以其快速和准确的目标检测性能而著称，广泛应用于实时应用程序中。主要特点高效性：YOLOv8在保持高检测速度的同时，进一步提高了检测精度。端到端训练：可以直接从图像输入端到分类结果输出，简化了训练和部署过程。改进的架构：包括更深的网络结构、更复杂的特征提取方法以及更高效的
llama.cpp 和 LLM（大语言模型）这个懒人 llama 语言模型人工智能
llama.cpp和LLM（大语言模型）的介绍，以及两者的关联与区别：1.LLM（LargeLanguageModel，大语言模型）定义：LLM是基于深度学习技术（如Transformer架构）构建的超大参数量的自然语言处理模型。它通过海量文本数据训练，能够生成连贯、语义丰富的文本，完成问答、创作、推理等任务。特点：参数规模大：如GPT-3（1750亿参数）、Llama-65B（650亿参数）等。
构建未来智能：在Mojo模型中自定义模型架构的艺术 2401_85761003 mojo 架构
构建未来智能：在Mojo模型中自定义模型架构的艺术在深度学习的世界里，模型架构的设计往往决定了算法的性能和适用性。Mojo模型，作为一个假想中的高级机器学习框架，允许用户实现自定义的模型架构来解决特定的问题。本文将深入探讨如何在Mojo模型中实现自定义模型架构，并提供详细的步骤和代码示例，以帮助读者掌握这一强大的技术。自定义模型架构的重要性灵活性自定义模型架构提供了设计适合特定问题需求的模型的灵活
大模型与自然语言理解（NLU）：差异与联系技术流 Gavin AIoT python 语言模型 ai
近年来，人工智能领域取得了显著进展，尤其是在自然语言处理（NLP）方面。大模型和自然语言理解（NLU）作为NLP的两个重要分支，常常被提及，但它们之间存在着本质区别。1.定义与目标大模型:通常指拥有庞大参数规模（数十亿甚至数千亿）的深度学习模型，例如GPT-3、LaMDA等。它们通过海量文本数据进行训练，旨在学习语言的统计规律，并能够生成流畅、连贯的文本。NLU:是NLP的一个子领域，专注于让机器
PyTorch 生态概览：为什么选择动态计算图框架？小诸葛IT课堂 pytorch 人工智能 python
一、PyTorch的核心价值PyTorch作为深度学习框架的后起之秀，通过动态计算图技术革新了传统的静态图模式。其核心优势体现在：动态灵活性：代码即模型，支持即时调试Python原生支持：无缝衔接Python生态高效的GPU加速：通过CUDA实现透明的硬件加速活跃的社区生态：GitHub贡献者超1.8万人，日均更新100+次二、动态计算图VS静态计算图对比#动态计算图示例（PyTorch）impo
学习pytorch 阿什么名字不会重复呢学习 pytorch 人工智能
学习PyTorch是一个很好的选择，尤其是如果你对深度学习和机器学习感兴趣。以下是一个详细的学习计划，可以帮助你系统地掌握PyTorch的基本概念和应用。学习计划概览学习周期：8周（每周约4-5小时）目标：掌握PyTorch基础，能够实现简单的深度学习模型。第1周：基础知识目标：了解深度学习的基础知识，掌握Python和NumPy基础。任务：学习Python基础（数据类型、控制流、函数、类）。资源
AI驱动的代码重构与优化技术 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI驱动的代码重构与优化技术概述什么是AI驱动的代码重构与优化？AI驱动的代码重构与优化技术，是指利用人工智能，特别是机器学习和深度学习的算法，对软件代码进行自动分析和改进的技术。这种技术能够通过学习大量的代码样本，识别出代码中的模式、问题和改进点，从而自动完成代码的重构和优化。重构的定义重构（Refactoring）是改进代码内部结构而不改变外部行为的过程。其目的通常是为了提高代码的可读性、可维
神经网络模型压缩&实例教程—非结构化剪枝程序先锋《python深度学习》笔记神经网络剪枝深度学习
目录1.导包&定义一个简单的网络2.获取网络需要剪枝的模块3.模块剪枝（核心）3.1随机剪枝weight3.2L1范数剪枝bias4.总结最先进的深度学习技术依赖于难以部署的过度参数化模型。相反，已知生物神经网络使用高效的稀疏连接。为了在不牺牲准确性的情况下减少内存、电池和硬件消耗，通过减少模型中的参数数量来确定压缩模型的最佳技术是很重要的。这反过来又允许您在设备上部署轻量级模型，并通过设备上的私
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri