九三智能控v

【重磅】ICLR2020 || 106篇深度强化学习顶会论文汇总

关注：决策智能与机器学习，深耕AI脱水干货

来源 | EndtoEnd.ai

作者 | DeepRL

报道 | 深度强化学习实验室

编辑 | 九三山人

【导读】今年的ICLR大会转到了线上举行，DeepMind和哈佛的研究人员投稿了一篇神经网络控制虚拟小白鼠模的论文十分亮眼。此次ICLR大会，华人学者参与论文数占比近60%，Google入选80余篇表现依旧抢眼，而国内的研究团队也不落下风，满分论文频现。本届ICLR 2020共有2594篇投稿，687 篇被接收。其中：48篇 oral 108篇，spotlights 531篇， poster 录取率为 26.5%，相比去年的 31.4% 略有降低。强化学习一直是ICLR投稿的热点，近年来强化学习及深度强化学习不断刷新着人类在游戏、棋牌等领域的最好成绩，关于谷歌研究人员用6小时完成AI芯片设计，也是采用了深度强化学习方法，强化学习的威力不容小觑。本文共列举了106篇深度强化学习领域的论文。

排名	1
平均得分	8
论文地址	https://openreview.net/forum?id=HJgLZR4KvH
标题	Dynamics-aware Unsupervised Skill Discovery
得分	8 8 8
Variance	0
Decision	Accept (Talk)


排名	1
平均得分	8
论文地址	https://openreview.net/forum?id=H1gax6VtDB
标题	Contrastive Learning Of Structured World Models
得分	8 8 8
Variance	0
Decision	Accept (Talk)


排名	1
平均得分	8
论文地址	https://openreview.net/forum?id=r1etN1rtPB
标题	Implementation Matters In Deep Rl: A Case Study On Ppo And Trpo
得分	8 8 8
Variance	0
Decision	Accept (Talk)


排名	1
平均得分	8
论文地址	https://openreview.net/forum?id=HkxlcnVFwB
标题	Gendice: Generalized Offline Estimation Of Stationary Values
得分	8 8 8
Variance	0
Decision	Accept (Talk)


排名	1
平均得分	8
论文地址	https://openreview.net/forum?id=S1g2skStPB
标题	Causal Discovery With Reinforcement Learning
得分	8 8 8
Variance	0
Decision	Accept (Talk)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=r1genAVKPB
标题	Is A Good Representation Sufficient For Sample Efficient Reinforcement Learning?
得分	8 8 6
Variance	0.89
Decision	Accept (Spotlight)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=rklHqRVKvH
标题	Harnessing Structures For Value-based Planning And Reinforcement Learning
得分	6 8 8
Variance	0.89
Decision	Accept (Talk)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=SJgzLkBKPB
标题	Explain Your Move: Understanding Agent Actions Using Focused Feature Saliency
得分	6 8 8
Variance	0.89
Decision	Accept (Poster)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=SJeD3CEFPH
标题	Meta-q-learning
得分	8 8 6
Variance	0.89
Decision	Accept (Talk)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=HJl8_eHYvS
标题	Discriminative Particle Filter Reinforcement Learning For Complex Partial Observations
得分	8 6 8
Variance	0.89
Decision	Accept (Poster)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=rkgbYyHtwB
标题	Disagreement-regularized Imitation Learning
得分	6 8 8
Variance	0.89
Decision	Accept (Spotlight)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=S1glGANtDr
标题	Doubly Robust Bias Reduction In Infinite Horizon Off-policy Estimation
得分	6 8 8
Variance	0.89
Decision	Accept (Spotlight)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=rkgvXlrKwH
标题	Seed Rl: Scalable And Efficient Deep-rl With Accelerated Central Inference
得分	8 6 8
Variance	0.89
Decision	Accept (Talk)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=rJe2syrtvS
标题	The Ingredients Of Real World Robotic Reinforcement Learning
得分	6 8 8
Variance	0.89
Decision	Accept (Spotlight)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=BJlQtJSKDB
标题	Watch The Unobserved: A Simple Approach To Parallelizing Monte Carlo Tree Search
得分	8 6 8
Variance	0.89
Decision	Accept (Talk)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=ryeYpJSKwr
标题	Meta-learning Acquisition Functions For Transfer Learning In Bayesian Optimization
得分	8 6 8
Variance	0.89
Decision	Accept (Spotlight)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=ryxdEkHtPS
标题	A Closer Look At Deep Policy Gradients
得分	8 6 8
Variance	0.89
Decision	Accept (Talk)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=BJeAHkrYDS
标题	Fast Task Inference With Variational Intrinsic Successor Features
得分	8 6 8
Variance	0.89
Decision	Accept (Talk)


排名	2
平均得分	7.33
论文地址	https://openreview.net/forum?id=rJgJDAVKvB
标题	Learning To Plan In High Dimensions Via Neural Exploration-exploitation Trees
得分	8 8 6
Variance	0.89
Decision	Accept (Spotlight)


排名	3
平均得分	7
论文地址	https://openreview.net/forum?id=S1lOTC4tDS
标题	Dream To Control: Learning Behaviors By Latent Imagination
得分	8 6 6 8
Variance	1
Decision	Accept (Spotlight)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=SygKyeHKDH
标题	Making Efficient Use Of Demonstrations To Solve Hard Exploration Problems
得分	6 8 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=SJleNCNtDH
标题	Intrinsic Motivation For Encouraging Synergistic Behavior
得分	6 8 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=S1xKd24twB
标题	Sqil: Imitation Learning Via Reinforcement Learning With Sparse Rewards
得分	8 6 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=ryxgJTEYDr
标题	Reinforcement Learning With Competitive Ensembles Of Information-constrained Primitives
得分	8 6 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=B1gZV1HYvS
标题	Multi-agent Interactions Modeling With Correlated Policies
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=BJgy96EYvr
标题	Influence-based Multi-agent Exploration
得分	6 6 8
Variance	0.89
Decision	Accept (Spotlight)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=rylJkpEtwS
标题	Learning The Arrow Of Time For Problems In Reinforcement Learning
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=Bkl7bREtDr
标题	Amrl: Aggregated Memory For Reinforcement Learning
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=S1xCPJHtDB
标题	Model Based Reinforcement Learning For Atari
得分	6 8 6
Variance	0.89
Decision	Accept (Spotlight)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=r1lL4a4tDB
标题	Variational Recurrent Models For Solving Partially Observable Control Tasks
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=HJlxIJBFDr
标题	Sample Efficient Policy Gradient Methods With Recursive Variance Reduction
得分	6 8 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=H1exf64KwH
标题	Exploring Model-based Planning With Policy Networks
得分	6 8 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=HygnDhEtvr
标题	Reinforcement Learning Based Graph-to-sequence Model For Natural Question Generation
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=rkg-TJBFPB
标题	Ride: Rewarding Impact-driven Exploration For Procedurally-generated Environments
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=ryeG924twB
标题	Learning Expensive Coordination: An Event-based Deep Rl Approach
得分	6 8 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=SJxbHkrKDH
标题	Evolutionary Population Curriculum For Scaling Multi-agent Reinforcement Learning
得分	6 8 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=S1xitgHtvS
标题	Making Sense Of Reinforcement Learning And Probabilistic Inference
得分	6 6 8
Variance	0.89
Decision	Accept (Spotlight)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=rkxDoJBYPB
标题	Reinforced Genetic Algorithm Learning For Optimizing Computation Graphs
得分	8 6 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=Sye57xStvB
标题	Never Give Up: Learning Directed Exploration Strategies
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=HJgC60EtwB
标题	Robust Reinforcement Learning For Continuous Control With Model Misspecification
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=S1l8oANFDH
标题	Synthesizing Programmatic Policies That Inductively Generalize
得分	6 8 6
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=r1lOgyrKDS
标题	Adaptive Correlated Monte Carlo For Contextual Categorical Sequence Generation
得分	6 6 8
Variance	0.89
Decision	Accept (Poster)


排名	4
平均得分	6.67
论文地址	https://openreview.net/forum?id=S1evHerYPr
标题	Improving Generalization In Meta Reinforcement Learning Using Neural Objectives
得分	6 6 8
Variance	0.89
Decision	Accept (Spotlight)


排名	5
平均得分	6.33
论文地址	https://openreview.net/forum?id=rJeQoCNYDS
标题	Single Episode Transfer For Differing Environmental Dynamics In Reinforcement Learning
得分	3 8 8
Variance	5.56
Decision	Accept (Poster)


排名	5
平均得分	6.33
论文地址	https://openreview.net/forum?id=H1gX8C4YPr
标题	Decentralized Distributed Ppo: Mastering Pointgoal Navigation
得分	3 8 8
Variance	5.56
Decision	Accept (Poster)


排名	6
平均得分	6.25
论文地址	https://openreview.net/forum?id=SJezGp4YPr
标题	Geometric Insights Into The Convergence Of Nonlinear Td Learning
得分	8 3 6 8
Variance	4.19
Decision	Accept (Poster)


排名	6
平均得分	6.25
论文地址	https://openreview.net/forum?id=BJgZGeHFPH
标题	Dynamics-aware Embeddings
得分	3 8 6 8
Variance	4.19
Decision	Accept (Poster)


排名	7
平均得分	6.2
论文地址	https://openreview.net/forum?id=S1ly10EKDS
标题	Reanalysis Of Variance Reduced Temporal Difference Learning
得分	8 8 6 3 6
Variance	3.36
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=BkglSTNFDB
标题	Q-learning With Ucb Exploration Is Sample Efficient For Infinite-horizon Mdp
得分	6 6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=H1e0Wp4KvH
标题	Automated Curriculum Generation Through Setter-solver Interactions
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=r1xGP6VYwH
标题	Optimistic Exploration Even With A Pessimistic Initialisation
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=Syx7A3NFvH
标题	Multi-agent Reinforcement Learning For Networked System Control
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=BJe1334YDH
标题	A Learning-based Iterative Method For Solving Vehicle Routing Problems
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=rkgpv2VFvr
标题	Sharing Knowledge In Multi-task Deep Reinforcement Learning
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=SJgob6NKvH
标题	Rtfm: Generalising To New Environment Dynamics Via Reading
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=HkgsWxrtPB
标题	Meta Reinforcement Learning With Autonomous Inference Of Subtask Dependencies
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=rke3TJrtPS
标题	Projection Based Constrained Policy Optimization
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=B1x6w0EtwH
标题	Graph Constrained Reinforcement Learning For Natural Language Action Spaces
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=SylOlp4FvH
标题	V-mpo: On-policy Maximum A Posteriori Policy Optimization For Discrete And Continuous Control
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=SJexHkSFPS
标题	Thinking While Moving: Deep Reinforcement Learning With Concurrent Control
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=rke7geHtwH
标题	Keep Doing What Worked: Behavior Modelling Priors For Offline Reinforcement Learning
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=Hyg-JC4FDr
标题	Imitation Learning Via Off-policy Distribution Matching
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=ByxdUySKvS
标题	Adversarial Autoaugment
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=B1gqipNYwH
标题	Option Discovery Using Deep Skill Chaining
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=HJgLLyrYwB
标题	State-only Imitation With Transition Dynamics Mismatch
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=HyxnMyBKwB
标题	The Gambler’s Problem And Beyond
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=B1e-kxSKDH
标题	Structured Object-aware Physics Prediction For Video Modeling And Planning
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=H1lmhaVtvr
标题	Dynamical Distance Learning For Semi-supervised And Unsupervised Skill Discovery
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=SkeIyaVtwB
标题	Exploration In Reinforcement Learning With Deep Covering Options
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=S1lEX04tPr
标题	Cm3: Cooperative Multi-goal Multi-stage Multi-agent Reinforcement Learning
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=ryxB2lBtvH
标题	Learning To Coordinate Manipulation Skills Via Skill Behavior Diversification
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=H1ezFREtwH
标题	Composing Task-agnostic Policies With Deep Reinforcement Learning
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=B1gskyStwr
标题	Frequency-based Search-control In Dyna
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=S1ltg1rFDS
标题	Black-box Off-policy Estimation For Infinite-horizon Reinforcement Learning
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=ryg48p4tPH
标题	Action Semantics Network: Considering The Effects Of Actions In Multiagent Systems
得分	6 6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=BkxXe0Etwr
标题	Caql: Continuous Action Q-learning
得分	6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=SkgC6TNFvr
标题	Reinforced Active Learning For Image Segmentation
得分	6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=Hye1kTVFDS
标题	The Variational Bandwidth Bottleneck: Stochastic Evaluation On An Information Budget
得分	6 6
Variance	0
Decision	Accept (Poster)


排名	8
平均得分	6
论文地址	https://openreview.net/forum?id=H1gzR2VKDH
标题	Hierarchical Foresight: Self-supervised Learning Of Long-horizon Tasks Via Visual Subgoal Generation
得分	6 6
Variance	0
Decision	Accept (Poster)


排名	9
平均得分	5.75
论文地址	https://openreview.net/forum?id=BJliakStvH
标题	Maximum Likelihood Constraint Inference For Inverse Reinforcement Learning
得分	8 6 3 6
Variance	3.19
Decision	Accept (Spotlight)


排名	9
平均得分	5.75
论文地址	https://openreview.net/forum?id=rygfnn4twS
标题	Autoq: Automated Kernel-wise Neural Network Quantization
得分	6 6 8 3
Variance	3.19
Decision	Accept (Poster)


排名	9
平均得分	5.75
论文地址	https://openreview.net/forum?id=Hkl9JlBYvr
标题	Varibad: A Very Good Method For Bayes-adaptive Deep Rl Via Meta-learning
得分	8 6 8 1
Variance	8.19
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=SJg5J6NtDr
标题	Watch, Try, Learn: Meta-learning From Demonstrations And Rewards
得分	8 3 6
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=rJeINp4KwH
标题	Population-guided Parallel Policy Search For Reinforcement Learning
得分	6 8 3
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=HJgcvJBFvB
标题	A Simple Randomization Technique For Generalization In Deep Reinforcement Learning
得分	8 3 6
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=H1eCw3EKvH
标题	On The Weaknesses Of Reinforcement Learning For Neural Machine Translation
得分	8 6 3
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=rylrdxHFDr
标题	State Alignment-based Imitation Learning
得分	6 8 3
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=rylvYaNYDH
标题	Finding And Visualizing Weaknesses Of Deep Reinforcement Learning Agents
得分	8 6 3
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=Skln2A4YDB
标题	Model-augmented Actor-critic: Backpropagating Through Paths
得分	3 6 8
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=rygf-kSYwH
标题	Behaviour Suite For Reinforcement Learning
得分	8 3 6
Variance	4.22
Decision	Accept (Spotlight)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=BJluxREKDB
标题	Learning Heuristics For Quantified Boolean Formulas Through Reinforcement Learning
得分	6 8 3
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=Bkg0u3Etwr
标题	Maxmin Q-learning: Controlling The Estimation Bias Of Q-learning
得分	8 6 3
Variance	4.22
Decision	Accept (Poster)


排名	10
平均得分	5.67
论文地址	https://openreview.net/forum?id=ryx6WgStPB
标题	Hypermodels For Exploration
得分	8 3 6
Variance	4.22
Decision	Accept (Poster)


排名	11
平均得分	5.5
论文地址	https://openreview.net/forum?id=ByeWogStDS
标题	Sub-policy Adaptation For Hierarchical Reinforcement Learning
得分	3 8
Variance	6.25
Decision	Accept (Poster)


排名	11
平均得分	5.5
论文地址	https://openreview.net/forum?id=r1xPh2VtPB
标题	Svqn: Sequential Variational Soft Q-learning Networks
得分	3 8
Variance	6.25
Decision	Accept (Poster)


排名	12
平均得分	5.25
论文地址	https://openreview.net/forum?id=BJeGlJStPr
标题	Impact: Importance Weighted Asynchronous Architectures With Clipped Target Networks
得分	6 3 6 6
Variance	1.69
Decision	Accept (Poster)


排名	13
平均得分	5
论文地址	https://openreview.net/forum?id=rJld3hEYvS
标题	排名ing Policy Gradient
得分	6 3 6
Variance	2
Decision	Accept (Poster)


排名	13
平均得分	5
论文地址	https://openreview.net/forum?id=HklxbgBKvr
标题	Model-based Reinforcement Learning For Biological Sequence Design
得分	6 3 6
Variance	2
Decision	Accept (Poster)


排名	13
平均得分	5
论文地址	https://openreview.net/forum?id=HJx-3grYDB
标题	Learning Nearly Decomposable Value Functions Via Communication Minimization
得分	6 6 3
Variance	2
Decision	Accept (Poster)


排名	13
平均得分	5
论文地址	https://openreview.net/forum?id=Byx4NkrtDS
标题	Implementing Inductive Bias For Different Navigation Tasks Through Diverse Rnn Attrractors
得分	3 6 6
Variance	2
Decision	Accept (Poster)


排名	13
平均得分	5
论文地址	https://openreview.net/forum?id=SylL0krYPS
标题	Toward Evaluating Robustness Of Deep Reinforcement Learning With Continuous Control
得分	6 3 6
Variance	2
Decision	Accept (Poster)


排名	13
平均得分	5
论文地址	https://openreview.net/forum?id=rJxX8T4Kvr
标题	Learning Efficient Parameter Server Synchronization Policies For Distributed Sgd
得分	6 3 6
Variance	2
Decision	Accept (Poster)


排名	13
平均得分	5
论文地址	https://openreview.net/forum?id=HkxjqxBYDB
标题	Episodic Reinforcement Learning With Associative Memory
得分	6 3 6
Variance	2
Decision	Accept (Poster)


排名	14
平均得分	4.67
论文地址	https://openreview.net/forum?id=rkecJ6VFvr
标题	Logic And The 2-simplicial Transformer
得分	8 3 3
Variance	5.56
Decision	Accept (Poster)


排名	15
平均得分	4
论文地址	https://openreview.net/forum?id=rkl3m1BFDB
标题	Exploratory Not Explanatory: Counterfactual Analysis Of Saliency Maps For Deep Rl
得分	1 3 8
Variance	8.67
Decision	Accept (Poster)


排名	15
平均得分	4
论文地址	https://openreview.net/forum?id=S1xnXRVFwH
标题	Playing The Lottery With Rewards And Multiple Languages: Lottery Tickets In Rl And Nlp
得分	3 3 6
Variance	2
Decision	Accept (Poster)

本文同步推送至

知乎：https://zhuanlan.zhihu.com/c_1196078521515343872

Github: https://github.com/NeuronDance/DeepRL/tree/master/DRL-ConferencePaper/ICLR/2020

交流合作

请加微信号：yan_kylin_phenix，注明姓名+单位+从业方向+地点，非诚勿扰。

你可能感兴趣的:(【重磅】ICLR2020 || 106篇深度强化学习顶会论文汇总)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
那个抄袭的大张伟猫小努
最近一直在追《即刻电音》这个综艺，除了觉得出场节目的音乐制作人有意思之外，也觉得有两个导师挺有趣的（另外一个就忽略了吧）。孙艺兴在上一篇文章里面已经说过了，那么这篇就说说我们的大老师，大张伟吧。其实在节目刚开始大张伟出来的时候，我以为他是属于导师里面来活跃气氛负责搞笑的，毕竟孙艺兴属于卖萌卖傻卖老实的，尚雯婕一般负责装逼耍狠的，而大张伟一贯以来上综艺的形象基本上都是蹦蹦跳跳带动气氛的。谁知道，两期
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
今日囧事唯愿岁月可回首
今天晚上，房东打来电话说晚上过来取个东西。晚上到家后，洗了一下水果，把卧室的空调打开，在卧室的阳台叠衣服。不一会儿，听见了敲门声，老公和丫头出去开门，果然是房东来了。由于我在叠衣服，床上比较乱，老公随手就把卧室门带上了。我赶紧把衣服收在柜子里，一拧门，好吧，打不开。听见外面热热闹闹的，我喊老公帮我开门，开了几次都开不开。丫头说：妈妈，你先在里面休息一会，我们正在找钥匙。听见外面房东拿了自己东西，老
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
【夜读】提升生活品质的8个建议茳淮秀水
停止攀比很多人之所以感觉疲惫，部分原因是来自于跟别人攀比。殊不知，攀比得到的满足只是片刻的，过后往往会感到空虚。过分在意别人的评价，丢失的是自己原有的审美，扰乱的是自己最初的节奏。不妨活得洒脱些，自己内心丰盈了，快乐就能更持久。停止自责想改变自己，先从接纳自己开始。越是过分自责，就越难改变现状，因为如果把精力全耗在自责上，就没有精力用来改变了。遇到问题，我们要用正确的心态去面对。与其一味自责，不如
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
少了生活气息我爱大草莓
最近啊，总觉得自己日更的内容缺了点什么。我仔细地想，大概是少了些生活气息。这两三个月减少了许多与别人相处的时间，独自生活，偶尔只是出去买菜，总觉得生活好像变空了许多。买菜的时候会跟档口的阿姨聊一两句话，让自己感觉在真实地生活着。幸好我也不是一宅到底，偶尔周末也会约着跟好朋友见面，面对面交流跟隔着屏幕交流，效果还是不一样的，至少有更为真实的生活感。写作不仅需要有阅读量，有文笔，生活阅历也是非常重要的
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
没有一件绝对好看的衣服段童
没有一件绝对好看的衣服只有好看的人没有绝对好看的人只有你可能会爱上的他没有你绝对会爱上的他只有你从来就缺少的那一部分的自己爱是本能的脆弱是欲望的茧——《没有一件绝对好看的衣服》
想明白这个问题，你才能写下去文自拾
春节放假的时候，又有一天梦见她，第二天她冒着漫天大雪，傻傻地跑来见我。她说，见见傻傻的我，天很冷，心很暖。她回去后，我写了一篇文章，题目叫——从此梦中只有你。我们没在一起的很长一段时间里，她都在我的心底，一次次出现在我的梦里。我对她说，在一起之前，是胆小且闷骚，在一起之后，我变得不要脸了。不要脸的——去爱你。那文章没写完，火车上，给她看了。我有点小失望，花了好几个小时写，她分分钟就看完，很希望她逐
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
人生的每一步路都算数 sheli
如果你想打工，一直靠打工赚钱，那你就会不断的希望自己变得更专业，不断的希望能够获得更好的工作机会，升职加薪。如果你的目标志不在此，而是拥有自己的企业，那你的选择就会出现差别。在认真打工的人眼里，会“不务正业”，会总是选择不同岗位，甚至放弃高薪机会。但是这背后都是有更加长远的规划。成功富人所必需的管理技能包括：1．对现金流的管理。2．对系统的管理。3．对人员的管理。所以，在没有获得这些能力之前，只要
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
梁文道《尽头:怎样是好的阅读和书写》片段白夜书摘
1、写小说的人，有时会强烈地感到一种现实的召唤，想去面对和回应现实。这时他们会觉得自己正站在时代中心，就像黑格尔说的，要把时代精神掌握在自己的小说（不是哲学）里面。但是这也很危险，当一个作家像一个时代那样书写，可能就会出现问题了。2、文字是远比语言大块而且湿冷的木头，又距离我们内心的火花稍远，不容易瞬间点燃起来，这处隙缝，给了我们回身的余地，可以再多看一下想一下设身处地一下；人类过往这最后五千年，
似乎，发生了很多事情阿皮Ponder
似乎，有很多事情正在发生。今天，我跟夫人陪着孩子走进来幼儿园，人生头一回以孩子家长的身份参加了小小的班级家长会。在幼儿园，遇见老同学。从2017年开始失联，因为对方遇到了一些事情，跟大家都失去了联系，今日再见面，分外激动，他拉着我一直聊，一直聊。感谢我们的孩子。孩子有点咳嗽，去医院做了检查。叔叔家的两个妹妹开始了高中生活，新的开始。过去看望，遇到一位老师，很是面熟。咨询之下，果然，曾经初中母校的老
2022-11-17 无奇君
又去了一次社康，这次是急性支气管炎……太难了。半夜就猛咳，天天咳醒，还好他戴海绵耳塞睡吵不到他，要不然对他来说也是种煎熬。一累也会猛咳，希望这次是最后一次吃药，吃完就好。又想把头发剪短了，顺便染个色。可是刚刚去看人家还没开门，不是休息日老板好佛系。理发店是个夫妻店，一年多前刚搬来的时候老板还没对象呢，当时聊天老板就说希望能找个对象一起两个人守着店都比上班强。不久后再去他已经有对象了，而且在店里帮忙
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
自我意识徐立华
----读帕克.帕尔默《教学勇气》（P18----19）5.铸造我们的学科帕克.帕尔默说学科知识对我们的自身认同和外部世界有启发意义。学科会铸造我们。“在我们与学科的命题概念和学科的生活框架相遇之前，自我意识知识处于潜伏状态，通过回想学科是怎样唤醒自我意识，我们就可以找回教学心灵。”《教学勇气》（P18）我们的自我意识像冰山表面下无限延伸的冰层，常常处于潜伏状态。但是在我们对所教授的学科进行深入思
23.3.27精进 07439acfb561
落地真经严格就是爱，放纵既是害正能量语录每一颗螺丝都有标准每一颗螺丝都是标维今日体验不要质疑你的付出，这些都会是一种积累，一种沉淀，它们会默默的铺路，只为让你成为更优秀的人。
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s