风度78

【论文相关】强化学习：提前看287篇ICLR-2021 "深度强化学习"领域论文得分汇总列表...

深度强化学习实验室

来源：ICLR2021

编辑：DeepRL

[1]. What Matters for On-Policy Deep Actor-Critic Methods? A Large-Scale Study

平均得分: 8

得分: ['7', '9', '9', '7']

论文链接: https://openreview.net/forum?id=nIAxjsniDzg

[2]. Invariant Representations for Reinforcement Learning without Reconstruction

平均得分: 7.67

得分: ['9', '7', '7']

论文链接: https://openreview.net/forum?id=-2FCwDKRREu

[3]. Winning the L2RPN Challenge: Power Grid Management via Semi-Markov Afterstate Actor-Critic

平均得分: 7.5

得分: ['7', '9', '7', '7']

论文链接: https://openreview.net/forum?id=LmUJqB1Cz8

[4]. Deep symbolic regression: Recovering mathematical expressions from data via risk-seeking policy gradients

平均得分: 7.5

得分: ['9', '5', '8', '8']

论文链接: https://openreview.net/forum?id=m5Qsh0kBQG

[5]. Parrot: Data-Driven Behavioral Priors for Reinforcement Learning

平均得分: 7.5

得分: ['8', '7', '6', '9']

论文链接: https://openreview.net/forum?id=Ysuv-WOFeKR

[6]. Evolving Reinforcement Learning Algorithms

平均得分: 7.33

得分: ['9', '6', '7']

论文链接: https://openreview.net/forum?id=0XXpJ4OtjW

[7]. Global optimality of softmax policy gradient with single hidden layer neural networks in the mean-field regime

平均得分: 7

得分: ['7', '7', '7', '7']

论文链接: https://openreview.net/forum?id=bB2drc7DPuB

[8]. Single-Timescale Actor-Critic Provably Finds Globally Optimal Policy

平均得分: 7

得分: ['8', '8', '7', '5']

论文链接: https://openreview.net/forum?id=pqZV_srUVmK

[9]. UPDeT: Universal Multi-agent RL via Policy Decoupling with Transformers

平均得分: 7

得分: ['7', '9', '5']

论文链接: https://openreview.net/forum?id=v9c7hr9ADKx

[10]. Regularized Inverse Reinforcement Learning

平均得分: 6.8

得分: ['6', '6', '7', '8', '7']

论文链接: https://openreview.net/forum?id=HgLO8yalfwc

[11]. Randomized Ensembled Double Q-Learning: Learning Fast Without a Model

平均得分: 6.75

得分: ['6', '7', '7', '7']

论文链接: https://openreview.net/forum?id=AY8zfZm0tDd

[12]. Deployment-Efficient Reinforcement Learning via Model-Based Offline Optimization

平均得分: 6.75

得分: ['8', '7', '5', '7']

论文链接: https://openreview.net/forum?id=3hGNqpI4WS

[13]. Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels

平均得分: 6.75

得分: ['7', '6', '7', '7']

论文链接: https://openreview.net/forum?id=GY6-6sTvGaf

[14]. Support-set bottlenecks for video-text representation learning

平均得分: 6.75

得分: ['6', '9', '7', '5']

论文链接: https://openreview.net/forum?id=EqoXe2zmhrh

[15]. A Sharp Analysis of Model-based Reinforcement Learning with Self-Play

平均得分: 6.75

得分: ['4', '7', '8', '8']

论文链接: https://openreview.net/forum?id=9Y7_c5ZAd5i

[16]. RODE: Learning Roles to Decompose Multi-Agent Tasks

平均得分: 6.67

得分: ['8', '6', '6']

论文链接: https://openreview.net/forum?id=TTUVg6vkNjK

[17]. Text Generation by Learning from Off-Policy Demonstrations

平均得分: 6.6

得分: ['7', '7', '7', '5', '7']

论文链接: https://openreview.net/forum?id=RovX-uQ1Hua

[18]. Robust Reinforcement Learning on State Observations with Learned Optimal Adversary

平均得分: 6.5

得分: ['5', '7', '7', '7']

论文链接: https://openreview.net/forum?id=sCZbhBvqQaU

[19]. Self-supervised Visual Reinforcement Learning with Object-centric Representations

平均得分: 6.5

得分: ['7', '6', '4', '9']

论文链接: https://openreview.net/forum?id=xppLmXCbOw1

[20]. On Effective Parallelization of Monte Carlo Tree Search

平均得分: 6.5

得分: ['6', '6', '7', '7']

论文链接: https://openreview.net/forum?id=_FXqMj7T0QQ

[21]. Non-asymptotic Confidence Intervals of Off-policy Evaluation: Primal and Dual Bounds

平均得分: 6.5

得分: ['6', '5', '8', '7']

论文链接: https://openreview.net/forum?id=dKg5D1Z1Lm

[22]. Efficient Transformers in Reinforcement Learning using Actor-Learner Distillation

平均得分: 6.5

得分: ['5', '6', '7', '8']

论文链接: https://openreview.net/forum?id=uR9LaO_QxF

[23]. Ask Your Humans: Using Human Instructions to Improve Generalization in Reinforcement Learning

平均得分: 6.5

得分: ['8', '7', '5', '6']

论文链接: https://openreview.net/forum?id=Y87Ri-GNHYu

[24]. SMiRL: Surprise Minimizing Reinforcement Learning in Unstable Environments

平均得分: 6.5

得分: ['5', '6', '8', '7']

论文链接: https://openreview.net/forum?id=cPZOyoDloxl

[25]. Model-Based Visual Planning with Self-Supervised Functional Distances

平均得分: 6.5

得分: ['7', '6', '7', '6']

论文链接: https://openreview.net/forum?id=UcoXdfrORC

[26]. Learning-based Support Estimation in Sublinear Time

平均得分: 6.5

得分: ['7', '4', '8', '7']

论文链接: https://openreview.net/forum?id=tilovEHA3YS

[27]. DOP: Off-Policy Multi-Agent Decomposed Policy Gradients

平均得分: 6.5

得分: ['7', '3', '9', '7']

论文链接: https://openreview.net/forum?id=6FqKiVAdI3Y

[28]. Correcting experience replay for multi-agent communication

平均得分: 6.5

得分: ['4', '6', '8', '8']

论文链接: https://openreview.net/forum?id=xvxPuCkCNPO

[29]. Risk-Averse Offline Reinforcement Learning

平均得分: 6.4

得分: ['6', '8', '5', '6', '7']

论文链接: https://openreview.net/forum?id=TBIzh9b5eaz

[30]. Learning Value Functions in Deep Policy Gradients using Residual Variance

平均得分: 6.33

得分: ['8', '7', '4']

论文链接: https://openreview.net/forum?id=NX1He-aFO_F

[31]. Contrastive Explanations for Reinforcement Learning via Embedded Self Predictions

平均得分: 6.33

得分: ['4', '8', '7']

论文链接: https://openreview.net/forum?id=Ud3DSz72nYR

[32]. PODS: Policy Optimization via Differentiable Simulation

平均得分: 6.33

得分: ['9', '4', '6']

论文链接: https://openreview.net/forum?id=4f04RAhMUo6

[33]. Transient Non-stationarity and Generalisation in Deep Reinforcement Learning

平均得分: 6.25

得分: ['7', '5', '5', '8']

论文链接: https://openreview.net/forum?id=Qun8fv4qSby

[34]. Improving Learning to Branch via Reinforcement Learning

平均得分: 6.25

得分: ['7', '7', '8', '3']

论文链接: https://openreview.net/forum?id=M_KwRsbhi5e

[35]. Mastering Atari with Discrete World Models

平均得分: 6.25

得分: ['4', '7', '10', '4']

论文链接: https://openreview.net/forum?id=0oabwyZbOu

[36]. Data-Efficient Reinforcement Learning with Self-Predictive Representations

平均得分: 6.25

得分: ['6', '5', '7', '7']

论文链接: https://openreview.net/forum?id=uCQfPZwRaUu

[37]. Local Information Opponent Modelling Using Variational Autoencoders

平均得分: 6.25

得分: ['8', '7', '4', '6']

论文链接: https://openreview.net/forum?id=xF5r3dVeaEl

[38]. Contrastive Behavioral Similarity Embeddings for Generalization in Reinforcement Learning

平均得分: 6.25

得分: ['6', '6', '6', '7']

论文链接: https://openreview.net/forum?id=qda7-sVg84

[39]. Efficient Reinforcement Learning in Factored MDPs with Application to Constrained RL

平均得分: 6.25

得分: ['7', '5', '7', '6']

论文链接: https://openreview.net/forum?id=fmtSg8591Q

[40]. Batch Reinforcement Learning Through Continuation Method

平均得分: 6.25

得分: ['6', '9', '6', '4']

论文链接: https://openreview.net/forum?id=po-DLlBuAuz

[41]. Optimistic Exploration with Backward Bootstrapped Bonus for Deep Reinforcement Learning

平均得分: 6.2

得分: ['7', '6', '7', '6', '5']

论文链接: https://openreview.net/forum?id=QxQkG-gIKJM

[42]. Optimism in Reinforcement Learning with Generalized Linear Function Approximation

平均得分: 6

得分: ['6', '7', '6', '5']

论文链接: https://openreview.net/forum?id=CBmJwzneppz

[43]. Adversarially Guided Actor-Critic

平均得分: 6

得分: ['5', '6', '7']

论文链接: https://openreview.net/forum?id=_mQp5cr_iNy

[44]. QTRAN++: Improved Value Transformation for Cooperative Multi-Agent Reinforcement Learning

平均得分: 6

得分: ['7', '6', '6', '5']

论文链接: https://openreview.net/forum?id=TlS3LBoDj3Z

[45]. Policy Optimization in Zero-Sum Markov Games: Fictitious Self-Play Provably Attains Nash Equilibria

平均得分: 6

得分: ['6', '5', '8', '5']

论文链接: https://openreview.net/forum?id=c3MWGN_cTf

[46]. Optimistic Policy Optimization with General Function Approximations

平均得分: 6

得分: ['7', '7', '4']

论文链接: https://openreview.net/forum?id=JydXRRDoDTv

[47]. Multi-Agent Collaboration via Reward Attribution Decomposition

平均得分: 6

得分: ['5', '6', '7', '6']

论文链接: https://openreview.net/forum?id=GVNGAaY2Dr1

[48]. Efficient Wasserstein Natural Gradients for Reinforcement Learning

平均得分: 6

得分: ['5', '8', '5']

论文链接: https://openreview.net/forum?id=OHgnfSrn2jv

[49]. Density Constrained Reinforcement Learning

平均得分: 6

得分: ['7', '6', '5', '6']

论文链接: https://openreview.net/forum?id=jMc7DlflrMC

[50]. Representation Balancing Offline Model-based Reinforcement Learning

平均得分: 6

得分: ['5', '6', '7', '6']

论文链接: https://openreview.net/forum?id=QpNz8r_Ri2Y

[51]. Decoupling Representation Learning from Reinforcement Learning

平均得分: 6

得分: ['7', '5', '4', '8']

论文链接: https://openreview.net/forum?id=_SKUm2AJpvN

[52]. Model-based micro-data reinforcement learning: what are the crucial model properties and which model to choose?

平均得分: 5.8

得分: ['7', '7', '6', '5', '4']

论文链接: https://openreview.net/forum?id=p5uylG94S68

[53]. Model-based Asynchronous Hyperparameter and Neural Architecture Search

平均得分: 5.8

得分: ['7', '5', '6', '6', '5']

论文链接: https://openreview.net/forum?id=a2rFihIU7i

[54]. DeepAveragers: Offline Reinforcement Learning By Solving Derived Non-Parametric MDPs

平均得分: 5.8

得分: ['5', '7', '5', '7', '5']

论文链接: https://openreview.net/forum?id=eMP1j9efXtX

[55]. Uncertainty Weighted Offline Reinforcement Learning

平均得分: 5.8

得分: ['8', '6', '5', '6', '4']

论文链接: https://openreview.net/forum?id=7hMenh--8g

[56]. Optimizing Memory Placement using Evolutionary Graph Reinforcement Learning

平均得分: 5.75

得分: ['5', '7', '5', '6']

论文链接: https://openreview.net/forum?id=-6vS_4Kfz0

[57]. Parameter-based Value Functions

平均得分: 5.75

得分: ['3', '7', '7', '6']

论文链接: https://openreview.net/forum?id=tV6oBfuyLTQ

[58]. Sample-Efficient Automated Deep Reinforcement Learning

平均得分: 5.75

得分: ['7', '5', '5', '6']

论文链接: https://openreview.net/forum?id=hSjxQ3B7GWq

[59]. Causal Inference Q-Network: Toward Resilient Reinforcement Learning

平均得分: 5.75

得分: ['4', '6', '6', '7']

论文链接: https://openreview.net/forum?id=PvVbsAmxdlZ

[60]. SACoD: Sensor Algorithm Co-Design Towards Efficient CNN-powered Intelligent PhlatCam

平均得分: 5.75

得分: ['6', '6', '5', '6']

论文链接: https://openreview.net/forum?id=jQUf0TmN-oT

[61]. Learn Goal-Conditioned Policy with Intrinsic Motivation for Deep Reinforcement Learning

平均得分: 5.75

得分: ['6', '7', '5', '5']

论文链接: https://openreview.net/forum?id=MmcywoW7PbJ

[62]. Benchmarks for Deep Off-Policy Evaluation

平均得分: 5.75

得分: ['7', '6', '4', '6']

论文链接: https://openreview.net/forum?id=kWSeGEeHvF8

[63]. Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks

平均得分: 5.75

得分: ['6', '5', '6', '6']

论文链接: https://openreview.net/forum?id=Y-Wl1l0Va-

[64]. Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent Populations

平均得分: 5.75

得分: ['6', '4', '6', '7']

论文链接: https://openreview.net/forum?id=Fblk4_Fd7ao

[65]. Randomized Entity-wise Factorization for Multi-Agent Reinforcement Learning

平均得分: 5.75

得分: ['5', '5', '7', '6']

论文链接: https://openreview.net/forum?id=szUsQ3NcQwV

[66]. Learning Robust State Abstractions for Hidden-Parameter Block MDPs

平均得分: 5.75

得分: ['5', '6', '5', '7']

论文链接: https://openreview.net/forum?id=fmOOI2a3tQP

[67]. Adapting to Reward Progressivity via Spectral Reinforcement Learning

平均得分: 5.75

得分: ['5', '7', '5', '6']

论文链接: https://openreview.net/forum?id=dyjPVUc2KB

[68]. Accelerating Safe Reinforcement Learning with Constraint-mismatched Policies

平均得分: 5.75

得分: ['5', '6', '5', '7']

论文链接: https://openreview.net/forum?id=M3NDrHEGyyO

[69]. Off-Dynamics Reinforcement Learning: Training for Transfer with Domain Classifiers

平均得分: 5.75

得分: ['5', '6', '5', '7']

论文链接: https://openreview.net/forum?id=eqBwg3AcIAK

[70]. Meta-Reinforcement Learning With Informed Policy Regularization

平均得分: 5.75

得分: ['6', '5', '6', '6']

论文链接: https://openreview.net/forum?id=pTZ6EgZtzDU

[71]. Hierarchical Reinforcement Learning by Discovering Intrinsic Options

平均得分: 5.75

得分: ['4', '4', '7', '8']

论文链接: https://openreview.net/forum?id=r-gPPHEjpmw

[72]. Multi-Agent Trust Region Learning

平均得分: 5.75

得分: ['4', '8', '5', '6']

论文链接: https://openreview.net/forum?id=eHG7asK_v-k

[73]. Unity of Opposites: SelfNorm and CrossNorm for Model Robustness

平均得分: 5.75

得分: ['5', '7', '6', '5']

论文链接: https://openreview.net/forum?id=Oj2hGyJwhwX

[74]. The Advantage Regret-Matching Actor-Critic

平均得分: 5.67

得分: ['5', '6', '6']

论文链接: https://openreview.net/forum?id=YMsbeG6FqBU

[75]. Differentiable Trust Region Layers for Deep Reinforcement Learning

平均得分: 5.67

得分: ['7', '4', '6']

论文链接: https://openreview.net/forum?id=qYZD-AO1Vn

[76]. Linear Representation Meta-Reinforcement Learning for Instant Adaptation

平均得分: 5.67

得分: ['5', '5', '7']

论文链接: https://openreview.net/forum?id=lNrtNGkr-vw

[77]. Symmetry-Aware Actor-Critic for 3D Molecular Design

平均得分: 5.67

得分: ['6', '4', '7']

论文链接: https://openreview.net/forum?id=jEYKjPE1xYN

[78]. The Importance of Pessimism in Fixed-Dataset Policy Optimization

平均得分: 5.67

得分: ['5', '5', '7']

论文链接: https://openreview.net/forum?id=E3Ys6a1NTGT

[79]. Understanding and Leveraging Causal Relations in Deep Reinforcement Learning

平均得分: 5.67

得分: ['5', '6', '6']

论文链接: https://openreview.net/forum?id=30I4Azqc_oP

[80]. Efficient Fully-Offline Meta-Reinforcement Learning via Distance Metric Learning and Behavior Regularization

平均得分: 5.67

得分: ['7', '5', '5']

论文链接: https://openreview.net/forum?id=8cpHIfgY4Dj

[81]. Grounding Language to Entities for Generalization in Reinforcement Learning

平均得分: 5.6

得分: ['6', '7', '6', '5', '4']

论文链接: https://openreview.net/forum?id=udbMZR1cKE6

[82]. Large Batch Simulation for Deep Reinforcement Learning

平均得分: 5.6

得分: ['7', '6', '6', '5', '4']

论文链接: https://openreview.net/forum?id=cP5IcoAkfKa

[83]. Deep Reinforcement Learning For Wireless Scheduling with Multiclass Services

平均得分: 5.5

得分: ['3', '7', '7', '5']

论文链接: https://openreview.net/forum?id=UiLl8yjh57

[84]. Monotonic Robust Policy Optimization with Model Discrepancy

平均得分: 5.5

得分: ['7', '6', '5', '4']

论文链接: https://openreview.net/forum?id=kdm4Lm9rgB

[85]. Truly Deterministic Policy Optimization

平均得分: 5.5

得分: ['5', '6', '6', '5']

论文链接: https://openreview.net/forum?id=BntruCi1uvF

[86]. Distributional Reinforcement Learning for Risk-Sensitive Policies

平均得分: 5.5

得分: ['5', '7', '5', '5']

论文链接: https://openreview.net/forum?id=19drPzGV691

[87]. Bounded Myopic Adversaries for Deep Reinforcement Learning Agents

平均得分: 5.5

得分: ['5', '6', '5', '6']

论文链接: https://openreview.net/forum?id=Ew0zR07CYRd

[88]. Decoupling Exploration and Exploitation for Meta-Reinforcement Learning without Sacrifices

平均得分: 5.5

得分: ['7', '6', '4', '5']

论文链接: https://openreview.net/forum?id=rSwTMomgCz

[89]. Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization

平均得分: 5.5

得分: ['5', '7', '5', '5']

论文链接: https://openreview.net/forum?id=lvRTC669EY_

[90]. Blending MPC & Value Function Approximation for Efficient Reinforcement Learning

平均得分: 5.5

得分: ['5', '5', '5', '7']

论文链接: https://openreview.net/forum?id=RqCC_00Bg7V

[91]. A Policy Gradient Algorithm for Learning to Learn in Multiagent Reinforcement Learning

平均得分: 5.5

得分: ['6', '5', '5', '6']

论文链接: https://openreview.net/forum?id=zdrls6LIX4W

[92]. The act of remembering: A study in partially observable reinforcement learning

平均得分: 5.5

得分: ['6', '7', '6', '3']

论文链接: https://openreview.net/forum?id=uFkGzn9RId8

[93]. Random Coordinate Langevin Monte Carlo

平均得分: 5.5

得分: ['7', '7', '4', '4']

论文链接: https://openreview.net/forum?id=lbc44k2jgnX

[94]. Provable Rich Observation Reinforcement Learning with Combinatorial Latent States

平均得分: 5.5

得分: ['4', '6', '5', '7']

论文链接: https://openreview.net/forum?id=hx1IXFHAw7R

[95]. Automatic Data Augmentation for Generalization in Reinforcement Learning

平均得分: 5.5

得分: ['6', '7', '3', '6']

论文链接: https://openreview.net/forum?id=9l9WD4ahJgs

[96]. Reinforcement Learning with Random Delays

平均得分: 5.5

得分: ['3', '6', '5', '8']

论文链接: https://openreview.net/forum?id=QFYnKlBJYR

[97]. On Proximal Policy Optimization's Heavy-Tailed Gradients

平均得分: 5.5

得分: ['6', '5', '6', '5']

论文链接: https://openreview.net/forum?id=cYek5NoXNiX

[98]. A Primal Approach to Constrained Policy Optimization: Global Optimality and Finite-Time Analysis

平均得分: 5.5

得分: ['7', '5', '5', '5']

论文链接: https://openreview.net/forum?id=rI3RMgDkZqJ

[99]. Regularization Matters in Policy Optimization - An Empirical Study on Continuous Control

平均得分: 5.5

得分: ['4', '6', '5', '7']

论文链接: https://openreview.net/forum?id=yr1mzrH3IC

[100]. Divide-and-Conquer Monte Carlo Tree Search

平均得分: 5.5

得分: ['8', '5', '4', '5']

论文链接: https://openreview.net/forum?id=Nj8EIrSu5O

[101]. Status-Quo Policy Gradient in Multi-agent Reinforcement Learning

平均得分: 5.5

得分: ['4', '5', '6', '7']

论文链接: https://openreview.net/forum?id=76M3pxkqRl

[102]. QPLEX: Duplex Dueling Multi-Agent Q-Learning

平均得分: 5.5

得分: ['4', '5', '6', '7']

论文链接: https://openreview.net/forum?id=Rcmk0xxIQV

[103]. A Reduction Approach to Constrained Reinforcement Learning

平均得分: 5.5

得分: ['6', '7', '5', '4']

论文链接: https://openreview.net/forum?id=fV4vvs1J5iM

[104]. Compute- and Memory-Efficient Reinforcement Learning with Latent Experience Replay

平均得分: 5.5

得分: ['7', '4', '5', '6']

论文链接: https://openreview.net/forum?id=J7bUsLCb0zf

[105]. On Trade-offs of Image Prediction in Visual Model-Based Reinforcement Learning

平均得分: 5.5

得分: ['5', '3', '7', '7']

论文链接: https://openreview.net/forum?id=mewtfP6YZ7

[106]. Towards Understanding Linear Value Decomposition in Cooperative Multi-Agent Q-Learning

平均得分: 5.5

得分: ['5', '7', '5', '5']

论文链接: https://openreview.net/forum?id=VMtftZqMruq

[107]. Average Reward Reinforcement Learning with Monotonic Policy Improvement

平均得分: 5.5

得分: ['6', '4', '6', '6']

论文链接: https://openreview.net/forum?id=lo7GKwmakFZ

[108]. FactoredRL: Leveraging Factored Graphs for Deep Reinforcement Learning

平均得分: 5.5

得分: ['5', '6', '6', '5']

论文链接: https://openreview.net/forum?id=wE-3ly4eT5G

[109]. Implicit Under-Parameterization Inhibits Data-Efficient Deep Reinforcement Learning

平均得分: 5.5

得分: ['4', '7', '6', '5']

论文链接: https://openreview.net/forum?id=O9bnihsFfXU

[110]. Scalable Bayesian Inverse Reinforcement Learning by Auto-Encoding Reward

平均得分: 5.5

得分: ['4', '5', '7', '6']

论文链接: https://openreview.net/forum?id=4qR3coiNaIv

[111]. Model-Based Offline Planning

平均得分: 5.5

得分: ['6', '4', '8', '4']

论文链接: https://openreview.net/forum?id=OMNB1G5xzd4

[112]. BRAC+: Going Deeper with Behavior Regularized Offline Reinforcement Learning

平均得分: 5.5

得分: ['4', '6', '7', '5']

论文链接: https://openreview.net/forum?id=bMCfFepJXM

[113]. Learning to Share in Multi-Agent Reinforcement Learning

平均得分: 5.4

得分: ['4', '4', '8', '8', '3']

论文链接: https://openreview.net/forum?id=awnQ2qTLSwn

[114]. Explicit Pareto Front Optimization for Constrained Reinforcement Learning

平均得分: 5.33

得分: ['6', '6', '4']

论文链接: https://openreview.net/forum?id=pOHW7EwFbo9

[115]. Guided Exploration with Proximal Policy Optimization using a Single Demonstration

平均得分: 5.33

得分: ['6', '4', '6']

论文链接: https://openreview.net/forum?id=88_MfcJoJlS

[116]. Unsupervised Active Pre-Training for Reinforcement Learning

平均得分: 5.33

得分: ['5', '6', '5']

论文链接: https://openreview.net/forum?id=cvNYovr16SB

[117]. RECONNAISSANCE FOR REINFORCEMENT LEARNING WITH SAFETY CONSTRAINTS

平均得分: 5.33

得分: ['4', '5', '7']

论文链接: https://openreview.net/forum?id=Gc4MQq-JIgj

[118]. Daylight: Assessing Generalization Skills of Deep Reinforcement Learning Agents

平均得分: 5.33

得分: ['6', '5', '5']

论文链接: https://openreview.net/forum?id=Z3XVHSbSawb

[119]. Diversity Actor-Critic: Sample-Aware Entropy Regularization for Sample-Efficient Exploration

平均得分: 5.33

得分: ['4', '5', '7']

论文链接: https://openreview.net/forum?id=7qmQNB6Wn_B

[120]. OPAL: Offline Primitive Discovery for Accelerating Offline Reinforcement Learning

平均得分: 5.33

得分: ['7', '5', '4']

论文链接: https://openreview.net/forum?id=V69LGwJ0lIN

[121]. A REINFORCEMENT LEARNING FRAMEWORK FOR TIME DEPENDENT CAUSAL EFFECTS EVALUATION IN A/B TESTING

平均得分: 5.33

得分: ['6', '5', '5']

论文链接: https://openreview.net/forum?id=Dtahsj2FkrK

[122]. PettingZoo: Gym for Multi-Agent Reinforcement Learning

平均得分: 5.25

得分: ['7', '5', '6', '3']

论文链接: https://openreview.net/forum?id=WoLQsYU8aZ

[123]. Hippocampal representations emerge when training recurrent neural networks on a memory dependent maze navigation task

平均得分: 5.25

得分: ['4', '6', '4', '7']

论文链接: https://openreview.net/forum?id=Jr8XGtK04Pw

[124]. Data-efficient Hindsight Off-policy Option Learning

平均得分: 5.25

得分: ['5', '6', '5', '5']

论文链接: https://openreview.net/forum?id=QKbS9KXkE_y

[125]. Attacking Few-Shot Classifiers with Adversarial Support Sets

平均得分: 5.25

得分: ['6', '4', '6', '5']

论文链接: https://openreview.net/forum?id=0xdQXkz69x9

[126]. Coverage as a Principle for Discovering Transferable Behavior in Reinforcement Learning

平均得分: 5.25

得分: ['8', '5', '4', '4']

论文链接: https://openreview.net/forum?id=INhwJdJtxn6

[127]. Reinforcement Learning for Control with Probabilistic Stability Guarantee

平均得分: 5.25

得分: ['6', '5', '5', '5']

论文链接: https://openreview.net/forum?id=QfEssgaXpm

[128]. Efficient Reinforcement Learning in Resource Allocation Problems Through Permutation Invariant Multi-task Learning

平均得分: 5.25

得分: ['7', '5', '5', '4']

论文链接: https://openreview.net/forum?id=TiGF63rxr8Q

[129]. Meta-Reinforcement Learning Robust to Distributional Shift via Model Identification and Experience Relabeling

平均得分: 5.25

得分: ['6', '5', '5', '5']

论文链接: https://openreview.net/forum?id=AT7jak63NNK

[130]. Solving Compositional Reinforcement Learning Problems via Task Reduction

平均得分: 5.25

得分: ['3', '5', '6', '7']

论文链接: https://openreview.net/forum?id=9SS69KwomAM

[131]. Emergent Road Rules In Multi-Agent Driving Environments

平均得分: 5.25

得分: ['7', '4', '5', '5']

论文链接: https://openreview.net/forum?id=d8Q1mt2Ghw

[132]. EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL

平均得分: 5.25

得分: ['4', '6', '6', '5']

论文链接: https://openreview.net/forum?id=B8fp0LVMHa

[133]. Double Q-learning: New Analysis and Sharper Finite-time Bound

平均得分: 5.25

得分: ['6', '4', '6', '5']

论文链接: https://openreview.net/forum?id=MwxaStJXK6v

[134]. Safety Verification of Model Based Reinforcement Learning Controllers

平均得分: 5.25

得分: ['3', '7', '6', '5']

论文链接: https://openreview.net/forum?id=mfJepDyIUcQ

[135]. D3C: Reducing the Price of Anarchy in Multi-Agent Learning

平均得分: 5.25

得分: ['3', '4', '7', '7']

论文链接: https://openreview.net/forum?id=8wa7HrUsElL

[136]. Near-Optimal Regret Bounds for Model-Free RL in Non-Stationary Episodic MDPs

平均得分: 5.25

得分: ['6', '4', '4', '7']

论文链接: https://openreview.net/forum?id=TJzkxFw-mGm

[137]. Communication in Multi-Agent Reinforcement Learning: Intention Sharing

平均得分: 5.25

得分: ['6', '4', '6', '5']

论文链接: https://openreview.net/forum?id=qpsl2dR9twy

[138]. On the role of planning in model-based deep reinforcement learning

平均得分: 5.25

得分: ['7', '3', '6', '5']

论文链接: https://openreview.net/forum?id=IrM64DGB21

[139]. Reinforcement Learning with Latent Flow

平均得分: 5.25

得分: ['7', '3', '6', '5']

论文链接: https://openreview.net/forum?id=lSijhyKKsct

[140]. Iterative Amortized Policy Optimization

平均得分: 5.25

得分: ['6', '5', '5', '5']

论文链接: https://openreview.net/forum?id=49mMdsxkPlD

[141]. Unsupervised Task Clustering for Multi-Task Reinforcement Learning

平均得分: 5.25

得分: ['6', '5', '5', '5']

论文链接: https://openreview.net/forum?id=4K_NaDAHc0d

[142]. Adaptive Multi-model Fusion Learning for Sparse-Reward Reinforcement Learning

平均得分: 5.25

得分: ['6', '5', '6', '4']

论文链接: https://openreview.net/forum?id=4emQEegFhSy

[143]. ERMAS: Learning Policies Robust to Reality Gaps in Multi-Agent Simulations

平均得分: 5.25

得分: ['6', '5', '6', '4']

论文链接: https://openreview.net/forum?id=uIc4W6MtbDA

[144]. A Distributional Perspective on Actor-Critic Framework

平均得分: 5.25

得分: ['5', '7', '3', '6']

论文链接: https://openreview.net/forum?id=jWXBUsWP7N

[145]. Robust Reinforcement Learning using Adversarial Populations

平均得分: 5.25

得分: ['5', '7', '4', '5']

论文链接: https://openreview.net/forum?id=I6NRcao1w-X

[146]. The Compact Support Neural Network

平均得分: 5.25

得分: ['5', '5', '6', '5']

论文链接: https://openreview.net/forum?id=xCy9thPPTb_

[147]. RMIX: Risk-Sensitive Multi-Agent Reinforcement Learning

平均得分: 5.25

得分: ['6', '4', '7', '4']

论文链接: https://openreview.net/forum?id=1EVb8XRBDNr

[148]. Meta-Model-Based Meta-Policy Optimization

平均得分: 5.25

得分: ['5', '5', '5', '6']

论文链接: https://openreview.net/forum?id=KOtxfjpQsq

[149]. Decentralized Deterministic Multi-Agent Reinforcement Learning

平均得分: 5.2

得分: ['5', '4', '7', '5', '5']

论文链接: https://openreview.net/forum?id=QM4_h99pjCE

[150]. Transfer among Agents: An Efficient Multiagent Transfer Learning Framework

平均得分: 5.2

得分: ['5', '6', '4', '6', '5']

论文链接: https://openreview.net/forum?id=9w03rTs7w5

[151]. Gradient-based tuning of Hamiltonian Monte Carlo hyperparameters

平均得分: 5

得分: ['5', '4', '6', '5']

论文链接: https://openreview.net/forum?id=LvJ8hLSusrv

[152]. Combining Imitation and Reinforcement Learning with Free Energy Principle

平均得分: 5

得分: ['4', '6', '5', '5']

论文链接: https://openreview.net/forum?id=JI2TGOehNT0

[153]. Ordering-Based Causal Discovery with Reinforcement Learning

平均得分: 5

得分: ['5', '5', '5', '5']

论文链接: https://openreview.net/forum?id=bMzj6hXL2VJ

[154]. Universal Value Density Estimation for Imitation Learning and Goal-Conditioned Reinforcement Learning

平均得分: 5

得分: ['5', '5', '4', '6']

论文链接: https://openreview.net/forum?id=S2UB9PkrEjF

[155]. The Emergence of Individuality in Multi-Agent Reinforcement Learning

平均得分: 5

得分: ['5', '5', '4', '6']

论文链接: https://openreview.net/forum?id=EoVmlONgI9e

[156]. Explore with Dynamic Map: Graph Structured Reinforcement Learning

平均得分: 5

得分: ['4', '5', '6', '5']

论文链接: https://openreview.net/forum?id=-u4j4dHeWQi

[157]. Offline Meta-Reinforcement Learning with Advantage Weighting

平均得分: 5

得分: ['5', '6', '5', '4']

论文链接: https://openreview.net/forum?id=S5S3eTEmouw

[158]. Deep Q-Learning with Low Switching Cost

平均得分: 5

得分: ['6', '5', '5', '4']

论文链接: https://openreview.net/forum?id=7ODIasgLJlU

[159]. AWAC: Accelerating Online Reinforcement Learning with Offline Datasets

平均得分: 5

得分: ['6', '6', '3', '6', '4']

论文链接: https://openreview.net/forum?id=OJiM1R3jAtZ

[160]. A Strong On-Policy Competitor To PPO

平均得分: 5

得分: ['5', '5', '5']

论文链接: https://openreview.net/forum?id=0migj5lyUZl

[161]. Control-Aware Representations for Model-based Reinforcement Learning

平均得分: 5

得分: ['6', '5', '4']

论文链接: https://openreview.net/forum?id=dgd4EJqsbW5

[162]. Formal Language Constrained Markov Decision Processes

平均得分: 5

得分: ['5', '6', '4', '5']

论文链接: https://openreview.net/forum?id=NTP9OdaT6nm

[163]. Multi-Agent Imitation Learning with Copulas

平均得分: 5

得分: ['4', '4', '7']

论文链接: https://openreview.net/forum?id=gRr_gt5bker

[164]. Projected Latent Markov Chain Monte Carlo: Conditional Sampling of Normalizing Flows

平均得分: 5

得分: ['6', '5', '4']

论文链接: https://openreview.net/forum?id=MBpHUFrcG2x

[165]. Efficient Competitive Self-Play Policy Optimization

平均得分: 5

得分: ['7', '5', '3', '5']

论文链接: https://openreview.net/forum?id=99M-4QlinPr

[166]. Offline Model-Based Optimization via Normalized Maximum Likelihood Estimation

平均得分: 5

得分: ['5', '5', '5']

论文链接: https://openreview.net/forum?id=FmMKSO4e8JK

[167]. Beyond Prioritized Replay: Sampling States in Model-Based RL via Simulated Priorities

平均得分: 5

得分: ['4', '6', '5']

论文链接: https://openreview.net/forum?id=B5bZp0m7jZd

[168]. Action Guidance: Getting the Best of Sparse Rewards and Shaped Rewards for Real-time Strategy Games

平均得分: 5

得分: ['6', '4', '6', '4']

论文链接: https://openreview.net/forum?id=1OQ90khuUGZ

[169]. What About Taking Policy as Input of Value Function: Policy-extended Value Function Approximator

平均得分: 5

得分: ['7', '5', '5', '3']

论文链接: https://openreview.net/forum?id=V4AVDoFtVM

[170]. Optimizing Information Bottleneck in Reinforcement Learning: A Stein Variational Approach

平均得分: 5

得分: ['6', '4', '5', '5']

论文链接: https://openreview.net/forum?id=IKqCy8i1XL3

[171]. On the Estimation Bias in Double Q-Learning

平均得分: 5

得分: ['6', '5', '3', '6']

论文链接: https://openreview.net/forum?id=FKotzp6PZJw

[172]. Entropic Risk-Sensitive Reinforcement Learning: A Meta Regret Framework with Function Approximation

平均得分: 5

得分: ['6', '5', '4', '5']

论文链接: https://openreview.net/forum?id=q_kZm9eHIeD

[173]. Goal-Auxiliary Actor-Critic for 6D Robotic Grasping with Point Clouds

平均得分: 5

得分: ['5', '7', '3']

论文链接: https://openreview.net/forum?id=H5B3lmpO1g

[174]. Policy Gradient with Expected Quadratic Utility Maximization: A New Mean-Variance Approach in Reinforcement Learning

平均得分: 5

得分: ['4', '5', '6']

论文链接: https://openreview.net/forum?id=BEs-Q1ggdwT

[175]. D2RL: Deep Dense Architectures in Reinforcement Learning

平均得分: 5

得分: ['4', '8', '4', '4']

论文链接: https://openreview.net/forum?id=mYNfmvt8oSv

[176]. Intention Propagation for Multi-agent Reinforcement Learning

平均得分: 5

得分: ['3', '6', '6', '5']

论文链接: https://openreview.net/forum?id=7apQQsbahFz

[177]. SIM-GAN: Adversarial Calibration of Multi-Agent Market Simulators.

平均得分: 5

得分: ['3', '7', '5']

论文链接: https://openreview.net/forum?id=1z_Hg9oBCtY

[178]. Preventing Value Function Collapse in Ensemble Q-Learning by Maximizing Representation Diversity

平均得分: 5

得分: ['4', '5', '5', '6']

论文链接: https://openreview.net/forum?id=dN_iVr6iNuU

[179]. REPAINT: Knowledge Transfer in Deep Actor-Critic Reinforcement Learning

平均得分: 5

得分: ['4', '6', '4', '6']

论文链接: https://openreview.net/forum?id=P84ryxVG6tR

[180]. Mixture of Step Returns in Bootstrapped DQN

平均得分: 5

得分: ['5', '4', '4', '7', '5']

论文链接: https://openreview.net/forum?id=X6YPReSv5CX

[181]. PAC-Bayesian Randomized Value Function with Informative Prior

平均得分: 4.8

得分: ['7', '3', '5', '4', '5']

论文链接: https://openreview.net/forum?id=d2m6yCwyJW

[182]. Learning Safe Multi-agent Control with Decentralized Neural Barrier Certificates

平均得分: 4.8

得分: ['4', '4', '6', '5', '5']

论文链接: https://openreview.net/forum?id=P6_q1BRxY8Q

[183]. Maximum Reward Formulation In Reinforcement Learning

平均得分: 4.8

得分: ['5', '6', '3', '4', '6']

论文链接: https://openreview.net/forum?id=BnokSKnhC7F

[184]. Model-Free Counterfactual Credit Assignment

平均得分: 4.75

得分: ['5', '5', '6', '3']

论文链接: https://openreview.net/forum?id=F8xpAPm_ZKS

[185]. Plan-Based Asymptotically Equivalent Reward Shaping

平均得分: 4.75

得分: ['3', '5', '7', '4']

论文链接: https://openreview.net/forum?id=w2Z2OwVNeK

[186]. Design-Bench: Benchmarks for Data-Driven Offline Model-Based Optimization

平均得分: 4.75

得分: ['4', '3', '7', '5']

论文链接: https://openreview.net/forum?id=cQzf26aA3vM

[187]. Regioned Episodic Reinforcement Learning

平均得分: 4.75

得分: ['6', '4', '5', '4']

论文链接: https://openreview.net/forum?id=amRmtfpYgDt

[188]. Reinforcement Learning with Bayesian Classifiers: Efficient Skill Learning from Outcome Examples

平均得分: 4.75

得分: ['5', '4', '5', '5']

论文链接: https://openreview.net/forum?id=OZgVHzdKicb

[189]. Provably More Efficient Q-Learning in the One-Sided-Feedback/Full-Feedback Settings

平均得分: 4.75

得分: ['4', '4', '6', '5']

论文链接: https://openreview.net/forum?id=vY0bnzBBvtr

[190]. Systematic Evaluation of Causal Discovery in Visual Model Based Reinforcement Learning

平均得分: 4.75

得分: ['4', '6', '4', '5']

论文链接: https://openreview.net/forum?id=gp5Uzbl-9C-

[191]. Safe Reinforcement Learning with Natural Language Constraints

平均得分: 4.75

得分: ['5', '3', '5', '6']

论文链接: https://openreview.net/forum?id=Ua5yGJhfgAg

[192]. ReaPER: Improving Sample Efficiency in Model-Based Latent Imagination

平均得分: 4.75

得分: ['4', '5', '4', '6']

论文链接: https://openreview.net/forum?id=nlWgE3A-iS

[193]. Coordinated Multi-Agent Exploration Using Shared Goals

平均得分: 4.75

得分: ['4', '5', '5', '5']

论文链接: https://openreview.net/forum?id=MPO4oML_JC

[194]. Measuring and mitigating interference in reinforcement learning

平均得分: 4.75

得分: ['5', '6', '4', '4']

论文链接: https://openreview.net/forum?id=26WnoE4hjS

[195]. Hamiltonian Q-Learning: Leveraging Importance-sampling for Data Efficient RL

平均得分: 4.75

得分: ['5', '5', '5', '4']

论文链接: https://openreview.net/forum?id=10XWPuAro86

[196]. A Maximum Mutual Information Framework for Multi-Agent Reinforcement Learning

平均得分: 4.75

得分: ['3', '5', '6', '5']

论文链接: https://openreview.net/forum?id=_zHHAZOLTVh

[197]. Non-decreasing Quantile Function Network with Efficient Exploration for Distributional Reinforcement Learning

平均得分: 4.75

得分: ['4', '5', '4', '6']

论文链接: https://openreview.net/forum?id=f_GA2IU9-K-

[198]. Constrained Reinforcement Learning With Learned Constraints

平均得分: 4.75

得分: ['3', '3', '5', '8']

论文链接: https://openreview.net/forum?id=akgiLNAkC7P

[199]. Efficient Exploration for Model-based Reinforcement Learning with Continuous States and Actions

平均得分: 4.75

得分: ['5', '5', '4', '5']

论文链接: https://openreview.net/forum?id=asLT0W1w7Li

[200]. Error Controlled Actor-Critic Method to Reinforcement Learning

平均得分: 4.75

得分: ['7', '3', '3', '6']

论文链接: https://openreview.net/forum?id=n5yBuzpqqw

[201]. Cross-State Self-Constraint for Feature Generalization in Deep Reinforcement Learning

平均得分: 4.75

得分: ['5', '5', '4', '5']

论文链接: https://openreview.net/forum?id=JiNvAGORcMW

[202]. Safety Aware Reinforcement Learning (SARL)

平均得分: 4.75

得分: ['4', '6', '6', '3']

论文链接: https://openreview.net/forum?id=RDpTZpubOh7

[203]. UneVEn: Universal Value Exploration for Multi-Agent Reinforcement Learning

平均得分: 4.75

得分: ['4', '4', '6', '5']

论文链接: https://openreview.net/forum?id=0z1HScLBEpb

[204]. Interpretable Reinforcement Learning With Neural Symbolic Logic

平均得分: 4.67

得分: ['5', '4', '5']

论文链接: https://openreview.net/forum?id=M_gk45ItxIp

[205]. Network Reusability Analysis for Multi-Joint Robot Reinforcement Learning

平均得分: 4.67

得分: ['5', '4', '5']

论文链接: https://openreview.net/forum?id=hypDstHla7

[206]. Factored Action Spaces in Deep Reinforcement Learning

平均得分: 4.67

得分: ['6', '3', '5']

论文链接: https://openreview.net/forum?id=naSAkn2Xo46

[207]. Genetic Soft Updates for Policy Evolution in Deep Reinforcement Learning

平均得分: 4.67

得分: ['4', '6', '4']

论文链接: https://openreview.net/forum?id=TGFO0DbD_pk

[208]. The Skill-Action Architecture: Learning Abstract Action Embeddings for Reinforcement Learning

平均得分: 4.67

得分: ['5', '4', '5']

论文链接: https://openreview.net/forum?id=PU35uLgRZkk

[209]. Learning Intrinsic Symbolic Rewards in Reinforcement Learning

平均得分: 4.67

得分: ['5', '4', '5']

论文链接: https://openreview.net/forum?id=4CxsUBDQJqv

[210]. Robust Offline Reinforcement Learning from Low-Quality Data

平均得分: 4.6

得分: ['5', '4', '6', '6', '2']

论文链接: https://openreview.net/forum?id=uOjm_xqKEoX

[211]. Adaptive Learning Rates for Multi-Agent Reinforcement Learning

平均得分: 4.6

得分: ['5', '4', '4', '5', '5']

论文链接: https://openreview.net/forum?id=yN18f9V1Onp

[212]. Revisiting Parameter Sharing in Multi-Agent Deep Reinforcement Learning

平均得分: 4.5

得分: ['3', '3', '5', '7']

论文链接: https://openreview.net/forum?id=MWj_P-Lk3jC

[213]. Addressing Distribution Shift in Online Reinforcement Learning with Offline Datasets

平均得分: 4.5

得分: ['6', '5', '4', '3']

论文链接: https://openreview.net/forum?id=9hgEG-k57Zj

[214]. TOMA: Topological Map Abstraction for Reinforcement Learning

平均得分: 4.5

得分: ['4', '3', '5', '6']

论文链接: https://openreview.net/forum?id=yoem5ud2vb

[215]. Multi-agent Policy Optimization with Approximatively Synchronous Advantage Estimation

平均得分: 4.5

得分: ['5', '3', '6', '4']

论文链接: https://openreview.net/forum?id=Rw_vo-wIAa

[216]. Why Convolutional Networks Learn Oriented Bandpass Filters: Theory and Empirical Support

平均得分: 4.5

得分: ['6', '4', '5', '3']

论文链接: https://openreview.net/forum?id=UJRFjuJDsIO

[217]. Self-Activating Neural Ensembles for Continual Reinforcement Learning

平均得分: 4.5

得分: ['4', '4', '4', '6']

论文链接: https://openreview.net/forum?id=Jf24xdaAwF9

[218]. Approximating Pareto Frontier through Bayesian-optimization-directed Robust Multi-objective Reinforcement Learning

平均得分: 4.5

得分: ['5', '5', '5', '3']

论文链接: https://openreview.net/forum?id=S9MPX7ejmv

[219]. Model-Based Reinforcement Learning via Latent-Space Collocation

平均得分: 4.5

得分: ['3', '5', '6', '4']

论文链接: https://openreview.net/forum?id=ku4sJKvnbwV

[220]. CDT: Cascading Decision Trees for Explainable Reinforcement Learning

平均得分: 4.5

得分: ['4', '4', '5', '5']

论文链接: https://openreview.net/forum?id=WdOCkf4aCM

[221]. PGPS : Coupling Policy Gradient with Population-based Search

平均得分: 4.5

得分: ['5', '5', '3', '5']

论文链接: https://openreview.net/forum?id=PeT5p3ocagr

[222]. CAT-SAC: Soft Actor-Critic with Curiosity-Aware Entropy Temperature

平均得分: 4.5

得分: ['6', '4', '4', '4']

论文链接: https://openreview.net/forum?id=paE8yL0aKHo

[223]. Learning to Observe with Reinforcement Learning

平均得分: 4.5

得分: ['3', '6', '5', '4']

论文链接: https://openreview.net/forum?id=65sCF5wmhpv

[224]. Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning

平均得分: 4.5

得分: ['3', '6', '3', '6']

论文链接: https://openreview.net/forum?id=LtgEkhLScK3

[225]. Visual Imitation with Reinforcement Learning using Recurrent Siamese Networks

平均得分: 4.5

得分: ['4', '4', '4', '6']

论文链接: https://openreview.net/forum?id=MBdafA3G9k

[226]. Lyapunov Barrier Policy Optimization

平均得分: 4.5

得分: ['4', '6', '4', '4']

论文链接: https://openreview.net/forum?id=qUs18ed9oe

[227]. A Deeper Look at Discounting Mismatch in Actor-Critic Algorithms

平均得分: 4.5

得分: ['6', '4', '3', '5']

论文链接: https://openreview.net/forum?id=ypJS_nyu-I

[228]. Cross-Modal Domain Adaptation for Reinforcement Learning

平均得分: 4.5

得分: ['5', '4', '5', '4']

论文链接: https://openreview.net/forum?id=0owsv3F-fM

[229]. L2E: Learning to Exploit Your Opponent

平均得分: 4.5

得分: ['6', '4', '3', '5']

论文链接: https://openreview.net/forum?id=m4PC1eUknQG

[230]. MQES: Max-Q Entropy Search for Efficient Exploration in Continuous Reinforcement Learning

平均得分: 4.4

得分: ['4', '3', '5', '6', '4']

论文链接: https://openreview.net/forum?id=98ntbCuqf4i

[231]. Robust Multi-Agent Reinforcement Learning Driven by Correlated Equilibrium

平均得分: 4.4

得分: ['5', '4', '3', '6', '4']

论文链接: https://openreview.net/forum?id=JvPsKam58LX

[232]. R-LAtte: Attention Module for Visual Control via Reinforcement Learning

平均得分: 4.33

得分: ['4', '4', '5']

论文链接: https://openreview.net/forum?id=D4QFCXGe_z2

[233]. Multi-agent Deep FBSDE Representation For Large Scale Stochastic Differential Games

平均得分: 4.33

得分: ['5', '3', '5']

论文链接: https://openreview.net/forum?id=UoAFJMzCNM

[234]. Aspect-based Sentiment Classification via Reinforcement Learning

平均得分: 4.33

得分: ['5', '5', '3']

论文链接: https://openreview.net/forum?id=bfTUfrqL6d

[235]. Refine and Imitate: Reducing Repetition and Inconsistency in Dialogue Generation via Reinforcement Learning and Human Demonstration

平均得分: 4.33

得分: ['3', '6', '4']

论文链接: https://openreview.net/forum?id=JthLaV0RsV

[236]. An Examination of Preference-based Reinforcement Learning for Treatment Recommendation

平均得分: 4.33

得分: ['4', '4', '5']

论文链接: https://openreview.net/forum?id=uxYjVEXx48i

[237]. Adaptive Dataset Sampling by Deep Policy Gradient

平均得分: 4.33

得分: ['5', '3', '5']

论文链接: https://openreview.net/forum?id=t2C42s67gsQ

[238]. Convergence Proof for Actor-Critic Methods Applied to PPO and RUDDER

平均得分: 4.25

得分: ['5', '4', '4', '4']

论文链接: https://openreview.net/forum?id=0hMthVxlS89

[239]. Q-Value Weighted Regression: Reinforcement Learning with Limited Data

平均得分: 4.25

得分: ['4', '6', '3', '4']

论文链接: https://openreview.net/forum?id=rd_bm8CK7o0

[240]. ScheduleNet: Learn to Solve MinMax mTSP Using Reinforcement Learning with Delayed Reward

平均得分: 4.25

得分: ['5', '4', '3', '5']

论文链接: https://openreview.net/forum?id=P63SQE0fVa

[241]. Benchmarking Multi-Agent Deep Reinforcement Learning Algorithms

平均得分: 4.25

得分: ['4', '4', '3', '6']

论文链接: https://openreview.net/forum?id=t5lNr0Lw84H

[242]. Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in First-person Simulated 3D Environments

平均得分: 4.25

得分: ['3', '4', '4', '6']

论文链接: https://openreview.net/forum?id=7AQUzh5ntX_

[243]. Model-Free Energy Distance for Pruning DNNs

平均得分: 4.25

得分: ['5', '2', '5', '5']

论文链接: https://openreview.net/forum?id=k2TyMLwuikx

[244]. D4RL: Datasets for Deep Data-Driven Reinforcement Learning

平均得分: 4.25

得分: ['2', '3', '6', '6']

论文链接: https://openreview.net/forum?id=px0-N3_KjA

[245]. Exploring Transferability of Perturbations in Deep Reinforcement Learning

平均得分: 4.25

得分: ['3', '4', '6', '4']

论文链接: https://openreview.net/forum?id=inBTt_wSv0

[246]. Alpha-DAG: a reinforcement learning based algorithm to learn Directed Acyclic Graphs

平均得分: 4.25

得分: ['4', '5', '4', '4']

论文链接: https://openreview.net/forum?id=0jqRSnFnmL_

[247]. Visual Explanation using Attention Mechanism in Actor-Critic-based Deep Reinforcement Learning

平均得分: 4.25

得分: ['5', '5', '4', '3']

论文链接: https://openreview.net/forum?id=Y0MgRifqikY

[248]. Knapsack Pruning with Inner Distillation

平均得分: 4.25

得分: ['4', '4', '5', '4']

论文链接: https://openreview.net/forum?id=O9NAKC_MqMx

[249]. Reinforcement Learning for Flexibility Design Problems

平均得分: 4.25

得分: ['5', '4', '4', '4']

论文链接: https://openreview.net/forum?id=oAkujcqxJzW

[250]. Model-based Navigation in Environments with Novel Layouts Using Abstract $2$-D Maps

平均得分: 4.25

得分: ['6', '4', '4', '3']

论文链接: https://openreview.net/forum?id=_lV1OrJIgiG

[251]. Model-Based Robust Deep Learning: Generalizing to Natural, Out-of-Distribution Data

平均得分: 4.25

得分: ['5', '5', '4', '3']

论文链接: https://openreview.net/forum?id=RgDq8-AwvtN

[252]. Structure and randomness in planning and reinforcement learning

平均得分: 4.2

得分: ['5', '3', '6', '3', '4']

论文链接: https://openreview.net/forum?id=UOOmHiXetC

[253]. Trust, but verify: model-based exploration in sparse reward environments

平均得分: 4

得分: ['4', '2', '6', '4']

论文链接: https://openreview.net/forum?id=DE0MSwKv32y

[254]. Play to Grade: Grading Interactive Coding Games as Classifying Markov Decision Process

平均得分: 4

得分: ['4', '3', '5']

论文链接: https://openreview.net/forum?id=GJkTaYTmzVS

[255]. Graph Convolutional Value Decomposition in Multi-Agent Reinforcement Learning

平均得分: 4

得分: ['5', '3', '4', '4']

论文链接: https://openreview.net/forum?id=gDikr8MVsMF

[256]. Regret Bounds and Reinforcement Learning Exploration of EXP-based Algorithms

平均得分: 4

得分: ['4', '4', '4']

论文链接: https://openreview.net/forum?id=-5W5OBfFlwX

[257]. MDP Playground: Controlling Dimensions of Hardness in Reinforcement Learning

平均得分: 4

得分: ['4', '3', '4', '5']

论文链接: https://openreview.net/forum?id=axNDkxU9-6z

[258]. Intrinsically Guided Exploration in Meta Reinforcement Learning

平均得分: 4

得分: ['4', '4', '4', '4']

论文链接: https://openreview.net/forum?id=RwQZd8znR10

[259]. Adaptive N-step Bootstrapping with Off-policy Data

平均得分: 4

得分: ['4', '4', '3', '5']

论文链接: https://openreview.net/forum?id=bhngY7lHu_

[260]. FORK: A FORward-looKing Actor for Model-Free Reinforcement Learning

平均得分: 4

得分: ['5', '3', '5', '3']

论文链接: https://openreview.net/forum?id=lXW6Sk1075v

[261]. Measuring Progress in Deep Reinforcement Learning Sample Efficiency

平均得分: 4

得分: ['4', '5', '5', '2']

论文链接: https://openreview.net/forum?id=_QdvdkxOii6

[262]. Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning

平均得分: 4

得分: ['6', '3', '4', '3']

论文链接: https://openreview.net/forum?id=ToWi1RjuEr8

[263]. Joint State-Action Embedding for Efficient Reinforcement Learning

平均得分: 3.8

得分: ['5', '1', '4', '3', '6']

论文链接: https://openreview.net/forum?id=5USOVm2HkfG

[264]. Deep Reinforcement Learning for Optimal Stopping with Application in Financial Engineering

平均得分: 3.75

得分: ['2', '4', '4', '5']

论文链接: https://openreview.net/forum?id=REKvFYIgwz9

[265]. Playing Atari with Capsule Networks: A systematic comparison of CNN and CapsNets-based agents.

平均得分: 3.75

得分: ['2', '4', '5', '4']

论文链接: https://openreview.net/forum?id=GeOIKynj_V

[266]. Robust Constrained Reinforcement Learning for Continuous Control with Model Misspecification

平均得分: 3.75

得分: ['4', '3', '3', '5']

论文链接: https://openreview.net/forum?id=e-ZdxsIwweR

[267]. Decorrelated Double Q-learning

平均得分: 3.75

得分: ['4', '3', '5', '3']

论文链接: https://openreview.net/forum?id=jcN7a3yZeQc

[268]. Learning to Dynamically Select Between Reward Shaping Signals

平均得分: 3.75

得分: ['5', '2', '4', '4']

论文链接: https://openreview.net/forum?id=NrN8XarA2Iz

[269]. Empirically Verifying Hypotheses Using Reinforcement Learning

平均得分: 3.75

得分: ['3', '3', '5', '4']

论文链接: https://openreview.net/forum?id=XbJiphOWXiU

[270]. Self-Supervised Continuous Control without Policy Gradient

平均得分: 3.75

得分: ['3', '4', '4', '4']

论文链接: https://openreview.net/forum?id=pNDvPXd1qUk

[271]. Dynamic Relational Inference in Multi-Agent Trajectories

平均得分: 3.75

得分: ['2', '4', '5', '4']

论文链接: https://openreview.net/forum?id=UV9kN3S4uTZ

[272]. Greedy Multi-Step Off-Policy Reinforcement Learning

平均得分: 3.75

得分: ['2', '4', '4', '5']

论文链接: https://openreview.net/forum?id=rAIkhjUK0Tx

[273]. Addressing Extrapolation Error in Deep Offline Reinforcement Learning

平均得分: 3.67

得分: ['3', '4', '4']

论文链接: https://openreview.net/forum?id=OCRKCul3eKN

[274]. Offline Policy Optimization with Variance Regularization

平均得分: 3.67

得分: ['3', '4', '4']

论文链接: https://openreview.net/forum?id=P3WG6p6Jnb

[275]. Fine-Tuning Offline Reinforcement Learning with Model-Based Policy Optimization

平均得分: 3.6

得分: ['3', '4', '4', '5', '2']

论文链接: https://openreview.net/forum?id=wiSgdeJ29ee

[276]. Learning to communicate through imagination with model-based deep multi-agent reinforcement learning

平均得分: 3.5

得分: ['3', '4', '4', '3']

论文链接: https://openreview.net/forum?id=boZj4g3Jocj

[277]. A Robust Fuel Optimization Strategy For Hybrid Electric Vehicles: A Deep Reinforcement Learning Based Continuous Time Design Approach

平均得分: 3.5

得分: ['3', '5', '4', '2']

论文链接: https://openreview.net/forum?id=LFs3CnHwfM

[278]. Deep Reinforcement Learning With Adaptive Combined Critics

平均得分: 3.5

得分: ['3', '3', '5', '3']

论文链接: https://openreview.net/forum?id=gtwVBChN8td

[279]. FSV: Learning to Factorize Soft Value Function for Cooperative Multi-Agent Reinforcement Learning

平均得分: 3.4

得分: ['2', '6', '2', '3', '4']

论文链接: https://openreview.net/forum?id=ijVgDcvLmZ

[280]. Success-Rate Targeted Reinforcement Learning by Disorientation Penalty

平均得分: 3.25

得分: ['2', '3', '4', '4']

论文链接: https://openreview.net/forum?id=rQYyXqHPgZR

[281]. Explainable Reinforcement Learning Through Goal-Based Explanations

平均得分: 3.25

得分: ['3', '3', '4', '3']

论文链接: https://openreview.net/forum?id=IlJbTsygaI6

[282]. Hierarchical Meta Reinforcement Learning for Multi-Task Environments

平均得分: 3.25

得分: ['3', '3', '4', '3']

论文链接: https://openreview.net/forum?id=u9ax42K7ND

[283]. Interpretable Meta-Reinforcement Learning with Actor-Critic Method

平均得分: 3.2

得分: ['4', '3', '4', '2', '3']

论文链接: https://openreview.net/forum?id=-RQVWPX73VP

[284]. Reinforcement Learning Based Asymmetrical DNN Modularization for Optimal Loading

平均得分: 3

得分: ['3', '2', '3', '4']

论文链接: https://openreview.net/forum?id=_qJXkf347k

[285]. Stochastic Inverse Reinforcement Learning

平均得分: 2.8

得分: ['2', '2', '4', '3', '3']

论文链接: https://openreview.net/forum?id=l3gNU1KStIC

[286]. Using Deep Reinforcement Learning to Train and Evaluate Instructional Sequencing Policies for an Intelligent Tutoring System

平均得分: 2.67

得分: ['2', '4', '2']

论文链接: https://openreview.net/forum?id=eIPsmKwTrIe

[287]. Guiding Representation Learning in Deep Generative Models with Policy Gradients

平均得分: 2.5

得分: ['2', '4', '3', '1']

论文链接: https://openreview.net/forum?id=sgNhTKrZjaT

完


往期精彩回顾



适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑
获取本站知识星球优惠券，复制链接直接打开：
https://t.zsxq.com/y7uvZF6
本站qq群704220115。

加入微信群请扫码：

你可能感兴趣的:(【论文相关】强化学习：提前看287篇ICLR-2021 "深度强化学习"领域论文得分汇总列表...)

铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
那个抄袭的大张伟猫小努
最近一直在追《即刻电音》这个综艺，除了觉得出场节目的音乐制作人有意思之外，也觉得有两个导师挺有趣的（另外一个就忽略了吧）。孙艺兴在上一篇文章里面已经说过了，那么这篇就说说我们的大老师，大张伟吧。其实在节目刚开始大张伟出来的时候，我以为他是属于导师里面来活跃气氛负责搞笑的，毕竟孙艺兴属于卖萌卖傻卖老实的，尚雯婕一般负责装逼耍狠的，而大张伟一贯以来上综艺的形象基本上都是蹦蹦跳跳带动气氛的。谁知道，两期
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
活给自己看，笑容才灿烂听着了么
白岩松说“有时候，我们活得很累，并非生活过于刻薄，而是我们太容易被外界的氛围所感染，被他人的情绪所左右。”心情是自己的。若只是活在别人的眼里、嘴里，便掌握不了让自己开心的主动权。人活着，不是为了活给别人看的，唯有做最真实的自己，活给自己看，笑容才灿烂。诚然，世事纷繁复杂，人人都有一张嘴，管也管不了。永远有人欣赏你，也永远有人批评你，不可能做到让所有人都满意，开心做自己才是最重要的。人生苦短，有太多
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
《人世间》南询yi
今日分享十点推文，《人世间》有感苏格拉底说：“天地只有三尺，而人在五尺开外，所以人人都要懂得低头。”深以为然。懂得低头，不是认输。而是于人世间找寻温存的成熟，于困境中寻觅柳暗花明的智慧，于争执中展示屈伸自如的格局。正如仰头不是骄傲，是要看见自己的天空；低头也不是认输，而是要看清自己的路。成大事者，不仅要抬头挺胸，还得低头看路。懂得低头，进退有度，不是认输，而是竭尽全力过好这一生。宫崎骏说过：“所有
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
想明白这个问题，你才能写下去文自拾
春节放假的时候，又有一天梦见她，第二天她冒着漫天大雪，傻傻地跑来见我。她说，见见傻傻的我，天很冷，心很暖。她回去后，我写了一篇文章，题目叫——从此梦中只有你。我们没在一起的很长一段时间里，她都在我的心底，一次次出现在我的梦里。我对她说，在一起之前，是胆小且闷骚，在一起之后，我变得不要脸了。不要脸的——去爱你。那文章没写完，火车上，给她看了。我有点小失望，花了好几个小时写，她分分钟就看完，很希望她逐
勇士赢了，我把掌声给了骑士复角度的生活
今天，不参加高考，只看NBA总决赛第三场的较量。这么说有点得罪高考生了，不过我没有当他们面秀，也没有跑到考点外面得瑟，所以我内心毫无波澜。毫无疑问，考场里不乏骑士和勇士球迷，在紧张作答语文考卷同时还心系着球队，不过我希望今天的比赛不会让你们有所分心，毕竟高考不会像比赛录像那样可以再来。今天，好像起来赶考一样，我起得很早，然而事实是睡不着，挺郁闷的，又不是我高考，我紧张什么？九点我并没有准时打开浏览
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
读《人间鲁迅》有感琳语读书
上周读完《闻一多传》后，我对中国近代知识分子产生了兴趣，这周继续读了《人间鲁迅》。厚厚的两本书，记录了一个人的一生，苦痛，彷徨和挣扎，虽然只读了一小部分，却也心潮澎湃。闻一多和鲁迅是完全不同的。鲁迅是沉郁的，现实的，寂寞的，抗争的。除了天生性格的不同外，环境的塑造也是非常之大。鲁迅少年经历了家庭的变故，看尽了人间冷暖，世态炎凉。这种经历促使他很早就观察思考人生，立志用文学来改变中国国民的劣根。闻一
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring