【论文笔记】用机器学习解决组合优化问题的论文综述

        现在用机器学习(特别是深度学习和深度增强学习)研究的组合优化问题:旅行商问题(TSP),3D装箱问题,车辆路径问题(VRP)等。

基础知识:

seq2seq:

           1、sequence to sequence learning with neural network.

          seq2seq框架的提出

attention:

           1、Recurrent Models of Visual Attention.

            attention机制的提出

           2、Neural machine translation by jointly learning to align and translate.

            attention机制用于机器翻译

           3、Attention Is All You Need.

           不采用神经网络,全attention机制的提出

问题应用:

TSP问题:

          1、Pointer Network.(Vinyals et al,NIPS,2015)

          seq2seq模式的变形pointer network的提出,并用于解决组合优化问题(TSP)

          2、Neural combinatorial optimization with reinforcement learning.(Bello et al,ICLR,2016)

         第一次尝试用强化学习(actor-critic框架)解决组合优化问题

          3、Order matters: Sequence to sequence for sets. (Vinyals et al,ICLR,2016)

          输入顺序对神经网络决策的影响

          4、Learning combinatorial optimization algorithms over graphs. (Dai et al,NIPS,2017 )

          运用了强化学习(reinforcement learning)和一个叫structure2vec的图嵌入(graph embedding)方法

          5、Learning Heuristics for the TSP by Policy Gradient.(CPAIOR 2018)

、      半attention半神经网络的方法

3D装箱问题:

         1、Solving a New 3D Bin Packing Problem with Deep Reinforcement Learning Method(阿里菜鸟物流,IJCAI,2017)

         用policy gradient的方法解决三维装箱问题

车辆路径问题(VRP):

         6、Reinforcement Learning for Solving the Vehicle Routing Problem(NIPS,2018)

         用AC框架处理路径规划(VRP问题)

         7、Attention, Learn to Solve Routing Problems(ICLR,2019)

         用全attention机制去处理路径规划(VRP问题)

 

你可能感兴趣的:(论文笔记)