2018NIPS Pommerman Multi-Agent比赛环境搭建

2018NIPS的Pommerman比赛结果已出,这里要恭喜启元世界获得佳绩,不知大家成绩如何?

这里把搭建Pommerman环境的过程记录一下,Pommerman游戏环境相对《星际争霸2》来说简单很多,无需考虑建筑、科技树以及多兵种(区分多单位)协同,但同时又具有不完全信息、多人协同以及道具使用等难题,因此对于游戏AI的研究是很有帮助的。这里把对应论文链接附上。

https://arxiv.org/pdf/1809.07124.pdf​arxiv.org

 


第一步:

打开命令行,从github下载Pommerman的工程项目(需要配置git)

$ git clone https://github.com/MultiAgentLearning/playground ~/playground

https://github.com/MultiAgentLearning/playground​github.com

 

如未配置git,请直接从链接进入github对应项目,下载zip文件。

第二步:

切换到python虚拟环境,环境配置要求如下:

  • Python 3.6.0+ (including pip)
  • Docker (only needed for DockerAgent)
  • virtualenv (optional, for isolated Python environment)

如果只是自己利用pommerman来学习研究,可以先不安装Docker(推荐安装,可以利用已有智能体加快研究进度)。

虚拟环境我使用的为Anaconda,因此下面激活虚拟环境的命令以Anaconda为例。

激活对应虚拟环境(根据自己安装的虚拟环境名称来替换掉其中的“p36”)。

$ source activate p36

如果忘记了自己虚拟环境的名字,利用如下命令查看

$ conda info -e

第三步:

进入下载的playground文件夹,配置pommerman

$ cd ~/playground
$ pip install -U .

安装对应docker镜像中的agent。这个安装过程比较长,需要下载比较多东西。

$ docker build -t pommerman/simple-agent -f examples/docker-agent/Dockerfile .

第四步:

测试安装环境,首先测试项目自带的RandomAgent,进入examples文件夹

$ cd examples
$ python simple_ffa_run.py

出现如下页面,则第三步的环境配置无误。

2018NIPS Pommerman Multi-Agent比赛环境搭建_第1张图片

测试图片-工程自带agent

 

然后我们打开examples目录下的simple_ffa_run.py文件,修改agent_list如下图所示。

2018NIPS Pommerman Multi-Agent比赛环境搭建_第2张图片

simple_ffarun.py

再次运行该文件。

$ python simple_ffa_run.py

可以通过“WSAD”来控制炸弹人上下左右移动,通过“E”来控制炸弹人放置炸弹。

你可能感兴趣的:(强化学习,博士生涯)