帮嫦娥五号登月的AI还能用来玩游戏,20行Python代码带你领略强化学习的风采

       嫦娥五号将使用AI登陆月球      

      有关最近嫦娥五号的好消息不断,在最近举办的2019软件定义卫星高峰论坛上,中国探月工程首任首席科学家欧阳自远表示“嫦娥五号仍采用软着陆。这实际上是人工智能的自主决策。“探测器非常聪明,它一直晃来晃去地拍照,琢磨这个地点安全不安全,如果4个点不能在一致的水平面上,是会翻车的。”欧阳自远说,它一直在边走边找,最后作出判断和决策。”也就是说嫦娥五号会利用人工智能技术帮助其进行登月着陆。那么这种AI会哪种AI模型呢?

     我们知道在目前人工智能领域分为深度学习模型和强化学习模型两种流派。其中深度学习模型以深度神经网络模型为主,在图像及自然语言识别、分类以及生成等方面都有不错的成绩。而强化学习则是以OPENAI的Dexterous之手为代表:

后来在OPENAI的强化学习模型在DOTA比赛中完胜人类冠军,而抱得大名。这我在之前的博客OpenAI完胜DOTA世界冠军也有介绍。

       深度学习比较合适根据海量的数据推测数据之间规律和关联,而强化学习主要用于探索未知领域,所以由本次嫦娥五号要执行的登月任务来看,由于月球表面的数据匮乏,其使用深度学习的可能微乎其微,几乎可以肯定他是使用强化学习来完成登陆目标的。

     强化学习的原理

        强化学习的原理图是这样:

你可能感兴趣的:(python,AI与最新技术演进)