python实现q-learning算法

关于q-learning算法,可参照以下博客,我只是复现作者的算法,如有错误,请私信改正。

A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)_peghoty-CSDN博客

 

import numpy as np
import pandas as pd

class QL:
    def __init__(self, actions, gamma=0.8, e_greedy=0.9):
        self.actions = actions
        self.gamma = gamma
        self.e_greedy = e_greedy
        self.q_table = pd.DataFrame(columns=actions, dtype=np.float64)  #行为状态,列是动作,这里简化了,同时也是下一个状态

    def choose_action(self, state):
        self.check_state(state)
        if(np.random.uniform(0, 1)

你可能感兴趣的:(算法,python,机器学习)