dqn_agent_nature.py 文件源码

python
阅读 26 收藏 0 点赞 0 评论 0

项目:stock_dqn 作者: wdy06 项目源码 文件源码
def agent_start(self, observation):


        # Initialize State
        self.state = observation
        state_ = cuda.to_gpu(np.asanyarray(self.state, dtype=np.float32),self.gpu_id)

        # Generate an Action e-greedy
        action, Q_now = self.DQN.e_greedy(state_, self.epsilon)

        # Update for next step
        self.lastAction = action
        self.last_state = self.state.copy()
        self.last_observation = observation.copy()
        self.max_Q_list.append(np.max(Q_now.get()))

        return action
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号