dqn_agent_nature.py 文件源码

python

阅读 30 收藏 0 点赞 0 评论 0

项目：stock_dqn 作者: wdy06 项目源码文件源码

def agent_start(self, observation):


        # Initialize State
        self.state = observation
        state_ = cuda.to_gpu(np.asanyarray(self.state, dtype=np.float32),self.gpu_id)

        # Generate an Action e-greedy
        action, Q_now = self.DQN.e_greedy(state_, self.epsilon)

        # Update for next step
        self.lastAction = action
        self.last_state = self.state.copy()
        self.last_observation = observation.copy()
        self.max_Q_list.append(np.max(Q_now.get()))

        return action

评论列表正在加载评论...

文章目录

提
问题

写
面经

写
文章

微信
公众号

扫码关注公众号