def wrap_dqn(env, history_len=4, action_repeat=4, no_op_max=30):
"""
DQN???????????
Parameters
----------
env: gym.envs
gym???
history_len: int
????????????????????
action_repeat: int
1????????????????????????
no_op_max: int
?????????????????????????????
??????????
Returns
----------
env: gym.wrappers.time_limit.TimeLimit
gym.env????????
"""
env = EpisodicLifeEnv(env)
env = NoOpResetEnv(env, no_op_max)
env = MaxAndSkipEnv(env, action_repeat)
if 'FIRE' in env.unwrapped.get_action_meanings():
env = FireResetEnv(env)
env = ProcessFrame84(env)
env = FrameStack(env, history_len)
env = ClippedRewardsWrapper(env)
env = ScaledFloatFrame(env)
return env
评论列表
文章目录