强化学习中,TD(lambda)算法中 lambda取值为1时等价于以下哪种模型
发布于 2022-03-03 16:34:31
【单选】强化学习中,TD(lambda)算法中 lambda取值为1时等价于以下哪种模型
登录后免费查看答案
关注者
0
被浏览
21