多选题

【单选】强化学习中,TD(lambda)算法中 lambda取值为1时等价...

发布于 2022-03-03 16:32:34

【单选】强化学习中,TD(lambda)算法中 lambda取值为1时等价于以下哪种模型

登录后免费查看答案
关注者
0
被浏览
34