多选题

强化学习中,TD(lambda)算法中 lambda取值为1时等价于以下哪种模型

发布于 2022-03-03 16:34:31

【单选】强化学习中,TD(lambda)算法中 lambda取值为1时等价于以下哪种模型

登录后免费查看答案
关注者
0
被浏览
21
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看