policies.py 文件源码

python
阅读 37 收藏 0 点赞 0 评论 0

项目:drl.pth 作者: seba-1511 项目源码 文件源码
def __init__(self, model, action_size=1, init_value=0.0, *args, **kwargs):
        super(DiagonalGaussianPolicy, self).__init__(model, *args, **kwargs)
        self.init_value = init_value
        self.logstd = th.zeros((1, action_size)) + self.init_value
        self.logstd = P(self.logstd)
        self.halflog2pie = V(T([2 * pi * exp(1)])) * 0.5
        self.halflog2pi = V(T([2.0 * pi])) * 0.5
        self.pi = V(T([pi]))
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号