带动量的随机梯度(MomentumSGD)下降法常用于加速优化损失函数,在...
发布于 2022-03-03 16:09:58
带动量的随机梯度(Momentum SGD)下降法常用于加速优化损失函数,在图像分类等问题中应用广泛。假定损失函数为J(θ),那么带动量的随机梯度下降的对θ更新正确表达是,
登录后免费查看答案
关注者
0
被浏览
26