我在学习深度学习时遇到了一个问题:在训练神经网络时,可能会遇到局部极小点问题,使得模型无法收敛。我知道有一些解决方法,比如在优化算法中增加随机性,比如使用随机梯度下降法,使得模型能够从局部最小点中跳出来。但是我希望能更加深入地了解这个问题以及解决方法,希望有经验...