局部极小点

我在学习深度学习时遇到了一个问题：在训练神经网络时，可能会遇到局部极小点问题，使得模型无法收敛。我知道有一些解决方法，比如在优化算法中增加随机性，比如使用随机梯度下降法，使得模型能够从局部最小点中跳出来。但是我希望能更加深入地了解这个问题以及解决方法，希望有经验...