Batch Normalization 为了解决深度网络训练时可能会出现的梯度消失、梯度爆炸或者,导致收敛速度变慢的 问题,使用批标准化的方法将每层的数据都规范到相同的均值和方差, 批标准化可以解决 internal convraiate shift,通过适当的使用较大的学习率,减少训练时间; 能够解决梯度消失和 爆炸的问题;还能够降低对参数的初始化影响。