Batch Normalization的目的是使我们的一批(Batch)feature map(特征矩阵 )满足均值为0,方差为1的分布规律。
常见的迁移学习方式: 1、载入权重后训练所有参数 2、载入权重后只训练最后几层参数 3、载入权重后在原网络基础上再添加一层全连接层,仅训练最后一个全连接层