每张图片都会随机裁剪出10个crop出来,把这10个crop当作10张不同的图片喂到模型里面,再把10张不同图片的预测结果做整合来输出最终的 模型对于这张图片的预测结果。 可以提升准确率。(挺耗时的) 相当于做了一个投票。