batch batch-size - 为之网

C/C++教程

batch batch-size

本文主要是介绍batch batch-size，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

什么是batch,batch-size
深度学习训练过程本身是就是求损失函数的最小值。这一过程一般通过梯度下降来实现。如果训练一个epoch，遍历所有训练集，计算一次loss，反向传播一次，梯度也下降一次。如果把训练集切割成一些小的训练集，，每次遍历完一个小的训练集，就计算一次loss，反向传播一次，梯度下降一次，那么一个epoch中就可以实现多次梯度下降，从而能够加快训练的收敛速度。这个小的训练集就是一个batch，每个batch的大小就是batch-size。
batch-size大小对训练过程有什么影响
极端的例子，如果batch-size是整个训练集，那么每个epoch需要遍历所有的数据，导致占用的显存大，且收敛的速度慢。如果batch-size为1，那么相邻两次迭代权重梯度可能差异大，会导致梯度振荡，不容易收敛。所以一般batch-size取中间数，通常为64的倍数或因子。

还有说batch-size太大，可能会使得相邻两次迭代的数据分布相似，梯度差异小，从而使loss陷入局部最小值。

batch-size

这篇关于batch batch-size的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯