当 datanode 上新写完一个块,默认会立即汇报给 namenode。在一个大规模 Hadoop 集群上,每时每刻都在写数据,datanode 上随时都会有写完数据块然后汇报给 namenode 的情况。因此 namenode 会频繁处理 datanode 这种快汇报请求,会频繁地持有锁,其实非常影响其他 rpc 的处理和响应时间。
通过延迟快汇报配置可以减少 datanode 写完块后的块汇报次数,提高namenode 处理 rpc 的响应时间和处理速度。
dfs.blockreport.incremental.intervalMsec
300