1.hadoop与spark存在的差异
Hadoop 的计算处理,需要在中间步骤将临时结果持久化到磁盘中;
而Spark 则是在内存足够情况下,主动将临时结果保存与内存中,以提高计算性能。
所以他们的差异在于数据计算时注意依赖I/O还是内存。
2.MYSQL中创建的表默认分区规则
MySQL实例中创建的表默认分区规则是存在主键或手工指定分区规则的表为分区表,否则为非分区表。
3.ReplSize数值的设置
为了防止某个节点突然故障,导致数据库完全不可用,可以将 ReplSize 设为 -1,指的是写所有的活跃节点。例如,复制组有三副本,某个备节点因为磁盘不足而异常停止,ReplSize 为 -1 时,写操作会写入另外 2 个非故障节点后才返回。。