hdfs dfs -mkdir /zwj25 hdfs dfs -ls /
访问 http://[IP]:50070
hdfs dfs -put file.txt /zwj25
var hdfsrdd=sc.textFile("/zwj25/file.txt") hdfsrdd.collect hdfsrdd.partitions hdfsrdd.partitions.size
sc.defaultMinPartitions=min(sc.defaultParallelism,2)
rdd分区数=max(hdfs文件的block数目,sc.defaultMinPartitions)