Spark Core快速入门系列(8) | HashPartitioner和RangePartitioner

£神魔★判官ぃ 2022-11-29 12:28 213阅读 0赞

HashPatitioner

  1. 1.默认分区器
  2. 2.聚合算子如果没有分区器就是默认分区器对shuffle后的rdd进行重新分区
  3. 缺点:
  4. 容易造成数据倾斜

RangePartitioner
sortByKey排序算子使用的RangePartitioner
在这里插入图片描述
看源码
在0分区
在这里插入图片描述
在3分区
在这里插入图片描述
在4分区
在这里插入图片描述

发表评论

表情:
评论列表 (有 0 条评论,213人围观)

还没有评论,来说两句吧...

相关阅读