hive 中四种排序的区别(sortby/orderby/distributedby/clusterby)

发布于 2022-09-21 08:59:24
关注者
0
被浏览
15
1 个回答
  • 匿名网友
    匿名网友 2022-09-21
    Order by 全局排序,只会过一个reduce, Sort by 局部排序,只保证相同reduce 中有序,全局无序 distributed by 其实不是排序,是分组划分,类似partition by 通常跟 sort by合用 用这个分组后,一个字段的相同值都会在一个reduce 里,但同一个reduce里可能会包含多个不同的字段值 cluster by 就是distributed by和sort by的整合,但是只能正序,不能指定排序规则
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看