在当下比较流行的分布式数据处理平台&nbspSpark 中,有一些常用的...
发布于 2022-03-03 17:35:56
在当下比较流行的分布式数据处理平台 Spark 中,有一些常用的高阶算子,比如说 flatMap, filter, groupByKey等等;它们中的某些算子会触发shuffle操作,所谓shuffle,粗略的可以理解为要处理的数据集的内部分区需要进行重排,而不是原地计算。下面哪个算子会引起shuffle? ()
登录后免费查看答案
关注者
0
被浏览
33