Hadoop

简单说一下hadoop和spark的shuffle过程

发布于 2020-01-10 22:27:09

关注者

被浏览

1621

1 个回答

面试哥 2020-01-10

为面试而生，有面试问题，就找面试哥。

hadoop：map端保存分片数据，通过网络收集到reduce端 spark：spark的shuffle是在DAGSchedular划分Stage的时候产生的，TaskSchedule要分发Stage到各个worker的executor
减少shuffle可以提高性能

知识点

面圈网VIP题库全新上线，海量真题题库资源。 90大类考试，超10万份考试真题开放下载啦