Hive中两大表连接,发生了数据倾斜,有一个reduce无法完成,检查发现...

发布于 2022-03-03 17:17:37

Hive中两大表连接,发生了数据倾斜,有一个reduce无法完成,检查发现t1中guid=''的记录有很多,其他guid都不重复,这条语句该怎样优化?
select t1.*
,nvl(t2.x,1)
from t1
left join t2
on t1.guid = t2.guid

关注者
0
被浏览
32
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看