rdd分布式弹性数据集,简单的理解成一种数据结构,是spark框架上的通用货币。 所有算子都是基于rdd来执行的,不同的场景会有不同的rdd实现类,但是都可以进行互相转换。 rdd执行过程中会形成dag图,然后形成lineage保证容错性等。 从物理的角度来看rdd存储的是block和node之间的映射。
面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦
提 问题
写 面经
写 文章
微信 公众号
回到 顶部
没有帐户? 立即注册
已有帐号?立即登录