小赵在测试spark的时候，写了如下的代码 do lines ...

发布于 2022-03-03 16:53:07

小赵在测试spark的时候，写了如下的代码

lines = sc.textFile("data.txt")

pairs = lines.map(lambda s: (s, 1))

counts = pairs.groupByKey(lambda a, b: a + b)

结果运行时等待了一段时间直接报错，data.txt文件较大，小赵对其进行抽样后结果如下：

data

apple

new

name

apple

work

请分析报错的原因以及解决方案

关注者

被浏览

1 个回答

相关试卷

知识点

面圈网VIP题库全新上线，海量真题题库资源。 90大类考试，超10万份考试真题开放下载啦