小赵在测试spark的时候,写了如下的代码 do lines ...

发布于 2022-03-03 16:53:07

小赵在测试spark的时候,写了如下的代码
do

lines = sc.textFile("data.txt")

pairs = lines.map(lambda s: (s, 1))

counts = pairs.groupByKey(lambda a, b: a + b)

结果运行时等待了一段时间直接报错,data.txt文件较大,小赵对其进行抽样后结果如下:

data

apple

apple

apple

new

name

apple

apple

work

as

请分析报错的原因以及解决方案
关注者
0
被浏览
28
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看