在pyspark中按行串联字符串
发布于 2021-01-29 18:25:34
我有一个pyspark数据框为
DOCTOR | PATIENT
JOHN | SAM
JOHN | PETER
JOHN | ROBIN
BEN | ROSE
BEN | GRAY
并且需要按行连接患者姓名,以便获得如下输出:
DOCTOR | PATIENT
JOHN | SAM, PETER, ROBIN
BEN | ROSE, GRAY
有人可以帮我有关在pyspark中创建此数据框吗?
提前致谢。
关注者
0
被浏览
47
1 个回答