在PySpark ML中创建自定义变压器

发布于 2021-01-29 19:36:15

我是Spark SQL
DataFrames和ML(PySpark)的新手。如何创建自定义令牌生成器,例如删除停用词并使用nltk中的某些库?我可以扩展默认值吗?

关注者
0
被浏览
95
1 个回答
知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看