def _transform(self, dataset):
opinion_stemm = SnowballStemmer('english')
udfStemmer = udf(lambda tokens: [opinion_stemm.stem(word) for word in tokens], ArrayType(StringType()))
inCol = self.getInputCol()
outCol = self.getOutputCol()
return dataset.withColumn(outCol, udfStemmer(inCol))
ml_transformer.py 文件源码
python
阅读 20
收藏 0
点赞 0
评论 0
评论列表
文章目录