def stem_str(sen):
sen = text.re.sub('[^a-zA-Z0-9]', ' ', sen)
sen = nltk.word_tokenize(sen.lower())
sen = map(snowball_stemmer.stem, sen)
sen = map(wordnet_lemmatizer.lemmatize, sen)
return (' '.join(sen)).lower()
generate_pattern_mining.py 文件源码
python
阅读 22
收藏 0
点赞 0
评论 0
评论列表
文章目录