def stem_str(sen):
sen = text.re.sub('[^a-zA-Z0-9]', ' ', sen)
sen = nltk.word_tokenize(sen.lower())
sen = map(snowball_stemmer.stem, sen)
sen = map(wordnet_lemmatizer.lemmatize, sen)
return (' '.join(sen)).lower()
评论列表
文章目录