sentiment.py 文件源码

python
阅读 27 收藏 0 点赞 0 评论 0

项目:RottenCrawler 作者: kevin940726 项目源码 文件源码
def getAllCritics(movieList):
    reviews = np.array(map(lambda x: x["critics"], movieList))
    reviews = np.concatenate(reviews)

    tokenizeReview = []

    for review in reviews:
        s = review['review']
        s = RegexpTokenizer(r'\w+').tokenize(s.lower())
        s = map(lambda x: PorterStemmer().stem(x), s)
        s = filter(lambda x: x not in stopwords.words('english'), s)
        tokenizeReview.append((s, 'pos' if review["tomatometer"] == "fresh" else 'neg'))

    return tokenizeReview
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号