text_utils.py 文件源码

python
阅读 25 收藏 0 点赞 0 评论 0

项目:document-qa 作者: allenai 项目源码 文件源码
def __init__(self, lower: bool = True, stemmer="port"):
        self.lower = lower
        self.stemmer = stemmer
        if stemmer == "port":
            self._stemmer = PorterStemmer()
            self._stem = self._stemmer.stem
        elif stemmer == "wordnet":
            self._stemmer = WordNetLemmatizer()
            self._stem = self._stemmer.lemmatize
        else:
            raise ValueError(stemmer)
        # stemming is slow, so we cache words as we go
        self.normalize_cache = {}
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号