acceptability.py 文件源码

python
阅读 25 收藏 0 点赞 0 评论 0

项目:trf 作者: aistairc 项目源码 文件源码
def tokenize(sentences: List[str]) -> Tuple[List[int], List[List[str]]]:

    tokenizer = Tokenizer()
    lengths = []
    texts = []
    for s in sentences:
        result = tokenizer.tokenize(s)

        surfaces = [t.surface for t in result]
        lengths.append(len(surfaces))

        text = ' '.join(surfaces)
        texts.append(text)
    return lengths, texts
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号