build_dictionary.py 文件源码

python
阅读 25 收藏 0 点赞 0 评论 0

项目:samnorsk 作者: gisleyt 项目源码 文件源码
def article_to_pairs(arg):
    article, direction = arg
    pairs = []

    if 'text' not in article:
        return []

    sents = sent_tokenize(article['text'], language='norwegian')
    translations = translate(sents, direction)

    for sent, trans in zip(sents, translations):
        trans_tokens = tokenize(trans)
        tokens = tokenize(sent)

        pairs += compare(tokens, trans_tokens)

    del article
    del sents
    del translations

    return pairs
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号