feature_extractor.py 文件源码

python
阅读 26 收藏 0 点赞 0 评论 0

项目:CNKICrawler 作者: roliygu 项目源码 文件源码
def parse_item(item):
    """

    :param item: dictionary
    :return: void
    """

    def add_school_seq(t):
        t['school_seq'] = jieba.lcut_for_search(t['school'])

    def add_title_seq(t):
        t['title_seq'] = build_tf(t['title'])[1]

    def add_abstract_seq_and_tf(t):
        t['abstract_seq_tf'], t['abstract_seq'] = build_tf(t['abstract'])

    add_abstract_seq_and_tf(item)
    add_school_seq(item)
    add_title_seq(item)

    item['_id'] = str(item['_id'])

    return item
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号