train_doc2vec.py 文件源码

python
阅读 21 收藏 0 点赞 0 评论 0

项目:hh-page-classifier 作者: TeamHG-Memex 项目源码 文件源码
def train(input_jlgz, *, size, limit, min_df, max_features):
    print('FAST_VERSION', FAST_VERSION)
    documents = Documents(input_jlgz, limit=limit)
    model = Doc2Vec(
        documents=documents,
        size=size,
        min_count=min_df,
        max_vocab_size=max_features,
        workers=multiprocessing.cpu_count(),
        sample=1e-5,
    )
    return model
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号