dataset.py 文件源码

python
阅读 23 收藏 0 点赞 0 评论 0

项目:vaelm 作者: TatsuyaShirakawa 项目源码 文件源码
def encode_and_pack(vocab, fin, fout, input_sepline=sepline):

    packer = msgpack.Packer()
    for line in fin:
        words = input_sepline(line)
        encoded = [vocab.sos_id]
        encoded.extend([vocab.get_id(word) for word in words])
        encoded.append(vocab.eos_id)
        fout.write(packer.pack(encoded))
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号