vectorization.py 文件源码

python
阅读 22 收藏 0 点赞 0 评论 0

项目:atap 作者: foxbook 项目源码 文件源码
def sklearn_one_hot_vectorize(corpus):
    # The Sklearn one hot vectorize method

    from sklearn.feature_extraction.text import CountVectorizer
    from sklearn.preprocessing import Binarizer

    freq    = CountVectorizer()
    vectors = freq.fit_transform(corpus)

    print(len(vectors.toarray()[0]))

    onehot  = Binarizer()
    vectors = onehot.fit_transform(vectors.toarray())

    print(len(vectors[0]))
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号