twenty_news_group.py 文件源码

python
阅读 27 收藏 0 点赞 0 评论 0

项目:DataScience-And-MachineLearning-Handbook-For-Coders 作者: wxyyxc1992 项目源码 文件源码
def extract_feature(self):
        """
        ???????????
        """

        # ?????????-???
        self.train_dtm = self.count_vect.fit_transform(self.data['train'].data)

        # ????? TF ??

        tf_transformer = TfidfTransformer(use_idf=False)

        self.train_tf = tf_transformer.transform(self.train_dtm)

        # ????? TF-IDF ??

        tfidf_transformer = TfidfTransformer().fit(self.train_dtm)

        self.train_tfidf = tf_transformer.transform(self.train_dtm)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号