InverseIndex.py 文件源码

python
阅读 24 收藏 0 点赞 0 评论 0

项目:NewsSpider 作者: lzjqsdd 项目源码 文件源码
def loadDataFromCutFile(self,totalnum):
        doc = []
        cut = Cut()
        for i in range(1,totalnum):
            line = cut.getRow(i,Global.cutnews_dir,Global.filesize)
            if not line:
                break
            data = json.loads(line)
            keyword = analyse.extract_tags(data['content'],topK=20)
            seg = " ".join(keyword)
            print seg
            doc.append(seg)
        return doc


    #calculate tf-idf
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号