updateidf.py 文件源码

python
阅读 25 收藏 0 点赞 0 评论 0

项目:HtmlExtract-Python 作者: xinyi-spark 项目源码 文件源码
def get_word_count(filename):
    data_source=open(filename,'r')
    data=data_source.read()
    if(data!=''):
        temp_result = jieba.cut(data,cut_all=True)
        temp_result = '/'.join(temp_result)
        word_result=temp_result.split('/')
        word_view={}#word_view[i]?????????????????i?
        for i in word_result:
            word_view[i]=0
            if(i not in word_doc):
                word_doc[i]=0
        for i in word_result:
            if(word_view[i]==0):
                word_view[i]=1;
                word_doc[i]=word_doc[i]+1
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号