TopicDet.py 文件源码

python
阅读 19 收藏 0 点赞 0 评论 0

项目:Data-Mining-From-Twitter 作者: N1h1l1sT 项目源码 文件源码
def get_frequency_table(titles, vocab):
    tokenizer = RegexpTokenizer(r'\w+')
    freqtable = np.ndarray(shape=(len(titles),len(vocab)), dtype=int, order='C')
    freqtable.fill(0)
    for i in range(0,len(titles)):
        raw = titles[i].lower()
        tokens = tokenizer.tokenize(raw)
        for token in tokens:
            index = vocab[token]
            freqtable[i][index] +=1
    return freqtable
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号