indexer.py 文件源码

python
阅读 31 收藏 0 点赞 0 评论 0

项目:Search-Engine 作者: SoufianEly 项目源码 文件源码
def create_index_from_dir(stored_docs_dir,index_dir):
    indexer = Indexer()
    for filename in os.listdir(stored_docs_dir):
        opened_file = open(os.path.join(stored_docs_dir,filename))
        doc_raw = html_to_text(opened_file.read())
        parsed_doc = to_doc_terms(doc_raw)
        indexer.add_document(b16decode(filename),parsed_doc)

    indexer.store_on_desk(index_dir)
评论列表


问题


面经


文章

微信
公众号

扫码关注公众号