pypdfocr_pdffiler.py 文件源码

python
阅读 19 收藏 0 点赞 0 评论 0

项目:pdf_liberty 作者: mplitnikas 项目源码 文件源码
def iter_pdf_page_text(self, filename):
        self.filename = filename
        reader = PdfFileReader(filename)
        logging.info("pdf scanner found %d pages in %s" % (reader.getNumPages(), filename))
        for pgnum in range(reader.getNumPages()):
            text = reader.getPage(pgnum).extractText()
            text = text.encode('ascii', 'ignore')
            text = text.replace('\n', ' ')
            yield text
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号