Linux中的Python OCR模块?

发布于 2021-01-29 15:07:06

我想在linux中找到一个易于使用的OCR python模块,我发现pytesser
http://code.google.com/p/pytesser/,但是它包含一个.exe可执行文件。

我尝试过更改代码以使用wine,它确实有效,但是它太慢了,真的不是一个好主意。

有没有像它一样易于使用的Linux替代品?

关注者
0
被浏览
85
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    您可以只包装tesseract一个函数:

    import os
    import tempfile
    import subprocess
    
    def ocr(path):
        temp = tempfile.NamedTemporaryFile(delete=False)
    
        process = subprocess.Popen(['tesseract', path, temp.name], stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
        process.communicate()
    
        with open(temp.name + '.txt', 'r') as handle:
            contents = handle.read()
    
        os.remove(temp.name + '.txt')
        os.remove(temp.name)
    
        return contents
    

    如果您希望文档分割和更多高级功能,请尝试OCRopus



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看