article_title.py 文件源码

python
阅读 22 收藏 0 点赞 0 评论 0

项目:repeat-aft 作者: ripeta 项目源码 文件源码
def extract(text, paper=None, logger=logger):

    # try using pypdf2/pdfminer
    try:
        pdf = paper._read_document()
        pdfReader = PdfFileReader(pdf)
        title = pdfReader.getDocumentInfo().title
        value_text, value_result = title, title
        source_type = "extracted"
        source_detail = "pdf metadata"
        if title:
            return (value_text, value_result, source_type, source_detail)
        else:
            return None
    except:
        # search for title or return None
        # Though currently there is no search function
        return None
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号