url.py 文件源码

python
阅读 33 收藏 0 点赞 0 评论 0

项目:web-search-engine 作者: AnthonySigogne 项目源码 文件源码
def detect_language(html) :
    """
    Detect the language of the text content of a page.
    """
    # handle string, need bytes
    try :
        html = html.decode("utf8")
    except :
        try :
            html = html.decode("latin1")
        except :
            pass
    h = html2text.HTML2Text()
    return langdetect.detect(h.handle(html))
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号