base.py 文件源码

python
阅读 19 收藏 0 点赞 0 评论 0

项目:ahmia-crawler 作者: ahmia 项目源码 文件源码
def html2string(self, response):
        """HTML 2 string converter. Returns a string."""
        converter = html2text.HTML2Text()
        converter.ignore_links = True
        encoding = self.detect_encoding(response)
        decoded_html = response.body.decode(encoding, 'ignore')
        string = converter.handle(decoded_html)
        return string
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号