handle_html.py 文件源码

python
阅读 20 收藏 0 点赞 0 评论 0

项目:DIS_MeituanReptile 作者: myvary 项目源码 文件源码
def downloader_html(self,url):
        '''
        :param url: ??????url
        :return  ???????,????????????0
        '''
        try:
            print url
            BAIDU_UA = 'Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)'#????UA
            headers = {'User-Agent': BAIDU_UA}  ##????????User-Agent ?UA?????????????????
            data = requests.get(url, headers=headers) ##??????????????????
            html_parser = HTMLParser.HTMLParser()
            data = html_parser.unescape(data.text)
            return data
        except:
            print '?????????',url
            return '0'
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号