handle_html.py 文件源码

python

阅读 20 收藏 0 点赞 0 评论 0

项目：DIS_MeituanReptile 作者: myvary 项目源码文件源码

def downloader_html(self,url):
        '''
        :param url: ??????url
        :return  ???????,????????????0
        '''
        try:
            print url
            BAIDU_UA = 'Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)'#????UA
            headers = {'User-Agent': BAIDU_UA}  ##????????User-Agent ?UA?????????????????
            data = requests.get(url, headers=headers) ##??????????????????
            html_parser = HTMLParser.HTMLParser()
            data = html_parser.unescape(data.text)
            return data
        except:
            print '?????????',url
            return '0'

评论列表正在加载评论...

文章目录

提
问题

写
面经

写
文章

微信
公众号

扫码关注公众号