Spider.py 文件源码

python
阅读 36 收藏 0 点赞 0 评论 0

项目:gfw_domain_whitelist_spider 作者: R0uter 项目源码 文件源码
def __getPage(self,url):
        http = urllib3.PoolManager(
            cert_reqs='CERT_REQUIRED',  # Force certificate check.
            ca_certs=certifi.where(),  # Path to the Certifi bundle.
        )
        data = ''
        try:
            data = http.request('GET', url, timeout=10,
                                headers={
                                    'User-agent' : 'Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5'}
                                ).data

            codeType = chardet.detect(data)
            data = data.decode(codeType['encoding'])
        except:
            pass

        return data
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号