middlewares.py 文件源码

python
阅读 17 收藏 0 点赞 0 评论 0

项目:freshonions-torscraper 作者: dirtyfilthy 项目源码 文件源码
def process_request(self, request, spider):

        parsed_url = urlparse.urlparse(request.url)
        host = parsed_url.hostname
        if self.counter[host] < self.max_pages:
            self.counter[host] += 1
            spider.logger.info('Page count is %d for %s' % (self.counter[host], host))
            return None                   
        else:
            raise IgnoreRequest('MAX_PAGES_PER_DOMAIN reached, filtered %s' % request.url)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号