middlewares.py 文件源码

python
阅读 16 收藏 0 点赞 0 评论 0

项目:scrapy_project 作者: zhanghe06 项目源码 文件源码
def process_request(self, request, spider):
        if not request.url:
            return None
        url_hash = hashlib.md5(request.url.encode("utf8")).hexdigest()
        if self.redis_client.sismember(spider.name, url_hash):
            raise IgnoreRequest("Spider : %s, IgnoreRequest : %s" % (spider.name, request.url))
        else:
            self.redis_client.sadd(spider.name, url_hash)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号