spiders.py 文件源码

python
阅读 19 收藏 0 点赞 0 评论 0

项目:domain-discovery-crawler 作者: TeamHG-Memex 项目源码 文件源码
def start_requests(self):
        if not self.page_clf and self.settings.get(
                'QUEUE_MAX_RELEVANT_DOMAINS'):
            raise NotConfigured('Pass page_clf to spider')
        for request in super().start_requests():
            request.priority = self.initial_priority
            if self.queue is not None:
                self.queue.push(request)
            else:
                yield request
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号