spiders.py 文件源码

python

阅读 19 收藏 0 点赞 0 评论 0

项目：domain-discovery-crawler 作者: TeamHG-Memex 项目源码文件源码

def start_requests(self):
        if not self.page_clf and self.settings.get(
                'QUEUE_MAX_RELEVANT_DOMAINS'):
            raise NotConfigured('Pass page_clf to spider')
        for request in super().start_requests():
            request.priority = self.initial_priority
            if self.queue is not None:
                self.queue.push(request)
            else:
                yield request

评论列表正在加载评论...

文章目录

提
问题

写
面经

写
文章

微信
公众号

扫码关注公众号