spider_dingdian.py 文件源码

python
阅读 20 收藏 0 点赞 0 评论 0

项目:crawler 作者: fst034356 项目源码 文件源码
def parse(self, response):

        max_num = BeautifulSoup(response.text, 'lxml').find(
            'div', class_='pagelink').find_all('a')[-1].get_text()
        baseurl = str(response.url)[:27]
        for num in range(1, int(max_num) + 1):
            if baseurl == 'http://www.23us.com/quanben':
                url = baseurl + '/' + str(num)
            else:
                url = baseurl + '_' + str(num) + self.end_Url
            yield Request(url, callback=self.get_name)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号