diputados_scrapy.py 文件源码

python
阅读 19 收藏 0 点赞 0 评论 0

项目:scraping-python 作者: python-madrid 项目源码 文件源码
def parse_lista_diputados(self, response):
        # listado de diputados
        diputados = response.xpath(
            '//div[@class="listado_1"]/ul/li/a/@href').extract()
        for diputado in diputados:
            request = scrapy.Request(
                response.urljoin(diputado),
                callback=self.parse_diputado)
            yield request

        # proxima pagina
        pagina_siguiente = response.xpath(
            '//a[contains(., "Página Siguiente")]/@href').extract_first()
        if pagina_siguiente:
            request = scrapy.Request(
                pagina_siguiente,
                callback=self.parse_lista_diputados)
            yield request
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号