def parse_lista_diputados(self, response):
# listado de diputados
diputados = response.xpath(
'//div[@class="listado_1"]/ul/li/a/@href').extract()
for diputado in diputados:
request = scrapy.Request(
response.urljoin(diputado),
callback=self.parse_diputado)
yield request
# proxima pagina
pagina_siguiente = response.xpath(
'//a[contains(., "Página Siguiente")]/@href').extract_first()
if pagina_siguiente:
request = scrapy.Request(
pagina_siguiente,
callback=self.parse_lista_diputados)
yield request
评论列表
文章目录