huawei_spider.py 文件源码

python

阅读 18 收藏 0 点赞 0 评论 0

项目：MonkeyKing_crawler_recommender 作者: BitTigerInst 项目源码文件源码

def parse(self, response):
    page = Selector(response)

    hrefs = page.xpath('//h4[@class="title"]/a/@href')

    for href in hrefs:
      url = href.extract()
      yield scrapy.Request(url, callback=self.parse_item)

    div = page.xpath('//div[@class="page-ctrl ctrl-app"]')
    hrefs = div.xpath('.//a/@href').extract()

    for href in hrefs:
      url = response.urljoin(href)
      print url
      # yield scrapy.Request(url, self.parse, meta={
      #   'splash': {
      #     'endpoint': 'render.html',
      #     'args': {'wait': 0.5}
      #   }
      # })

评论列表正在加载评论...

文章目录

提
问题

写
面经

写
文章

微信
公众号

扫码关注公众号