crawlkeywords.py 文件源码

python
阅读 19 收藏 0 点赞 0 评论 0

项目:crawllagou 作者: ScarecrowFu 项目源码 文件源码
def parse(self,response):
        sel = Selector(response)
        keys = sel.xpath('//*[@class="menu_main job_hopping"]/h2/text()').extract()
        i = 1
        item = defaultdict(list)
        for key in keys:
            if key.strip() != '':
                print "test"
                print key.strip()
                try:
                    print i
                    item[key.strip()].append(sel.xpath('//*[@class="menu_box"][{}]/div[2]/dl/dd/a/text()'.format(i)).extract())
                    i = i + 1
                    # item["key"].append(key)
                except Exception, e:
                    print e
            else:
                continue
        yield item
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号