page_spider.py 文件源码

python
阅读 23 收藏 0 点赞 0 评论 0

项目:ScrapyTutorial 作者: boybeak 项目源码 文件源码
def parse(self, response):
        content_info = response.css('div.contentinfo')
        symbol1 = u'?'
        symbol2 = u'?'

        rex = r'%s(.*)%s' % (symbol1, symbol2)
        logging.log(logging.INFO, "rex=" + rex)
        title = content_info.css('h1 a::text').re_first(rex)
        logging.log(logging.INFO, title)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号