page_spider.py 文件源码

python

阅读 23 收藏 0 点赞 0 评论 0

项目：ScrapyTutorial 作者: boybeak 项目源码文件源码

def parse(self, response):
        content_info = response.css('div.contentinfo')
        symbol1 = u'?'
        symbol2 = u'?'

        rex = r'%s(.*)%s' % (symbol1, symbol2)
        logging.log(logging.INFO, "rex=" + rex)
        title = content_info.css('h1 a::text').re_first(rex)
        logging.log(logging.INFO, title)

评论列表正在加载评论...

文章目录

提
问题

写
面经

写
文章

微信
公众号

扫码关注公众号