test.py 文件源码

python
阅读 29 收藏 0 点赞 0 评论 0

项目:yjspider 作者: junyu1991 项目源码 文件源码
def handle_link(self):
        #ownload_url=self._r.hget(self.name,codes.url)
        a_link=[a.get('href') for a in self._soup.find_all('a') if a.get('href')]
        a_link=list(set(a_link))
        b_link=[]
        for a in a_link:
            a=urlparse.urldefrag(a)[0]
            if a.startswith('//jandan.net/ooxx') or a.startswith('//wx1.sinaimg.cn'):
                print("Putting %s " % (a))
                #self._r.lpush(download_url,a)
                b_link.append(a)
        self._add_link(b_link)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号