index_spider.py 文件源码-python代码片段

index_spider.py 文件源码

python

阅读 35 收藏 0 点赞 0 评论 0

项目：wechat-crawler 作者: DMGbupt 项目源码文件源码

def get_cookie(self,query):
        """
        @summary: ??cookie
        @param query: ?????????
        @return: ??cookie??
        """
        cookies={}
        i=0
        while True:
            cookie = cookielib.CookieJar()
            handler=urllib2.HTTPCookieProcessor(cookie)
            opener = urllib2.build_opener(handler)
            response = opener.open(self._search_url.format(query)) # ???????????????cookie
            for item in cookie:
                # ???????????cookie????SNUID?????????????
                # ???SNUID???cookie????cookie???????????
                if("SNUID" in item.name):
                    cookies[item.name]=item.value
                    return cookies
            if(i>3):
                # ????3???????????cookie????IP????????????cookie??????????
                spider_logger.error("Can't get cookies when searching {0} !".format(query))
                return cookies
            i=i+1
            time.sleep(10*random.expovariate(1)) # ?????????????????????????????