guangdong_spider.py 文件源码-python代码片段

guangdong_spider.py 文件源码

python

阅读 24 收藏 0 点赞 0 评论 0

项目：xspider 作者: zym1115718204 项目源码文件源码

def start_downloader(self, url, args):
        """
        Start Downloader
        """
        resp = Response()
        if url.find(u'?args=') > -1:
            real_url, search_word = url.split('?args=')
            search_word = unicode(unquote(search_word))
            print 'url: ', real_url
            print 'search_word: ', search_word
            c = IndustryAndCommerceGeetestCrack(
                url=real_url,
                search_text=search_word,
                input_id="content",
                search_element_id="search",
                gt_element_class_name="gt_box",
                gt_slider_knob_name="gt_slider_knob",
                result_numbers_xpath='/html/body/div[1]/div[6]/div[1]/span',
                result_list_verify_class='clickStyle')
            result, cookies = c.crack()
            current_url = real_url
            body = result.encode('utf-8') if result else u'<html>??????</html>'.encode('utf-8')
            # resp.status_code = 200
            resp._content = body
            resp.url = real_url
            resp.doc = PyQuery(body)
            return resp
        else:
            resp = self.download(url, args=args)
            return resp