pipelines.py 文件源码

python
阅读 21 收藏 0 点赞 0 评论 0

项目:web_crawler 作者: NearXdu 项目源码 文件源码
def process_item(self, item, spider):
        if redis_db.hexists(redis_data_dict, item['link']):
            raise DropItem("Duplicate item found: %s" % item)
        else:
#            print item['link']

            cur=self.conn.cursor()
            add_url = """insert into sohuurl(url) VALUES (%s)"""
            data_url=(str(item['link']),)
            cur.execute(add_url,data_url)
            self.conn.commit()
            cur.close()
            return item
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号