def process_item(self, item, spider):
try:
data = {
'url': item['url'],
'file_name': item['file_name'],
'media_type': item['media_type'],
'host': item['host'],
'file_dir': item['file_dir'],
'download': item['download'],
'extract': item['extract'],
'info': item['info'],
'stack': item['stack'],
'media_urls': item['media_urls'],
}
self.col.update({'url': item['url']}, data, upsert=True)
# self.col.update({'url': item['url']}, {'$set': {'info': item['info']}})
# self.col.insert(data)
except Exception, err:
logging.error(str(err))
raise DropItem(str(err))
return item
评论列表
文章目录