基于python3.6的微博爬虫(scrapy)
基于python3.6的微博爬虫(scrapy)
Python Web爬虫
共12Star
详细介绍
WeiboWebSpider
一个爬取微博WAP端的程序,通过关注列表收集个人、每一条微博的信息。
运行环境:
- python 3.6 安装方法
- MongoDB,PhantomJS
- 相关第三方库:Scrapy以及相关依赖库,Pymongo,Selenium等
简介
- 用 selenium+PhantomJS 模拟登录weibo.cn,获取cookies
- scrapy 爬取新浪微博个人信息、微博信息
- 保存到MongoDB
- 验证码处理:检测到验证码自动弹出窗口,手动输入即可
为了防止账号被封,微博账号是淘宝买的,花了1块大洋,最后发现是直接封IP的。。。。
使用方法
-
3042 Star
-
3 Star
-
9 Star
-
4 Star
-
215 Star
-
2416 Star
-
3 Star
-
0 Star