多线程知乎用户爬虫,基于python3
分布式微博爬虫。抓取内容包括微博用户资料、微博信息、评论信息和转发信息。目前专注于微博数据抓取本身,正在快速迭代。如果觉得有帮助,不妨到github上给我点个star,osc上可能不会再继续更新了
《Web Scraping with Python》用python写网络爬虫一书的源代码。
一个scrapy爬虫项目,用来进行学习爬虫,提交到开源中国 是为了顺便学习git。