TA Star 的仓库 - penglo (penglo)

TA Star 的仓库 (35)

Star DTC2/ECommerceCrawlers

Python

实战多种网站、电商数据爬虫。包含：淘宝商品、微信公众号、大众点评、闲鱼、阿里任务、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家️️️

最近更新: 4年前

项目代号：土拨鼠（tubo）万维网网络机器人,又称蜘蛛,爬虫,原理主要是通过构造符合HTTP协议的网络数据包,向指定主机请求资源,获取返回的数据.万维网有大量的公开信息,人力采集数据费时费力,故激发了爬虫的产业化. 批量获取公开网络数据并不违反,但由于无差别性,无节制,十分暴力的手段会导致对方服务的不稳定,因此,大部分资源提供商对数据包进行了某些过滤,在此背景下,小批量数据获取成为了难题. 综合各种需求，如各种API对接,自动化测试等原理均一样，故开发了此爬虫库. 土拨鼠爬虫库是一个人类友好姿势的代码库,开发采用面向对象的方式,易于理解.通过对Golang原生HTTP库的封装,帮用户处理了一些琐碎逻辑(如收集信息,检测参数),并加入了一些容错机制(如加锁,及时关闭流),保证了爬虫高并发的安全. 此库提供了大量优美的API接口,复用率高,十分方便地支持Cookie接力,爬虫代理设置,以及一般的HTTP请求设置如头部设置,超时,暂停设置,数据设置等,支持全部的HTTP方法如POST/PUT/GET/DELETE等,内置爬虫池和浏览器UA池,易于开发多UA多Cookie分布式爬虫. 此外,还提供第三方存储库,支持mysql/postgresql/redis/cassandra/hbase等.该库简单实用,短短几行代码即可取代以往杂乱无章的面包条代码片段,已经应用在某些大项目中:如大型亚马逊分布式爬虫(美国/日本/德国/英国),经受住两千代理IP超长时间高并发的考验,单台机器每天获取上百万数据. 该库主要用途：微信开发/API对接/自动化测试/抢票脚本/网站监控/点赞插件/数据爬取

最近更新: 4年前

Star 猕花桃/微同商城
暂停

Java
forked from 微同软件/微同商城

减少重复造轮子，开源微信小程序商城。快速搭建一个属于自己的微信小程序商城。QQ交流群：66502035、870579539、151602347欢迎大家进群交流技术。

1
1
7184

最近更新: 接近5年前

Star ColdCurlyFu/百度图片下载筛选器python-tkinter

Python

基于Python的百度图片批量下载,具有筛选功能,采用多线程下载.

最近更新: 接近7年前

TA Star 的仓库 (35)

Star lnn_/AI小程序

JavaScript

Star DTC2/ECommerceCrawlers

Python

Star Gitee 极速下载/gospider

Star 猕花桃/微同商城
暂停

Java
forked from 微同软件/微同商城

Star ColdCurlyFu/百度图片下载筛选器python-tkinter

Python

TA Star 的仓库 (35)

Star lnn_/AI小程序 JavaScript

Star DTC2/ECommerceCrawlers Python

Star Gitee 极速下载/gospider

Star 猕花桃/微同商城暂停 Java forked from 微同软件/微同商城

Star ColdCurlyFu/百度图片下载筛选器python-tkinter Python

Star lnn_/AI小程序

JavaScript

Star DTC2/ECommerceCrawlers

Python

Star 猕花桃/微同商城
暂停

Java
forked from 微同软件/微同商城

Star ColdCurlyFu/百度图片下载筛选器python-tkinter

Python