采集工具(荷兰linux采集工具解析:拥有非常多的linux平台上线下兼容的浏览器插件功能)
优采云 发布时间: 2022-03-15 09:05采集工具(荷兰linux采集工具解析:拥有非常多的linux平台上线下兼容的浏览器插件功能)
采集工具解析:拥有非常多的linux平台上线下兼容的采集工具,大部分都具有浏览器插件功能,对于采集工具自己来说不需要做任何改变,
1、duckduckgo,/是一款由荷兰的kleejan2015年发布的一款http/https抓取工具,支持4大流行的网站类型:视频、图片、地图、音乐,无需注册,
2、kwfield,/,为网站进行http/https、websites整站抓取,其中http抓取,可以抓取*敏*感*词*的新闻等,https抓取,
3、fiddler,支持,整站抓取,配合squid/metasploit工具,
4、awesome-javascript,抓取*敏*感*词*网站进行单站抓取,可以爬取百度、谷歌搜索引擎的数据,目前github上已经有5000+star,可抓取谷歌自己的站点,然后上传github让其他人修改,
5、bigjpg,支持全球站点抓取,生成全球站点地图,抓取*敏*感*词*新闻网站,配合wget/jsoup/xpath工具一键实现。
6、51cto,采集多站点的网站热点信息,提供大量的*敏*感*词*网站地图,类似谷歌的热点图,可抓取百度、google搜索引擎的数据!本文由兴趣交流群社群友友提供,由内容社群友友提供,该工具只支持python3,python2.x需要另行获取!下载地址:采集可以直接使用这些免费工具使用即可。