采集工具(荷兰linux采集工具解析:拥有非常多的linux平台上线下兼容的浏览器插件功能)

优采云 发布时间: 2022-03-15 09:05

  采集工具(荷兰linux采集工具解析:拥有非常多的linux平台上线下兼容的浏览器插件功能)

  采集工具解析:拥有非常多的linux平台上线下兼容的采集工具,大部分都具有浏览器插件功能,对于采集工具自己来说不需要做任何改变,

  1、duckduckgo,/是一款由荷兰的kleejan2015年发布的一款http/https抓取工具,支持4大流行的网站类型:视频、图片、地图、音乐,无需注册,

  2、kwfield,/,为网站进行http/https、websites整站抓取,其中http抓取,可以抓取*敏*感*词*的新闻等,https抓取,

  3、fiddler,支持,整站抓取,配合squid/metasploit工具,

  4、awesome-javascript,抓取*敏*感*词*网站进行单站抓取,可以爬取百度、谷歌搜索引擎的数据,目前github上已经有5000+star,可抓取谷歌自己的站点,然后上传github让其他人修改,

  5、bigjpg,支持全球站点抓取,生成全球站点地图,抓取*敏*感*词*新闻网站,配合wget/jsoup/xpath工具一键实现。

  6、51cto,采集多站点的网站热点信息,提供大量的*敏*感*词*网站地图,类似谷歌的热点图,可抓取百度、google搜索引擎的数据!本文由兴趣交流群社群友友提供,由内容社群友友提供,该工具只支持python3,python2.x需要另行获取!下载地址:采集可以直接使用这些免费工具使用即可。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线