国内常用的采集器优缺点

优采云 发布时间: 2020-08-11 20:02

  优采云云采集引擎

  可能大部分人还不知道,这是我自主研制的,以前仍然用爬虫写程序,java、python等,后面认为很麻烦,就摆弄着要做的简单一些,然后就无法收手了,最近仍然在进行产品迭代。

  优点:功能聚合性强、速度快、saas构架、数据可预览、数据规则市场、api等多种输出方法、免费。自动高效防屏蔽全球海量实时高匿IP手动切换,高效分布式节点策略无须代码轻松配置快速获取数据,实时手动更新数据精准完整获取目标数据,无缝对接自有系统支持多种CMS系统手动发布。

  真正的云采集引擎,任何网站都可以采集,任何人都可以使用,海量数据市场。

  缺点:知名度还比较低

  ET工具

  优点:无人值守,自动更新,适合常年做站,用户群主要集中在常年做站潜水站长。软件清晰,必备功能也挺齐全,关键是软件免费,听说早已降低采集中英文翻译功能。

  技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易

  缺点:对峰会和CMS的支持通常

  三人行

  主要针对峰会的采集,功能比较健全

  优点:还是针对峰会,适合开峰会的

  技术:收费技术,免费有广告

  缺点:超级复杂,上手难,对cms支持比较差

  优采云

  优采云应该是国外采集软件最成功的典型之一,使用人数包括收费用户数目上应当是最多的

  优点:功能比较齐全,采集速度比较快,主要针对cms,短时间可以采集很多,过滤,替换都不错,比较详尽;

  技术:技术主要是峰会支持,帮助文件多,上手容易。有收费、免费版本

  缺点:功能复杂,软件越来越大,比较占用显存和CPU资源,大批量采集速度不行,资源回收控制得不好,受CS构架限制

  海纳

  优点:海量,可以抓取网站很多一个关键词文章,似乎适合做网站的专题,特别是文章类、博客类

  技术:无论坛 收费,免费有功能限制

  缺点:分类不便捷,也就说采集文章归类不便捷,要自动(自动容易混淆),特定插口,采集的内容有限

  优采云

  优点:非常适宜采集discuz峰会

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线