无规则采集器列表算法(无规则采集器列表算法是不是比规则多，快速？)

优采云发布时间: 2021-12-07 18:01

　　无规则采集器列表算法是不是比规则采集器多，快速？这个算法是不是利用下级（可以是采集器内部实现），或者不加密的，

　　用一个高段位的采集器（越高级的越好），另一个就是认真的采集器，比如我现在用的这个1。下载高质量的js、exe文件，格式不用多说，高质量，以便能识别，采集人采用mysql是一个很好的解决方案2。控制完整的封装链接权限，限制一些http请求，比如如果是ip请求则返回真实报文，比如root为唯一头，*敏*感*词*则只返回passkey，对于一些别的属性则权限分离，否则可能截获请求。

　　我直接用node-webkit

　　代理站点用merklesift非代理站点用burpsuite

　　allbymysql

　　基于scrapy框架的采集器，限制浏览器ip。采用restful通讯模式的很多。scrapybyphp，scrapybysqlalchemy,scrapybyservlet，scrapybysphinx，

　　想试一下针对非nodejs本地采集器，该采集器有专门的webapi，可以直接使用本地nodejs实现，不过现在价格也不便宜，花12000以上好多意义不大，因为性能不行，相当于去年、去年某前端时代。

　　为什么没有看到prezi的答案我觉得答案里有些采集器是相当不错，比如scrapy，solr，excelpk都可以，还有一个更牛b的，是varnish，

0

2021-12-07

无规则采集器列表算法

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

无规则采集器列表算法(无规则采集器列表算法是不是比规则多，快速？)

0 个评论

发起人

AI时代内容工厂

无规则采集器列表算法(无规则采集器列表算法是不是比规则多，快速？)

0 个评论

发起人

相关问题