[易语言软件开源] 速度秒掉优采云采集,强大的文章采集软件,自定义规则

优采云 发布时间: 2020-08-04 07:01

  因为我在研究伪原创文章方面的技术,所以仍然想着开发个采集快点的采集器,优采云不用说了。太慢,而且好多方面没有自己想要的,比如一个匹配规则匹配到的文本为空时如何办? 我想要的是手动启用下一条匹配规则,更重要的是采集速度问题,采集一个栏目,编辑规则到采集网址 到采集标题内容更是很慢。

  之前开源过一次,不过都是最快速的开发没有考虑太多扩展性,这次直接解决这个问题,软件支持采集规则导出导入。现在简单图文介绍下解释:

  软件仅使用了精易模板3.56版本,我就不打包了,软件100%原创

  解释:开始地址 每行一个,软件会手动分割每一行,如有”(*)“标示都会手动替换成序号,如果没有只采集一页! 下面的启用无限下一页是,软件判定出现某个关键词的时侯手动停止采集网址,但跟优采云的多级采集不一样的,我这个开始地址结果下来都必须是文章绝对地址!

  解释:下面的两个输入框,如果不会空的话采集来的地址都会手动替换

  解释:这个页设置较复杂些,但这种前后字符跟之前的设置也差不多,后面的失败标识解:如第一项,采集到的标题中软件会判定有没有出现输入框中的内容,支持多关键词规则采集文章软件,如果出现哪么这个标题都会辨识为失败,自动用下一个规则来匹配!下面的分页内容采集也是极其简单的,奥妙之处自己研究源码吧

  解释:这里就不多说了。上面的内容替换一行一个,下面的是正则,我最主要是用户来标识图片/:^_^

  解释:这是规则的导出导入,说简单点就是配合文件写入写出,,哎,很厌恶XX些软件一定要搞个太NB的后辍名,软件载入在转码解码这种,不明白这样有哪些意思,这些都是影响速率的关键所在,不说了,上源码图

  最后诅咒:拿去改版权,卖钱的,一辈子光棍,或讨个女儿生个小孩没屁股,软件为本人原创

  考虑到工程时间和软件复杂性。精币多收点,下载了你不会懊悔的,这个开源版本是最后一个版本规则采集文章软件,后期更新后我自己用,我也懒得发。只要你动手能力强,没有采集不到的文章

  :因软件源码复杂性比之前的版本要难多,新手就不建议了,所以精币收多些,回复几个贴就挣来了

  【------------求好评-------------】

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线