免费网页采集器(金石极速网页采集器使用说明系统设置的采集选项是什么)

优采云 发布时间: 2021-12-30 11:15

  免费网页采集器(金石极速网页采集器使用说明系统设置的采集选项是什么)

  金石极速网页采集器

专门采集

和订阅您自己指定的信息源网站。可以采集指定网页上的所有信息,也可以通过匹配关键词进行采集。您可以指定用于采集

的线程数以找到最有效的采集

设置。

  该软件是目前市场上唯一一款可以通过自定义栏目和关键词来采集

和构建自己的桌面新闻系统的软件。消息源完全由您指定,运行线程数也可自行设置。软件会自动过滤网络上的重复信息,并允许您设置相似度或更多信息不被重复采集

,让您轻松掌控重要信息。

  金石极速网页采集器使用说明

  系统设置中的采集选项是对软件的采集行为进行个性化设置。点击工具栏中的【系统设置】按钮进入后,界面如下图:

  

  1. 不采集

与现有信息相似的标题超过XX:软件会花一定的时间将每条信息与之前采集

的信息进行比较,看相似度是否超过设定的标准,如果超出标准的,将被视为类似信息不再重复采集

。当该值设置为98以上时,软件将不再进行比较,节省了比较的时间,但可能会出现类似的信息。因为当采集

到的信息量较大时,比较比较耗时,用户可以根据自己的情况进行选择。

  2.当相同的信息匹配不同的关键词时:您只能采集

一张,或者为每个不同的关键词采集

一张。根据每个人的喜好选择。

  3.订阅采集线程数和关键词采集线程数:如果指定多个线程,系统会生成多个线程进行采集。增加采集

线程数可以加快采集

速度,但如果过高,可能会导致系统生成线程出现问题,反而会中断采集

。建议一般计算机中两者的线程数之和不要超过20个。如果线程数为0或负数,系统将不进行此项采集工作。

  4. 信息老化:设置为10天时,软件只会采集

最近10天发布的有效信息,每次激活时自动删除10天以上的信息。(注:1天是指24小时内的信息,不仅仅是当天的信息)

  5.关键词 匹配方式:可以选择“精确匹配”和“模糊匹配”。精确匹配采集

的信息必须收录

完整的关键词,而模糊匹配允许集合只收录

部分关键词信息信息。为了避免采集

不相关的信息,将其设置为精确匹配更为合适。

  6.关键词 匹配范围:“全文匹配”和“标题匹配”是可选的,对应于关键词是在全文范围内匹配还是只匹配标题。

  7.使用代理服务器:本软件允许您使用代理服务器访问网络,但您的代理服务器必须可用且可匿名访问,否则本软件将无法采集

网络信息。

  PC正式版

  安卓官方手机版

  IOS官方手机版

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线