金石极速网页采集器专门采集和订阅您自已的信息源网站
优采云 发布时间: 2021-07-11 07:10
金石极速网页采集器专门采集和订阅您自已的信息源网站
金石极速网页采集器金石极速网站采集器special采集并订阅您自己指定的信息源网站,您可以采集指定网页上的所有信息,也可以按关键词采集。您可以为采集 指定线程数并找到最有效的采集 设置。该软件是目前市场上唯一一款可以通过自定义栏目和关键词来采集采集
创建自己的桌面新闻网页的软件
金石极速网页采集器special采集并订阅您自己指定的信息源网站,您既可以采集指定网页上的所有信息,也可以按关键词匹配采集。您可以为采集 指定线程数并找到最有效的采集 设置。
这款软件是市场上唯一一款可以通过自定义栏目和关键词来采集创建自己的桌面新闻系统的软件。消息来源完全由您指定,运行线程数也可以自定义。设置。软件会自动过滤网上重复的信息,并允许您在信息上方设置相似度,不再重复采集,让您轻松掌控重要信息。
金石极速网页采集器使用说明
系统设置中的采集选项是自定义软件的采集行为。点击工具栏中的【系统设置】按钮后,界面如下:
1.不采集标题与已有信息的相似度大于XX:软件会花费一定的时间将每条信息与之前的采集信息进行比较,是否相似度超过定标准。任何超出标准的都视为类似信息,采集不再重复。当数值设置为98以上时,软件将不再进行比较,节省了比较的时间,但可能会出现类似的信息。因为采集信息量大的时候,比较比较费时间,所以用户可以根据自己的需要选择。
2.当相同的信息匹配不同的关键词时:只能有一个采集或不同的关键词each采集。根据每个人的喜好选择。
3.Subscribe采集线程数和关键词采集线程数:如果指定多个线程,系统会生成多个线程到采集,增加采集线程数可以加快采集 ,但如果太高,可能会导致系统产生线程问题,转而中断采集。建议普通电脑的线程数总和不要超过20个。如果线程数为0或负数,系统不会执行采集任务。
4.信息时证:设置为10天时,软件只会采集最近10天内发布的有效信息,每次激活时自动删除10天以上的信息。 (注:1天是指24小时内的信息,不仅仅是当天的信息)
5.关键词 匹配方式:“精确匹配”和“模糊匹配”均可。精确匹配要求采集信息必须收录完整的关键词,而模糊匹配允许采集只收录关键词信息的一部分。为了防止采集到达不相关的信息,将其设置为精确匹配更为合适。
6.关键词Match range:“全文匹配”和“标题匹配”是可选的,对应关键词是在全文范围内匹配还是只匹配标题。
7.使用代理服务器:本软件允许您使用代理服务器上网,但您的代理服务器必须可用且可匿名访问,否则本软件将无法采集网络信息。