建站系统采集器(好后点一下网站管理中的“更新载入网站配置”说明)

优采云 发布时间: 2021-11-26 03:02

  建站系统采集器(好后点一下网站管理中的“更新载入网站配置”说明)

  7、过滤非法词。

  使用说明:

  下载采集器解压,运行程序如图

  

  点击登录用户,输入官网账号和密码

  这里会显示采集器的登录成功和过期日期

  采集器 7天免费,到期后可直接在官网续订

  

  登录官网、用户中心,点击renew

  费用是30元一个月,150元一年半 200元一年

  

  然后点击采集器的网站Management-Add网站

  

  填写网站信息

  注意:如果您的程序是多城市版本,请检查多城市版本

  域名直接填写你的网站域名,该域名用于上传采集的图片到你的网站

  数据库地址一般是你的服务器IP

  如果使用官网共享服务器,数据库地址为域名解析地址加2988

  如:, 2988 注意:逗号应该是英文

  数据库名、用户名和密码可以在你的网站 web.config文件中找到,如图

  

  database= 后跟数据库名称

  uid= 是数据库用户名

  pwd=下面是数据库密码

  全部填好后,点击测试数据库链接,正常提示链接成功

  这个采集器可以同时是多个网站采集内容,所以可以添加多个网站素材

  添加后点击网站管理中的“更新加载网站配置”

  

  导入网站的信息分类、区域分类、电话黑名单、中介电话名单、过滤词

  当网站的类别、地区和手机黑名单发生变化时,再次点击

  采集器没有采集手机黑名单信息

  采集 Rules-加载采集规则,并加载最新的采集规则

  如果您想要采集的网站不在采集规则中,可以联系官网客服免费定制。官网完成采集规则后,可以点击加载采集规则就好了

  

  在下方添加 采集 任务

  以采集百星网二手车为例

  点击采集任务-添加任务

  

  任务名称:自己写一个,好记

  网站选择:选择哪个网站写入采集的信息

  排序:是采集的顺序,因为可以添加多个任务,所以排序数越高,排在第一个采集

  采集URL:直接填写你要采集网站的信息列表页面地址,这里直接填写百行网二手车页面地址,替换带 {p} 的页码

  注意(百星网二手车点击第二页时,URL中数字改为2即为页码,只需将此2替换为{p}即可,其他网站也一样)

  

  采集页数:采集多少页,从下一页开始采集

  采集规则:根据网站你要采集选择对应的规则,这里你要采集人民网,所以选择人民网

  默认分类:这里会显示你的网站分类,选择你想要采集属于哪个分类(注意:如果不选择,采集器会根据内容自动判断)

  默认区域:选择采集去哪个区域(注意:如果不选择,采集器会根据内容自动确定)

  有效期:此处填写采集收到的信息的有效期

  采集图片:钩选采集图片,不选不采集

  自动审核:勾选就是自动勾选采集收到的信息,不勾选就是手动去后台核对

  过滤重复:当有两条内容相同的消息时,只有采集一条,因为有些网站有很多重复消息

  自动更新采集:之前采集的信息会直接更新,不会重复采集(不勾选,不会采集之前采集的信息不会更新)

  采集间隔:部分网站具有反采集功能,访问速度过快会阻塞访问速度,这里可以设置采集间隔为3到 5 秒

  水印设置,可用于遮挡采集图片上的水印,可自行设置水印位置和透明度

  全部填好后点击添加采集任务

  在采集管理-任务管理中可以看到所有采集任务,可以修改和删除。如果你暂时不想采集一个任务,可以去掉任务前的钩子

  

  采集添加所有任务后,点击开始采集,等待采集完成

  

  采集完成后,可以看到提示,采集完成,请点击写入信息。右侧显示每个任务采集成功多少条信息,有多少重复,有多少被列入黑名单,有多少失败

  点击写信息,让采集收到的信息和图片上传到网站

  

  等待写入排序完成,即可关闭采集器

  

  这个采集器采集信息从早上5点到当天的当前时间段自动分发,所以不会有所有信息同时发布的问题

  采集器采集 过去的信息不会重复采集。如果要重新采集已经采集的内容,可以点击清除所有采集记录或清除三天前的记录采集

  

  使用采集器一段时间后,如果目录过大,可以点击清除三天前采集的记录,将清除三天前采集的记录前

  采集保存的图片如果已经上传会直接删除。可能有一些不成功的删除。您可以定期手动删除它们。

  

  采集器常见问题及解决方法

  一些采集规则模拟了对采集的浏览器访问,这就要求IE浏览器能够正常访问网站。

  如果采集的过程中出现下图,说明这个网站的安全证书有问题

  

  或者如下图,页面打不开

  

  请打开您的IE浏览器,点击设置-互联网选项

  

  将使用 SSL3.0、使用 TLS 1.0、使用 TLS 1.1、使用 TLS 1.2、使用TLS1.3都勾选了,点确定,重启电脑即可解决。

  在采集人民网的过程中,如果采集间隔设置的太短,很容易被屏蔽。建议将采集间隔设置为5-10秒

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线