自动采集发布系统(前两天发布站的采集规则如何设置的教程!(每行))
优采云 发布时间: 2021-12-17 01:10自动采集发布系统(前两天发布站的采集规则如何设置的教程!(每行))
教程地址:
今天,我将重新做关于如何设置发布站采集规则的教程!有人回复说上次的教程看不下去了,那我今天再做一次!
这是前两天客户要求的网站,我们用这个来测试
私服列表页面地址列表(每行一个):采集的目标URL
网站名称:只要写上目标站的URL,方便区分
私服列表的起始标记:(这里指的是目标站的起始码位置采集)
私服列表结束符:(这个是指目标站的结束码位置采集)
@@@开始和结束标志的意思是我们要把这个区域的内容从头到尾@@@
私服单行匹配规则:(指的是匹配我们刚刚指定的区号中符合我们规则的数据)
这样我们就需要拿content标签来替换里面的内容。$any$ 标签然后替换可能是不同数据的内容。比如还有的url没有被替换,因为我们只需要一个,剩下的url,不同的广告url会不一样,所以我们需要用$arbitrary$替换,#0000ff是颜色代码,不同的ads可能有不同的颜色,我们也用$arbitrary$来代替,根据不同的网站设置,因为不同的广告代码不一样,所以这个网站目前是这样的
添加采集,和采集 广告有时响应缓慢。这是正常的,因为用户太多(付费用户和免费用户使用同一台服务器处理数据,所以很慢。我们计划在年底,免费用户的使用将被暂停)
有点慢,使用中请耐心等待!
现在让我们试试刚刚添加的 采集
一共采集 860条信息,其实这个网站的广告不止这么多,因为他的网站上不同的广告代码不一样,我们只能匹配出和我们一样的规则 广告出来了
你看到我刚选的那个了吗?他有4种代码展示广告,我们只写了一种,如果你想让所有采集都过来,那你要多设置几条规则
好的,这就是我刚选的广告。好了,教程结束。其实很简单。我不知道并输入了这么多字。
沐沐网络