文章采集规则(MaXCMS设置基本参数选择采集规则的流程一样(图))
优采云 发布时间: 2021-09-05 22:28文章采集规则(MaXCMS设置基本参数选择采集规则的流程一样(图))
配置MaXcms后,进入后台,比如我的是:
第一步是设置基本参数
选择采集主菜单,点击添加采集规则(我的其实是修改,但是过程和添加规则是一样的。这里的解释主要是修改别人的理解@的写法采集规则)
目标站点 URL:
======
这是列表的第一页
采集address 的批量生成:{$ID}-12.html
========
这是通过分页与类似网址的网址,通常只是ID的变化,例如第一页为xxx-1-12.html,第二页为xxx-2-12.html
其他
========
播放源一定要选好。如果目标不再在此之上,则不应是采集! !如果你有能力学习,你应该下载源代码并添加下一个规则。
分页设置,这里是采集page的形式,或者采集single page
内容过滤设置,这个应该只有采集或者不是采集这些标签。看起来应该只有采集这些标签。
下一步采集list 连接设置
这个页面是最关键的设置。需要分析之前的源码。
目标区域列表在右侧。在源码中可以看到这个block的上下部分都有对应的注释。那么列表的开头和列表的结尾就是这两个注释。其他情况可能没有注释,需要找一些带有class或id的div块来区分。
在源代码中,图片下方的电影链接为“title="成家立业">成家立业
链接开始:
链接结束:“
第三步:采集内容和数据地址设置
第三步的设置更详细。此时,该步骤设置了播放电影的页面的详细信息。例如上面的链接:
根据这些名字,比较要搜索的人的源代码。它应该是唯一必须找到的。这很累。麻烦。我的应该已经过时了,需要更新。
回来补充和完善。通过研究,我发现制定一些采集规则是相当折腾的,没关系。没有方便的教程。