文章采集规则(MaXCMS设置基本参数选择采集规则的流程一样(图))

优采云 发布时间: 2021-09-05 22:28

  文章采集规则(MaXCMS设置基本参数选择采集规则的流程一样(图))

  配置MaXcms后,进入后台,比如我的是:

  第一步是设置基本参数

  选择采集主菜单,点击添加采集规则(我的其实是修改,但是过程和添加规则是一样的。这里的解释主要是修改别人的理解@的写法采集规则)

  

  目标站点 URL:

  ======

  这是列表的第一页

  采集address 的批量生成:{$ID}-12.html

  ========

  这是通过分页与类似网址的网址,通常只是ID的变化,例如第一页为xxx-1-12.html,第二页为xxx-2-12.html

  其他

  ========

  播放源一定要选好。如果目标不再在此之上,则不应是采集! !如果你有能力学习,你应该下载源代码并添加下一个规则。

  分页设置,这里是采集page的形式,或者采集single page

  内容过滤设置,这个应该只有采集或者不是采集这些标签。看起来应该只有采集这些标签。

  下一步采集list 连接设置

  

  这个页面是最关键的设置。需要分析之前的源码。

  

  目标区域列表在右侧。在源码中可以看到这个block的上下部分都有对应的注释。那么列表的开头和列表的结尾就是这两个注释。其他情况可能没有注释,需要找一些带有class或id的div块来区分。

  在源代码中,图片下方的电影链接为“title="成家立业">成家立业

  链接开始:

  链接结束:“

  第三步:采集内容和数据地址设置

  第三步的设置更详细。此时,该步骤设置了播放电影的页面的详细信息。例如上面的链接:

  

  根据这些名字,比较要搜索的人的源代码。它应该是唯一必须找到的。这很累。麻烦。我的应该已经过时了,需要更新。

  回来补充和完善。通过研究,我发现制定一些采集规则是相当折腾的,没关系。没有方便的教程。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线