算法 自动采集列表(如下图设置在“添加多级网址采集规则”的第四步 )

优采云 发布时间: 2021-09-25 01:07

  算法 自动采集列表(如下图设置在“添加多级网址采集规则”的第四步

)

  列表页附加参数获取函数是内容页地址为采集时通过设置采集规则获取的值,即获取列表页的值,该值将添加到每个记录。

  如下图,在第四步“添加多级URL采集规则”中设置:

  

  我们以采集腾讯新闻为例来说明如何使用该功能。

  

  例如,当我们采集腾讯新闻时,我们需要在每条消息中添加“时事新闻”这个类别。

  就像第二步创建标签一样,在源码中找到前后字符,然后我们创建一个标签【标签:分类】,如下图,还有一个地方可以创建标签

  所以标签不仅仅建立在第二步采集内容规则中,大家应该明白了,看下图:

  

  设置好后,我们点击保存,测试一下。

  因为这个标签的值是在列表页面获取的,如果直接进入第二步采集,测试为采集没有任何值如下图:

  

  如上图所示,分类标签为灰色,表示标签是在采集的地址获取的,也就是通过第一步:采集 URL规则,如果你第二步不要直接通过第一步

  没有价值。

  必须通过如下所示的测试 URL:

  

  然后点击测试地址采集进入第二步。

  

  选择地址,列表页上创建的标签和采集的值会看到上图。

  然后双击地址跳转到第二步:采集内容规则和测试,可以显示列表页采集的标签如下图:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线