采集自动组合(v7版本增加了一个标签组合的结果和内容页标签 )

优采云 发布时间: 2021-11-20 16:11

  采集自动组合(v7版本增加了一个标签组合的结果和内容页标签

)

  v7版本增加了标签组合功能。很多朋友在使用过程中发现组合的结果与自己想要的结果不一致。让我解释一下这个功能的使用。

  1.标签的组合是文件下载前的内容

  有朋友发现a标签中下载了某个文件,原地址为aaa,下载或检测到的地址为bbb。那么,如果在b标签中组合a标签,a标签的值为aaa。为什么使用这种处理方法是因为文件下载是在标签组合后进行的。如何实现标签内容为文件下载后的结果?你可以新建一个标签,选择“自定义固定格式数据”,把你的标签组合的内容放进去。这里的替换会在文件下载后进行。

  2.内容页面标签循环采集并添加为新记录

  如果两个组合的标签都是内容页标签,当这两个标签组合时,会根据循环次数最多的记录生成相同数量的新循环记录。如果一个标签的循环次数较少,则新生成的标签中该标签的值为空。例如,将标签a、b 组合起来生成标签c。a的循环数为5,b的循环数为3,将产生5个cs。其中,前3个标签的值分别对应a和b。在最后两个值中,b 的值为空。假设a的值为11,22,33,44,55,b的值为aa,bb,cc.c是[label:a][label:b]的组合,生成c的值是 11aa,22bb,33cc,44,55.

  3.列表页标签和内容页标签组合

  如果两个标签中的一个是内容页,另一个是列表页,则内容页将参与第2条中的循环处理。在这个过程中,列表页被视为一个字符串。合并完成后,程序将再次进行数据处理操作。最后,组合标签中列表页面标签的内容将替换为实际值。可以再次提取和下载组合结果。比如内容页a和列表页b组合生成c,其中a的值为11、22、22,b的值为bb,那么c的第一个组合结果为11[label: b],22[label:b],33[label:b],然后进行数据处理。如果b的值为bb,那么最终的结果可能是11bb、22bb、33bb。

  有的朋友可能会说,为什么要把这个功能弄的这么复杂。其实这个函数主要用于第一个函数,其他的组合可能会产生和原来想法不同的结果。建议大家不要滥用这个功能,不要把它想象成灵丹妙药。

  标签组合示例,如下图:

  

  我们将标题和下载地址标签组合成一个新标签,以“$$$$”分隔,我们的测试结果如下:

  

  你看到了吗。效果和我们预想的一样。

  然后这个就简单使用了,我什么都没学到。

  然后还有另一种标签组合,见下图:

  

  这样测试的结果是什么,应该和上面的情况一样,谁知道呢,我们测试一下看看

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线