上图标注的就是,只需要输入的内容框,有如下

优采云 发布时间: 2021-08-26 07:10

  

上图标注的就是,只需要输入的内容框,有如下

  Auto采集文章content 和 publishing文章content

  经过几个月的推敲,这个工具终于出来了,自动采集文章content并发布文章content,先看下页。

  

  图标上的说明是只有需要输入的内容框如下:

  1.title 标签

  2.Content 标签

  3.文章link

  只需输入这3个项目,点击Test采集Result,测试无误完成后点击Start采集即可。

  文章link 我就不多说了,标题和内容就不多说了。我主要讲解标题和内容中一级和二级标签的用法。首先,我们以这个文章链接为例:

  来看看这个文章的标题位置:

  

  从上图可以看出,标题的一级标签是div,所以我们在标题的“一级标签”中输入: div 既然属性是class,我们输入class输入一级标签下的框:Fly-panel detail-box

  从上图可以看出,title也有二级标签,但是由于二级标签没有class和id,我们只需要输入二级标签:h1即可。

  以上是标题输入问题。好的,其实到了这一步,内容标签就不用我多说了,我再解释一下,如下图:

  

  从上图可以看出,内容标签的一级标签是一个div,所以我们在:div下输入内容一级标签输入框

  然后可以看到content标签是一个class,所以我们在content的一级标签下输入class输入框:detail-bodylayui-text photos

  另外,这个标签下的二级标签不再准确,都是文章content标签,所以我们不需要填写我们内容的二级标签。

  点击这些后,点击test采集results,看看是否有采集到文章的内容。如果是,点击开始识别采集。这样采集就成功加入到采集进程中了。

  之后点击采集management,就可以使用各种配置所需的采集数据了。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线