优采云采集器会自动识别分页,如何设置菜单图?(组图)

优采云 发布时间: 2021-08-12 02:11

  优采云采集器会自动识别分页,如何设置菜单图?(组图)

  在智能模式下,优采云采集器会自动识别分页。分页的类型通常包括以下几种:

  (1)page 按钮

  (2)rolling loading

  (3)Waterfall 分页(滚动加载)+分页按钮

  (4)不启用分页

  但偶尔会出现识别结果错误的情况,原因通常有以下几种:

  (1)网页加载速度太慢,软件自动识别结束后出现分页按钮

  (2)页面有多个分页按钮,软件最后只会选择其中一个

  (3)在滚动加载和分页按钮同时存在的情况下,软件滚动多次后仍然没有出现分页按钮。

  (4)当前页面的分页按钮软件暂时不兼容

  “页面设置”的设置菜单如下图所示。

  

  针对不同的分页类型,设置步骤如下:

  (1)page 按钮

  i:自动识别标签:

  点击“自动识别分页符”选项。

  软件会自动识别网页上的分页按钮。识别成功后,页面会自动滚动到分页按钮的位置,并使用红色背景色框进行选框。

  

  ii:点击分页按钮:

  如果软件无法自动识别分页按钮,则需要手动“点击分页按钮”。

  第一步:点击“点击分页按钮”选项

  第2步:点击页面上的分页按钮

  

  iii:编辑分页 XPath:

  如果以上两种情况都不能正确识别分页,则需要编写XPath来识别分页。

  

  (2)Waterfall 分页(滚动加载):

  适用于没有分页按钮并通过滚动加载内容的网页。

  

  (3)Waterfall 分页(滚动加载)+分页按钮:

  适用于开头没有分页按钮,需要多次滚动页面才能加载分页按钮,或者已经显示下一页按钮,但是当前网页内容还没有显示的网页,并且网页需要滚动多次才能显示当前页面的全部内容。

  这种类型的分页很难识别。虽然软件在自动识别时会尝试自动滚动,但滚动次数可能与当前网页所需的滚动次数不一致,因此此类分页通常需要一些手动操作。 .

  主要分为以下几种情况:

  第一种:识别滚动加载,但不识别分页按钮

  请手动滚动网页,直到页面上出现分页按钮,然后在分页设置中选择“自动识别分页”。

  

  如果自动识别失败,选择“点击分页按钮”,然后进入页面点击分页按钮。

  

  第二种:能识别分页按钮,但不能识别滚动加载

  这种情况下,只需要在原有分页设置的基础上选择“瀑布分页(滚动加载)”选项即可。

  

<p>注意:如果当前网页不需要滚动加载,并且软件识别滚动加载,则不会影响采集的结果,但取消滚动加载选项可以提高采集的速度。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线