优采云采集器会自动识别分页,如何设置菜单图?(组图)
优采云 发布时间: 2021-08-12 02:11优采云采集器会自动识别分页,如何设置菜单图?(组图)
在智能模式下,优采云采集器会自动识别分页。分页的类型通常包括以下几种:
(1)page 按钮
(2)rolling loading
(3)Waterfall 分页(滚动加载)+分页按钮
(4)不启用分页
但偶尔会出现识别结果错误的情况,原因通常有以下几种:
(1)网页加载速度太慢,软件自动识别结束后出现分页按钮
(2)页面有多个分页按钮,软件最后只会选择其中一个
(3)在滚动加载和分页按钮同时存在的情况下,软件滚动多次后仍然没有出现分页按钮。
(4)当前页面的分页按钮软件暂时不兼容
“页面设置”的设置菜单如下图所示。
针对不同的分页类型,设置步骤如下:
(1)page 按钮
i:自动识别标签:
点击“自动识别分页符”选项。
软件会自动识别网页上的分页按钮。识别成功后,页面会自动滚动到分页按钮的位置,并使用红色背景色框进行选框。
ii:点击分页按钮:
如果软件无法自动识别分页按钮,则需要手动“点击分页按钮”。
第一步:点击“点击分页按钮”选项
第2步:点击页面上的分页按钮
iii:编辑分页 XPath:
如果以上两种情况都不能正确识别分页,则需要编写XPath来识别分页。
(2)Waterfall 分页(滚动加载):
适用于没有分页按钮并通过滚动加载内容的网页。
(3)Waterfall 分页(滚动加载)+分页按钮:
适用于开头没有分页按钮,需要多次滚动页面才能加载分页按钮,或者已经显示下一页按钮,但是当前网页内容还没有显示的网页,并且网页需要滚动多次才能显示当前页面的全部内容。
这种类型的分页很难识别。虽然软件在自动识别时会尝试自动滚动,但滚动次数可能与当前网页所需的滚动次数不一致,因此此类分页通常需要一些手动操作。 .
主要分为以下几种情况:
第一种:识别滚动加载,但不识别分页按钮
请手动滚动网页,直到页面上出现分页按钮,然后在分页设置中选择“自动识别分页”。
如果自动识别失败,选择“点击分页按钮”,然后进入页面点击分页按钮。
第二种:能识别分页按钮,但不能识别滚动加载
这种情况下,只需要在原有分页设置的基础上选择“瀑布分页(滚动加载)”选项即可。
<p>注意:如果当前网页不需要滚动加载,并且软件识别滚动加载,则不会影响采集的结果,但取消滚动加载选项可以提高采集的速度。