【流程图模式】如何采集列表类型的网页
优采云 发布时间: 2020-08-26 17:06【流程图模式】如何采集列表类型的网页
1、什么样的网页是列表类型的网页
列表类型的网页是具有相同元素的内容页根据一定的线性次序排列分布的网页,如下图所示:
2、如何采集列表类型的网页
1)软件可以确切辨识列表的情况
点击列表中的任一行,软件会手动辨识出列表并给出提示,选择“提取列表中的数据”。
软件会手动辨识当前页面的分页按键,我们可以按照提示设置手动翻页操作。
更多详情内容,请参考以下教程:
如何设置分页
接下来我们可以对采集字段进行设置。
更多详情内容,请参考以下教程:
如何对采集字段进行配置
2)软件难以确切辨识列表的情况
点击列表中的任一行,如果软件手动辨识的列表不正确,我们可以在操作提示框内选则“修改列表辨识结果”。
然后依照操作提示框指示,点击列表中另一个相同的元素。建议点击另一个元素时最好选择不同行的元素,从而使软件辨识愈发确切。
在更改列表辨识结果过程中,存在以下两种情况:
第一种情况:修改以后列表辨识结果是正确的
此时我们可以在操作提示中选择提取数据或则点击列表操作。具体设置可参考上述1)的后续步骤。
第二种情况:修改以后的列表辨识结果依然不正确
我们可以再一次更改列表辨识结果,此时更改列表辨识结果须要点选列表中的两个元素,我们依然建议您选择不同行的两个元素。
之后我们会回到显示列表辨识结果步骤,然后我们可以根据上文所示进行下一步的操作。