优采云控制台列表提取器(网址采集规则)列表
优采云 发布时间: 2021-07-21 07:19优采云控制台列表提取器(网址采集规则)列表
优采云Navigation: 优采云采集器 优采云控制面板
列表提取器(URL采集rule)
列表提取器主要用于提取多个详情页链接(即设置URL采集规则),配置主要分为三个步骤:
点击“重置当前字段”按钮重新开始配置;用鼠标点击你想要采集的链接(标题),只需点击两个不同的链接,系统会自动选择其他相似的链接;检查页面左下角查看文章链接地址是否在“数据预览”下(相对或绝对链接都可以),如果有,则配置正确,如果没有,则需要再次点击,直到链接出现。
URL采集配置结果示例:
详细使用步骤:
1.清除旧配置
在智能向导创建任务期间或之后,如果URL采集规则不正确,您可以打开“列表提取器”进行修改。
点击列表提取器右上角的【重置当前字段配置】按钮,点击【确定】清除现有配置:
2.点击页面上采集的链接
用鼠标点击你想要采集的链接(标题),只需点击两个不同的链接,系统会自动选择其他相似的链接。
点击两次后,查看页面左下角“数据预览”下的文章链接地址是否列出(相对或绝对链接都可以),如果有则配置正确,如果没有,您需要单击“选择”,直到出现链接。 (如果没有出现链接,请检查)
(可选)URL采集Rule 通用性测试:如果任务配置了多个列表页面(如翻页),那么可以点击'Typical List Page URL'的输入框,其他会出现From列表页面的URL下拉列表,可以随意选择一两个不同的链接。
高级配置说明:列表提取器只能配置一个url字段,默认勾选“仅获取URL”和“自动选择相似元素”功能。 (一般不需要修改,使用系统默认配置即可)
列出页面配置常见问题及解决方法一、链接无法点击,怎么办?
解决方案主要分为四种情况:
二。列表提取器的入口?
列表提取器有两个主要入口:
优采云Navigation: 优采云采集器 优采云控制面板