文章采集系统(采集系统操作说明(傻瓜版)插件图(1))
优采云 发布时间: 2021-10-21 18:08文章采集系统(采集系统操作说明(傻瓜版)插件图(1))
采集系统操作说明(傻瓜版)
1.准备工作
1.1 安装 FireBug 浏览器插件
图片(1):FireBug插件安装
1.2 找到需要采集网站
的目标
使用以下教程示例:/main/zxnews.shtml 用于演示1.3 登录cms,进入需要的频道,进入采集的系统。
图片(2):采集系统入口
图片(3):成功进入采集系统
2.文章采集
2.1 进入节点管理页面,点击新建节点,正常选择节点类型文章
图(4):新建节点第一步
2.2命名节点,选择目标网站的页面编码属性,选择站点类型
图(5):新建节点第二步,基本信息设置
2.3 判断列表URL是批量生成还是手动指定;设置相关规则,本教程178斗神列表页面有分页,所以我们使用采集第1、2页的内容进行演示。如下图
图片(6):创建新节点的步骤3,列出URL获取规则
图片(7):创建新节点的步骤3,列出URL获取规则(通配后测试内容的显示)
2.4 使用之前安装的Firbug工具(F12调出工具),选择要采集的内容范围,设置采集列表区域和采集 列表信息 复制该区域对应的代码并粘贴到采集器。
图片(8):第4步新建节点,列出URL匹配规则(采集列表区域选择)
图片(8):创建新节点的第4步,列出URL匹配规则(采集复制列表区域对应的代码)
图片(9):第4步新建节点,列出URL匹配规则(粘贴到采集系统,删除红线代码)
图(10):第4步新建节点,列出URL匹配规则(红线代码删除后)
图(11):第四步新建节点,列出URL匹配规则(采集信息区选择)
图(12):创建新节点的第4步,列出URL匹配规则(采集信息区对应的代码拷贝)
图(13):第四步新建节点,列出URL匹配规则(粘贴到采集系统,删除相关代码)
图(14):第四步新建节点,列出URL匹配规则(删除后点击保存预览)
图片(15):采集列表网址预览(如果规则正确,可以显示以上列表,点击进入下一步)
图片(16):采集文章最终页面的内容(选择页面的方法和之前一样)
图片(17):采集文章最终页面内容(粘贴分页代码,删除多余部分,删除方法同上)
图片(18):采集文章终极页面内容(设置标题和正文规则)
图片(19):采集文章最终页面内容预览(如果没有问题,可以正常预览结果)
3.备注
3.1 使用从firebug复制的代码,需要删除html body部分。3.2采集 规则设置过程需要耐心和调试。如果你有任何问题,你可以 RTX 碧松