文章采集系统(采集系统操作说明(傻瓜版)插件图(1))

优采云 发布时间: 2021-10-21 18:08

  文章采集系统(采集系统操作说明(傻瓜版)插件图(1))

  采集系统操作说明(傻瓜版)

  

  1.准备工作

  1.1 安装 FireBug 浏览器插件

  

  图片(1):FireBug插件安装

  1.2 找到需要采集网站

  的目标

  使用以下教程示例:/main/zxnews.shtml 用于演示1.3 登录cms,进入需要的频道,进入采集的系统。

  

  图片(2):采集系统入口

  

  图片(3):成功进入采集系统

  2.文章采集

  2.1 进入节点管理页面,点击新建节点,正常选择节点类型文章

  

  图(4):新建节点第一步

  2.2命名节点,选择目标网站的页面编码属性,选择站点类型

  

  图(5):新建节点第二步,基本信息设置

  2.3 判断列表URL是批量生成还是手动指定;设置相关规则,本教程178斗神列表页面有分页,所以我们使用采集第1、2页的内容进行演示。如下图

  

  图片(6):创建新节点的步骤3,列出URL获取规则

  

  图片(7):创建新节点的步骤3,列出URL获取规则(通配后测试内容的显示)

  2.4 使用之前安装的Firbug工具(F12调出工具),选择要采集的内容范围,设置采集列表区域和采集 列表信息 复制该区域对应的代码并粘贴到采集器

  

  图片(8):第4步新建节点,列出URL匹配规则(采集列表区域选择)

  

  图片(8):创建新节点的第4步,列出URL匹配规则(采集复制列表区域对应的代码)

  

  图片(9):第4步新建节点,列出URL匹配规则(粘贴到采集系统,删除红线代码)

  

  图(10):第4步新建节点,列出URL匹配规则(红线代码删除后)

  

  图(11):第四步新建节点,列出URL匹配规则(采集信息区选择)

  

  图(12):创建新节点的第4步,列出URL匹配规则(采集信息区对应的代码拷贝)

  

  图(13):第四步新建节点,列出URL匹配规则(粘贴到采集系统,删除相关代码)

  

  图(14):第四步新建节点,列出URL匹配规则(删除后点击保存预览)

  

  图片(15):采集列表网址预览(如果规则正确,可以显示以上列表,点击进入下一步)

  

  图片(16):采集文章最终页面的内容(选择页面的方法和之前一样)

  

  图片(17):采集文章最终页面内容(粘贴分页代码,删除多余部分,删除方法同上)

  

  图片(18):采集文章终极页面内容(设置标题和正文规则)

  

  图片(19):采集文章最终页面内容预览(如果没有问题,可以正常预览结果)

  3.备注

  3.1 使用从firebug复制的代码,需要删除html body部分。3.2采集 规则设置过程需要耐心和调试。如果你有任何问题,你可以 RTX 碧松

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线