起点中文网小说采集方法以及详尽步骤

优采云 发布时间: 2020-08-09 19:54

  本文介绍使用优采云采集起点中文网(以鬼吹灯小说为例)的技巧。

  采集网站:

  使用功能点:

  l分页列表及详尽信息提取

  /tutorial/fylbxq7.aspx?t=1

  起点中文网介绍:起点中文网创建于2002年5月,是国外最大文学阅读与写作平台之一,是目前国外领先的原创文学门户网站,隶属于国外最大的数字内容综合平台——阅文集团旗下。

  起点中文网小说采集数据说明:本文进行了起点中文网-小说信息采集。本文仅以“起点中文网-小说信息采集”为例。大家在实操过程中,可依照自身需求,更换起点中文网的采集规则进行数据采集。

  起点中文网小说采集详细数组说明:小说标题,小说内容。

  步骤1:创建采集任务

  1)进入主界面,选择“自定义模式”

  

  2)将要采集的网址复制粘贴到网站输入框中,点击“保存网址”

  

  步骤2:创建列表循环

  1)在页面右上角,打开“流程”,以突显出“流程设计器”和“定制当前操作”两个蓝筹股。选中页面里的第一条链接,系统会手动辨识页面内的同类链接,选择“选中全部”

  

  2)选择“循环点击每位链接”

  

  步骤3:采集小说内容

  1)选中页面内要采集的小说内容(被选中的内容会弄成红色),选择“采集该元素的文本”

  

  2)修改数组名称

  

  3)选择“启动本地采集”

  

  步骤4:数据采集及导入

  1)采集完成后,会跳出提示,选择“导出数据。选择“合适的导入方法”,将采集好的评论信息数据导入

  

  2)这里我们选择excel作为导入为格式,数据导入后如下图

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线