采集Web HTML源代码

优采云 发布时间: 2020-08-08 05:55

  采集Web HTML源代码

  2016-10-28 11: 53 |海报: ym |查看: 11903 |评论: 0

  概述: 1.操作步骤对于学习网页设计的人来说,有时他们会遇到一个非常喜欢的网页,但是他们无法获取其html代码,或者所获得的代码不完整. 让我们以网易新闻采集为例,教您如何采集html源代码. 具体步骤如下: 2.案例规则+步骤...

  I. 操作步骤

  对于那些学习网页设计的人来说,有时他们会遇到一个非常喜欢的网页,但是他们无法获得其html代码,或者所获得的代码不完整. 让我们以网易新闻采集为例,教您如何采集html源代码. 具体步骤如下:

  

  两个,案例规则+操作步骤

  第1步: 打开网页

  1.1,打开Jishouke Web采集器,输入要采集的样本的URL并按ENTER,然后在加载网页后单击“定义规则”;

  1.2,在工作台中输入主题名称,然后单击“检查”以查看主题名称是否被占用.

  

  第2步: 标记信息

  2.1,双击要捕获的目标信息,输入分类框的名称和标签,然后检查关键内容.

  

  2.2,双击字段名称,为捕获的内容设置高级选项,选中“高级设置”,选择“ Web片段”,然后保存.

  

  第3步: 保存规则并捕获数据

  3.1. 规则测试成功后,单击“保存规则”;

  3.2,单击“爬网数据”,DS计数器将弹出并开始捕获数据.

  

  提示: 如果需要网页的完整html源代码,则可以直接映射html节点,然后在高级设置中选择网页片段,最后保存规则. 操作如下:

  

  上一篇: “如何读取数据规则”下一篇: “批量修改下载图片的名称”

  如果有任何疑问,可以或

  

  2

  

  花

  

  握手

  

  太棒了

  1

  

  路过

  

  鸡蛋

  刚刚发表意见的朋友()

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线