采集Web HTML源代码
优采云 发布时间: 2020-08-08 05:55采集Web HTML源代码
2016-10-28 11: 53 |海报: ym |查看: 11903 |评论: 0
概述: 1.操作步骤对于学习网页设计的人来说,有时他们会遇到一个非常喜欢的网页,但是他们无法获取其html代码,或者所获得的代码不完整. 让我们以网易新闻采集为例,教您如何采集html源代码. 具体步骤如下: 2.案例规则+步骤...
I. 操作步骤
对于那些学习网页设计的人来说,有时他们会遇到一个非常喜欢的网页,但是他们无法获得其html代码,或者所获得的代码不完整. 让我们以网易新闻采集为例,教您如何采集html源代码. 具体步骤如下:
两个,案例规则+操作步骤
第1步: 打开网页
1.1,打开Jishouke Web采集器,输入要采集的样本的URL并按ENTER,然后在加载网页后单击“定义规则”;
1.2,在工作台中输入主题名称,然后单击“检查”以查看主题名称是否被占用.
第2步: 标记信息
2.1,双击要捕获的目标信息,输入分类框的名称和标签,然后检查关键内容.
2.2,双击字段名称,为捕获的内容设置高级选项,选中“高级设置”,选择“ Web片段”,然后保存.
第3步: 保存规则并捕获数据
3.1. 规则测试成功后,单击“保存规则”;
3.2,单击“爬网数据”,DS计数器将弹出并开始捕获数据.
提示: 如果需要网页的完整html源代码,则可以直接映射html节点,然后在高级设置中选择网页片段,最后保存规则. 操作如下:
上一篇: “如何读取数据规则”下一篇: “批量修改下载图片的名称”
如果有任何疑问,可以或
2
花
握手
太棒了
1
路过
鸡蛋
刚刚发表意见的朋友()