网页表格数据采集助手的使用方法及使用方式使用技巧
优采云 发布时间: 2021-07-28 04:29网页表格数据采集助手的使用方法及使用方式使用技巧
Web Form Data采集助是一个支持采集single-page 规则和不规则表单的工具。同时该工具还可以自动连续采集specify网站表单等,可以指定采集需要的字段内容。 采集后的内容可以保存为EXCEL软件可以读取的文件格式,也可以保存为保留原格式的纯文本格式。绝对简单、方便、快捷、纯绿色,不信就下载试试。需要这个工具的朋友可以过来下载使用。
如何使用
1、首先在地址栏中输入waiting采集的网页地址。如果wait采集的网页已经在IE浏览器中打开过,就会出现在软件的URL列表中
这个地址会自动添加,你只需要下拉选择它就会打开。
2、 再次点击爬取测试按钮,可以看到网页源代码和网页收录的表数。网页源代码显示在软件下方的文本框中,net
表中收录的表数和头信息
页面显示在软件左上角的列表框中。
3、从表数列表中选择要抓取的表。此时,表格左上角的第一个文本会显示在软件表格左上角的第一个框中
在输入框中,表单中收录的字段(列)会显示在软件左侧的中间列表中。
4、然后选择你想要采集的表数据的字段(列),如果你不选择它,所有的采集都会被设置。
5、选择是否要抓取表格的标题行,保存时是否显示表格行,如果web表单中的字段有链接,可以选择是否
包括链接地址。如果你有并想要采集它的链接地址,那么你不能同时选择收录标题行。
6、如果你想让采集的表格数据只有一个网页,那么你可以点击抓取表格直接抓取,如果不选择收录前面的表格
网格线,表格数据会以CVS格式保存,这种格式可以直接用微软EXCEL软件打开转换成EXCEL表格,如果选择把表格放在前面
网格线,表格数据会以TXT格式保存,可以用记事本软件打开查看。表格行直接可用,也很清楚。
7、如果你想让采集的表数据有多个连续的页面,并且你想采集向下,那么请设置程序采集next page and later
继续页面的方式可以是根据链接名称打开下一个页面。几乎大多数页面的链接名称都是“下一页”。您查看页面并找到它。
只要输入,如果网页没有下一页的链接,但是URL中收录了页数,那么你也可以根据URL中的页数选择打开,即可
要从前到后选择,比如从第1页到第10页,或者从后到前,比如从第10页到第1页,在页码输入框中输入,但是这次
URL中代表页数的位置要用“(*)”代替,否则程序无法识别。
8、然后选择定时采集或者在采集之后等待网页打开加载,定时采集是程序设置的一个很小的时间间隔
<p>判断打开的页面中是否有你想要的表格,采集如果有,采集只要页面加载后采集打开你想要的网页,