网页表格数据采集助手的使用方法及使用方式使用技巧

优采云 发布时间: 2021-07-28 04:29

  网页表格数据采集助手的使用方法及使用方式使用技巧

  Web Form Data采集助是一个支持采集single-page 规则和不规则表单的工具。同时该工具还可以自动连续采集specify网站表单等,可以指定采集需要的字段内容。 采集后的内容可以保存为EXCEL软件可以读取的文件格式,也可以保存为保留原格式的纯文本格式。绝对简单、方便、快捷、纯绿色,不信就下载试试。需要这个工具的朋友可以过来下载使用。

  如何使用

  1、首先在地址栏中输入waiting采集的网页地址。如果wait采集的网页已经在IE浏览器中打开过,就会出现在软件的URL列表中

  这个地址会自动添加,你只需要下拉选择它就会打开。

  2、 再次点击爬取测试按钮,可以看到网页源代码和网页收录的表数。网页源代码显示在软件下方的文本框中,net

  表中收录的表数和头信息

  页面显示在软件左上角的列表框中。

  3、从表数列表中选择要抓取的表。此时,表格左上角的第一个文本会显示在软件表格左上角的第一个框中

  在输入框中,表单中收录的字段(列)会显示在软件左侧的中间列表中。

  4、然后选择你想要采集的表数据的字段(列),如果你不选择它,所有的采集都会被设置。

  5、选择是否要抓取表格的标题行,保存时是否显示表格行,如果web表单中的字段有链接,可以选择是否

  包括链接地址。如果你有并想要采集它的链接地址,那么你不能同时选择收录标题行。

  6、如果你想让采集的表格数据只有一个网页,那么你可以点击抓取表格直接抓取,如果不选择收录前面的表格

  网格线,表格数据会以CVS格式保存,这种格式可以直接用微软EXCEL软件打开转换成EXCEL表格,如果选择把表格放在前面

  网格线,表格数据会以TXT格式保存,可以用记事本软件打开查看。表格行直接可用,也很清楚。

  7、如果你想让采集的表数据有多个连续的页面,并且你想采集向下,那么请设置程序采集next page and later

  继续页面的方式可以是根据链接名称打开下一个页面。几乎大多数页面的链接名称都是“下一页”。您查看页面并找到它。

  只要输入,如果网页没有下一页的链接,但是URL中收录了页数,那么你也可以根据URL中的页数选择打开,即可

  要从前到后选择,比如从第1页到第10页,或者从后到前,比如从第10页到第1页,在页码输入框中输入,但是这次

  URL中代表页数的位置要用“(*)”代替,否则程序无法识别。

  8、然后选择定时采集或者在采集之后等待网页打开加载,定时采集是程序设置的一个很小的时间间隔

<p>判断打开的页面中是否有你想要的表格,采集如果有,采集只要页面加载后采集打开你想要的网页,

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线