网页表格数据采集助手使用方法:网页源码及使用技巧
优采云 发布时间: 2021-06-17 21:22网页表格数据采集助手使用方法:网页源码及使用技巧
网页表格data采集助是一款免费的绿色网页表格data采集软件。软件功能强大,可以采集单页规则和不规则表格,也可以自动连续采集指定网站表格,还可以指定采集、@需要的字段内容k15@后面的内容可以保存为EXCEL软件可以读取的文件格式,也可以保存为保留原格式的纯文本格式。它绝对简单、方便、快捷、纯绿色。如果您不相信,只需下载并尝试一下。 .
如何使用网页表单数据采集Assistant:
1、 首先在地址栏中输入waiting采集的网页地址。如果在IE浏览器中打开了wait采集的网页,该地址会自动添加到软件的URL列表中。只需下拉选择它,它就会打开。
2、 然后点击爬虫测试按钮,可以看到网页的源码和网页收录的表数。网页的源代码显示在软件下方的文本框中。网页中收录的表格数量和页眉信息在软件左上角的列表框中显示。
3、从表数列表中选择要抓取的表。此时,软件中窗体左上角第一个单元格的内容输入框中会显示窗体左上角的第一个文本。表单中收录的字段(列)将显示在软件左侧的中间列表中。
4、然后选择你想要采集的表数据的字段(列),如果你不选择它,所有的采集都会被设置。
5、选择是否要抓取表格的标题行以及保存时是否显示表格行。如果网页表单的某个字段中有链接,您可以选择是否收录链接地址。如果是这样,你可以采集其链接地址,那么你不能同时选择收录标题行。
6、如果你想让采集的表格数据只有一个网页,那么现在可以直接点击抓取表格。如果之前没有选择收录表格行,表格数据将保存为 CVS 格式。格式可以直接用微软EXCEL软件打开,转换成EXCEL格式。如果选择在前面收录表格行,表格数据会以TXT格式保存,可以用记事本软件打开查看。表行直接可用,也很清晰。
7、如果想让采集的表数据连续多页,又想采集向下,那么请设置程序采集下一页和后续页,可以打开下一页基于链接名称。几乎大多数带有链接名称的页面都是“下一页”。您可以查看页面,找到后输入。如果页面没有下一页的链接,但是URL中收录了页数,那么你也可以根据URL中的页数选择打开。可以从前到后选择,例如从第1页到第10页。也可以从后到前选择,例如从第10页到第1页,在页码输入框中输入。可以,但此时URL中代表页数的位置要换成“(*)”,否则程序将无法识别。
8、然后选择定时采集或者等待网页打开并在采集之后立即加载,定时采集是程序根据设定的小时间间隔来判断是否有打开的页面的你要的表格是采集,加载网页后,采集只要打开采集的网页,程序就会立即进行采集,两者各有特点,看需要选择。
9、最后,你只需点击表格按钮,你就可以泡一杯咖啡了!
10、如果你已经熟悉了你想要采集的网页信息,并且你想让采集指定表单中的所有字段,你也可以输入一些你需要的信息,而不需要经过crawl test 等待操作,直接点击抓取表格。