excel抓取网页数据(搞网上信息采集工作,最头疼的便是从网页上一次次)
优采云 发布时间: 2021-09-28 14:02excel抓取网页数据(搞网上信息采集工作,最头疼的便是从网页上一次次)
网上资料采集的工作最麻烦的就是从网页上复制数据表,而且复制之后还要做很多修改,不仅麻烦而且浪费时间和工作效率。大大打折。这个时候,我们不妨试试用功能强大的Excel来解决这个问题。
网上资料采集的工作最麻烦的就是从网页上复制数据表,而且复制之后还要做很多修改,不仅麻烦而且浪费时间和工作效率。大大打折。这个时候,我们不妨试试用功能强大的Excel来解决这个问题。
对于更规范的表格数据,我们可以在表格页面右击选择“导出到Microsoft Office Excel”(图1),然后系统会自动打开Office Excel进行数据加载。这个过程只需要加载几秒后数据(图2)。如果你觉得数据更适合你的编辑需求,那么你可以直接保存。否则你也可以做适当的修改,因为在表格处理方面,Excel比词好得多。
图1
无论是在线表格还是数据采集,Excel往往更智能。当它执行数据采集和加载时,它只加载表格固定区域的数据,而不是加载整个网页。装进去,这个我试过很多次了,都非常听话。请看图2的效果。
图2
当然,网页中也有一些非标准的数据和表格。Excel处理这样的数据有点难度,但只要熟悉Excel的操作功能,还是可以轻松搞定的。先看看这个页面(图片3),
图 3
图3 这种不规则的页面数据,如果用Excel处理,会出现这样的结果(图4),看是不是觉得乱七八糟,什么都错位了,一般人会觉得快的主要原因是文件数据的开头和结尾是额外的。
图 4
但是,只要我们删除文件顶部和底部的不规则区域,剩下的数据是不是会变得更容易处理?这时候我们执行菜单:“Data-Columns-Next”,这样不规则的数据就可以标准化了。这是处理后的结果(图5)
图 5
对于那些已经比较标准的表,就简单多了,只要执行“导出加载-轻微修改-保存”即可。