excel抓取网页数据(网上信息采集工作,最头疼的便是从网页上导出到OfficeExcel)

优采云 发布时间: 2021-09-29 21:35

  excel抓取网页数据(网上信息采集工作,最头疼的便是从网页上导出到OfficeExcel)

  网上资料采集的工作最麻烦的就是从网页上复制数据表很枯燥,复制后需要大量修改,不仅麻烦而且浪费时间和工作效率。大大打折。这个时候,我们不妨试试用功能强大的Excel来解决这个问题。

  对于更规范的表格数据,我们可以在表格页面右击选择“导出到Microsoft Office Excel”(图1),然后系统会自动打开Office Excel进行数据加载。这个过程只需要加载几秒后数据(图2)。如果你觉得数据更适合你的编辑需求,那么你可以直接保存。否则你也可以做适当的修改,因为在表格处理方面,Excel比词好得多。

  <IMG src="http://up.2cto.com/net/200506/20050610125726588.jpg" border=0>

  图1

  无论是在线表格还是数据采集,Excel往往更智能。它只在执行数据采集和加载时加载表单固定区域的数据,而不是加载整个网页。装进去,这个我试过很多次了,都非常听话。请看图2的效果。

  <IMG src="http://up.2cto.com/net/200506/20050610125727299.jpg" border=0>

  图2

  当然,网页中也有一些非标准的数据和表格。Excel处理这样的数据,有点难度,但只要熟悉Excel的操作功能,还是可以轻松搞定的。先看看这个页面(图片3),

  <IMG src="http://up.2cto.com/net/200506/20050610125727323.jpg" border=0>

  图 3

  图3 这种不规则的页面数据,如果用Excel处理会出现这样的结果(图4),看是不是觉得乱七八糟,什么都错位了,一般人会觉得快的主要原因是文件数据的开头和结尾是额外的。

  <IMG src="http://up.2cto.com/net/200506/20050610125728752.jpg" border=0>

  图 4

  但是,只要我们删除文件顶部和底部的不规则区域,剩下的数据是不是会变得更容易处理?这时候我们执行菜单:“Data-Columns-Next”,这样不规则的数据就可以标准化了。这是处理后的结果(图5)

  <IMG src="http://up.2cto.com/net/200506/20050610125728981.jpg" border=0>

  图 5

  对于那些已经比较标准的表,就简单多了,只要执行“导出加载-轻微修改-保存”即可。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线