excel vba 网页数据抓取(如何在EXCEL中用正则表达式抓取网页中的信息文章链接 )

优采云 发布时间: 2022-01-30 03:15

  excel vba 网页数据抓取(如何在EXCEL中用正则表达式抓取网页中的信息文章链接

)

  上一篇介绍了如何在EXCEL中使用正则表达式爬取网页中的信息,文章链接:使用EXCEL爬取网页中的信息和Python一样优雅,但是有人说,我不会知道正则表达式有没有这么难,不知道VBA怎么这么难。我不想编程。有没有更简单的方法?所以本文文章将介绍一个EXCEL插件,seotoolsforexcel。安装此插件后,即可使用Xpath抓取网页信息。

  1.先打开浏览器查看,选择要抓取的元素,复制Xpath表达式,在百度首页抓取“Baidu click”四个字。同样的原则也适用于其他网页。文案下的表达式为“//*[@id="su"]”

  

  复制 Xpth

  2.安装seotoolsforexcel后,点击SeoTools选项卡-HTTP按钮-XPathOnUrl功能

  

  XPathOnUrl

  3.在弹出的XPathOnUrl属性中,“百度一一”四个字符所在的html段用“”、“.//*[@id='su']”填充,并且值为Yes,具体填充方式和爬取效果如下

  

  XPathOnUrl 填充方法

  4.点击Http设置,在弹出的Http设置对话框中,还可以定义请求头,定义认证信息,设置随机请求等,非常强大。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线