excel vba 网页数据抓取(如何在EXCEL中用正则表达式抓取网页中的信息文章链接 )
优采云 发布时间: 2022-01-30 03:15excel vba 网页数据抓取(如何在EXCEL中用正则表达式抓取网页中的信息文章链接
)
上一篇介绍了如何在EXCEL中使用正则表达式爬取网页中的信息,文章链接:使用EXCEL爬取网页中的信息和Python一样优雅,但是有人说,我不会知道正则表达式有没有这么难,不知道VBA怎么这么难。我不想编程。有没有更简单的方法?所以本文文章将介绍一个EXCEL插件,seotoolsforexcel。安装此插件后,即可使用Xpath抓取网页信息。
1.先打开浏览器查看,选择要抓取的元素,复制Xpath表达式,在百度首页抓取“Baidu click”四个字。同样的原则也适用于其他网页。文案下的表达式为“//*[@id="su"]”
复制 Xpth
2.安装seotoolsforexcel后,点击SeoTools选项卡-HTTP按钮-XPathOnUrl功能
XPathOnUrl
3.在弹出的XPathOnUrl属性中,“百度一一”四个字符所在的html段用“”、“.//*[@id='su']”填充,并且值为Yes,具体填充方式和爬取效果如下
XPathOnUrl 填充方法
4.点击Http设置,在弹出的Http设置对话框中,还可以定义请求头,定义认证信息,设置随机请求等,非常强大。