vba xmlhttp 抓取网页(《VBA信息获取与处理》教程之HTML与HTML)
优采云 发布时间: 2022-04-11 12:00vba xmlhttp 抓取网页(《VBA信息获取与处理》教程之HTML与HTML)
【分享成果,为正能量而欢欣鼓舞】“人情如纸,世界如一盘棋”,对外界叠加期待,简直是在骚扰自己。世事跌宕起伏,学会放弃依赖,降低期望,控制敏感,多一些冷漠,顺其自然,更容易得到意想不到的快乐。
《VBA信息获取与处理》教程是我推出的第六套教程,目前是第一次改版。这套教程定位在最高级的水平。这是针对初学者和中级的教程。本教程将为大家讲解:跨应用信息获取、随机信息的使用、邮件发送、VBA上网数据抓取、VBA延时操作、剪贴板应用、Split功能扩展、工作表信息等应用交互、FSO对象的使用、获取工作表和文件夹信息、图形信息获取、自定义工作表信息功能等。程序文件在32位和64位OFFICE系统上测试。非常抽象,更有研究价值。
本课程由两卷八十四讲组成。今天的内容是话题八《VBA与HTML文档》:文档访问端口DOM
第 5 节 HTML 文档访问端口 DOM(文档对象模型)
大家好,我们继续研究HTML文档。在前面的部分中,我们了解了 Web 文档中的各种元素,那么我们如何访问它们,以及如何实现它们呢?实际上,HTML 文档提供了访问其元素的端口,即 HTML DOM,它定义了一组标准的机制,用于访问或操作 HTML 文档中的对象。 HTML DOM 定义了所有 HTML 元素的对象和属性,以及访问它们的方法。换句话说,HTML DOM 是关于如何获取、修改、添加或删除 HTML 元素的标准。
1 HTML DOM(文档对象模型)对象集合
加载到浏览器中的每个 HTML 文档都成为一个 Document 对象。 Document 对象使我们能够从脚本访问 HTML 页面中的所有元素。 Document 对象是 HTML 文档的根节点。
特别说明:Document对象是Window对象的一部分,可以通过window.document属性访问。
集合说明
all[] 提供对文档中所有 HTML 元素的访问。
anchors[] 返回对文档中所有 Anchor 对象的引用。
applet 返回对文档中所有 Applet 对象的引用。
forms[] 返回对文档中所有 Form 对象的引用。
images[] 返回对文档中所有 Image 对象的引用。
links[] 返回对文档中所有 Area 和 Link 对象的引用。
VBA 直接支持有限数量的对象调用,如下:
对象描述
Document代表整个HTML文档,可以用来访问页面中的所有元素
锚点代表元素的集合
body代表元素
表单代表元素的集合
框架表示元素或元素的集合
图片代表
元素的集合
链接代表元素的集合
Options表示元素的集合(可以直接在select元素中使用)
Cells表示元素的集合(可以直接用在表格元素中)
Rows表示元素的集合(可以直接用在表格元素中)
提供对文档中所有 HTML 元素的访问的所有对象的集合。
上面的VBA支持直接调用对象的元素,调用起来很方便。可以通过序号调用,比如forms(0),也可以通过name/ID调用,比如forms("name/ID")。其他不能直接调用对象的元素可以间接调用元素或者DOM对象对应的元素来自一般的所有对象集合。
(待续)
本节知识点介绍:
HTML DOM 文档的属性有哪些,常用的属性有哪些。
本节参考:008 Worksheet.xlsm
我 20 多年的 VBA 实践经验全部浓缩为以下教程,按顺序排列:
【分享成果,快乐正能量】只要身体健康平安,人生就是最充实的人生,人生就是最美好的一天。