js 抓取网页内容(、网抓(网页打开)过程中的几种情况 )
优采云 发布时间: 2021-12-24 14:07js 抓取网页内容(、网抓(网页打开)过程中的几种情况
)
首先,我不是派对!有一定的vba和抓网技术水平。
我爬过的网页无外乎以下几种情况:
1、 GET 方法请求数据。这种类型的网页一般都非常简单,URL 中有各种参数。
2、 POST方式请求数据,这种网页有一定难度。但是使用fiddler工具可以快速分析出实际地址和要传递的参数。主要难点是有些参数是通过JS动态生成的,所以可以在vba中找到JS函数并执行对应的JS。
--------------------我是分割线--------------------
最近抓了一个网站的数据,第一次遇到网页数据是用AngularJS技术动态写的!!你可以用fiddler获取你想要的内容,但是用代码抓取时,http头返回304错误。
经过多日的 AngularJS 技术黑客攻击,最终以失败告终。在此恳请各位大神帮忙,小弟感激不尽。
网页抓取(网页打开)的过程大致如下:
, 打开网站,输入关键词,如:支付宝(中国,点击眼睛打开二级页面
, 点击找到的第一个信息打开另一个页面。
, 获取此页面上的所有数据。如法定代表人、注册资本、身份、行业等。
ps:使用code发送搜索数据时,httphead只需要发送一条数据:.setRequestHeader "loop", "null",这个head必须设置。
再次恳求各位大神帮忙!谢谢!