js 抓取网页内容(、网抓(网页打开)过程中的几种情况 )

优采云 发布时间: 2021-12-24 14:07

  js 抓取网页内容(、网抓(网页打开)过程中的几种情况

)

  首先,我不是派对!有一定的vba和抓网技术水平。

  我爬过的网页无外乎以下几种情况:

  1、 GET 方法请求数据。这种类型的网页一般都非常简单,URL 中有各种参数。

  2、 POST方式请求数据,这种网页有一定难度。但是使用fiddler工具可以快速分析出实际地址和要传递的参数。主要难点是有些参数是通过JS动态生成的,所以可以在vba中找到JS函数并执行对应的JS。

  --------------------我是分割线--------------------

  最近抓了一个网站的数据,第一次遇到网页数据是用AngularJS技术动态写的!!你可以用fiddler获取你想要的内容,但是用代码抓取时,http头返回304错误。

  经过多日的 AngularJS 技术黑客攻击,最终以失败告终。在此恳请各位大神帮忙,小弟感激不尽。

  网页抓取(网页打开)的过程大致如下:

  , 打开网站,输入关键词,如:支付宝(中国,点击眼睛打开二级页面

  , 点击找到的第一个信息打开另一个页面。

  , 获取此页面上的所有数据。如法定代表人、注册资本、身份、行业等。

  ps:使用code发送搜索数据时,httphead只需要发送一条数据:.setRequestHeader "loop", "null",这个head必须设置。

  再次恳求各位大神帮忙!谢谢!

  

  

  

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线