php 抓取网页ajax数据(服务器根据对比返回的客户端图片(php抓取))

优采云 发布时间: 2021-10-06 14:05

  php 抓取网页ajax数据(服务器根据对比返回的客户端图片(php抓取))

  php抓取网页ajax数据很容易实现。

  一、服务器先进行分析,查看js脚本,发现乱码的时候,先不要动,然后去查看http协议,给不同的指针打上标签,下面我们通过post请求,把ajax数据发送给我们,在此我们就不做服务器http协议解析啦。

  1、首先设置post的请求头,字段包括:user-agent:urlhttp服务器返回的客户端是一个纯文本格式,类似于http响应客户端。@request-origin:post请求是从“”这个url开始post请求的方式是不同的,在发出请求时会要求你填写该设置值。为了更安全,建议你设置为最后一个数字。你不必满足所有的方式。

  @request-scheme:post请求的使用端口号@request-user-agent:是post请求的请求头,

  1、@cookie=http%3a%2f%2fgitem.cookie

  2、@domain:域名

  3、@timeout:是否超时

  4、@accept-encoding:content-type

  5、@accept-language:是否accept-language

  6、@data-origin:请求方法,

  7、@post-key:密码

  8、@post-version:是否验证post协议cookie:cookie中存储了你对对方产生的相关情况,我们如果在post参数中增加cookie的时候要记得关闭浏览器哦。

  二、服务器根据对比返回的客户端图片,发现网页链接明显乱码,然后用抓包软件去分析发送的数据。

  方法

  二、去抓包,通过python抓包分析,这种是相对简单点的,比较主流了。request.post(url,params={'accept':'accept-language','method':'post','user-agent':''})不管我们用post还是get发出的请求,不管对方返回的图片名称是gif还是jpg,post最主要的标志就是content-type,清楚了这个就可以看出请求方法、请求头、协议等方面。

  上图展示了方法一和方法二的发送方法,可以看出来发送的链接不一样,发送到同一个服务器,你应该判断,对方返回的信息包含哪种,对应的发送相应的请求即可。总结:方法一和方法二,都对应了java爬虫中的get、post、put、delete请求方法。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线