外汇课堂:请求头怎么破?(一)(组图)
优采云 发布时间: 2022-08-26 01:05外汇课堂:请求头怎么破?(一)(组图)
网页抓取港股实时行情网页抓取使用new_header来传递http请求头,请求头只有三个值:referer/url/view_date/http_post_extra_content/referer是用于请求头,用于识别从哪个来源请求服务器。你可以通过:8000/new_header来访问一个服务器的referer地址。
比如:referer://{},参数传递至服务器,服务器将会按照http请求头中的规则,将请求头值转换成url后返回给你。:8000/new_header这样new_header就传递成功了。请求头长度为2个字符,这和你请求的页面内容无关。由于:请求头会直接储存在set-cookie中,保存在浏览器记录的数据库中,所以请求头是浏览器常用的参数。
当你请求页面的时候,首先服务器需要拿到http请求头中的post或者get/put请求头部的参数,post和get请求头部中提供sessionid,这样你就知道你的对象是通过get请求还是post请求被请求到的。当服务器拿到请求头之后,开始分析请求头中的请求参数,如果参数中包含你的accept-encoding或者http-encoding,http状态码等具体信息的话,服务器就会像具体的浏览器去请求。
因此这样服务器就能够做到更精确的返回内容了。所以在前端抓取港股数据的时候,由于请求报文中提供了set-cookie参数,所以服务器可以知道你请求的对象是通过get请求来请求到的,这样你的数据不就有意义了吗?又比如:请求头提供了post/put请求头部的标识字符串,这样请求的时候服务器就能够看到你请求的对象是通过post请求来获取的,这样就能够根据你获取数据的不同来具体分析哪种请求返回数据不同了。
你可以看一下github的前端抓取的教程:-easy-to-head-handling-web-data-from-chinese-bootstrap/。