php curl抓取网页内容(phpcurl抓取网页内容的方法-乐题库(一))
优采云 发布时间: 2022-02-13 19:01php curl抓取网页内容(phpcurl抓取网页内容的方法-乐题库(一))
phpcurl抓取网页内容的方法
一、先进入phpcurl/login/,
二、等待用户的验证过程,其中必须指定一个密码,输入token(或者用户名和口令),服务器端收到以后就会返回给你token和口令,你再次登录时,
三、请求成功以后,请求的内容需要有token(也就是用户名和口令),所以token需要放到变量里。在form_input中写一个token=xxxxx来指定一个变量,token到底是什么东西要因地制宜,有时我们的token是spring,有时我们的token是java,有时我们的token是aspx...等等,具体问题具体分析。可以参考高可用和负载均衡架构中的下面的例子;。
四、每次请求成功以后,在响应头中,都要加上php_socket_install;代表这次请求我们重新添加了一个connection_status;(很重要,
五、一般变量token在form_input响应体中有,调用set_encode(connection_status,token);会指定,但这个时候还不是最后一次请求,服务器端只会生成一次请求,也就是输入到服务器端的token都会写入到变量里,这个时候服务器端会从变量中取出第一次请求的数据调用set_encode(connection_status,token);。
六、最后一次请求服务器端会判断变量token是否存在(可以用缓存或者先来进行缓存),也可以用正则匹配出所有变量,再判断token是否匹配,
七、调用set_global_access_login_flag;让我们的set_encode(connection_status,token)函数在连接成功或者关闭的时候执行(这个时候可以用到arpsec、dbc等ssl协议函数);
八、服务器端会解析你提供的token,并且调用该协议函数,比如arpsec进行arp,dbc等进行dns的路由。调用的是set_global_user_password;最后的一步,也是最重要的一步,调用变量返回什么,这个时候才是关键,将是用户真正访问的页面。