php抓取网页动态数据(详解动态网站的访问过程,动态网页与动态页面共存)
优采云 发布时间: 2022-02-10 11:10php抓取网页动态数据(详解动态网站的访问过程,动态网页与动态页面共存)
目前网站页面主要分为静态页面和动态页面。纯静态页面组成的网站现在比较少见,大型网站一般采用动态网站建站技术,部分网站是静态网页和动态网页。本文以Apache服务器和php语言为例,详细讲解动态网站的访问过程。下面直接切入本文的主题。
(1)客户端访问服务端的html文件
S1:通过本机配置的DNS域名服务器地址找到DNS服务器,将网站 URL中的web主机域名解析为web服务器所在Linux操作系统(Apache通常与Linux操作系统结合使用)。IP地址。
S2:通过HTTP协议(超文本传输协议)连接到上面IP地址的服务器系统,通过默认端口80请求Apache服务器上的对应目录(默认端口为80,还有其他端口,你输入 URL 时一般不需要输入端口)。html 文件(例如 index.htm)。
S3:Apache服务器接收到用户的访问请求后,在其管理的文档目录中找到并打开相应的html文件(如index.htm),并将文件内容响应给客户端浏览器(即用户)。
S4:浏览器收到web服务器的响应后,在服务器端接收并下载html静态代码,然后浏览器对代码进行解释,最后渲染网页(由于不同的浏览器对代码的解释规则不同) , 所以不同的浏览器对代码的解释不同. 浏览器对同一个网页最终呈现的页面效果会有所不同).
(2)客户端访问服务端的php文件
S1:这一步和上面访问html静态网页一样,通过DNS服务器解析对应web服务器的IP地址。
S2:和上面访问html静态页面类似,但是最终请求的是Apache服务器上对应目录下的php文件,比如index.php。
S3:Apache服务器本身无法处理php动态语言脚本文件,所以找到并委托PHP应用服务器处理(PHP应用服务器必须提前安装在服务器端),Apache服务器提交php文件(例如 index. 到 PHP 应用程序服务器。
S4:PHP应用服务器接收到php文件(如index.php),打开并解释php文件,最后翻译成html静态代码,然后将html静态代码返回给Apache服务器,Apache服务器将接收到的html静态代码输出到客户端浏览器(即用户)。
S5:和上面访问html静态页面一样,浏览器收到web服务器的响应后,在服务器端接收并下载html静态代码,然后浏览器对代码进行解析,最终渲染出网页。
(3)客户端访问服务器端的MySQL数据库
如果用户需要对MySQL数据库中的数据进行操作,那么就需要在服务器端安装数据库管理软件MySQL server来存储和管理网站数据。由于Apache服务器无法连接和操作MySQL服务器,所以需要安装php应用服务器,让Apache服务器委托php应用服务器连接和操作数据库。在管理数据库中的数据时,一般需要使用结构查询语句,即SQL语句。
S1:这一步和上面访问php文件一样,通过DNS服务器解析对应web服务器的IP地址。
S2:和上面访问php文件一样,请求访问Apache服务器对应目录下的php文件。
S3:和上面访问php文件一样,PHP应用服务器接受Apache服务器的委托,接收到对应的php文件。
S4:PHP应用服务器打开php文件,通过php文件中的数据库连接代码连接本地机器或网络上其他机器的MySQL数据库,执行php程序中的标准SQL查询语句获取数据在数据库中。数据,然后通过 PHP 应用服务器从数据中生成 html 静态代码。
S5:浏览器收到web服务器的响应后,在服务器端接收并下载html静态代码,然后浏览器对代码进行解释,最终呈现网页。
需要注意的是,文中的(2)和(3))的区别是一个访问数据库,另一个不访问数据库,所以在流程上有一点区别。