php 网页抓取(AD:阿里云服务器企业会员更优惠腾讯云香港,韩国免备案服务器1.8折优惠)
优采云 发布时间: 2021-10-31 13:08php 网页抓取(AD:阿里云服务器企业会员更优惠腾讯云香港,韩国免备案服务器1.8折优惠)
AD:阿里云服务器企业会员更优惠。腾讯云香港、韩国免备案服务器。1.20%优惠
本文文章主要介绍PHP中使用file_get_contents抓取网页中文乱码问题的解决方法。可以通过使用 curl 配置 gzip 选项来解决。有一定的参考价值,有需要的朋友可以参考
本文介绍了PHP中使用file_get_contents抓取网页中文乱码问题的解决方案示例。分享给大家,供大家参考。具体方法如下:
file_get_contents 函数本来是一个很好的php内置的本地和远程文件操作函数。它可以让我们不费吹灰之力就可以直接下载远程数据,但是我在使用它来阅读网页时会遇到一些问题。页面出现乱码,这里总结一下具体的解决方法。
据网上的朋友说,可能是服务器开启了GZIP压缩的原因。下面是用firebug查看我的网站的header信息。 Gzip 已打开。请求头信息的原创头信息如下:
<p>Accepttext/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8Accept-Encodinggzip,deflateAccept-Languagezh-cn,zh;q =0.8,en-us;q=0.5,en;q=0.3Connectionkeep-aliveCookie__utma=225240837.787252530.1317310581.1335406161.1335411401.1537;__utmz=225240837.1326850415.887.3.utmcsr=google=22524083 |utmcmd=有机|utmctr=%E4%BB%BB%E4%BD%95%E9%A1%B9%E7%9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A% E9%82%A3%E4%B9%88%E7%AE%80%E5%8D%95%20site%3A;PHPSESSID=888mj4425p8s0m7s0frre3ovc7;__utmc=225240837;__utmb=225@