php curl抓取网页( 远程网页内容的php代码,做小偷采集程序的程序经常用得到)
优采云 发布时间: 2021-09-17 12:02php curl抓取网页(
远程网页内容的php代码,做小偷采集程序的程序经常用得到)
获取远程网页内容的PHP代码(fopen,经过测试)
更新时间:2011年6月6日09:05:33作者:
获取远程网页内容的PHP代码通常用作小偷采集程序。现在卷曲被更多地使用
1、fopen使用
副本代码如下:
副本代码如下:
//对于PHP5和更高版本,可以使用以下代码
但是上面的代码很容易打开流失败:http请求失败!错误、解决方案
有人说,在php.ini中,有两个选项:allow_url_ufopen=on(表示可以通过url打开远程文件),user_Agent=“php”(表示使用哪个脚本访问网络。默认情况下,前面有一个“;”,只需删除它)重新启动服务器
然而,有些人仍然有这个警告信息。离完美解决方案还有一步之遥。您必须在php.ini u代理中设置用户,php默认用户u代理是php,我们将其更改为Mozilla/4.0(兼容;MSIE6.0;Windows NT5.0)以模拟浏览器
<IMG src="/upload/201106/20110606090106493.gif" border=0>
user\u agent=“Mozilla/4.0(兼容;MSIE6.0;Windows NT5.0)”
我在工作中遇到了这个问题,并完美地解决了它,因此我将与您分享
2、由curl实现
副本代码如下:
在Linux下,您可以使用以下代码下载
exec(“wget{$url}”)
PHP获取外部资源函数fopen/file\u get\u contents/curl
Fopen/file\u get\u内容每次请求都会重复DNS查询,并且不会缓存DNS信息
但是,curl将自动缓存DNS信息。对同一域名下的网页或图片的请求只需要一个DNS查询
这大大减少了DNS查询的数量
因此,curl的性能远远优于fopen/file\u get\u contents