php抓取网页数据插入数据库( 3种利用php获得网页源代码抓取网页内容的方法,值得收藏)
优采云 发布时间: 2022-02-13 03:20php抓取网页数据插入数据库(
3种利用php获得网页源代码抓取网页内容的方法,值得收藏)
本文文章为大家带来php获取网页内容的方法有哪些? php获取网页内容的代码示例有一定的参考价值。有需要的朋友可以参考一下,希望对你有帮助。
使用php获取网页源代码抓取网页内容的3种方式,我们可以根据实际需要进行选择。
1、使用file_get_contents获取网页源代码
这种方法最常用,只需要两行代码,非常简单方便。
参考代码:
?php$fh= file_get_contents( http://www.webkaka.com/ echo $fh;?
2、使用fopen获取网页源代码
用这种方法的人很多,但是代码有点多。
参考代码:
?php$fh = fopen( http://www.webkaka.com/ , r if($fh){ while(!feof($fh)) { echo fgets($fh);?
3、使用curl获取网页源代码
使用curl获取网页源代码的做法,经常被要求较高的人使用。比如在爬取网页内容的同时需要获取网页的头部信息,以及使用ENCODING编码,使用USERAGENT等。
参考代码一:
?php// 创建一个新cURL资源$ch = curl_init();// 设置URL和相应的选项curl_setopt($ch, CURLOPT_URL, http://www.webkaka.com/ curl_setopt($ch, CURLOPT_HEADER, false);// 抓取URL并把它传递给浏览器$data = curl_exec($ch);echo $data;//关闭cURL资源,并且释放系统资源curl_close($ch);?
参考代码2:
?php$szUrl = http://www.webkaka.com/ $UserAgent = Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322) $curl = curl_init();curl_setopt($curl, CURLOPT_URL, $szUrl);curl_setopt($curl, CURLOPT_HEADER, 0); //0表示不输出Header,1表示输出curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);curl_setopt($curl, CURLOPT_ENCODING, curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);$data = curl_exec($curl); echo $data;//echo curl_errno($curl); //返回0时表示程序执行成功 exit();?
以上是php获取网页内容的方法有哪些? php获取网页内容的代码示例详细内容,PHP教程
郑重声明:本文版权归原作者所有,转载文章仅出于传播更多信息之目的。如果作者信息标注有误,请尽快联系我们修改或删除,谢谢。