php curl抓取网页内容(先用getJobsHubuNotice()函数获取新闻的链接,用浏览器打开没有问题)
优采云 发布时间: 2021-12-06 10:16php curl抓取网页内容(先用getJobsHubuNotice()函数获取新闻的链接,用浏览器打开没有问题)
单独使用curl来取是可行的,但是如果取一系列相同类型的网站会报错,把它们放在一个数组中
在 $linkList 中,它们是,依此类推。
function getJobsHubuNotice()
{
$curl = curl_init('http://jobs.hubu.edu.cn/List.aspx?ArticleChannelId=81');
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($curl);
//内容处理
$result = strip_tags($result,'<a>');
$result = stristr($result, 'nbsp当前位置:');
$result = str_replace('nbsp当前位置:', '', $result);
$result = stristr($result, '当前1/2页',true);
$result = stristr($result, '通知公告');
$result = str_replace('通知公告</a>', '', $result);
preg_match_all('/(? 通知公告', '', $result);
$result = stristr($result, '$(document).ready',true);
$result = trim($result);
$result = str_replace("\r\n", '
', $result);
$result = preg_replace('/(\){1,}/', '
', $result);
echo $result;
echo '
';
echo "退出makePage函数";
return $result;
}
}
首先使用getJobsHubuNotice()函数获取新闻的链接、标题、日期,然后使用makePage()函数获取内容
这是在makePage里面打印链接的结果。用浏览器打开链接没有问题。