php curl抓取网页内容(先用getJobsHubuNotice()函数获取新闻的链接，用浏览器打开没有问题)

优采云发布时间: 2021-12-06 10:16

　　单独使用curl来取是可行的，但是如果取一系列相同类型的网站会报错，把它们放在一个数组中

　　在 $linkList 中，它们是，依此类推。

　　function getJobsHubuNotice()

{

$curl = curl_init('http://jobs.hubu.edu.cn/List.aspx?ArticleChannelId=81');

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

$result = curl_exec($curl);

//内容处理

$result = strip_tags($result,'<a>');

$result = stristr($result, 'nbsp当前位置：');

$result = str_replace('nbsp当前位置：', '', $result);

$result = stristr($result, '当前1/2页',true);

$result = stristr($result, '通知公告');

$result = str_replace('通知公告</a>', '', $result);

preg_match_all('/(? 通知公告', '', $result);

$result = stristr($result, '$(document).ready',true);

$result = trim($result);

$result = str_replace("\r\n", '

', $result);

$result = preg_replace('/(\){1,}/', '

', $result);

echo $result;

echo '

';

echo "退出makePage函数";

return $result;

}

　　首先使用getJobsHubuNotice()函数获取新闻的链接、标题、日期，然后使用makePage()函数获取内容

　　这是在makePage里面打印链接的结果。用浏览器打开链接没有问题。

0

2021-12-06

php curl抓取网页内容

0 个评论

要回复文章请先登录或注册