php 正则 抓取网页( PHP正则表达式抓取某个标签的特定属性值的接口通用方法)
优采云 发布时间: 2021-10-08 19:25php 正则 抓取网页(
PHP正则表达式抓取某个标签的特定属性值的接口通用方法)
正则表达式 PHP 正则表达式抓取标签的特定属性值
学了几天php正则,抓了一些网站的数据,发现自己写正则很麻烦,每次都重新抓,所以想写一个通用的接口来抓具体的标签具有特定的属性值。代码。
//$html-被查找的字符串 $tag-被查找的标签 $attr-被查找的属性名 $value-被查找的属性值
function get_tag_data($html,$tag,$attr,$value){
$regex = "/(.*?)/is";
echo $regex."
";
preg_match_all($regex,$html,$matches,PREG_PATTERN_ORDER);
return $matches[1];
}
//返回值为数组 查找到的标签内的内容
这是一个例子
header("Content-type: text/html; charset=utf-8");
$temp = '
';
$result = get_tag_data($temp,"a","class","fc01");
var_dump($result);
输出结果是
array(6) { [0]=> string(6) "首页" [1]=> string(6) "日志" [2]=> string(6) "LOFTER" [3]=> string(6) "相册" [4]=> string(6) "博友" [5]=> string(9) "关于我" }
你可以看到源代码
array(6) {
[0]=>
string(6) "首页"
[1]=>
string(6) "日志"
[2]=>
string(6) "LOFTER"
[3]=>
string(6) "相册"
[4]=>
string(6) "博友"
[5]=>
string(9) "关于我"
}
第一次写博客的时候很紧张,哈哈哈,希望对大家有用,也希望大家能指出代码中的问题,不做大量测试~~
以上就是我给大家介绍的PHP正则表达式抓取标签特定属性值的方法。我希望它会对你有所帮助。如果您有任何问题,请给我留言。小编会及时回复您。. 非常感谢您对脚本之家网站的支持!