php抓取网页标签( 9个非常有用的PHP代码片段,感兴趣的小伙伴们 )
优采云 发布时间: 2022-04-12 22:31php抓取网页标签(
9个非常有用的PHP代码片段,感兴趣的小伙伴们
)
9 个有用的 php 代码片段
更新时间:2016年3月15日15:12:13 作者:郑宏信尔克
本文章主要介绍9个非常有用的PHP代码片段,可以帮助你开发PHP项目。这里采集了9个PHP代码片段,感兴趣的朋友可以参考
p>
比较有用的php代码片段分享给大家参考。具体代码如下
一、从网页中提取关键词
$meta = get_meta_tags('http://www.emoticode.net/');
$keywords = $meta['keywords'];
// Split keywords
$keywords = explode(',', $keywords );
// Trim them
$keywords = array_map( 'trim', $keywords );
// Remove empty values
$keywords = array_filter( $keywords );
print_r( $keywords );
二、查找页面上的所有链接
使用 DOM,您可以在任何页面上抓取链接,示例如下。
$html = file_get_contents('http://www.example.com');
$dom = new DOMDocument();
@$dom->loadHTML($html);
// grab all the on the page
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute('href');
echo $url.'<br />';
}
三、创建数据 URI
数据 URI 可以帮助将图像嵌入 HTML/CSS/JS,从而节省 HTTP 请求。以下函数使用 $file 创建数据 URI。
function data_uri($file, $mime) {
$contents=file_get_contents($file);
$base64=base64_encode($contents);
echo "data:$mime;base64,$base64";
}
四、下载远程图像并将其保存到您的服务器
在构建网站 时,您很可能会从远程服务器下载图像并将它们保存到您自己的服务器上。下面的代码可以帮你实现这个功能。
$image = file_get_contents('http://www.php100.com/image.jpg');
file_put_contents('/images/image.jpg', $image); //Where to save the image
五、删除 Microsoft Word HTML 标签
在你使用Microsoft Word的时候,会创建很多标签,比如font、span、style、class等。这些标签在Word中非常有用,但是当你将Word中的文本粘贴到网页上时,会出现很多无用的标签。以下实用功能可以帮助您清除所有 Word HTML 标签。
function cleanHTML($html) {
///
/// Removes all FONT and SPAN tags, and all Class and Style attributes.
/// Designed to get rid of non-standard Microsoft Word HTML tags.
///
// start by completely removing all unwanted tags
$html = ereg_replace("]*>","",$html);
// then run another pass over the html (twice), removing unwanted attributes
$html = ereg_replace("]*)(class|lang|style|size|face)=("[^"]*"|'[^']*'|[^>]+)([^>]*)>","",$html);
$html = ereg_replace("]*)(class|lang|style|size|face)=("[^"]*"|'[^']*'|[^>]+)([^>]*)>","",$html);
return $html
}
六、检测浏览器语言
如果你的网站是多语言的,下面的代码可以帮你检测浏览器语言,它会返回客户端浏览器的默认语言。
function get_client_language($availableLanguages, $default='en'){
if (isset($_SERVER['HTTP_ACCEPT_LANGUAGE'])) {
$langs=explode(',',$_SERVER['HTTP_ACCEPT_LANGUAGE']);
foreach ($langs as $value){
$choice=substr($value,0,2);
if(in_array($choice, $availableLanguages)){
return $choice;
}
}
}
return $default;
}
七、本地保存请求信息
复制代码代码如下:
file_put_contents('/tmp/all.log','mapping'.date("m-d H:i:s")."\n",FILE_APPEND);
八、Excel相互转换日期
//如果去获取某个excel日期(格式为:2016-03-12),那么获取到的是数字,需要经过转换才能恢复
public function excelTime($date, $time = false) {
if(function_exists('GregorianToJD')){
if (is_numeric( $date )) {
$jd = GregorianToJD( 1, 1, 1970 );
$gregorian = JDToGregorian( $jd + intval ( $date ) - 25569 );
$date = explode( '/', $gregorian );
$date_str = str_pad( $date [2], 4, '0', STR_PAD_LEFT )
."-". str_pad( $date [0], 2, '0', STR_PAD_LEFT )
."-". str_pad( $date [1], 2, '0', STR_PAD_LEFT )
. ($time ? " 00:00:00" : '');
return $date_str;
}
}else{
// $date=$date>25568? $date+1:25569;
/*There was a bug if Converting date before 1-1-1970 (tstamp 0)*/
$ofs=(70 * 365 + 17+2) * 86400;
$date = date("Y-m-d",($date * 86400) - $ofs).($time ? " 00:00:00" : '');
return $date;
}
}
九、json和数据转换
1 json转换成数组
$json = '[{"id":"22","name":"33","descn":"44"}]'; //json格式的数组转换成 php的数组
$arr = (Array)json_decode($json);
echo $arr[0]->id; //用对象的方式访问(这种是没有转换成数组,而是转换成对象的情况
2 数组转换成json
$json_arr = array('WebName'=>'11','WebSite'=>'11');
$php_json = json_encode($json_arr); //把php数组格式转换成 json 格式的数据
echo $php_json;