php抓取网页title(一个开源的浏览器引擎,与之相对应的引擎有Gecko)
优采云 发布时间: 2022-04-13 17:19php抓取网页title(一个开源的浏览器引擎,与之相对应的引擎有Gecko)
WebKit是一个开源的浏览器引擎,对应的引擎有Gecko(Mozilla Firefox等使用)和Trident(又称MSHTML,IE使用)
参考来源:
代码示例:
phantomjs 和 slimerjs,都是服务端 js。简而言之,它们都封装了浏览器解析引擎。不同的是webkti是用phantomjs封装的,而slimerjs是用Gecko(firefox)封装的。权衡利弊后,我决定研究phantomjs,所以我使用phantomjs来生成网站快照。 phantomjs的项目地址是:
代码涉及两部分,一是设计业务的index.php,二是生成快照的js脚本snapshot.js。代码比较简单,只是实现功能,没有做太多修改。代码如下:
php:
html
快照生成
* {
margin: 0;
padding: 0;
}
form {
padding: 20px;
}
div {
margin: 20px 0 0;
}
input {
width: 200px;
padding: 4px 2px;
}
#placeholder {
display: none;
}
生成快照
$(function(){
$('#form').submit(function(){
if (typeof($(this).data('generate')) !== 'undefined' && $(this).data('generate') === true)
{
alert('正在生成网站快照,请耐心等待...');
return false;
}
$(this).data('generate', true);
$('button').text('正在生成快照...').attr('disabled', true);
$.ajax({
type: 'GET',
url: '?',
data: 'url=' + $('#url').val(),
success: function(data){
$('#placeholder').attr('src', data).show();
$('#form').data('generate', false);
$('button').text('生成快照').attr('disabled', false);
}
});
return false;
});
});
php使用CutyCapt实现网页高清截图:
网页截图功能,必须安装IE+CutyCapturl:要截图的网页:图片保存路径路径:CutyCapt路径cmd:CutyCapt执行命令如:你的php path.php?url=
CutyCapt下载地址:http://sourceforge.net/projects/cutycapt/files/cutycapt/
windows的不用安装的,直接下载解压放到相对应的路径即可
linux安装CutyCapt教程:http://niutuku9.com/tech/php/273578.shtml
组织参考来自:软联盟