php抓取网页title(一个开源的浏览器引擎,与之相对应的引擎有Gecko)

优采云 发布时间: 2022-04-13 17:19

  php抓取网页title(一个开源的浏览器引擎,与之相对应的引擎有Gecko)

  WebKit是一个开源的浏览器引擎,对应的引擎有Gecko(Mozilla Firefox等使用)和Trident(又称MSHTML,IE使用)

  参考来源:

  代码示例:

  phantomjs 和 slimerjs,都是服务端 js。简而言之,它们都封装了浏览器解析引擎。不同的是webkti是用phantomjs封装的,而slimerjs是用Gecko(firefox)封装的。权衡利弊后,我决定研究phantomjs,所以我使用phantomjs来生成网站快照。 phantomjs的项目地址是:

  代码涉及两部分,一是设计业务的index.php,二是生成快照的js脚本snapshot.js。代码比较简单,只是实现功能,没有做太多修改。代码如下:

  php:

  html

  

快照生成

* {

margin: 0;

padding: 0;

}

form {

padding: 20px;

}

div {

margin: 20px 0 0;

}

input {

width: 200px;

padding: 4px 2px;

}

#placeholder {

display: none;

}

生成快照

$(function(){

$('#form').submit(function(){

if (typeof($(this).data('generate')) !== 'undefined' && $(this).data('generate') === true)

{

alert('正在生成网站快照,请耐心等待...');

return false;

}

$(this).data('generate', true);

$('button').text('正在生成快照...').attr('disabled', true);

$.ajax({

type: 'GET',

url: '?',

data: 'url=' + $('#url').val(),

success: function(data){

$('#placeholder').attr('src', data).show();

$('#form').data('generate', false);

$('button').text('生成快照').attr('disabled', false);

}

});

return false;

});

});

  php使用CutyCapt实现网页高清截图:

  网页截图功能,必须安装IE+CutyCapturl:要截图的网页:图片保存路径路径:CutyCapt路径cmd:CutyCapt执行命令如:你的php path.php?url=

  

CutyCapt下载地址:http://sourceforge.net/projects/cutycapt/files/cutycapt/

windows的不用安装的,直接下载解压放到相对应的路径即可

linux安装CutyCapt教程:http://niutuku9.com/tech/php/273578.shtml

  组织参考来自:软联盟

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线