PHP + fiddler捕获数据包并采集微信文章的想法的详细说明.
优采云 发布时间: 2020-08-09 06:25简介:
分析界面知道,要获得阅读的文章数和喜欢的数目,必须有两个关键参数,即key和uin. 不同的官方帐户的密钥不同(据说有一个通用的微信密钥,但我不知道如何获得),并且同一官方帐户的密钥将在大约半小时内失效
提交链接以获取阅读API的文章
思考:
1. 拦截并将客户端请求读取接口的请求转发到您自己的服务器,以便您可以获取密钥,并使用__biz关联缓存半小时
2. 提交商品链接进行查询时,服务器从商品链接获取__biz,并查询是否缓存了当前官方账号对应的密钥. 如果是,请继续执行步骤3,而不是步骤4.
3.curl请求?界面获取数据
4. 当密钥不存在时,通知客户端重定向到url(使用websocket通知或客户端ajax轮询进行通知,您需要使用数据包捕获工具来修改文章详细信息页面代码,以跳至中间页面以等待,打开在文章页面之后,它每隔几秒钟跳回到中间页面),并将程序暂停几秒钟,以等待客户端更新密钥. 此时,客户端提交新密钥并使用它进行查询
实现
1. 封包捕获
该界面是获取阅读量的界面,参数如下
2. 拦截此接口并将其转发到您自己的服务器,单击“规则”-“自定义规则”并将其添加到onbeforerequest(在正式请求之前执行的功能)
if (osession.fullurl.contains("mp.weixin.qq.com/mp/getappmsgext"))
{
osession.orequest["host"]= 'ccc.aaa.com' ;
}
效果不错,您可以看到该界面已转发
3. 服务器端缓存密钥,代码以php为例
public function savekey(request $request)
{
$__biz = $request->param('__biz',0);
$data['uin'] = $request->param('uin',0);
$data['key'] = $request->param('key',0);
cache::set($__biz,$data,30 * 60);
return 'ok';
}
4. 提交文章链接查询api代码
public function getreadnum(request $request)
{
$url = $request->param('url');
parse_str(parse_url($url)['query'], $param);
$__biz = $param['__biz'];
$key_data = cache::get($__biz);
if (empty($key_data))
return 'no key';
$uin = $key_data['uin'];
$key = $key_data['key'];
$param['uin'] = $uin;
$param['key'] = $key;
$param['wxtoken'] = "777";
$wechat_url = "https://mp.weixin.qq.com/mp/getappmsgext?" . http_build_query($param);
//dump($wechat_url);
$data = array(
'is_only_read' => 1,
'is_temp_url' => 0,
'appmsg_type' => 9,
);
$res = $this->get_url($wechat_url,$data);
return $res;
}
function get_url($url,$data)
{
$ifpost = 1;//是否post请求
$datafields = $data;//post数据
$cookiefile = '';//cookie文件
$cookie = '';//cookie变量
$v = false;
//模拟http请求header头
$header = array("connection: keep-alive","accept: text/html, application/xhtml+xml, */*", "pragma: no-cache", "accept-language: zh-hans-cn,zh-hans;q=0.8,en-us;q=0.5,en;q=0.3","user-agent: mozilla/5.0 (windows nt 6.1; wow64) applewebkit/537.36 (khtml, like gecko) chrome/53.0.2785.116 safari/537.36 qbcore/4.0.1278.400 qqbrowser/9.0.2524.400 mozilla/5.0 (windows nt 6.1; wow64) applewebkit/537.36 (khtml, like gecko) chrome/53.0.2875.116 safari/537.36 nettype/wifi micromessenger/7.0.5 windowswechat");
$ch = curl_init();
curl_setopt($ch, curlopt_url, $url);
curl_setopt($ch, curlopt_header, $v);
curl_setopt($ch, curlopt_httpheader, $header);
$ifpost && curl_setopt($ch, curlopt_post, $ifpost);
$ifpost && curl_setopt($ch, curlopt_postfields, $datafields);
curl_setopt($ch, curlopt_returntransfer, true);
curl_setopt($ch, curlopt_followlocation, true);
$cookie && curl_setopt($ch, curlopt_cookie, $cookie);//发送cookie变量
$cookiefile && curl_setopt($ch, curlopt_cookiefile, $cookiefile);//发送cookie文件
$cookiefile && curl_setopt($ch, curlopt_cookiejar, $cookiefile);//写入cookie到文件
curl_setopt($ch,curlopt_timeout,60); //允许执行的最长秒数
curl_setopt($ch, curlopt_ssl_verifypeer, false);
curl_setopt($ch, curlopt_ssl_verifyhost, false);
$ok = curl_exec($ch);
curl_close($ch);
unset($ch);
return $ok;
}
5. 通知客户端重定向页面(此部分未编写,请参见我有关文本套接字的其他文章)
6. 使用提琴手来修改微信文章和jsj脚本,
在onbeforeresponse(返回客户端之前执行的方法)中,添加代码以跳转到中间页
效果
摘要