微信抓取过程中的参数分析

优采云 发布时间: 2020-08-08 17:17

  __ biz可被视为在微信公众平台上公开宣布的公共账户的唯一ID

  mid是图形消息的ID

  idx是发布的头几条消息(1表示标题位置消息)

  sn是一个随机加密的字符串(对于图形消息来说是唯一的,如果您想询问此sn的生成规则是什么或如何破解它,您基本上只能从微信公众平台开发中获得答案. 团队)变相煮

  三: 伪装微信客户端登录并获取历史信息页面. 4个最重要的参数是: __biz; uin =; key =; pass_ticket =;这四个参数. [有时需要手机]

  四: 获得general_msg_list后,分析每个字段

  "list": [ //最外层的键名;只出现一次,所有内容都被它包含。

{//这个大阔号之内是一条多图文或单图文消息,通俗的说就是一天的群发都在这里

"app_msg_ext_info":{//图文消息的扩展信息

"content_url": "图文消息的链接地址",

"cover": "封面图片",

"digest": "摘要",

"is_multi": "是否多图文,值为1和0",

"multi_app_msg_item_list": [//这里面包含的是从第二条开始的图文消息,如果is_multi=0,这里将为空

{

"content_url": "图文消息的链接地址",

"cover": "封面图片",

"digest": ""摘要"",

"source_url": "阅读原文的地址",

"title": "子内容标题"

},

...//循环被省略

],

"source_url": "阅读原文的地址",

"title": "头条标题"

},

"comm_msg_info":{//图文消息的基本信息

"datetime": '发布时间,值为unix时间戳',

"type": 49 //类型为49的时候是图文消息

}

},

...//循环被省略

]

  五: 获取程序的原型

  创建表格:

  1. 微信公众号列表

  CREATE TABLE `weixin` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`biz` varchar(255) DEFAULT '' COMMENT '公众号唯一标识biz',

`collect` int(11) DEFAULT '1' COMMENT '记录采集时间的时间戳',

PRIMARY KEY (`id`)

) ;

  2,微信文章列表

  CREATE TABLE `post` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`biz` varchar(255) CHARACTER SET utf8 NOT NULL COMMENT '文章对应的公众号biz',

`field_id` int(11) NOT NULL COMMENT '微信定义的一个id,每条文章唯一',

`title` varchar(255) NOT NULL DEFAULT '' COMMENT '文章标题',

`title_encode` text CHARACTER SET utf8 NOT NULL COMMENT '文章编码,防止文章出现emoji',

`digest` varchar(500) NOT NULL DEFAULT '' COMMENT '文章摘要',

`content_url` varchar(500) CHARACTER SET utf8 NOT NULL COMMENT '文章地址',

`source_url` varchar(500) CHARACTER SET utf8 NOT NULL COMMENT '阅读原文地址',

`cover` varchar(500) CHARACTER SET utf8 NOT NULL COMMENT '封面图片',

`is_multi` int(11) NOT NULL COMMENT '是否多图文',

`is_top` int(11) NOT NULL COMMENT '是否头条',

`datetime` int(11) NOT NULL COMMENT '文章时间戳',

`readNum` int(11) NOT NULL DEFAULT '1' COMMENT '文章阅读量',

`likeNum` int(11) NOT NULL DEFAULT '0' COMMENT '文章点赞量',

PRIMARY KEY (`id`)

) ;

  3. 采集团队名单

  CREATE TABLE `tmplist` (

`id` int(11) unsigned NOT NULL AUTO_INCREMENT,

`content_url` varchar(255) DEFAULT NULL COMMENT '文章地址',

`load` int(11) DEFAULT '0' COMMENT '读取中标记',

PRIMARY KEY (`id`),

UNIQUE KEY `content_url` (`content_url`)

) ;

  采集:

  1,getMsgJson.php: 该程序负责接收已解析并存储在数据库中的历史消息的json

<p>

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线