微信文章自动采集软件(微信公众号实时的发文采用hook拦截消息)
优采云 发布时间: 2022-03-31 01:19微信文章自动采集软件(微信公众号实时的发文采用hook拦截消息)
介绍
目前主流公众号采集的解决方案只有以下几种
搜狗微信
没有采集历史,搜索也不是按时间顺序排列的。获取到的数据价值不高,但是可以用来获取公众号的biz。
微信公众平台
微信公众平台虽然有采集的历史,但是限制很多,不抓太多就会被封。可以与其他程序结合使用。
安卓微信
xposed挂钩微信消息不难,网上可以找到相关代码和教程,基本就是挂钩微信进库的功能。但是微信会检测到xposed直接封号,即使你没用过微信插件,当然也会根据账号权重封号。目前还没有找到好的解决方案。
一些第三方平台
有很多第三方平台提供了一些微信数据,比如最流行的文章等。
网络上的微信
基本没用,能上的都是很老的号码。
Windows 和 Mac 上的微信
文本
微信采集的难度对于新手来说并不容易。新手基本是在windows端模拟点击和拦截,模拟的点击还是用python,需要监视器才能正常运行,只运行一个客户端。不说繁琐的操作,这种效率也是很低的。
接触微信采集半年了,研究了很久。我什至找了一些windows逆向工程师直接买了代码,终于实现了采集这个可以接受的方法。当然,对于Windows端的微信也是如此。
公众号的实时发帖使用钩子拦截。如果你真的有时间,你可以参考免费的在线教程自己学习。相关教程很多,随便搜PC微信拦截消息钩子(关键词不要加公众号,有时候技术是互通的,只受限于人的需求)。只需要找到接收消息的呼叫即可。有兴趣的可以看看这位大佬的文章关于微信机器人:。
自动跟随和取消跟随有两种实现。第一种是基于反向RPC调用微信内部代码,需要公众号的原创ID(一般以gh_开头,与wxid类似,可以关注也可以取消关注)。另一种是使用biz拼写链接打开公众号主页,模拟点击(只能关注,不能取消)。此外,biz关注度也将占据历史界面一次。本来历史界面有一天的限制,注意会占据一部分,不适合。
获取微信公众号关注列表有两种实现方式。第一个是基于反向挂钩相关的调用。这种方式有很大的局限性,无法实时获取后续列表,因为只有登录才会加载所有公众号。第二种:读取内存(公众号列表一般是全局数据,所以可以直接从内存中读取),可以实时读取。一般来说,这种方法比较合适。
链接的打开方式也有很多(文章链接和公众号首页链接),比如模拟点击、基于反向等。尝试了半天,针对不同的情况使用不同的方法,文章反向打开链接更方便。模拟点击一般用于在公众号首页获取参数。
模拟点击需要基于控制句柄(windows窗口有自己的句柄,不同微信窗口的句柄不同)。如果只根据屏幕坐标,是不是很准确。当然,配合ocr使用会更好(有点费CPU)。
输入url的步骤其实可以简化。您不需要模拟鼠标或键盘。您可以直接反向呼叫发送消息呼叫,并向文件传输助手发送消息。另外,如何找出发送的最后一个链接我已经尝试了多种方法,并且一切正常。从屏幕搜索、屏幕 ocr 到现在通过窗口句柄遍历元素。虽然前两个成功率也很高,基本没有错误,但是资源消耗大,所以最后还是采用了遍历元素的方法。详情请参考微软官方文档:
其他所有功能
如果技术太复杂而无法学习怎么办?我已经把所有的功能都封装成exe了,你只需要操作采集微信文章的接口(你需要了解基本的东西,比如json和网页解析),你需要编写自己解析,因为我不知道你需要哪些字段。如果软件不符合您的要求,您也可以要求我单独定制一个。另外,如果需要自己封装扩展功能,可以提供代码和指导,如果只需要数据可以配合。
演示监控推送(图中监控账号是我的,欢迎补充交流)
程序中的监控是指监控哪个微信好友的消息。当收到好友指定格式的消息时,打开采集程序采集的对应内容。设置是设置邮箱发送的一些信息。当微信意外退出时,它会发送电子邮件通知。
视窗版本
家用电脑:Windows7、window10
服务器:WinServer2012、winserver2016
其他未经测试的并非无法使用。目前无法使用的版本是Windows8。一些必要的软件无法安装,dll无法成功注入。
接口文档
这是当前软件已经实现的功能。该软件由http接口控制。
测试界面
暴露几个接口和测试是一样的,只是测试用的,请不要要求太多。可以报告任何错误或问题
在post请求体中增加一个验证参数key,获取key有两种方式。简单来说,如果你的微信号存在于我的好友列表中,那么你可以用你的微信号作为key(更新列表需要一些时间,一般十分钟左右),另见备注和提示在该方法的文档中
因为是公网请求,redis需要验证,所以响应时间可能会比较长,具体看实际请求。如果部署在局域网中,去掉认证会快很多。
提示
如有需要,请联系上图中的微信。如果你不需要它来工作,只是想免费卖淫,请不要打扰。