xposedhook微信公众号实时推送文章的采集方案只有以下几种方法
优采云 发布时间: 2021-03-28 02:17xposedhook微信公众号实时推送文章的采集方案只有以下几种方法
简介
当前的主流公共帐户采集方案只有以下几种方法
搜狗微信
采集历史记录不再可用,搜索也不按时间排序。获得的数据价值不高,但可用于获得官方帐户的业务。
微信公众平台
尽管微信公众平台已有采集的历史记录,但它具有很大的局限性,如果捕获不多,它将被阻止。仅适用于少量数据采集。
Android微信
Internet上有很多关于[x15]方案的实时推送[x13]挂钩微信官方帐户文章。据我所知,大多数公司采集都使用这种方案。但是,在线发布的文章均基于旧版本。碰巧的是,大多数旧版本的微信帐户无法正常登录,而当前版本通常较低。新版本的微信已经对xposed进行了强大的检测(如果您使用xposed钩子,旧版本的WeChat可能不会阻止您,但是新版本会直接检测到手机已安装xposed。当然,无论是旧版本登录失败还是检测到新版本,实际上都有解决方法。可以挂起检测代码,但是我仍然无法做到这一点。我已经看到一个大老板意识到了成品,但是价格却被说服了。
某些第三方平台
有许多第三方平台提供一些微信数据,例如最热门的文章等。这取决于您是否要抓住它。
网络端微信
基本上没用,可以登船的都是很老的船。
Windows微信
与Android上的WeChat一样,WeChat具有Windows客户端。实际上,我们具有应该存在的所有功能,因此我们也可以在Windows端挂接微信以获取数据。该技术涉及Windows逆向工程,dll注入等。
其他方法
当然,有一些技术含量较低的方法:模拟点击和浏览器js注入(采集官方帐户无法实时推送数据,只有采集历史记录才能实时推送数据)。模拟点击实际上是使用一些自动化工具来模拟一个人打开链接,然后通过某些数据包捕获工具拦截响应。 js注入是类似的,可能是拦截响应并对其进行修改,添加了一些js以使他等待很短的时间才能打开下一个文章链接,以便在Windows和Android上浏览器始终可以打开链接而无需手动操作。可以实现的。但是,尽管这些技术很简单,但是它们实施起来比较麻烦并且效率低下。
插曲
由于钩子Windows可以获取官方帐户数据,因此,您当然也可以获取微信自动消息发送和接收机器人。我已经完成了软件,代码是半开源的(不是与官方账号有关的开源):
身体
对于新接触的人来说,微信的采集难度并不容易,除了那些直接模拟点击的人。老板掌握的技术根本不会直接公开。他要么以高价为您定制产品,要么将数据出售给您。这也是正常现象,因为您认识的人越多,宝贵的技术就是原因之一。它可以使用多长时间也是一个问题。如果它在发布后不久被微信作为目标。
我已经与微信采集联系了半年了。我尝试了很多方法,最后找到了一种可以接受的采集方法,该方法可以在Windows端反转微信的Windows EXE程序,并找到相关CALL的偏移量,可以真正拦截官方帐户推送的数据时间。
功能(所有功能均基于Windows端的微信,这是您在计算机上聊天的软件)技术堆栈其他
如果技术太复杂而无法学习怎么办?我已经将所有功能封装到exe中,只需要操作采集微信文章接口(您需要了解基本内容,例如json和网页解析),解析就需要您自己编写,因为我不知道你需要什么领域。 采集该软件不到2M,占用的资源非常少。只要计算机配置足以运行微信,就没有问题。另外,如果您需要自己两次封装扩展功能,则可以提供代码和指导。当然,如果您只需要数据,就可以合作。
演示阅读编号演示图片(图片中的监视帐户是我的,欢迎添加交流信息
演示*敏*感*词*
视频太大,无法上传,只需转到*敏*感*词*图片即可看到:。*敏*感*词*中有三个窗口。左侧是微信浏览器,右上方是采集程序,右下方是任务栏。任务栏中显示的WXSpider是右上角的采集程序,仅用于显示它。该程序占用的资源。
显示器推送
程序中的监视是指要监视其微信好友的消息。收到朋友指定格式的消息后,采集程序采集的相应内容将打开。该设置用于设置邮箱发送的一些信息,当微信意外注销时,将发送电子邮件通知。
历史
历史记录与阅读次数相似。两者都控制微信浏览器访问指定的URL,然后在请求历史记录文章列表中获取参数。后来,我们对采集使用了模拟点击拦截,它更稳定并且可以达到更多采集。当然,您可以控制浏览器采集,但是采集的数量将相对较小。
其他
直接将浏览器控制为采集确实更有效,更方便。但是,请求的数量是有限的,可以通过更改IP来解决(IP质量更好,我尝试使用某些代理微信浏览器来非常缓慢地打开网页)。限制最少的方法是模拟点击和拦截,因此我添加了一个模拟点击打开URL的功能。当程序达到极限时,您仍然可以模拟单击以继续阅读采集。当然,历史文章界*敏*感*词*有更高的限制,并且密封界面的频率也很高,因此不可能突破模拟咔嗒声。在测试中,每个帐户可以在24小时内访问320-330接口,并且每个接口都返回10天的历史数据。不管每天发布多少个项目,或者每天发布8个项目,每个界面都将返回80条数据文章。
温馨提醒
如果您不需要工作,而只想学习技术,请不要打扰。当然,您可以随意赚钱。