可采集文章(搜狗微信公众号采集难度接触的人不算)

优采云 发布时间: 2021-08-30 17:00

  可采集文章(搜狗微信公众号采集难度接触的人不算)

  简介

  目前主流公众号采集方案只有以下方法

  搜狗微信

  采集history 不再可用,并且搜索不按时间排序。获取的数据价值不高,但可以用来获取公众号的biz。

  微信公众平台

  微信公众平台虽然可以采集史,但是限制性很强,没抓到界面就会被屏蔽。只适合少量数据采集,或者和别人一起用,毕竟少肉就是肉。

  安卓微信

  xposed hook 微信消息不难,网上可以找到相关的代码和教程。但是网上公开的文章都是基于旧版本的。恰巧老版本的微信账号大部分都无法正常登录,当前版本普遍偏低。新版微信已经对xposed进行了强检测(旧版微信用xposed钩子可能不会屏蔽你,但是新版直接检测到手机安装了xposed)。所以关键是如何克服xposed检测或者低版本登录限制。这个方法很可能掌握在某些人手中,不会公开。当然,你没有通过微信检测。如果直接修改xposed,也可以

  部分第三方平台

  提供一些微信数据的第三方平台有很多,比如最热的文章等,看你要不要抢。

  网页端微信

  基本没用,能登机的都是很老的。

  Windows 和 Mac 上的微信

  插曲

  由于hook Windows可以获得公众号数据,当然你也可以获得微信自动收发消息机器人。我已经做了成品软件,代码是半开源的(不是公众号相关的开源):

  身体

  微信的采集难度对于刚接触的人来说并不容易。新手基本都是在windows端模拟点击和拦截,而模拟点击使用的是Python,需要一个监视器才能正常运行,而且只能操作一个客户端。不说操作麻烦,这个效率也很低。

  我联系微信采集已经半年了。研究了半天,竟然找了一些windows逆向工程师直接买代码,终于实现了一个可以接受的采集方法。当然,对于Windows端的微信也是如此。

  公众号实时发帖被钩子拦截。如果你真的有时间,可以参考网上的免费教程,自己学习。有很多相关的教程。随便搜索PC微信拦截消息钩子(关键词不要加公众号,是的,当时技术是可以互通的,但是因为人的需要限制了)。只需找到收到消息的电话即可。有兴趣的可以去微信机器人上看看这位大佬的文章:

  自动关注和取消关注,有两种实现方式。第一种:基于反向rpc调用微信内码,需要原创公众号ID(一般以gh_开头,类似wxid,可以关注和取消关注)。另一种是用biz拼链接打开公众号首页,模拟点击(只能关注,无法查看)。并且biz关注者会占用历史界面一次。原来历史界面每天只有330左右,关注者会占一部分,不合适。

  获取已关注的微信公众号列表,有两种实现方式。第一种是基于反向挂钩相关的调用。这种方式非常有限,无法实时获取关注列表,因为只有登录才会加载所有公众号。 不会。第二种:读内存(这种数据一般是全局数据,所以可以直接从内存中读取),可以实时读取。一般来说,这种方法比较合适。

  打开链接的方式也有很多种(文章链接和公众号首页链接),比如模拟点击、基于反向等。经过长时间的尝试,针对不同的情况采用了不同的方法。反向打开文章链接更方便。模拟点击一般用于公众号首页获取参数。

  模拟点击需要基于控件的句柄(Windows窗口有自己的句柄,不同微信窗口的句柄不同)。如果仅仅根据屏幕坐标,是不太准确的。当然,和ocr一起使用更好(有点费CPU)。

  输入url的步骤其实可以简化。您不需要模拟鼠标或键盘。可以直接反向调用发送消息调用,向文件传输助手发送消息。另外,我尝试了很多方法来找到最后发送的链接,它们都是可行的。从屏幕搜索,屏幕ocr到当前通过窗口句柄的元素遍历。虽然前两者的成功率也很高,基本没有错误,但是资源消耗大,所以最后还是采用了遍历元素的方法。具体信息请参考微软官方文档:

  所有功能及其他

  如果技术太复杂而无法学习怎么办?我把所有的功能都封装成exe了,只需要操作界面采集微信文章(需要了解基本的东西,比如json和网页解析),解析需要自己写,因为我不知道您需要哪些字段。如果软件不符合您的要求,您也可以要求我单独定制一个。另外,如果需要自己封装扩展功能,可以提供代码和指导。如果你只是想要数据,也可以合作。

  演示监控推送(图中监控账号是我的,欢迎补充交流)

  程序中的*敏*感*词*是指要*敏*感*词*哪个微信好友的消息。当收到好友指定格式的消息时,开启采集程序采集对应的内容。设置是设置邮箱发送的一些信息,微信不小心退出时会发送邮件通知。

  

  Windows 版本

  家用电脑:Windows7、window10

  服务器:WinServer2012、winserver2016

  其他未经测试的不可用。不可用的版本是Windows 8。一些必要的软件无法安装,无法成功注入dll

  接口文档

  这是目前软件已经实现的功能,通过http接口控制软件

  温馨提醒

  需要软件的请联系上图中的微信。如果您不需要工作,只是想学习技术,请不要打扰。当然,你可以随意有钱。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线