分享文章:微信公众号搜索接口采集微信公众号文章采集系统---开箱即用
优采云 发布时间: 2020-08-31 07:34摘要: 本着开放源代码和用户方便的精神,“微信公众号文章采集系统”已打包到虚拟机中. 您只需要下载并安装虚拟机映像即可使用它. 首先,我要感谢团队负责人饭口勇(Iiguchi)开放他的采集解决方案. 规则代码的主要逻辑是拦截微信公众号请求并将数据转发到php. 从一开始就了解公共帐户的文章采集,到了解实施原理,最后到制作镜像,我在中间遇到了种种困难,既费时又费力. 我咨询了很多人,甚至在吃饭和睡觉时都想过一些细节. 解决方案,解决问题的喜悦以及被问题纠缠的困扰,感谢您在此过程中所提供的帮助.
微信公众号搜索界面采集
本着开放源代码和用户方便的精神,“微信公众号文章采集系统”已打包为虚拟机. 您只需要下载并安装虚拟机映像即可使用它.
系统镜像有6 Gs,只能以*敏*感*词*形式下载,镜像*敏*感*词*下载地址
链接: 密码: 7r4d
首先,我要感谢团队负责人饭口勇(Iiguchi)将其采集项目开源.
在这里可以称为系统,因为涉及许多技术,这里是一个接一个的:
1,anyproxy阿里巴巴的开源代理*敏*感*词*(使用4.0版)可以轻松修改响应信息. 我已经在系统中安装了anyproxy,并且安装非常简单. 首先安装nodejs环境,然后使用npm安装anyproxy.
anyproxy 4.0的开始规则可以作为模块开发. 编写规则代码后,您无需触摸原创代码,只需将规则文件放在anproxy参数中即可. 此处使用的命令是anproxy --rule weixin.js. 关于anproxy如何设置https证书,请访问官方网站. 我已经在虚拟机中设置了全局代理,因此需要先打开任何代理,然后才能在端口8001上成功访问该请求.
规则代码的主要逻辑是拦截微信公众号请求并将数据转发到php.
2,apache + php + mysql,主要用作Web服务器,处理被anyproxy拦截的请求,处理微信文章数据以及喜欢和阅读的次数.
截取的数据的处理可以在特定的PHP代码中看到,逻辑不是太复杂. 为方便起见,这是phpstudy的集成开发环境.
3. 按钮向导. 按钮向导是一种国产工具,可模拟类似于vb语法的键盘和鼠标. 按钮向导在此处用于模拟单击Windows下的微信客户端.
在处理多个微信公众号时,客户需要点击,所有手动操作均由按钮向导模拟. 当我去检查特定的代码时,我使用了一个小技巧来处理单击历史消息. 事实是,我开始通过直接识别图片来找到“历史记录消息”按钮的位置,但找不到. 您只能循环向下移动鼠标,直到在该区域找到特定的颜色,即“历史记录”按钮.
当一个想法不起作用时,请尝试其他想法. 整个系统完成了,就是要处理这种看似可行但不切实际的问题,然后再试一次,依此类推.
4. Windows WeChat客户端,我实际上尝试使用Android模拟器,因为我的目标是开箱即用,所以我需要将所有程序安装在一起,但是无法将其安装在虚拟机Android模拟器中,也就是说也就是说,不可能在虚拟机中进行辅助虚拟化. 我已经踩到了这个坑,所以您不需要踩到它. 我记得以前有人问过,阿里云Windows服务器可以配备Android模拟器吗?我认为答案是相同的. 虚拟机无法执行辅助虚拟化. 阿里云窗口服务器无法安装Android模拟器.
因此,当我尝试使用Android模拟器时,我发现原创微信PC客户端(包括mac)的功能已经完善,然后尝试了Windows客户端.
5. Virtualbox虚拟机,这是Oracle生产的虚拟机. 将涉及一些网络配置,例如设置为NAT模式.
现在将虚拟机映像开源,其中所有代码都在虚拟机中,您可以随意对其进行修改.
从了解官方帐户文章采集到了解实施原理,然后到最终镜像,我在中间经历了种种困难,这既费时又费力. 我咨询了很多人,甚至想到了吃饭和睡觉. 对于详细的解决方案而言,解决问题会很高兴,而被问题纠缠也很痛苦. 感谢您在此过程中对人们的帮助.
如果在安装和使用过程中遇到任何问题,请将我添加到微信(liuhan199012)