一下如何批量导出“微信指数”小程序中的关键词指数

优采云 发布时间: 2021-08-02 22:01

  一下如何批量导出“微信指数”小程序中的关键词指数

  [内容摘要]

  备注:本文只做采集想法的笔记,不做具体的技术文档。微信在2017年前十天推出微信指数,可根据用户输入的关键词查询关键词7天、30天、90天的搜索热度。本文旨在记录批量采集微信索引的思路。

  [文字]

  由于老婆的工作需要,我不得不研究如何批量导出“微信索引”小程序中的关键词索引。

  一、manual+agent

  由于时间限制,T.T任务繁重,我先采用了比较笨拙的方法,使用anyproxy抓手机流量,找到关键词index信息对应的json文件。思路是保存对应的json文件,不输入关键词,手动替换所有不需要的信息,保存成txt文件。

  这种方法的优点是简单!任何抓包工具或软件如anyproxy、fiddler或Apache proxy都可以找到对应的json文件。缺点也很明显,就是要手动输入!效率低!需要手动替换json中不需要的符号,保存为excel更麻烦!

  二、manual+agent+script

  根据之前版本的经验,为了加快采集的效率,我们还是使用anyproxy来抓取关键词对应的json文件,然后使用anyproxy提供的接口来编写脚本自动保存。由于各个工具使用的语言不太一样,anyproxy使用nodejs语言编写了对应的界面,所以这里省略了脚本代码。思路很简单,就是代理服务器检测到json文件时,会将对应的关键词信息:微信索引保存在txt文本或数据库中,从而省去手动保存的过程。

  这种方式的优点是相比方式一省去了手动保存索引的过程,并且可以通过脚本自定义存储方式和格式。缺点还是需要手动输入关键词,不够自动。

  三、手机自动模拟按键输入关键词+Proxy+Script

  我老婆采集的关键词需求已经增加到几百了,还手动输入是不现实的。这时候手机需要能够在微信索引小程序的搜索框中自动输入关键词。只要能自动输入关键词,其他方法和第二种差别不大。手机按键精灵的实现方法和对应的代码百度是个好东西(我用的是android系统的模拟器)。

  这种方式的好处是采集自动化程度比较高!你只需要在你的手机里有一个关键词list 文件就可以自动化采集!也有不足之处。编写按钮向导相当麻烦。我没做过安卓。有时点击过程中会出现bug,需要手动注视。

  四、python+url解析

  分析抓包得到的json文件的URL,可以发现它们是规则的,对应的参数是小程序生成的。因此,我用python写了一个小爬虫,对分析的URL执行采集!这是成功的!思路是用app小程序来生成参数!将值传给python,然后拼接url,执行采集!这个方法非常有效!我决定每秒3个json数据还是可以采集(如果你想更高效,可以减少采集间隔。至于会不会被阻塞,我还没试过)。这种方式的缺点是url参数不固定,需要app定时生成。

  五、待大神完善

  能力有限,一定有更方便快捷的采集方法,等待网络大神施展魔法^^。

  以下是我导出的索引的一些格式,供参考。

  (1)txt 格式

  

  (2)ExcelHorizo​​ntal 格式格式

  

  (3)Excel 竖排格式

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线