批量下载微信公众号历史文章数量比显示的要多

优采云 发布时间: 2021-06-21 20:12

  批量下载微信公众号历史文章数量比显示的要多

  由于历史原因,早期的公众号没有给予奖励,原创这些功能,所以你实际搜索到的文章数量会比显示的文章数量多。以下教程,正文部分直接引用官方文档。

  01第一步:开通公众号

  打开微信电脑版登录,登录微信后,打开需要采集的公众号。

  以公众号【晶莹*敏*感*词*】为例。开通公众号后,先点击进入公众号,然后点击右上角的三个点。

  

  

  选择目标公众号02 第二步:进入历史消息界面

  打开上图界面后,点击右上角三个点,然后点击查看下图界面中的历史消息

  

  

  点击查看历史消息

  点击上图中的历史消息界面,提示“请在微信客户端打开链接”,打开PC端微信设置-通用设置,使用系统默认浏览器打开网页并取消选中它。

  

  

  在微信电脑客户端打开链接

  

  

  修改设置,取消系统默认浏览器打开网页

  03第三步:开始爬取文章

  然后在软件的采集界面,点击启动采集按钮(点击后,360等安全软件可能会有屏蔽提示,请务必点击允许,第一次使用,也可能会提示你安装证书,一定要同时点击允许)

  等待按钮名称变为监控,然后刷新公众号历史消息界面。

  注意是刷新公众号历史消息界面,如下图二,其他界面不行。

  

  

  点击刷新按钮开始*敏*感*词*cookie

  

  

  点击账号采集START采集04 第四步:输入文章取取

  刷新后软件会自动采集史文章。建议设置加载间隔为10秒,采集完成后可以导出文章或者浏览。

  

  

  采集end

  裴哥给大家做了个GIF教程,官网也有讲解视频教程供大家参考。

  

  

  微信公众号文章*敏*感*词*教程批量下载历史

  另找一个公众号,从头开始完整演示。

  

  

  硅谷旺川微信历史文章采集*敏*感*词*教程

  特别注意:

  等待按钮名称变为监控后刷新历史界面;是刷新历史消息界面,不是刷新文章content页面,千万不要搞错; 采集过程中不需要刷新历史消息界面只需要刷新一次; 05 导出为PDF、WORD、HTML

  以上是内容抓取工作完成,接下来要做的就是以本地可读的方式备份数据。常用的格式有PDF、WORD和HTML三种。

  我选择了HTML进行备份,因为我还需要将抓到的数据批量导入印象笔记。 HTML 是最友好的格式。导入后可以直接阅读,也可以全文检索。操作方法如下,

  点击左上角的ID,全选,右击列表中任意文章弹出选择菜单,点击Export File,选择Export as HTML。

  

  

  全选并导出文章

  下一步是在方便使用时,将下载的文件批量导入印象笔记中进行全文检索。

  如何从印象笔记批量导入文件,请参考“如何从印象笔记批量导入文件?” 》

  

  

  导入印象笔记后的效果

  在印象笔记中搜索

  比如我知道王川是特斯拉的铁粉,那么铁粉有多少呢?让我们在传哥文章的历史中寻找【特斯拉】关键词。在这607个文章中,一共有152个出现在特斯拉,25%的频率!川哥真的是特斯拉的粉丝!

  

  

  在指定笔记本中准确搜索

  这个方法有点类似于舆论监测。您可以了解其他人对公司或活动的看法。

  如果你有更好的工具,比如词频统计分析,以这些数据为基础,接下来的事情就很简单了。

  

  

  备份到本地文章批量导入印象笔记

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线