批量下载微信公众号历史文章数量比显示的要多
优采云 发布时间: 2021-06-21 20:12批量下载微信公众号历史文章数量比显示的要多
由于历史原因,早期的公众号没有给予奖励,原创这些功能,所以你实际搜索到的文章数量会比显示的文章数量多。以下教程,正文部分直接引用官方文档。
01第一步:开通公众号
打开微信电脑版登录,登录微信后,打开需要采集的公众号。
以公众号【晶莹*敏*感*词*】为例。开通公众号后,先点击进入公众号,然后点击右上角的三个点。
选择目标公众号02 第二步:进入历史消息界面
打开上图界面后,点击右上角三个点,然后点击查看下图界面中的历史消息
点击查看历史消息
点击上图中的历史消息界面,提示“请在微信客户端打开链接”,打开PC端微信设置-通用设置,使用系统默认浏览器打开网页并取消选中它。
在微信电脑客户端打开链接
修改设置,取消系统默认浏览器打开网页
03第三步:开始爬取文章
然后在软件的采集界面,点击启动采集按钮(点击后,360等安全软件可能会有屏蔽提示,请务必点击允许,第一次使用,也可能会提示你安装证书,一定要同时点击允许)
等待按钮名称变为监控,然后刷新公众号历史消息界面。
注意是刷新公众号历史消息界面,如下图二,其他界面不行。
点击刷新按钮开始*敏*感*词*cookie
点击账号采集START采集04 第四步:输入文章取取
刷新后软件会自动采集史文章。建议设置加载间隔为10秒,采集完成后可以导出文章或者浏览。
采集end
裴哥给大家做了个GIF教程,官网也有讲解视频教程供大家参考。
微信公众号文章*敏*感*词*教程批量下载历史
另找一个公众号,从头开始完整演示。
硅谷旺川微信历史文章采集*敏*感*词*教程
特别注意:
等待按钮名称变为监控后刷新历史界面;是刷新历史消息界面,不是刷新文章content页面,千万不要搞错; 采集过程中不需要刷新历史消息界面只需要刷新一次; 05 导出为PDF、WORD、HTML
以上是内容抓取工作完成,接下来要做的就是以本地可读的方式备份数据。常用的格式有PDF、WORD和HTML三种。
我选择了HTML进行备份,因为我还需要将抓到的数据批量导入印象笔记。 HTML 是最友好的格式。导入后可以直接阅读,也可以全文检索。操作方法如下,
点击左上角的ID,全选,右击列表中任意文章弹出选择菜单,点击Export File,选择Export as HTML。
全选并导出文章
下一步是在方便使用时,将下载的文件批量导入印象笔记中进行全文检索。
如何从印象笔记批量导入文件,请参考“如何从印象笔记批量导入文件?” 》
导入印象笔记后的效果
在印象笔记中搜索
比如我知道王川是特斯拉的铁粉,那么铁粉有多少呢?让我们在传哥文章的历史中寻找【特斯拉】关键词。在这607个文章中,一共有152个出现在特斯拉,25%的频率!川哥真的是特斯拉的粉丝!
在指定笔记本中准确搜索
这个方法有点类似于舆论监测。您可以了解其他人对公司或活动的看法。
如果你有更好的工具,比如词频统计分析,以这些数据为基础,接下来的事情就很简单了。
备份到本地文章批量导入印象笔记