太棒了!使用新界面抓取微信公众号的所有文章

优采云 发布时间: 2020-08-07 00:06

  

  伙计们,您一定遭受了采集微信公众号的困扰!特别! ! ! ! ! !公开帐户历史记录信息! ! !除了通过中间代理采集APP外,实际上没有任何技巧可以获取数据!

  直到···········

  前一段时间,微信在当晚正式发布了一篇文章:

  

  妈妈!这不是始终需要的采集接口!嘿,上帝也帮助我!来...让我们谈谈一般方法.

  1. 首先,您需要一个订阅帐户!我不知道官方帐户和企业帐户是否可行. 因为我没有...

  2. 接下来,您需要登录!

  我没有仔细查看微信官方帐户登录.

  暂且不说,我使用硒的方法来驱动浏览器获取cookie以达到登录效果.

  3. 使用请求携带cookie,登录以获取URL的令牌(这很重要,您需要在每个请求中都带上它),如下所示:

  

  4. 使用获取的令牌和官方账号的微信ID(即数字+字符)来获取官方账号的伪造品(可以了解官方账号的身份)

  

  当我们搜索官方帐户时,浏览器使用GET方法向带参数的红色框中的URL发起了请求. 请求参数如下:

  

  请求如下:

  

  代码如下:

  

  好的,让我们继续:

  5. 单击我们搜索的官方帐户后,发现了另一个请求:

  

  请求参数如下:

  

  返回结果如下:

  

  代码如下:

  

  好吧···最后一步,要获取所有文章,您需要处理翻页. 翻页请求如下:

  

  我可能看了一眼. 极客学院的每一页至少有5条信息,即文章总数/ 5 /有多少页. 但是有小数,我们将其四舍五入,然后加1以得到总页数.

  代码如下:

  

  item.get(‘link’)是我们需要的官方帐户文章链接!继续请求该URL以提取其中的内容!

  结束.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线