太棒了!使用新界面抓取微信公众号的所有文章
优采云 发布时间: 2020-08-07 00:06
伙计们,您一定遭受了采集微信公众号的困扰!特别! ! ! ! ! !公开帐户历史记录信息! ! !除了通过中间代理采集APP外,实际上没有任何技巧可以获取数据!
直到···········
前一段时间,微信在当晚正式发布了一篇文章:
妈妈!这不是始终需要的采集接口!嘿,上帝也帮助我!来...让我们谈谈一般方法.
1. 首先,您需要一个订阅帐户!我不知道官方帐户和企业帐户是否可行. 因为我没有...
2. 接下来,您需要登录!
我没有仔细查看微信官方帐户登录.
暂且不说,我使用硒的方法来驱动浏览器获取cookie以达到登录效果.
3. 使用请求携带cookie,登录以获取URL的令牌(这很重要,您需要在每个请求中都带上它),如下所示:
4. 使用获取的令牌和官方账号的微信ID(即数字+字符)来获取官方账号的伪造品(可以了解官方账号的身份)
当我们搜索官方帐户时,浏览器使用GET方法向带参数的红色框中的URL发起了请求. 请求参数如下:
请求如下:
代码如下:
好的,让我们继续:
5. 单击我们搜索的官方帐户后,发现了另一个请求:
请求参数如下:
返回结果如下:
代码如下:
好吧···最后一步,要获取所有文章,您需要处理翻页. 翻页请求如下:
我可能看了一眼. 极客学院的每一页至少有5条信息,即文章总数/ 5 /有多少页. 但是有小数,我们将其四舍五入,然后加1以得到总页数.
代码如下:
item.get(‘link’)是我们需要的官方帐户文章链接!继续请求该URL以提取其中的内容!
结束.