通过微信公众平台的查找文章接口抓取我们需要的相关文章
优采云 发布时间: 2021-05-20 20:06通过微信公众平台的查找文章接口抓取我们需要的相关文章
阅读:4743
通过微信公众平台的搜索文章界面,获取我们需要的相关文章
1.首先,让我们看一下,正常登录我们的微信官方帐户,然后使用文章搜索功能搜索我们需要查找的相关文章。
打开
登录到官方帐户,打开物料管理,然后单击“新建”以共享图形
打开文章搜索界面
输入要搜索的内容后,您可以搜索相关文章的标题,它来自哪个官方帐户以及其他信息。
2.实施思路
这里有一个问题。打开微信公众号的主页,输入帐号密码,然后使用托管的微信帐号扫描代码进行确认,最终可以成功登录微信公众号。该如何解决?
首次登录时,我们可以按照正常过程输入帐户密码,扫描代码进行登录,获取cookie并保存,以便我们稍后调用cookie来验证登录信息当然,Cookie有有效期,但我正在测试,看来它在3-4小时后仍然可以使用,足以完成很多事情。
基本思路:1.通过硒驱动的浏览器打开登录页面,输入帐号密码登录,登录后获取cookie,并保存待调用的cookie; 2.获取cookie后,进入主页并直接跳转以登录。进入个人主页,打开文章搜索框并找到一些需要的信息; 3.获取有用的信息后,构造一个数据包,模拟发布请求,然后返回数据。获取数据后,解析出我们需要的数据。
3.获取Cookie,不要说太多,发布代码
#!/ usr / bin / env python
#_ * _编码:utf-8 _ * _
从硒导入网络驱动程序
导入时间
导入json
driver = webdriver.Chrome()#需要使用Google云端硬盘chromedriver.exe,以支持您当前版本的Google Chrome浏览器
driver.get('#39;)#发起获取请求以打开微信公众号平台登录页面,然后输入帐号密码登录微信公众号
driver.find_element_by_xpath('// * [@ id =“ header”] / div [2] / div / div / form / div [1] / div [1] / div / span / input')。clear ()#找到帐户输入框,清除其中的内容
driver.find_element_by_xpath('// * [@ id =“ header”] / div [2] / div / div / form / div [1] / div [1] / div / span / input')。send_keys (“在此处输入您的帐户”)#找到帐户输入框,输入帐户
time.sleep(3)#等待3秒钟,然后执行下一个操作,以避免网络延迟和浏览器加载输入框的时间,这可能导致以下操作失败
driver.find_element_by_xpath('// * [@ id =“ header”] / div [2] / div / div / form / div [1] / div [2] / div / span / input')。clear ()#找到密码输入框,清除里面的内容
driver.find_element_by_xpath('// * [@ id =“ header”] / div [2] / div / div / form / div [1] / div [2] / div / span / input')。send_keys (“在此处输入密码”)#找到密码输入框,输入密码
time.sleep(3)#原因与上面相同
driver.find_element_by_xpath('// * [@ id =“ header”] / div [2] / div / div / form / div [3] / label')。click()#单击以记住密码
time.sleep(3)#原因与上面相同
<p>driver.find_element_by_xpath('// * [@ id =“ header”] / div [2] / div / div / form / div [4] / a')。click()#click登录