python网页数据抓取(向网页提交数据回忆一下(二):Get方法)

优采云 发布时间: 2021-10-20 15:11

  python网页数据抓取(向网页提交数据回忆一下(二):Get方法)

  python爬虫(二):向网络提交数据

  回想一下,我们在看一些网站的时候,有没有遇到过网站里面的一些信息,开始显示它的一部分,然后当我们拉下鼠标滚轮的时候,就显示了一些信息。这是异步加载。在我上一篇文章python爬虫*敏*感*词*中,标题数据爬取的所有标题都是已经加载的页面。但是对于这种一开始没有加载的数据,我们应该如何抓取呢?

  接下来,我们先介绍一些概念:

  异步加载:举个简单的例子,如果老师判断作业,有两种情况。第一个是不管哪个学生先写完,都会等所有学生写完,老师说所有的作业都收了。开始判断作业后。在第二种情况下,如果一个学生完成了他的家庭作业,老师会判断一个。这将节省一些时间,并且不会影响进度。这里的第二种方法是异步加载。

  get方法是从服务器获取数据

  post是向服务器发送数据

  Get通过在URL中构造参数来实现功能

  post就是把数据放在header中提交数据

  提交数据到网页

  核心方法:requests.post

  核心步骤:构造表单-提交表单-获取返回信息

  输入我们的链接以构建代码

  首先我们浏览一下我们要爬取的网站:

  

  现在我们打开Chrome的review元素,如何显示

  

  在网页的源代码中,我们可以发现每张卡片的标题都存储在这种格式的代码中。

  铁托米洛夫伏特加有限责任公司

  OK,我们找到了规则,接下来我们就可以按照这个规则来构建我们的程序了:

  title = re.findall('"card-title">(.*?)

  ',post_html.text,re.S)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线