python网页数据抓取(向网页提交数据回忆一下(二)：Get方法)

优采云发布时间: 2021-10-20 15:11

　　python爬虫（二)：向网络提交数据

　　回想一下，我们在看一些网站的时候，有没有遇到过网站里面的一些信息，开始显示它的一部分，然后当我们拉下鼠标滚轮的时候，就显示了一些信息。这是异步加载。在我上一篇文章python爬虫*敏*感*词*中，标题数据爬取的所有标题都是已经加载的页面。但是对于这种一开始没有加载的数据，我们应该如何抓取呢？

　　接下来，我们先介绍一些概念：

　　异步加载：举个简单的例子，如果老师判断作业，有两种情况。第一个是不管哪个学生先写完，都会等所有学生写完，老师说所有的作业都收了。开始判断作业后。在第二种情况下，如果一个学生完成了他的家庭作业，老师会判断一个。这将节省一些时间，并且不会影响进度。这里的第二种方法是异步加载。

　　get方法是从服务器获取数据

　　post是向服务器发送数据

　　Get通过在URL中构造参数来实现功能

　　post就是把数据放在header中提交数据

　　提交数据到网页

　　核心方法：requests.post

　　核心步骤：构造表单-提交表单-获取返回信息

　　输入我们的链接以构建代码

　　首先我们浏览一下我们要爬取的网站：

　　现在我们打开Chrome的review元素，如何显示

　　在网页的源代码中，我们可以发现每张卡片的标题都存储在这种格式的代码中。

　　铁托米洛夫伏特加有限责任公司

　　OK，我们找到了规则，接下来我们就可以按照这个规则来构建我们的程序了：

　　title = re.findall('"card-title">(.*?)

　　',post_html.text,re.S)

0

2021-10-20

python网页数据抓取

0 个评论

要回复文章请先登录或注册