excel抓取多页网页数据(2.保存电影信息到Excel文件添加的部分:抓取网页所需)

优采云 发布时间: 2021-10-01 09:00

  excel抓取多页网页数据(2.保存电影信息到Excel文件添加的部分:抓取网页所需)

  发布所有爬网所需的信息

  上次我们成功获取了单个页面上所有电影的名字,剩下的电影信息也一样,代码先:

  1) 添加可以获取其他信息的规则,如*敏*感*词*区域所示:

  

  2) 然后在得到的code中添加对应的code作为电影名称:

  

  写完上面的代码,可以再次调试,确保得到的信息是你想要的,没有逻辑错误。

  通过每部电影获得的信息存储在列表数据中,然后通过dataList.append(data)将电影的信息列表存储在电影集合列表dataList中。

  获取后,我们可以将列表中的数据写入Excel文件,方便我们以后使用。

  2. 将电影信息保存到 Excel 文件

  我们在下面的*敏*感*词*区域添加代码。这部分是将之前保存在dataList列表中的数据保存到Excel文件中。需要特别注意的是,我们使用的是xlwt模块的主代码。整个过程就是模拟我们手动将数据一一填入Excel单元格,然后保存Excel文件。需要注意的是,如果要保存的文件“豆瓣电影.xls”已经打开,保存时会自动报错,文件扩展名不能错误。

  

  执行完所有代码后,我们可以在C盘根目录看到代码创建的Excel文件“豆瓣电影.xls”。打开它,看到我们已经获取到了第一页所有电影的信息:

  

  您可以将Excel表格中的数据与网页上的信息进行对比,看看是否一致。如果它们不一致,则需要进一步调试以找出错误。

  至此,我们已经成功获取到了第一页的所有信息。剩下的9页数据能轻松处理吗?那就试试吧。

  还有一点,你觉得你之前写的代码有点流水账吗?如果你能成功获取10页的电影信息并保存到Excel中,你也可以尝试通过定义函数来进一步构造和优化代码,让我们的代码在以后更容易阅读和维护,甚至有些代码重用。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线