抓取网页flash(Python3的requests模块抓取网页源码并保存到文件示例)

优采云 发布时间: 2021-09-17 19:05

  抓取网页flash(Python3的requests模块抓取网页源码并保存到文件示例)

  本文描述了Python3如何使用requests包获取和保存网页源代码。与您分享,供您参考,如下所示:

  使用Python 3的请求模块获取网页源代码并将其保存到文件中示例:

  

import requests

html = requests.get("http://www.baidu.com")

with open('test.txt','w',encoding='utf-8') as f:

f.write(html.text)

  这是一个基本的文件保存操作,但有几个值得注意的问题:

  1.安装请求包。在命令行中,输入PIP install requests以自动安装它。许多人建议使用请求。自足的urlib。请求还可以抓取web源代码

  2.open方法的编码参数设置为UTF-8,否则保存的文件将被乱码

  3.如果捕获的内容直接以CMD输出,则会提示各种编码错误,因此将其保存到文件中以供查看

  4.withopen方法是一种更好的编写方法。它可以在自动操作后释放资源

  另一个例子:

  

import requests

ff = open('testt.txt','w',encoding='utf-8')

with open('test.txt',encoding="utf-8") as f:

for line in f:

ff.write(line)

ff.close()

  这是一个一次读取一行TXT文件并将其保存到另一个TXT文件的示例

  因为在命令行上打印一行一行读取的数据时会出现中文编码错误,所以每次读取一行并保存到另一个文件中,以测试读取是否正常。(打开时请注意编码方法)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线