抓取网页flash(Python3的requests模块抓取网页源码并保存到文件示例)
优采云 发布时间: 2021-09-17 19:05抓取网页flash(Python3的requests模块抓取网页源码并保存到文件示例)
本文描述了Python3如何使用requests包获取和保存网页源代码。与您分享,供您参考,如下所示:
使用Python 3的请求模块获取网页源代码并将其保存到文件中示例:
import requests
html = requests.get("http://www.baidu.com")
with open('test.txt','w',encoding='utf-8') as f:
f.write(html.text)
这是一个基本的文件保存操作,但有几个值得注意的问题:
1.安装请求包。在命令行中,输入PIP install requests以自动安装它。许多人建议使用请求。自足的urlib。请求还可以抓取web源代码
2.open方法的编码参数设置为UTF-8,否则保存的文件将被乱码
3.如果捕获的内容直接以CMD输出,则会提示各种编码错误,因此将其保存到文件中以供查看
4.withopen方法是一种更好的编写方法。它可以在自动操作后释放资源
另一个例子:
import requests
ff = open('testt.txt','w',encoding='utf-8')
with open('test.txt',encoding="utf-8") as f:
for line in f:
ff.write(line)
ff.close()
这是一个一次读取一行TXT文件并将其保存到另一个TXT文件的示例
因为在命令行上打印一行一行读取的数据时会出现中文编码错误,所以每次读取一行并保存到另一个文件中,以测试读取是否正常。(打开时请注意编码方法)