抓取网页flash(Python3的requests模块抓取网页源码并保存到文件示例)

优采云发布时间: 2021-09-17 19:05

　　本文描述了Python3如何使用requests包获取和保存网页源代码。与您分享，供您参考，如下所示：

　　使用Python 3的请求模块获取网页源代码并将其保存到文件中示例：

import requests

html = requests.get("http://www.baidu.com")

with open('test.txt','w',encoding='utf-8') as f:

f.write(html.text)

　　这是一个基本的文件保存操作，但有几个值得注意的问题：

　　1.安装请求包。在命令行中，输入PIP install requests以自动安装它。许多人建议使用请求。自足的urlib。请求还可以抓取web源代码

　　2.open方法的编码参数设置为UTF-8，否则保存的文件将被乱码

　　3.如果捕获的内容直接以CMD输出，则会提示各种编码错误，因此将其保存到文件中以供查看

　　4.withopen方法是一种更好的编写方法。它可以在自动操作后释放资源

　　另一个例子：

import requests

ff = open('testt.txt','w',encoding='utf-8')

with open('test.txt',encoding="utf-8") as f:

for line in f:

ff.write(line)

ff.close()

　　这是一个一次读取一行TXT文件并将其保存到另一个TXT文件的示例

　　因为在命令行上打印一行一行读取的数据时会出现中文编码错误，所以每次读取一行并保存到另一个文件中，以测试读取是否正常。（打开时请注意编码方法）

0

2021-09-17

抓取网页flash

0 个评论

要回复文章请先登录或注册