文章定时自动采集(一个图片质量非常高的网站先是爬虫代码导入数据解析)
优采云 发布时间: 2022-04-03 22:05文章定时自动采集(一个图片质量非常高的网站先是爬虫代码导入数据解析)
前言
找到一张不错的壁纸网站,里面全是超高清图片
所以,我打算把这些壁纸都采集,然后做一个脚本来自动更换桌面壁纸,这样基本上一年不用每天重复就可以拥有桌面了。
目标地址
再来看看我们这次的受害者:一张非常高质量的图片网站
一、爬虫代码导入数据
import requests
import re
请求数据
for page in range(1, 126):
url = 'https://wallhaven.cc/toplist?page={}'.format(page)
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
分析数据
<p>urls = re.findall('