文章定时自动采集(一个图片质量非常高的网站先是爬虫代码导入数据解析)

优采云发布时间: 2022-04-03 22:05

　　前言

　　找到一张不错的壁纸网站，里面全是超高清图片

　　所以，我打算把这些壁纸都采集，然后做一个脚本来自动更换桌面壁纸，这样基本上一年不用每天重复就可以拥有桌面了。

　　目标地址

　　再来看看我们这次的受害者：一张非常高质量的图片网站

　　一、爬虫代码导入数据

　　import requests

import re

　　请求数据

　　for page in range(1, 126):

url = 'https://wallhaven.cc/toplist?page={}'.format(page)

headers = {

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'

}

response = requests.get(url=url, headers=headers)

　　分析数据

<p>urls = re.findall('

0

2022-04-03

文章定时自动采集

0 个评论

要回复文章请先登录或注册