自动采集发布文章(基于Python3爬虫,配合Chevereto图床一起使用)
优采云 发布时间: 2021-10-16 07:19自动采集发布文章(基于Python3爬虫,配合Chevereto图床一起使用)
注:本教程使用的是Python3爬虫,与Chevereto图像床配合使用。这里是搭建教程,仅适用于国外服务器。
教程
首先,您必须拥有一个 WordPress 博客。如果你不知道如何构建它,你可以在这个博客上搜索 关键词 找到一个教程。那么一定有 Chevereto 地图床。如何构建:一个功能强大且易于使用的地图床程序:chevereto 安装教程。设置好后需要到后台关闭防洪。
1、安装 Python 3.6
#检查系统是否有Python3
python3 -V
#安装Python3
#CentOS系统
wget https://www.moerats.com/usr/shell/Python3/CentOS_Python3.6.sh && sh CentOS_Python3.6.sh
#Debian系统
wget https://www.moerats.com/usr/shell/Python3/Debian_Python3.6.sh && sh Debian_Python3.6.sh
2、安装 Python 所需的库
pip3 install requests
pip3 install pymysql
3、下载和编辑爬虫
wget https://www.moerats.com/usr/shell/Python3/1024_wp.py
nano 1024_wp.py
修改如下:
1、设置连接的Mysql数据库信息,在代码第11行。
2、还有要修改第26、28行的图床Key,和图床url,只支持chevereto。
3、第80行文章分类ID(默认未分类)。
4、保留了采集一次后停止60s后再采集,如果不需要,删除第121行即可。
4、运行爬虫
chmod +x spider.py
python3 spider.py
建议搭配屏幕使用。参考:使用屏幕实现多任务和连续线操作命令。