python自动采集内容到wordpress

优采云 发布时间: 2022-05-13 02:04

  python自动采集内容到wordpress

  老金授权ITSEO独家发布其文章,转载注明出处!

  最近用wordpress做了一个小站,目的很简单就是要第一时间更新小说并发布到wordpress,本来是想用优采云解决的,但没有模块无赖之下,只有自己用python手写,本来是想用mysqldb直接插入的,但wordpress表单实在是有点麻烦,且远程速度有点慢。一想到python的主要思想是不要重复发明轮子,于是在pypi找到了wordpress_xmlrpc模块,主要功能就不说了,详见官网:

  目前wordpress_xmlrpc模块已经更新到了2.2版本,不过本人用的是1.5版本。懒的同学在centos下可以这样安装.

  Wget --no-check-certificate

  tar zxf python-wordpress-xmlrpc-1.5.tar.gz

  cd python-wordpress-xmlrpc-1.5

  python setup.py install

  好了wordpress_xmlrpc模块就介绍到这儿,其它功能参考官网介绍。下面说一下程序思路。

  1、用一个记事本记录已经抓取的URL。

  2、再去抓这个页面看看,得到这个页面文章的全部URL。

  3、for一下这个页面的全部URL是否在TXT中。

  4、如果不在,就抓取这个URL的标题和内容发送到wordpress,并将URL写入txt中

  5、最后用crontab自动任务,每天定时跑。

  代码如下:(为防止某些同学不劳而获,用图片代替代码,红色部分别为网址,账号,密码,保存URL地址的txt)

  

  当然代码有一个小问题就是没有定义类别,其实wordpress_xmlrpc也是可以定义发布类别的,只是本人比较懒就在后台撰写默认文章分类设置了一下目录。

  然后是crontab设为每小时定时更新一下。不会设置的自行脑补

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线