WordPress网站文章采集程序,顺道研究了下它的数据库
优采云 发布时间: 2021-08-09 02:32WordPress网站文章采集程序,顺道研究了下它的数据库
前言
最近在写WordPress网站的文章采集程序,顺便研究了一下它的数据库,记录在下面。
内容
wp_posts:
这个是文章表,主要存放文章的标题、内容、日期等主题信息。
wp_postmeta:
这张表主要是文章的一些附带信息,采集中需要注意的是`缩略图`,比如字段`meta_key`值为:`_wp_attached_file`、`_wp_attachment_metadata`、`_thumbnail_id`,这几个都是关联缩略图信息的,特别需要注意的是,如果你给文章添加了缩略图,那么在wp_posts中也会增加一行字段,作为`_wp_attached_file`和`_wp_attachment_metadata`两个字段的值。
wp_terms:
这个是分类表,主要存放文章的`分类目录`和`标签`等类目主题信息。
wp_term_taxonomy:
这张表主要和wp_terms关联,对应了后者中的栏目是属于分类还是标签信息。
wp_term_relationships:
该表关联的是文章和分类的关系,也就是每篇文章属于那个分类和拥有哪些标签的信息。
注意:插入文章之前,一定要先处理分类和标签,再处理文章之后的缩略图。
图片信息批量导入后,记得使用`Regenerate Thumbnails`等插件重新生成一下缩略图。
总结
上面大概讲了我理解的几张表的关系以及它们在文章中的作用。具体的数据表字段信息可以自己上网查,这里就不浪费篇幅了。
相比其他cms程序,WP的数据表结构还是稍微复杂一些,尤其是在一些相关的信息处理中,一张表可以解决,但是用了几张表,可能有些是我没有的原因注意到它。