小技巧:分享一个WordPress自动采集插件AutoPostPro使用技巧

优采云 发布时间: 2022-10-02 04:05

  小技巧:分享一个WordPress自动采集插件AutoPostPro使用技巧

  我们以采集“新浪互联网新闻”为例,文章列表网址为因此在 手工指定文章列表网址 中输入该网址即可,如下所示:

  ​

  之后需要设置该文章列表网址下具体文章网址的匹配规则

  ​

  五、文章网址匹配规则

  文章网址匹配规则的设置非常简单,无需复杂设置,提供两种匹配模式,可以使用URL通配符匹配,也可以使用CSS选择器进行匹配,通常使用URL通配符匹配较为简单。

  1. 使用URL通配符匹配

  通过点击列表网址上的文章,我们可以发现每篇文章的URL都为如下结构

  因此将URL中变化的数字或字母替换为通配符(*)即可,如:(*)/(*).shtml

  ​

  2. 使用CSS选择器进行匹配

  使用CSS选择器进行匹配,我们只需要设置文章网址的CSS选择器即可(不知道CSS选择器为何物,一分钟学会如何设置CSS选择器),通过查看列表网址 的源代码即可轻松设置,找到该列表网址下具体文章的超链接的代码,如下所示:

  ​

  可以看到,文章的超链接a标签在class为“contList”的标签内部,因此文章网址的CSS选择器只需要设置为.contList a 即可,如下所示:

  ​

  

  设置完成之后,不知道设置是否正确,可以点击上图中的测试按钮,如果设置正确,将列出该列表网址下所有文章名称和对应的网页地址,如下所示:

  ​

  六、文章抓取设置

  在该选项卡下,我们需要设置文章标题和文章内容的匹配规则,提供两种方式进行设置,推荐使用CSS选择器方式,使用该方式更为简单,精确。(不知道CSS选择器为何物,一分钟学会如何设置CSS选择器)

  我们只需要设置文章标题CSS选择器和文章内容CSS选择器,即可准确抓取文章标题和文章内容。

  在文章来源设置里,我们以采集”新浪互联网新闻“为例,这里还是以该例子讲解,通过查看列表网址 下某一篇文章的源代码即可轻松设置,例如,我们通过查看某篇具体文章 的源代码,如下所示:

  ​

  可以看到,文章标题在id为“artibodyTitle”的标签内部,因此文章标题CSS选择器只需要设置为#artibodyTitle即可;

  同样的,找到文章内容的相关代码:

  ​

  可以看到,文章内容在id为“artibody”的标签内部,因此文章内容CSS选择器只需要设置为#artibody即可;如下所示:

  ​

  设置完成之后,不知道设置是否正确,可点击测试按钮,输入测试地址,如果设置正确,将显示出文章标题和文章内容,方便检查设置

  ​

  七、抓取文章分页内容

  

  如果文章内容过长,有多个分页同样可以抓取全部内容,这时需要设置文章分页链接CSS选择器,通过查看具体文章网址源代码,找到分页链接的地方,例如某篇文章分页链接代码如下:

  ​

  可以看到,分页链接A标签在class为 “page-link” 的标签内部

  因此,文章分页链接CSS选择器设置为.page-link a即可,如下所示:

  ​

  如果勾选当发表时也分页时,发表文章也将同样被分页,如果你的WordPress主题不支持 标签,请勿勾选。

  八、文章内容过滤功能

  文章内容过滤功能,可过滤掉正文中不希望发布的内容(如广告代码,版权信息等),可设置两个关键词,删除掉两个关键词之间的内容,关键词2可以为空,表示删除掉关键词1之后的所有内容。

  如下所示,我们通过测试抓取文章后发现文章里有不希望发布的内容,切换到HTML显示,找到该内容的HTML代码,分别设置两个关键词即可过滤掉该内容。

  ​

  如上所示,如果我们希望过滤掉上面

  和

  之间的内容,添加如下设置即可

  ​

  如果需要过滤掉多处内容,可以添加多组设置。

  九、HTML标签过滤功能

  HTML标签过滤功能,可过滤掉采集文章中的超链接(a标签),

  技巧:网站批量爬取工具

  网站图集批量爬取工具主要是用来提取各种写真网站上的美图美照,可以让你一键下载或采集各种图集,当然你也可以将网站图集批量爬取工具用于网站建设和提取功能,欢迎下载。

  软件说明:

  使用方法很简单,分为32位和64位系统两个程序。

  

  大家自行根据自己电脑情况使用。

  1、选择下载路径

  2、设定要爬取的页数

  3、点击开始按钮即可爬取图片

  使用方法:

  

  1、下载压缩包后解压(建议解压到一个空间容量大的盘)

  2、根据电脑情况选择打开32位或64位的程序

  3、依据提示输入Y或N,按回车键

  之后软件就会自己把图片从网站下载下来,并存放到你解压出来的那个文件夹里。

  尝试了一下,数量很多大家慢慢尝试。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线