网站采集器自动超文章发布(免费的WordPress自动采集插件WP-CTspider超详细使用教程)

优采云 发布时间: 2022-04-18 01:14

  网站采集器自动超文章发布(免费的WordPress自动采集插件WP-CTspider超详细使用教程)

  今天去你的博客推荐一个免费的WordPress自动采集插件:WP-CTspider,这个插件是全自动的采集几乎采集any网站,设置很简单,只要设置目标采集 URL,通过CSS选择器准确识别采集区域,包括(内容、摘要、TAG、缩略图、自定义字段等),然后自动检测和抓取网页内容, 文章删除重复,更新和发布,这个过程是全自动的,无需人工干预。

  

  WP-CTspider 支持全功能 WordPress,完美支持各种 WordPress 功能、标签、摘要、特*敏*感*词*片、自定义栏目等。定时自动采集,你只需要设置每个任务,多久执行一次任务,然后你可以定期执行 采集 任务。支持多种语言伪原创,支持百度翻译引擎(完全免费),支持29种语言互译,轻松获取原创文章,SEO,支持SEO全功能优化,支持内容过滤,你甚至可以在 文章 任意位置添加自定义内容,并且可以自定义 文章 样式。附件下载,支持多种格式的附件下载,包括自定义采集缩略图,可选择图片加水印。

  给大家介绍一下WP-CTspider的超详细教程!

  使用教程创建新项目/基本配置

  接下来,我们将详细介绍如何采集一个项目

  我们以新浪科技为例:

  第一个基本配置:

  任务名称:新浪科技(PS:可以自定义) 更新时间:默认60分钟(PS:当前任务每60分钟自动执行一次) 字符集:默认选项OK(PS:如果有乱码,请参考当前网页字符集选择)随机IP:开启(PS:开启随机IP每次都会自动更换IP采集,减少服务器IP被阻塞的几率)多线程采集:开启(PS:采集开启后速度可提高)多线程数:默认10(PS:根据自己服务器配置酌情使用)

  

  列表设置

  

  点击列表测试查看当前项目列表配置

  

  文章设置

  标题匹配规则:h1

  文章内容设置:#article_content

  

  可以看到标题在h1标签下,也可以使用.main-title来获取标题

  文本的内容似乎有很多类和 id。如果有 id 属性,尝试使用 id。毕竟id唯一,定位准确。

  我们也可以给 采集TAG 标签添加规则

  长腿蜘蛛-CTspider共提供6条规则添加采集,并且可以自定义字段规则(PS:自定义字段规则可以添加多个)

  

  点击采集进行测试

  采集结果完美渲染(原文:Title: TAG)正确显示

  但是我们发现结果中出现了一个链接和一些更多的css属性和id属性和span标签

  

  我们可以使用长腿蜘蛛-CTspider强大的内容过滤模块进行数据清洗工作

  内容过滤首先删除数据中的所有a链接但不删除a标签内容删除数据中的span标签也不删除内容删除数据中无用的class属性和id属性

  具体设置如下:

  

  最后是 采集 测试(获取纯数据)

  

  点击采集后,显示没有数据,只有两种可能

  采集没有设置规则。如果确定采集规则没问题,请检查采集的当前URL是否为Ajax动态渲染加载(PS:目前long-leg spider-CTspider不支持动态渲染并加载采集) 如何授权

  

  登录长腿蜘蛛-CTspider官网注册账号(PS:注册账号需要邮箱验证激活码,邮箱账号请认真填写)。

  点击用户中心->添加授权域名(PS:目前每个用户可以授权3个域名)。获取授权码后点击CTspider插件->系统配置->授权码配置->填写授权码->保存配置->验证授权下载信息

  [btn type=”info” url=”″]下载插件[/btn]

  [btn type=”success” url=””]官方网站[/btn]

  总结

  这个WP-CTspider自动采集插件使用教程还是很详细的,可以说是傻瓜式教学了,最重要的是完全免费使用,大家可以试试你需要它,但是现在搜索引擎在采集网站上也很辛苦,做网站的时候最好有自己的原创内容。

  [dltable file=”CTSPIDER plugin v2.5下载” size=”0.35MB”]下载地址:[/dltable]

  [dl href='']

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线