wordpress文章采集软件( 免费的WordPress自动采集插件:WP-CTspider超详细使用教程)

优采云 发布时间: 2021-09-18 13:20

  wordpress文章采集软件(

免费的WordPress自动采集插件:WP-CTspider超详细使用教程)

  WordPress auto采集插件下载

  今天,我推荐一个免费的WordPress automatic采集插件:WP ctspider。这个插件完全自动采集几乎可以采集任何网站。它很容易设置。您只需设置一个定向采集URL,通过CSS选择器准确识别采集区域,包括(内容、摘要、标签、缩略图、自定义字段等),然后自动检测并抓取web内容,文章重复数据消除、更新和发布自动完成,无需手动干预。WordPress auto采集插件:WP ctspider

  Wp ctspider支持WordPress的全部功能,并完美支持各种WordPress功能、标签、摘要、特*敏*感*词*片、自定义列等。计时是自动的采集. 通过设置每个任务需要执行的频率,可以定期执行采集任务。支持多种语言伪原创,支持百度翻译引擎(完全免费),支持29种语言的互译,轻松获取原创文章,SEO,支持SEO全功能优化,支持内容过滤,甚至在文章的任意位置添加自定义内容,或自行定义文章风格。附件下载支持各种格式的附件下载,包括自定义的采集缩略图,您可以选择图片添加水印

  让我们介绍一下wp-ctspider超级详细教程

  使用教程

  新项目/基本配置

  接下来,让我们详细讨论如何采集a项目

  我们以新浪科技为例:

  第一,基本配置:

  任务名称:新浪科技(PS:定制)

  更新时间:默认为60分钟(PS:当前任务每60分钟自动执行一次)

  字符集:默认选项为OK(PS:如果代码有误,请为当前网页选择字符集)

  随机IP:已启用(PS:启用随机IP时,IP将每隔采集时间自动更改一次,降低服务器IP被阻止的概率)

  多线程采集:on(PS:on后可提高采集速度)

  多线程数:默认情况下为10(PS:根据您的服务器配置酌情使用)

  Wp-ctspider基本设置

  列表设置

  列表URL:(PS:如果需要多个URL,可以将其添加到新行)

  列表区域选择器:。控制列表>ul>Li(PS:[与CSS选择器完全相同][可以填写,不能填写]如果采集当前页面有多个相同列表的DOM节点,请填写以确保采集的准确性)右键单击Google浏览器查看元素,您可以看到当前列表数据在中。控制列表>ul>诽谤

  Wp-ctspider示例

  列表缩略图:如果有图片,可以直接填写当前缩略图的CSS选择器

  文章URL匹配:a(PS:由于上面的区域选择器已定位,我们可以直接填写a标记。如果区域选择器未定位,请设置:.Contlistlia或.Contlista。根据采集页面DOM结构自行分析)

  将源URL添加到自定义字段:源URL(PS:[自定义]可以打开或关闭。设置后,每天将在文章添加一个自定义字段源URL,当前的采集到URL链接将分配给此字段以进行前台调用显示),例如:get_uuuPost_uuuMeta(“源URL”)可以调用此字段的值

  单击列表测试以查看当前项目列表配置

  Wp-ctspider列表测试

  文章settings

  标题匹配规则:H1

  文章content settings:#文章uu内容

  WP-ctspider(长腿蜘蛛)文章

  您可以看到标题位于H1标记下,或者您可以使用。获取标题的主标题

  正文内容似乎有许多类和ID。如果有ID属性,请尝试使用ID。毕竟,ID是唯一和准确的

  我们还可以在采集TAG标签

  长腿spider ctspider提供了6条添加采集的一般规则,并可以自定义字段规则(PS:可以添加多个自定义字段规则)

  WP ctspider文章rules

  单击采集test

  采集结果完美呈现(原文:Title:tag)并正确显示

  然而,我们发现结果中有一个链接和一些CSS属性、ID属性和span标记

  Wp ctspider采集试验

  我们可以使用长腿蜘蛛ctspider强大的内容过滤模块来清理数据

  内容过滤

  首先,删除数据中的所有a链接,而不删除a标记的内容

  删除数据中的span标记,不要删除内容

  删除数据中无用的class属性和ID属性

  具体设置如下图所示:

  Wp ctspider采集试验

  最后进行采集测试(获取纯数据)

  测试2时k15处的Wp ctspider

  单击采集不显示任何数据。只有两种可能性

  @未设置采集规则

  如果您确定采集规则正常,请检查当前的采集网址是否为Ajax动态渲染加载(PS:目前,长腿蜘蛛ctspider不支持动态渲染加载采集)

  如何授权

  Wp-ctspider授权

  登录长腿蜘蛛ctspider官网注册账号(注:注册账号需要邮件验证激活码,请仔细填写邮件账号)

  单击用户中心->添加授权域名(PS:目前每个用户可以授权3个域名)

  获取授权代码后,单击ctspider插件->系统配置->授权代码配置->填写授权代码->保存配置->验证授权

  官方地址:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线