最新版:每日更新高考资讯采集规则插件30个分类

优采云 发布时间: 2022-10-08 10:26

  最新版:每日更新高考资讯采集规则插件30个分类

  详细介绍

  本插件可通过天人官方采集平台转入,获取F1赛事信息6大类(旧的文章(旧文章不是采集 文章 不是采集),就是说能拿到全网海量实时更新的最新文章。可配合自动采集插件实现自动免维护更新网站功能。

  先说:

  这样的采集规则插件会消耗大量的服务器资源和成本,所以每年都需要更新插件。授权包2及以上用户,授权内任意域名,安装本插件后可免费使用本插件一年,之后每年半价继续使用本插件。

  未购买授权用户或授权等级低于套餐3的用户需按原价单独购买续费。

  授权用户只需半价续订最昂贵的采集规则插件之一,所有网站用户均可免费使用所有采集规则插件。比如你每年只需要更新一个采集规则插件159元,半价79.5元。所有网站159元及以下的所有采集规则插件均可免费使用一年。

  指示:

  安装完成后,在网站后台--采集管理--规则管理中,可以点击规则前面的采集按钮,执行单独的采集,或者你可以选择多个采集。

  编辑方法:

  安装完成后,在网站后台--采集管理--规则管理,会看到多条采集规则。这些采集规则的归属列默认是你的网站id为1的列,默认设置是把远程图片保存到你的服务器。因此,请根据实际情况将采集规则归属列设置为其他列。方法是:网站后台--采集管理--规则管理--点击一个项目采集规则前面的“编辑”按钮--一个分类--选择你的类别--单击下一步保存当前页面的设置。

  如果不想将远程图片保存到服务器采集,方法是:网站后台--采集管理--规则管理--点击前面的一个采集规则“编辑”按钮--新闻设置--保存图片--取消勾选--点击下一步保存当前页面的设置。

  设置默认固定作者名,方法:URL后台--采集管理--规则管理--点击采集规则前面的“编辑”按钮--下一步--下一步--作者设置--填写固定字符。

  如何将采集 之后的数据发布到网站?方法:网站后台--采集管理--数据存储,可以选择存储全部内容或者勾选部分内容进行存储,也可以删除全部内容或者删除部分勾选内容.

  为什么内容提示的采集部分在采集之后重复出现?因为:为了防止重复采集浪费不必要的时间和资源,如果要重新采集已经采集的数据,请到网站后台-- 采集管理--历史记录,可以在这里删除历史记录或者选择性删除“成功记录”、“失败记录”、“无效记录”,在内部页面顶部的标题栏中过滤浏览器。

  常见问题:

  安装好的采集规则可以修改吗?

  

  答:“目标网页编码”和“远程列表URL”不能修改。其他内容请谨慎修改,否则容易失败采集。

  为什么我采集时提示“服务器资源有限,无法直接浏览此文章。请批量安装或升级采集插件采集”?

  答:1.“目标网页编码”和“远程列表URL”不能修改。其他内容请谨慎修改,否则容易失败采集。. 2、查看你登录后台的域名是否获取了采集规则插件的注册码。3、请直接到采集,不要点击测试按钮,测试时会出现这个提示。正常 采集 没问题。4、采集请使用您安装本插件时使用的域名登录后台。

  这个插件的优点:

  平台每日自动更新采集内容,所有内容自动排版,无需重新编辑。

  天仁系列管理系统所有系统均可使用,并自动匹配按键样式。

  此插件不是自动采集插件,需要点击按钮触发批处理采集

  安装过程

  单击上方的立即安装按钮(如下图所示):

  等待1分钟后,会出现黑底蓝字的“Loading”页面(如下图)

  然后稍等片刻,页面会变成黑底绿色字体的“天人系列管理系统项目自动部署工具”(如下图)

  如果页面上的所有权限检查通过,并且没有出现红色字体的“不可读”、“无法写入”和“无法删除”字样,则会自动安装。几分钟后会提示安装完成,不要关闭页面,8秒后会跳转到官网获取注册码,然后就可以使用这个应用了。

  获取注册码页面,点击“生成注册码”按钮(如下图)

  

  这时候系统会根据你的域名自动生成一个注册码(如下图)

  值得注意的是,注册码不需要单独填写网站,你安装的应用会自动获取注册码,你可以刷新刚才提示注册码的页面看看是否可以正常使用。

  常见问题

  Q:为什么免费应用需要获取注册码,并且需要付费?

  A:注册码是用来激活你安装的插件的。无需付费。在下一页输入一级域名网站,自动生成注册码。注册码根据一级域名生成。域名后可以再次获取注册码,不会像别人的网站程序或插件一样通过更改域名程序取消。另外值得一提的是,一般情况下,注册码不需要手动输入后台,后台更新缓存会自动获取你获取的所有注册码,非常方便快捷。

  Q:如何获取付费应用的注册码?

  A:付费申请需要使用*敏*感*词*购买注册码。按照页面提示点击“获取注册码”按钮,进入支付页面支付相应金额,注册码将自动生成。

  Q:注册码需要单独保存吗?如果丢失了该怎么办?如何在我的 网站 中输入注册码?

  A:一般不需要单独保存注册码,因为获得注册码的域名会自动保存在官网数据库中,您的网站会自动获得注册码从官网看,即使注册码丢失,只要你在后台更新缓存,你的注册码就会立即找回。当然,如果你愿意手动输入注册码,可以在后台“注册码管理”中输入注册码,效果和更新缓存得到的注册码一样。

  Q:我的注册码会被别人盗用吗?

  A:注册码是根据您的网站一级域名生成的。每个网站域名在这个世界上都是独一无二的,所以注册码也是唯一的,别人不能盗用你的注册码。

  Q:如何通过我的网站后台应用中心获取尚未下载的应用注册码?

  A:获取注册码可以在你的网站后台的“我的应用”或“我的模板”中找到刚刚安装的应用或模板对应的“点击查看”按钮,然后跳转到官网(如下图)

  跳转到官网申请对应的详情页面后,用红色字体“您的一级域名”填写您的域名。您可以将一级域名留空。系统会自动设置为一级域名,然后点击“获取注册码”按钮,按照提示操作。(如下图)

  干货教程:分享一个WordPress自动采集插件AutoPostPro使用技巧

  让我们以采集“新浪网讯”为例,文章列表URL是这样,请在手动指定文章列表URL中输入URL,如下所示:

  之后,您需要在文章列表URL下为特定URL设置匹配规则文章

  5. 文章网址匹配规则

  文章URL匹配规则的设置非常简单,没有复杂的设置,提供了两种匹配模式,可以使用URL通配符匹配,也可以使用CSS选择器进行匹配,通常使用URL通配符匹配比较简单。

  1. 使用 URL 通配符匹配

  通过单击文章

  在列表URL上,我们可以发现每个文章的URL的结构如下

  因此,将 URL 中不断变化的数字或字母替换为通配符 (*) 就足够了,例如:(*)/(*).shtml

  2. 使用 CSS 选择器进行匹配

  使用CSS选择器进行匹配,我们只需要设置文章URL的CSS选择器

  (不知道CSS选择器是什么,一分钟内学习如何设置CSS选择器),通过查看列表URL的源代码可以很容易地设置,找到代码文章列表URL下的超链接,如下所示:

  如您所见,一个标签文章超链接位于类为“contList”的 标签内,因此 CSS 选择器文章 URL 只需要设置为 .contList a,如下所示:

  之后的设置是

  

  完成,不知道设置是否正确,可以点击上图中的测试按钮,如果设置正确,列表URL下的所有文章名称和对应的页面地址都会列出,如下所示:

  6. 文章抓取设置

  在这个标签下,我们需要为文章标题和文章内容设置匹配规则,提供两种设置方式,建议使用CSS选择器方法,更简单,更精确。(不知道什么是CSS选择器,学习如何在一分钟内设置CSS选择器。

  我们只需要设置文章标题CSS选择器并文章内容

  CSS 选择器,用于准确抓取文章标题和文章内容。

  在文章源设置中,我们

  以采集《新浪网讯》为例,这里还是要解释一下的例子,通过查看列表URL的下一文章可以轻松设置源代码,例如,我们可以查看特定文章的源代码,如下所示:

  如您所见,文章标题位于id为“artibodyTitle”的标签内,因此文章标题CSS选择器只需要设置为#artibodyTitle;

  同样,查找文章内容的代码:

  如您所见,文章内容位于id为“artibody”的标签内,因此文章内容CSS选择器只需要设置为#artibody;如下所示

  设置后

  完成后,不知道设置是否正确,可以点击测试按钮,输入测试地址,如果设置正确,将显示文章标题和文章内容,方便检查设置

  7. 抓取文章分页内容

  

  如果文章内容是

  太长了,有多个分页也可以抓取所有内容,那么你需要设置文章分页链接CSS选择器,通过查看具体的文章URL源代码,找到分页链接的地方,比如文章分页链接代码如下:

  如您所见,分页链接 A 标记位于类为“页面链接”的 标记内

  因此,文章分页链接 CSS 选择器设置为 .page-link a,如下所示:

  如果您检查 当发布也分页时,文章也将被分页,如果您的WordPress主题不支持标签,请不要勾选。

  8. 文章内容过滤功能

  文章内容过滤功能,可以过滤掉正文中不想发布的内容(如广告代码、版权信息等),可以设置两关键词,删除两关键词之间的内容,关键词2可以为空,表示关键词1后的所有内容都将被删除。

  如下图所示,我们发现文章中有我们不想发布的内容,经过测试爬行文章,切换到HTML显示,找到内容的HTML代码,并设置两关键词来过滤掉内容。

  如上所示,如果我们想过滤掉上面的内容

  和

  将以下设置添加到内容中

  如果需要筛选出多个位置,可以添加多组设置。

  9.HTML标签过滤功能

  HTML标签过滤功能,用于过滤掉采集文章中的超链接(标签)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线