优采云采集器设置:规则名称就是你要采集内容对应的名称

优采云 发布时间: 2021-04-04 01:25

  优采云采集器设置:规则名称就是你要采集内容对应的名称

  采集器设置:规则的名称是与您想要的内容采集相对应的名称。例如,如果您要采集个新闻,则可以在此处编写新闻。您可以自己计划,填写并记得保存。

  

  起始页网址:我们可以在此处设置列页或列表页。

  

  

  获取内容页面的URL,请选择常规(这更加方便和简单),请记住保存操作并进行测试。

  

  

  只需单击保存,就可以测试每个步骤。

  

  这里的规则实际上可以使用xpath;

  

  

  xpath的采集规则比常规的// // @@ class =“ news_info” / a1 / @ href;

  *表示全部匹配;

  @是标签;

  class =“ news_info,这是我们网页的唯一代码标识符;

  /代表一个级别的路径,//代表两个级别的路径;

  a1这里的1表示只显示一个,因为在许多情况下页面上有几个带有名称的链接,我们只需要在此处设置一个即可显示。

  获取内容:

  最简单的方法是直接使用快捷键打开此页面;

  

  优采云 采集器标题设置

  

  优采云 采集器标题设置;在内容中,我们可以选择数据处理来过滤一些标签,空格等:

  

  

  缩略图设置;由于我们的发行插件中没有设置,因此我们需要手动进行设置:文件路径位于:优采云 采集器安装目录pluginlease cms PbootDemoSkycaiji.php

  

  以下是与我们的数据库相对应的信息;我们还可以添加更多,只需要对应我们的数据库即可。

  

  以上插件修改仅用于添加缩略图,如果不需要,将不会进行任何修改;只需点击保存即可。

  下一步是单击“发布设置”:首先在第三方云平台上下载pboot cms 文章插件(由没有皮肤的小芒果开发);

  选择本地cms作为释放方法。这些数据库的发布方法适合单独存储,不建议新手使用。

  请务必注意本地数据绑定的路径:D:phpstudyPHPTutorialWWW @ pboot以pboot结尾,并且该路径不应在采集器中绑定。然后选择我们的cms插件,在这里我们直接选择我们刚刚设置的内容数据,单击“保存”,然后直接保存。

  

  设置后,单击返回到我们的任务列表,然后单击采集。

  

  如果您仍然不了解上述内容,可以直接进入小组进行咨询和交流:548327025。

  如果您已阅读以上内容,但仍不理解,则可以直接观看我们的视频教程:

  相关知识点:

  此站点文章摘自Shurong网络上的权威资料,书籍或网络原创 文章。如果您有任何版权纠纷或侵权,请立即与我们联系以将其删除。禁止擅自复制和转载!谢谢...

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线