优采云伪原创插件(采集插件typecho免登陆采集辅助插件优采云采集器企业旗舰版,赠配套typecho发布插件)

优采云 发布时间: 2021-11-16 06:04

  优采云伪原创插件(采集插件typecho免登陆采集辅助插件优采云采集器企业旗舰版,赠配套typecho发布插件)

  文章 系列:

  采集插件typecho免费登录采集辅助插件IjkxsDatastypecho 优采云采集器 7.6企业旗舰版,免费typecho发布插件教你使用typecho 优采云采集壁纸站

  最近在找typecho的采集插件,看到很多都是收费的,主要是真的太贵了。对于没有收入的学生党,偶尔使用是无法支付的。所以我打算写一个插件来配合老式的优采云使用。没想到一看就用上了,效果还蛮惊喜的。

  以下是站长自己的采集壁纸站教程。

  工具:

  1.采集插件typecho免费登录采集辅助插件IjkxsDatas

  2.typecho 优采云采集器 7.6 企业旗舰版,免费typecho发布插件

  教程:

  首先按照工具1安装typecho插件,按照工具2配置优采云采集配置。

  然后启动官方采集壁纸。这次采集的壁纸站将成为进入桌面。

  

  总的来说,采集分为两大步。第一步是先获取分页规则,第二步是获取每个页面要解析的内容的详细地址。

  1. 打开优采云,新建群组壁纸,新建任务壁纸采集

  

  在任务的第一步中,我们首先需要添加起始URL,(以默认页面为例,当然选择不同的壁纸类别也是如此),滚动页面,我们打开开发者工具调试发现加载页面也可以正常使用。每个分页增加 1。

  

  因此,我们可以构造一个解析地址,为采集地址选择多页,用通配符(*)替换地址格式中的页数,选择一个等差数列,第一项为1,项目数等于页数。结构完成后,点击添加完成。至此,第一步大功告成。

  

  接下来是第二大步骤,需要在每个页面上获取需要解析的具体详细地址。因为大多数页面都加载了缩略图。您可以从开发者工具中查看图片的详细 html 结构。(如果没有,打开开发者工具,在工具左上角点击鼠标进行匹配,点击网页上的图片。)

  

  上图中a元素中的href属性就是我们想要的详细地址采集,那么我们如何得到这个地址呢?最简单的是使用xpath。我们发现 a 被 dl 用 dd 元素包裹,而 dd 用元素包裹 a。所以 xpath 可以这样写://dl/dd/a/@href。不了解xpath的可以百度一下,看几分钟xpath的基本语法。

  回到优采云,在获取多级URL的地方点击Add,输入xpath相关信息,如下图。这里也可以使用xpath浏览器获取xpath规则,不多介绍。

  

  这样URL采集就准备好了,可以点击右下角的测试URL采集查看效果。

  

  2.接下来是采集的详细内容(图)

  我们打开一个只有采集的详情页来看看页面结构。

  

  可以看到标题的页面结构。大多数网页的标题结构都是一样的。默认情况下已配置编辑器。不用担心,如果需要,您可以添加一些数据处理。

  

  接下来添加内容。

  方法一(老手):

  

  这张图片有一个特殊的类名class="arc_main_pic_img",可以作为我们分析的起点。我们需要获取其中的链接,即src="xxxxx"的部分。使用 xpath 非常简单。//img[@class="arc_main_pic_img"],这样就可以得到对应的图片节点了。

  双击采集内容规则左侧标签中的内容,填写如下。

  

  方法二(新手):

  双击采集内容规则左侧标签中的内容,在打开的页面中,点击通过采集获取数据,选择视觉提取,点击通过xpath浏览器获取

  

  得到图片节点后,我们做一些数据处理,点击数据处理->添加->高级特征->提取第一张图片。

  由于typecho使用Markdown来解析,所以还是需要对图片链接做一些处理,点击数据处理->添加->高级功能->内容添加后缀

  

  因为 Markdown 语法需要图片格式:![](图片链接)

  这样,我们就完成了内容的添加。

  标签 采集 是类似的。一般在head->meta location,找到对应的节点,mail copy,copy xpath。

  

  

  添加数据处理

  

  这样就完成了标签的采集。

  左边的选项卡只需要填写必要的选项。由于需要在本地下载图片,所以还需要填写一个图片列表(存放需要下载的图片链接)。

  一开始我们已经对图片进行了解析,所以选择内容,点击复制、粘贴,修改标签为图片列表命名,在数据处理中删除添加后缀和后缀的选项。

  

  完成基本内容后,在右侧规则测试中输入我们的详细链接,点击测试。

  

  看到内容分析和格式正确后就可以进行下一步了。

  3. 发布内容设置

  选项一:Web在线发布,如果没有内容,点击Web发布方式管理,按照

  2.typecho 优采云采集器 7.6 企业旗舰版,免费typecho发布插件

  配置它。

  配置完成后,您可以选择要发布的类别。

  

  最后保存并启动任务。

  

  相关推荐:优采云采集 QQdie示例教程 Typecho插件获取插件版本号 OneTypecho-Typecho多终端小程序开源!by 立即教你为网站添加个性化信息统计

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线