采集的文章内容不能直接发布(易优cms—安全好用,商用授权只需要188元!)

优采云 发布时间: 2021-12-11 05:26

  采集的文章内容不能直接发布(易优cms—安全好用,商用授权只需要188元!)

  易友cms——安全易用,商业授权仅需188元,网址:

  前言:本文为《无分页常见文章采集方法》的第二篇。在上一节的基础上,第二节将新增采集节点。第 2 步:“设置字段获取规则”以获取详细说明。为了与上一篇保持一致,本文将继续使用上一章的标记。

  继续第一部分。

  2.1 新建采集节点:第二步设置内容字段获取规则

  点击“保存信息,进入下一步设置”后,可以进入“新建采集节点:第二步设置内容字段获取规则”页面,如图(图22),

  

  (本图来源于网络,如有侵权请联系删除!)

  图22-设置内容字段获取规则

  在预览网址中,系统会自动指定一个内容页的网址,即采集文章(通常是采集列表页的第一个文章网址),作为演示页面。如果文章内容页面收录分页,则需要设置“内容分页导航所在区域的匹配规则”。对于“固定采集项目”中的“内容摘要、关键词和缩略图”三部分,系统会使用常规规则进行自动匹配,这里只需要配置过滤内容即可。下面主要介绍如何获取“文章标题、文章作者、文章出处、发布时间、文章内容”的采集规则。过滤规则只是简单地涉及。

  2.1.1 获取文章标题的采集规则

  首先打开“预览网址”页面,右键,选择“查看源代码”,找到文章标题”,在Dreamweaver中为插入的Flash添加透明度,如图23)@ > 显示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图23-源码中的文章标题

  这里,文章 的标题在“”之间。由于这组标签在本页多次出现,您应该填写“

  [Content]"作为文章标题的匹配规则,如果文章标题中有相关链接,可以使用过滤规则进行处理,无需设置在这里填写后,如图24所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图24-采集文章标题规则

  2.1.2 获取文章作者的采集规则

  如上图23所示,在“Author:”这个词之后有一组标签“”,猜测作者的名字会写在这组标签之间。同样,为了保持唯一性,此处应填写“作者:[内容]”作为文章作者的采集规则。为谨慎起见,请根据文章列表中的其他文章内容页面检查此采集规则是否正确。无需使用过滤规则。填充后,如图25所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图25-文章作者的采集规则

  2.1.3 从文章的源码中获取采集规则

  在上面的图23中,你可以在“source:”这个词之后找到一组标签“”,猜测源内容会写在这组标签之间。和2.1.2一样,为了保持唯一性,文章的来源的采集规则应该是“来源:[内容]”。同样,这里也不需要使用过滤规则。填充后,如图26所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图26-文章源代码中的采集规则

  2.1.4 获取文章采集发布时间规则

  再次回到图23,找到“Published in:”和下面的“2009-09-29 14:21”,和前面获取采集规则的方法一样,这里应该是“Published in: [Content] "作为采集发布时间规则。同样,这里也不需要使用过滤规则。填充后,如图27所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图27-文章发布时间的采集规则

  2.1.5 采集获取文章内容的规则

  这部分是编写采集规则的重点和难点。需要特别注意。

  具体步骤:

  (一)回到打开的文章内容页面的源码,找到文章内容的开头部分《Dreamweaver升级到8.0.2之后》 ,如图28所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图28-文章内容的开头

  注意:这句话在源码中出现了两处。其中,第一句在“

  在“之后,第二句在”

  ”之后。通过对比文章的内容页和它的源码,不难发现第一部分其实是一个摘要,第二部分是文章@内容的开头>. 因此,您应该选择“

  “是匹配规则的开始部分。

  (B) 找到文章内容的结尾部分“也是”wmode”参数加上了“transparent”的值”,如图29所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图29-文章的内容结束

  注意:由于结束部分的最后一个标签是“

  ”,并且这个标签在文章的内容中出现多次,所以不能作为采集规则的结束标签。考虑到它应该对应<的内容的开头@文章,经过对比和分析,得出的结论是“

  ”作为文章的内容结束,如图30所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图 30-文章 内容匹配规则结束

  (C) 结合(a)和(b),可以看出这里文章的内容匹配规则应该是"

  [内容]

  》,填写后,如图31所示,

  

  (本图来源于网络,如有侵权请联系删除!)

  图31-文章的内容匹配规则

  这里不使用过滤规则,过滤规则的介绍和使用将放在单独的章节中。

  至此,“新建采集节点:第二步设置内容字段获取规则”,设置完成。填写后,如图(图32),

  

  (本图来源于网络,如有侵权请联系删除!)

  图32-设置后新添加的采集节点: 第二步设置内容字段获取规则

  检查无误后,点击“保存配置并预览”。如果之前的设置正确,点击后会进入“新建采集节点:测试内容字段设置”页面,看到对应的文章内容。如图(图33)@>,

  

  (本图来源于网络,如有侵权请联系删除!)

  图33-新建采集节点:测试内容字段设置

  确认无误后,点击“只保存”,系统会提示“保存配置成功”,返回“采集节点管理”界面;如果单击“保存并启动采集”,您将进入“采集 指定节点”界面。否则,单击“返回上一步进行修改”。

  第二部分的介绍到此结束。现在进入第三部分。. .

  上一篇:如何使用Dedecms织梦采集函数-普通文章无需分页(三)

  下一篇:织梦模板dede:arclist标签排序具体实现方法

  免责声明:本站所有文章及图片均来自用户分享和网络采集。文章及图片版权归原作者所有。仅供学习和参考。请不要将它们用于商业目的。如果您的权益受到损害,请联系网站客服。

  Eyoucms,简单易用的企业网站管理系统,点击了解更多

  

  有问题可以加入织梦技术QQ群一起交流学习

  本站VIP会员请加入dede58 VIP②群 PS:加入时请备注用户名或昵称

  普通注册会员或访客请加入dede58技术交流②群

  来源:网友投稿关注:时间:2018-10-15 10:50

  ☉首先,只要是我们的VIP会员,所有源代码都可以免费下载,没有任何限制(了解更多)

  ☉本站源代码不会像其他下载站那样植入大量广告。为了更好的用户体验,以后坚持不打印水印

  ☉本站只提供精品织梦源代码,源代码可用,不多!!希望在这里找到合适的你。

  ☉本站提供的全站织梦程序,均附数据及演示地址。可以在任意源码详情页查看demo地址

  ☉本站所有资源(包括源代码、模板、素材、特效等)仅供学习参考,请勿用于商业用途。

  ☉如有其他问题,请加网站客服QQ(970003436))沟通。

  相关 织梦 教程:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线