采集的文章内容不能直接发布(易优cms—安全好用，商用授权只需要188元！)

优采云发布时间: 2021-12-11 05:26

　　易友cms——安全易用，商业授权仅需188元，网址：

　　前言：本文为《无分页常见文章采集方法》的第二篇。在上一节的基础上，第二节将新增采集节点。第 2 步：“设置字段获取规则”以获取详细说明。为了与上一篇保持一致，本文将继续使用上一章的标记。

　　继续第一部分。

　　2.1 新建采集节点：第二步设置内容字段获取规则

　　点击“保存信息，进入下一步设置”后，可以进入“新建采集节点：第二步设置内容字段获取规则”页面，如图（图22），

　　（本图来源于网络，如有侵权请联系删除！）

　　图22-设置内容字段获取规则

　　在预览网址中，系统会自动指定一个内容页的网址，即采集文章（通常是采集列表页的第一个文章网址），作为演示页面。如果文章内容页面收录分页，则需要设置“内容分页导航所在区域的匹配规则”。对于“固定采集项目”中的“内容摘要、关键词和缩略图”三部分，系统会使用常规规则进行自动匹配，这里只需要配置过滤内容即可。下面主要介绍如何获取“文章标题、文章作者、文章出处、发布时间、文章内容”的采集规则。过滤规则只是简单地涉及。

　　2.1.1 获取文章标题的采集规则

　　首先打开“预览网址”页面，右键，选择“查看源代码”，找到文章标题”，在Dreamweaver中为插入的Flash添加透明度，如图23）@ > 显示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图23-源码中的文章标题

　　这里，文章的标题在“”之间。由于这组标签在本页多次出现，您应该填写“

　　[Content]"作为文章标题的匹配规则，如果文章标题中有相关链接，可以使用过滤规则进行处理，无需设置在这里填写后，如图24所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图24-采集文章标题规则

　　2.1.2 获取文章作者的采集规则

　　如上图23所示，在“Author:”这个词之后有一组标签“”，猜测作者的名字会写在这组标签之间。同样，为了保持唯一性，此处应填写“作者：[内容]”作为文章作者的采集规则。为谨慎起见，请根据文章列表中的其他文章内容页面检查此采集规则是否正确。无需使用过滤规则。填充后，如图25所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图25-文章作者的采集规则

　　2.1.3 从文章的源码中获取采集规则

　　在上面的图23中，你可以在“source:”这个词之后找到一组标签“”，猜测源内容会写在这组标签之间。和2.1.2一样，为了保持唯一性，文章的来源的采集规则应该是“来源：[内容]”。同样，这里也不需要使用过滤规则。填充后，如图26所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图26-文章源代码中的采集规则

　　2.1.4 获取文章采集发布时间规则

　　再次回到图23，找到“Published in:”和下面的“2009-09-29 14:21”，和前面获取采集规则的方法一样，这里应该是“Published in: [Content] "作为采集发布时间规则。同样，这里也不需要使用过滤规则。填充后，如图27所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图27-文章发布时间的采集规则

　　2.1.5 采集获取文章内容的规则

　　这部分是编写采集规则的重点和难点。需要特别注意。

　　具体步骤：

　　（一）回到打开的文章内容页面的源码，找到文章内容的开头部分《Dreamweaver升级到8.0.2之后》，如图28所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图28-文章内容的开头

　　注意：这句话在源码中出现了两处。其中，第一句在“

　　在“之后，第二句在”

　　”之后。通过对比文章的内容页和它的源码，不难发现第一部分其实是一个摘要，第二部分是文章@内容的开头>. 因此，您应该选择“

　　“是匹配规则的开始部分。

　　(B) 找到文章内容的结尾部分“也是”wmode”参数加上了“transparent”的值”，如图29所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图29-文章的内容结束

　　注意：由于结束部分的最后一个标签是“

　　”，并且这个标签在文章的内容中出现多次，所以不能作为采集规则的结束标签。考虑到它应该对应<的内容的开头@文章，经过对比和分析，得出的结论是“

　　”作为文章的内容结束，如图30所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图 30-文章内容匹配规则结束

　　(C) 结合(a)和(b)，可以看出这里文章的内容匹配规则应该是"

　　[内容]

　　》，填写后，如图31所示，

　　（本图来源于网络，如有侵权请联系删除！）

　　图31-文章的内容匹配规则

　　这里不使用过滤规则，过滤规则的介绍和使用将放在单独的章节中。

　　至此，“新建采集节点：第二步设置内容字段获取规则”，设置完成。填写后，如图（图32），

　　（本图来源于网络，如有侵权请联系删除！）

　　图32-设置后新添加的采集节点：第二步设置内容字段获取规则

　　检查无误后，点击“保存配置并预览”。如果之前的设置正确，点击后会进入“新建采集节点：测试内容字段设置”页面，看到对应的文章内容。如图（图33）@>，

　　（本图来源于网络，如有侵权请联系删除！）

　　图33-新建采集节点：测试内容字段设置

　　确认无误后，点击“只保存”，系统会提示“保存配置成功”，返回“采集节点管理”界面；如果单击“保存并启动采集”，您将进入“采集指定节点”界面。否则，单击“返回上一步进行修改”。

　　第二部分的介绍到此结束。现在进入第三部分。. .

　　上一篇：如何使用Dedecms织梦采集函数-普通文章无需分页(三）

　　下一篇：织梦模板dede:arclist标签排序具体实现方法

　　免责声明：本站所有文章及图片均来自用户分享和网络采集。文章及图片版权归原作者所有。仅供学习和参考。请不要将它们用于商业目的。如果您的权益受到损害，请联系网站客服。

　　Eyoucms，简单易用的企业网站管理系统，点击了解更多

　　有问题可以加入织梦技术QQ群一起交流学习

　　本站VIP会员请加入dede58 VIP②群 PS：加入时请备注用户名或昵称

　　普通注册会员或访客请加入dede58技术交流②群

　　来源：网友投稿关注：时间：2018-10-15 10:50

　　☉首先，只要是我们的VIP会员，所有源代码都可以免费下载，没有任何限制（了解更多）

　　☉本站源代码不会像其他下载站那样植入大量广告。为了更好的用户体验，以后坚持不打印水印

　　☉本站只提供精品织梦源代码，源代码可用，不多！！希望在这里找到合适的你。

　　☉本站提供的全站织梦程序，均附数据及演示地址。可以在任意源码详情页查看demo地址

　　☉本站所有资源（包括源代码、模板、素材、特效等）仅供学习参考，请勿用于商业用途。

　　☉如有其他问题，请加网站客服QQ(970003436))沟通。

　　相关织梦教程：

0

2021-12-11

采集的文章内容不能直接发布

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

采集的文章内容不能直接发布(易优cms—安全好用，商用授权只需要188元！)

0 个评论

发起人

AI时代内容工厂

采集的文章内容不能直接发布(易优cms—安全好用，商用授权只需要188元！)

0 个评论

发起人

相关问题