文章采集功能(小编说功能的使用方法-不含分页的普通文章（三）)

优采云发布时间: 2022-02-17 00:04

　　最近有很多朋友来咨询小编，说功能怎么用——普通的文章不分页（三）。不过我对织梦了解不多，所以我希望小编给点建议等。其实dedecms织梦采集功能的使用——普通的文章不分页（三）是不行的大家说的那么难，下面小编就和大家说说Dedecms织梦采集函数的使用——普通的文章不分页（三））。

　　前言：本文为《普通文章无分页的采集方法》第三篇。“如何导出采集内容”以获取详细说明。为了与前面的文字保持一致，本文将继续使用前面的章节标记。

　　继续第二部分。

　　3.1采集指定节点

　　点击“保存并启动采集”后，会进入“采集指定节点”界面，如图（图34），

　　图 34 - 采集指定节点

　　每页采集：设置每页需要的采集个数，根据网站是否有防刷新功能设置采集的间隔。

　　特殊选项：设置是否检测重复图片，默认为“检测”。

　　附加选项：该选项有3种采集模式可供选择：第一种是“Monitoring采集模式（检测当前或所有节点是否有新内容）”，选择后系统只会采集指定节点中更新的内容；第二个是“重新下载所有内容”，选择后系统会采集指定节点中的所有内容；第三个是“下载torrent网站的未下载内容”，选择后系统只会采集指定节点中的未下载内容，包括之前未下载和更新的内容。

　　设置完成并确认后，点击“开始采集网页”或“查看Torrent URL”。此时，如果点击“查看*敏*感*词*URL”，会看到列表为空，因为新创建的采集节点从来都不是采集，如图（图35）显示，

　　图 35 - 查看节点的*敏*感*词* URL

　　点击“开始采集网页”后，系统会启动采集节点中设置的URL，并出现相关提示，如图（图36），

　　图36-采集过程中提示信息

　　采集结束后，再次点击“查看Torrent URL”或点击页面右上角的“查看已下载”，可以看到已经采集的URL信息，如（图3< @7）显示，

　　图 37 - 查看节点的*敏*感*词* URL

　　采集成功后，可以根据实际需要点击页面右上角的“采集节点管理”或“导出数据”。点击“导出数据”后，可以进入“采集管理>采集内容导出”界面，如图（图38），

　　图 38 - 采集内容导出

　　“默认导出列”：设置采集中的内容将被导入到的列

　　“批处理采集选项”：如果采集规则中已经指定了列ID，则可以使用该功能。如果指定的列 ID 为 0，系统会将采集的内容导入到“默认导出列”选择的列中。

　　“发布选项”：有发布为“普通文档”和“另存为草稿”的选项。

　　“每批导入”：设置每批导入的项目数，不宜过大。

　　“附加选项”：这里有多种选择。如果不想采集重复文章标题，可以选择“排除重复标题”；如果希望内容为采集直接生成HTML，选择“完成后自动生成导入”内容HTML”；如果希望系统在采集列表页时自动识别标题名称，可以选择“使用列表索引的标题”，一般不推荐。

　　“随机推荐”：填写一个代表文档数量的数字。推荐的文档在填写的文档数量中随机出现。如果填写“0”，则表示不推荐。

　　设置完成后，可以点击“确定”将下载的文件导入到选中的栏目中，如图（图39），

　　图 39 - 采集设置后的内容导出页面

　　同时系统会提示导出过程，如图（图40），

　　图40-采集内容导出提示信息

　　导出采集的内容后，提示“完成所有栏目列表的更新”，点击“浏览栏目”，可以进入网站的相关页面查看文章@的列表> 采集去的地方。及其具体内容。也可以在后台管理界面主菜单点击“Core”，然后点击“普通文章”进入“文档列表”页面，查看文章采集的列表@> 到，如图（图41），

　　图 41 - 文档列表

　　至此，目标网站的文章内容已经成功采集到达。

　　总之，采集“普通的文章没有分页”比较简单。由于本文章是基础教程，所以不涉及太多“过滤规则”。采集方法的使用和“普通文章带分页”的过滤规则将在下一篇文章文章中介绍。

　　附上本文的采集规则：

{dede:listconfig}

{dede:noteinfo notename="采集测试（一）" channelid="1" macthtype="string"

refurl="http://www.dedecms.com/knowledge/web-based/dreamweaver/2009/0929/765.html" sourcelang="gb2312" cosort="asc" isref="no" exptime="10" usemore="0" /}

{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://www.dedecms.com/knowledge/web-based/dreamweaver/list_47_(*).html"

startid="1" endid="1" addv="1" urlrule="area"

musthas=".html" nothas="" listpic="1" usemore="0"}

{dede:addurls}{/dede:addurls}

{dede:batchrule}{/dede:batchrule}

{dede:regxrule}{/dede:regxrule}

{dede:areastart}{/dede:areastart}

{dede:areaend}{/dede:areaend}

{/dede:listrule}

{/dede:listconfig}

{dede:itemconfig}

{dede:sppage sptype='full' sptype='full' srul='1' erul='5'}{/dede:sppage}

{dede:previewurl}http://www.dedecms.com/knowledge/web-based/dreamweaver/2009/0929/765.html{/dede:previewurl}

{dede:keywordtrim}{/dede:keywordtrim}

{dede:deｓｃｒｉｐｔiontrim}{/dede:deｓｃｒｉｐｔiontrim}

{dede:item field='title' value='' isunit='' isdown=''}

{dede:match}[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{dede:item field='writer' value='' isunit='' isdown=''}

{dede:match}作者：[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{dede:item field='source' value='' isunit='' isdown=''}

{dede:match}来源：[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{dede:item field='pubdate' value='' isunit='' isdown=''}

{dede:match}发表于：[内容]{/dede:match}

{dede:function}@me=GetMkTime(@me);{/dede:function}

{/dede:item}

{dede:item field='body' value='' isunit='1' isdown='1'}

{dede:match}[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{/dede:itemconfig}

　　以上就是关于Dedecms织梦采集函数的使用——普通文章(三）不分页。如果想了解更多织梦仿站内容请关注46仿站网站，可在页面底部给我们留言！我们会及时回复您！

　　如果你觉得这篇文章对你有帮助，就给个赞吧！

　　没有解决？点击这里呼唤大神帮忙（付费）！

0

2022-02-17

文章采集功能

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

文章采集功能(小编说功能的使用方法-不含分页的普通文章（三）)

0 个评论

发起人

AI时代内容工厂

文章采集功能(小编说功能的使用方法-不含分页的普通文章（三）)

0 个评论

发起人

相关问题