文章采集功能(小编说功能的使用方法-不含分页的普通文章(三))

优采云 发布时间: 2022-02-17 00:04

  文章采集功能(小编说功能的使用方法-不含分页的普通文章(三))

  最近有很多朋友来咨询小编,说功能怎么用——普通的文章不分页(三)。不过我对织梦了解不多,所以我希望小编给点建议等。其实dedecms织梦采集功能的使用——普通的文章不分页(三)是不行的大家说的那么难,下面小编就和大家说说Dedecms织梦采集函数的使用——普通的文章不分页(三) )。

  前言:本文为《普通文章无分页的采集方法》第三篇。“如何导出 采集 内容”以获取详细说明。为了与前面的文字保持一致,本文将继续使用前面的章节标记。

  继续第二部分。

  3.1采集指定节点

  点击“保存并启动采集”后,会进入“采集指定节点”界面,如图(图34),

  图 34 - 采集 指定节点

  每页采集:设置每页需要的采集个数,根据网站是否有防刷新功能设置采集的间隔。

  特殊选项:设置是否检测重复图片,默认为“检测”。

  附加选项:该选项有3种采集模式可供选择:第一种是“Monitoring采集模式(检测当前或所有节点是否有新内容)”,选择后系统只会采集指定节点中更新的内容;第二个是“重新下载所有内容”,选择后系统会采集指定节点中的所有内容;第三个是“下载torrent网站的未下载内容”,选择后系统只会采集指定节点中的未下载内容,包括之前未下载和更新的内容。

  设置完成并确认后,点击“开始采集网页”或“查看Torrent URL”。此时,如果点击“查看*敏*感*词*URL”,会看到列表为空,因为新创建的采集节点从来都不是采集,如图(图35) 显示,

  图 35 - 查看节点的*敏*感*词* URL

  点击“开始采集网页”后,系统会启动采集节点中设置的URL,并出现相关提示,如图(图36),

  图36-采集过程中提示信息

  采集结束后,再次点击“查看Torrent URL”或点击页面右上角的“查看已下载”,可以看到已经采集的URL信息,如(图3< @7) 显示,

  图 37 - 查看节点的*敏*感*词* URL

  采集成功后,可以根据实际需要点击页面右上角的“采集节点管理”或“导出数据”。点击“导出数据”后,可以进入“采集管理>采集内容导出”界面,如图(图38),

  图 38 - 采集 内容导出

  “默认导出列”:设置采集中的内容将被导入到的列

  “批处理采集选项”:如果采集规则中已经指定了列ID,则可以使用该功能。如果指定的列 ID 为 0,系统会将 采集 的内容导入到“默认导出列”选择的列中。

  “发布选项”:有发布为“普通文档”和“另存为草稿”的选项。

  “每批导入”:设置每批导入的项目数,不宜过大。

  “附加选项”:这里有多种选择。如果不想采集重复文章标题,可以选择“排除重复标题”;如果希望内容为采集直接生成HTML,选择“完成后自动生成导入”内容HTML”;如果希望系统在采集列表页时自动识别标题名称,可以选择“使用列表索引的标题”,一般不推荐。

  “随机推荐”:填写一个代表文档数量的数字。推荐的文档在填写的文档数量中随机出现。如果填写“0”,则表示不推荐。

  设置完成后,可以点击“确定”将下载的文件导入到选中的栏目中,如图(图39),

  图 39 - 采集 设置后的内容导出页面

  同时系统会提示导出过程,如图(图40),

  图40-采集内容导出提示信息

  导出采集的内容后,提示“完成所有栏目列表的更新”,点击“浏览栏目”,可以进入网站的相关页面查看文章@的列表> 采集 去的地方。及其具体内容。也可以在后台管理界面主菜单点击“Core”,然后点击“普通文章”进入“文档列表”页面,查看文章采集的列表@> 到 ,如图(图41),

  图 41 - 文档列表

  至此,目标网站的文章内容已经成功采集到达。

  总之,采集“普通的文章没有分页”比较简单。由于本文章是基础教程,所以不涉及太多“过滤规则”。采集方法的使用和“普通文章带分页”的过滤规则将在下一篇文章 文章 中介绍。

  附上本文的采集规则:

  

{dede:listconfig}

{dede:noteinfo notename="采集测试(一)" channelid="1" macthtype="string"

refurl="http://www.dedecms.com/knowledge/web-based/dreamweaver/2009/0929/765.html" sourcelang="gb2312" cosort="asc" isref="no" exptime="10" usemore="0" /}

{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://www.dedecms.com/knowledge/web-based/dreamweaver/list_47_(*).html"

startid="1" endid="1" addv="1" urlrule="area"

musthas=".html" nothas="" listpic="1" usemore="0"}

{dede:addurls}{/dede:addurls}

{dede:batchrule}{/dede:batchrule}

{dede:regxrule}{/dede:regxrule}

{dede:areastart}{/dede:areastart}

{dede:areaend}{/dede:areaend}

{/dede:listrule}

{/dede:listconfig}

{dede:itemconfig}

{dede:sppage sptype='full' sptype='full' srul='1' erul='5'}{/dede:sppage}

{dede:previewurl}http://www.dedecms.com/knowledge/web-based/dreamweaver/2009/0929/765.html{/dede:previewurl}

{dede:keywordtrim}{/dede:keywordtrim}

{dede:descriptiontrim}{/dede:descriptiontrim}

{dede:item field='title' value='' isunit='' isdown=''}

{dede:match}[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{dede:item field='writer' value='' isunit='' isdown=''}

{dede:match}作者:[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{dede:item field='source' value='' isunit='' isdown=''}

{dede:match}来源:[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{dede:item field='pubdate' value='' isunit='' isdown=''}

{dede:match}发表于:[内容]{/dede:match}

{dede:function}@me=GetMkTime(@me);{/dede:function}

{/dede:item}

{dede:item field='body' value='' isunit='1' isdown='1'}

{dede:match}[内容]{/dede:match}

{dede:function}{/dede:function}

{/dede:item}

{/dede:itemconfig}

  以上就是关于Dedecms织梦采集函数的使用——普通文章(三)不分页。如果想了解更多织梦仿站内容请关注46仿站网站,可在页面底部给我们留言!我们会及时回复您!

  如果你觉得这篇文章对你有帮助,就给个赞吧!

  没有解决?点击这里呼唤大神帮忙(付费)!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线