规则采集文章软件( DEDECMS采集规则（图解）(图解)(确定采集的网站))

优采云发布时间: 2022-03-15 03:10

　　规则采集文章软件(

DEDECMS采集规则（图解）(图解)(确定采集的网站))

　　DEDEcms采集规则（图解）第一步：确定采集的网站（我们使用DEDE官网作为采集站点进行演示）复制代码的第二步是确定站的代码是采集。打开原来是采集的网页后，查看源码（IE：查看->源码），找到中间的charset，后面会显示网页的代码。截图为“gb2312”第三步，采集List get

　　很明显pageno表示分页页码，所以如果有多个页列表采集应该用"[var: paging]"代替分页页码，截图如下 ;pageno=[var:Pagination]文章url必须收录url，不能收录这两个。一般不用写。它用于采集列表范围内有许多不必要的连接。做过滤器使用。更多

　　URL没有收录为什么要加在它前面的原因，所以我就不说了。如果只有一个列表页，直接在源 URL 中写 URL 即可。注意这里，最重要的是这里。下面是“采集获取文章列表的规则”，也就是上面采集打开的页面的源代码文件。在找到文章的列表之前，和这个页面是一样的。德德cms官网列表页面文章list之前和之前的代码

　　之后，最新的和不一样的是“class="newslist">”和“class="pages">”，分别写“开始HTML”和“结束HTML”，看第四步截图，< @采集文章标题、文章内容、文章作者、文章来源等规则书写、分页采集等“起始HTML”和“结束HTML”参考第三步中的“编写文章列表的规则”。

　　关于如何采集对内容进行分页，看截图中圈出来的地方，截图文档是否分页，选择“所有列出的分页列表”，“开始HTML”，“结束HTML”。文章写列表的规则”这里原来有截图，由于论坛配置的原因，现在显示在最上方。点击文章内容中的“分页内容栏”，如果你不选择它，你不能文章@采集。“下载字段中的多媒体资源”这是

　　下载多媒体资源（视频、软件、图片等）到本地，也就是你的网站。以下是过滤规则。过滤规则需要用“正则表达式”来写，但是对于新手来说，这简直比天上要难，看不懂。:) 完成以上操作。保存点“Test”，出现与上图类似的图片。表示成功后点击“采集”采集，完成后导出到你的栏目。详情在地址：

0

2022-03-15

规则采集文章软件

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

规则采集文章软件( DEDECMS采集规则（图解）(图解)(确定采集的网站))

0 个评论

发起人

AI时代内容工厂

规则采集文章软件( DEDECMS采集规则（图解）(图解)(确定采集的网站))

0 个评论

发起人

相关问题