文章采集功能( 浏览,dedecms自带了文章和图片采集功能(组图) )
优采云 发布时间: 2022-04-13 21:26文章采集功能(
浏览,dedecms自带了文章和图片采集功能(组图)
)
织梦采集函数使用方法
游戏/数字网络2017-09-27 8 浏览
织梦采集函数使用方法,dedecms自带文章和图片采集功能,对于不熟悉的新手,采集很配置规则比较麻烦,经常在采集中出错或者乱码,现在把dedecms的采集功能介绍给朋友。工具/原材料织梦程序方法/步骤进入采集节点管理界面,在后台管理界面主菜单点击“采集”,再点击“采集@ >节点管理”进入采集节点管理界面。在采集的节点管理界面,点击左下角的“添加新节点”或右上角的“添加新节点”,如图,可以进入“
织梦采集函数使用方法,dedecms自带文章和图片采集功能,对于不熟悉的新手,采集很配置规则比较麻烦,采集时经常出错或者乱码,现在把dedecms的采集功能介绍给朋友。
工具/材料
方法/步骤
进入采集节点管理界面,在后台管理界面主菜单点击“采集”,再点击“采集节点管理”进入采集节点管理界面。
在采集的节点管理界面,点击左下角的“添加新节点”或右上角的“添加新节点”,进入“选择内容模型”界面,如图,
设置节点基本信息
目标页面编码:设置目标页面的编码格式为采集,共有三种:GB2312、UTF8和BIG5。可以通过在采集目标页面上右击选择“查看源代码”来获得。
脚步:
(a) 打开目标页面采集:网站domain/knowledge/web-based/dreamweaver/;
右键单击并选择“查看源代码”,找到“字符集”
等号后面的代码就是想要的“编码格式”,这里是“gb2312”。
“区域匹配模式”:设置如何匹配想要的采集的内容部分,可以是字符串,也可以是正则表达式。系统默认模式为字符串。如果您对正则表达式了解更多,可以在此处选择正则表达式的模式。
“内容导入顺序”:指定 文章 列表的导入顺序。可以选择“与目标站一致”或“与目标站相反”。
“热链接模式”:目标站点 采集 没有刷新限制。一开始很难说,你需要测试才能知道。如果是这样,您需要在此处设置“资源下载超时时间”。
“参考 URL”:填写将是 采集 的任何 文章 内容页面的 URL。
在打开的文章列表页面,点击第一个文章
此时浏览器的URL地址栏显示的URL就是“参考URL”处需要填写的URL,如图(图)
至此,“节点基本信息”设置完毕。最终结果,如(图)所示,
检查后,进入下一步。
设置列表 URL 获取规则
下面是设置采集的文章列表页的匹配规则。如果采集的文章列表页有一定规则,可以选择“批量生成列表URL”;如果采集的文章列表页面完全没有规则可循,则可以选择“手动指定列表URL”;如果采集 提供的站点提供RSS,您可以选择“从RSS 获取”。对于特殊情况,例如:有些列表页面是规则的,而有些是不规则的,您可以在“匹配 URL”中填写规则部分,然后在“手动指定 URL”中填写不规则部分。