文章cms采集(图片如下:4.列表页采集设置4.1获取列表(组图) )
优采云 发布时间: 2021-12-13 02:20文章cms采集(图片如下:4.列表页采集设置4.1获取列表(组图)
)
1.登录后台,点击“内容管理”,选择“采集管理”。
本主题相关图片如下:
2. 在“采集治理向导”中,选择“添加采集项目”。
本主题相关图片如下:
3.采集项目设置这里我们以易讯网络学院的采集c#部分为例
本主题相关图片如下:
注意:编码选择为我们提供了三种编码方式(指网站的编码即为采集)。如何知道采集网站的编码方式?答案是看对方的源码。
易讯网>>学院>>程序开发>>c#语言
看上面的代码,对方使用的是gb2312,所以我这里也选择了gb2312。
4.列表页面采集设置
4.1获取列表页
本主题相关图片如下:
点击“测试列表”按钮,左边的源代码文本框会根据规则截取相应的源代码。
本主题相关图片如下:
|||
4.2获取连接
本主题相关图片如下:
本主题相关图片如下:
点击“测试连接”按钮,左边的源代码文本框会根据规则截取相应的源代码。
4.3 个分页设置
本主题相关图片如下:
5.内容页采集设置这里我只以设置文章标题和文章内容等选项为例。可以根据自己的需要自行设置。
5.1 获取文章
的标题
本主题相关图片如下:
本主题相关图片如下:
选择列表中的“Title”列并使用采集规则。点击“设置采集规则”按钮设置字段的开始和结束代码,然后点击测试字段左侧的源代码文本框显示结果标题设置完成。
5.2Get文章内容设置
在列表中选择“文章Content”列。使用采集规则并点击“设置采集规则”按钮
本主题相关图片如下:
|||
本主题相关图片如下:
设置字段的起止码,可以根据需要选择过滤参数网站。点击测试字段左侧的源代码文本框,显示结果文章内容设置完毕。
注意:在匹配获取文章的内容时,可以通过选择左侧下拉列表中的网页列表并选择相应的字段来分析文章的内容开始和结束标签。以求完美。
本主题相关图片如下:
6.项目采集
在采集治理向导中选择“开始采集”,选择你要采集的项目,点击“开始采集”按钮采集系统将开始运行。
本主题相关图片如下:
本主题相关图片如下: