帮助中心(网站)切换到自媒体版

定向采集使用教程

功能介绍
        定向采集功能提供两种模式:
        一种是提交一个网址,用户选择页面上的某些位置的链接,系统进行持续跟踪,发现所选区域存在新网址时进行抓取。这种模式叫跟踪采集,采集任务添加之后持续跟踪运行,但只跟踪一个单独页面,不支持设置翻页。
        另一种是提交一个网址和翻页页码,用户选择页面上的某些位置的链接,系统进行抓取,直到把每个翻页上的相同位置链接全部抓取完为止。这种模式叫单次采集,系统抓取完所有翻页之后就会停止。
 
使用方法
一、进入任务目标管理,点击定向采集,文章来源选择定向采集。

二、点击下方出现的“跟踪采集”或“单次采集”按钮,添加要采集的目标网址和设置阅读量,注意:目标网址通常是一个文章列表页的网址

三、添加完目标网址后,点击对应的“规则设置”按钮,在弹出的对话框中选择要采集的链接。

四、规则设置窗口左上角有操作说明按钮,有重新加载、抓取测试、全部取消和确定保存按钮。窗口基本操作非常简单,在下面显示的网页中随意移动鼠标,选中想要采集的链接,然后保存就可以了。

五、所有设置完成后,可以看到每个定向采集任务后面的规则设置变成绿色。记得点击右上角确定按钮保存栏目设置。


官方客服QQ群

微信人工客服

QQ人工客服


线