免规则采集器列表算法(怎么导出前台运行任务的采集任务?软件步骤)
优采云 发布时间: 2022-01-12 07:04免规则采集器列表算法(怎么导出前台运行任务的采集任务?软件步骤)
第一步:登录打开优采云采集器软件
第 2 步:创建一个新的 采集 任务
1、复制网址:采集需要评估的产品的网址
2、新流程图模式采集任务:导入采集规则创建智能任务
第 3 步:配置 采集 规则
1、设置预登录
输入网址后,我们进入宝贝详情页面。这时候我们可以点击关闭页面上出现的登录界面。我们也可以在不登录的情况下采集查看评论数据。
2、设置数据字段
在详情页面,您可以看到评论的数量,但看不到具体的评论内容。我们需要点击评论,然后在左上角跳出的提示框中选择“点击这个元素”。
3、进入评论界面后,根据搜索的方向选择元素,如好评、差评等元素。我们可以在此基础上右键字段进行相关设置,包括修改字段名、增减字段、处理数据等。等待。
由于我们要下载所有评论图片,我们可以选择评论中的所有图片,然后设置字段属性——提取外部html。
4、我们采集出了单页评论数据,现在我们需要采集下一页数据,我们点击页面上的“下一页”按钮,出现的操作在左上角的提示框中,选择“循环点击下一步”。
第 4 步:设置并启动 采集 任务
点击“开始采集”按钮,在弹出的启动设置页面中进行一些高级设置,包括“定时启动、防屏蔽、自动导出、文件下载、加速引擎、重复数据删除、开发者设置”,这次采集不使用这些功能,我们直接点击开始开始采集。
第 5 步:导出和查看数据
数据采集完成后,我们就可以查看和导出数据了。优采云采集器支持多种导出方式和导出文件格式,还支持导出特定数字,可以在数据中选择要导出的柱数,然后点击“确认出口”。
【如何导出】
1、导出采集前台运行任务结果
如果采集任务在前台运行,任务结束后软件会弹出提示框停止数据采集。这时候,我们可以点击“导出数据”按钮,导出采集数据结果。
2、导出采集后台运行任务的结果
如果采集任务在后台运行,任务结束后,桌面右下角会弹出导出提示框。我们可以根据右下角任务完成的弹出提示打开数据查看界面或者导出数据。
3、导出 采集 保存的 采集 任务的结果
如果不是实时运行的采集任务,而是之前运行过的采集任务,比如我们关闭软件再重新打开软件,然后导出< @采集 正在运行的 采集 任务的任务。采集结果。
这种情况下,我们可以右击任务,点击“查看数据”,打开查看数据界面,然后在该界面设置导出数据。
4、导出数据的其他注意事项
目前优采云采集器支持多种格式自由导出,包括:Excel2007、Excel2003、CSV、HTML文件、TXT文件;还支持免费导出到数据库。
个人专业版及以上支持发布到网站,目前支持发布到WordPress、Typecho、DEDEcms(织梦),更多网站模板会持续更新中间……
导出数据时,用户可以选择导出范围、导出未导出数据、导出选定数据或选择导出项数。
导出后还可以对导出的数据进行标记,这样可以清晰直观的看到哪些数据已经导出,哪些数据没有导出。
【如何下载图片】
第一种:一张一张添加图片
直接在页面点击要下载的图片,然后根据提示点击“提取此元素”,软件会自动生成提取的数据组件并添加图片字段。(如果有连续的采集字段,可能不会每次都产生新的提取数据,只会增加新的字段)
或者直接单击“添加字段”,然后在页面上单击要下载的图像。
第二种:一次下载多张图片
在这种情况下,需要将图片分组在一起,并且可以一次选择所有图片。
我们可以直接点击整个图片区域的右下角。在选框的时候,我们可以看到软件的蓝色选框区域,保证所有要下载的图片都加框。然后根据提示点击“提取此元素”,软件会自动生成提取的数据组件并添加图片字段。 (如果有连续的采集字段,可能不会每次都产生新的提取数据,只会增加新的字段)
然后右键单击该字段并将字段属性修改为“提取内部 HTML”。
点击右下角的“开始采集”按钮设置图片下载功能。
接下来,我们只需要点击“开始采集”,然后在启动框中勾选“在采集中同时下载图片到以下目录”即可启用图片下载功能。用户可以设置图片的本地保存路径。