最新版本:优采云采集器 V3.4.5 官方版
优采云 发布时间: 2021-01-13 09:15最新版本:优采云采集器 V3.4.5 官方版
第1步:登录以打开优采云采集器软件
第2步:创建一个新的采集任务
1、复制网页地址:需要采集评估的产品的网址
2、新的流程图模式采集任务:导入采集规则以创建智能任务
第3步:配置采集规则
1、设置预登录
输入网址后,我们进入婴儿的详细信息页面。这时,我们可以单击以关闭页面上显示的登录界面。您可以采集无需登录即可访问评论数据。
2、设置数据字段
在详细信息页面上,您可以看到评论的数量,但看不到特定的评论内容。我们需要单击注释,然后在左上角跳出的提示框中选择“单击此元素”。
3、进入评论界面后,根据搜索方向选择好评论,不好评论等元素。在此基础上,我们可以右键单击该字段以执行相关设置,包括修改字段名称,添加或减去字段以及处理数据等。
因为我们要下载所有评论图片,所以我们可以选择评论中的所有图片,然后设置字段属性-提取外部html。
4、我们采集发布了单页评论数据,现在我们需要采集下一页数据,我们单击页面上的“下一页”按钮,在操作提示框中,出现在左上角。选择“循环单击下一页”。
第4步:设置并启动采集任务
单击“开始采集”按钮,您可以在弹出的启动设置页面中进行一些高级设置,包括“定时启动,防阻塞,自动导出,文件下载,加速引擎,重复数据删除,开发人员设置”功能,这次采集没有使用这些功能,我们直接单击开始以启动采集。
第5步:导出和查看数据
完成数据采集之后,我们可以查看和导出数据。 优采云采集器支持多种导出方法和导出文件格式,并且还支持导出特定编号。您可以选择要导出的数据。条目数,然后单击“确认导出”。
[如何导出]
1、导出采集在前台运行的任务的结果
如果采集任务在前台运行,则软件将弹出提示框,指示任务结束后数据采集已停止。这时,我们单击“导出数据”按钮以导出采集数据结果。
2、导出采集个后台运行任务的结果
如果采集任务在后台运行,则该任务完成后,将在桌面右下角弹出一个导出提示框。我们将根据任务完成右下角的弹出窗口打开视图数据界面或导出数据。
3、导出已保存的采集任务的采集结果
例如,如果它不是实时运行的采集任务,而是先前运行的采集任务,则我们关闭软件,然后重新打开软件,然后导出采集的采集结果]已运行的任务。
在这种情况下,我们可以右键单击任务,然后单击“查看数据”以打开查看数据界面,然后在该界面上设置导出数据。
4、导出数据的其他事项
当前优采云采集器支持多种格式的免费导出,包括:Excel2007、Excel200 3、 CSV,HTML文件,TXT文件;同时,它支持免费导出到数据库。
个人专业版及更高版本支持发布到网站,目前支持发布到WordPress,发布到Typecho,发布到DEDEcms(织梦),更多网站模板正在继续更新...。 ..
导出数据时,用户可以选择导出范围,选择导出未导出的数据,导出选定的数据或选择导出项目的数量。
导出完成后,您还可以标记导出的数据,以便可以清晰直观地查看哪些数据已导出,哪些数据尚未导出。
[如何下载图片]
第一种类型:一张一张地添加图片
直接在页面上单击要下载的图片,然后根据提示单击“提取此元素”,软件将自动生成提取的数据成分并添加图像字段。 (如果采集字段是连续的,则可能不会每次都生成新的提取数据组价格,只会添加新的字段)
或直接单击“添加字段”,然后在页面上单击要下载的图片。
第二种类型:一次下载多张图片
在这种情况下,需要将图片分组在一起,您可以一次选择所有图片。
我们可以直接单击整个图片区域的右下角,选择框时可以看到软件的蓝色框选择区域,确保所有要下载的图片都被框起来。然后根据提示单击“提取此元素”,软件将自动生成提取的数据成分并添加图片字段。 (如果采集字段是连续的,则可能不会每次都生成新的提取数据组价格,只会添加新的字段)
然后右键单击该字段,并将字段属性修改为“提取内部HTML”。
单击右下角的“开始采集”按钮设置图片下载功能。
接下来,我们只需要单击“开始采集”,然后在开始框中选中“将图片同时下载到以下目录”即可启动图片下载功能,用户可以设置本地保存图片的路径。