干货教程:做电商必须学会这一招!教你用免费采集工具批量采集慧聪网商品数据
优采云 发布时间: 2020-09-02 00:19成为电子商务公司必须学习这一技巧!教您使用免费的采集工具批量处理采集 HC Net产品数据
本文主要介绍如何使用优采云 采集器的智能模式,免费的采集 HC网络产品和卖家信息.
采集工具简介:
优采云 采集器是基于人工智能技术的Web爬虫工具. 它可以通过输入URL自动识别网页数据,并且无需配置即可完成数据采集. 它是业内第一个支持三种操作系统(包括Windows,Mac和Linux)数据采集软件的软件.
这是一个真正免费的data 采集软件. 对采集结果的导出没有限制. 没有编程基础的新手用户可以轻松实现data 采集要求.
官方网站:
采集字段:
产品标题,产品链接,产品价格,产品图片,总供应量,卖方,卖方位置,交易指数,认证信息
功能点目录:
如何采集列出+详细页面类型的网页
如何下载图片
采集结果预览:
导出到Excel:
导出为本地图片:
现在,让我们详细介绍如何在HC上释放采集商品和卖家的信息. 让我们以家用空气净化器为例. 具体步骤如下:
第1步: 下载并安装优采云 采集器,然后注册并登录
1. 单击此处打开优采云 采集器官方网站,下载并安装采集器软件工具-优采云 采集器软件
2,单击“注册”以登录,注册一个新帐户,然后登录优采云 采集器
[提醒]您无需注册即可直接使用该采集器软件,但是切换到注册用户时,匿名帐户下的任务将会丢失,因此建议您在注册后使用它.
优采云 采集器是优采云云的乘积. 如果您是优采云用户,则可以直接登录.
第2步: 创建采集任务
1. 复制慧聪家用空气净化器的主页(需要搜索结果页面的URL,而不是主页的URL)
单击此处以了解如何正确输入URL.
2. 创建一个新的智能模式采集任务
您可以直接在软件上创建新的采集任务,也可以通过导入规则来创建任务.
点击此处了解如何导入和导出采集规则.
第3步: 配置采集规则
1. 设置提取数据字段
在智能模式下,输入URL后,软件可以自动识别页面上的数据并生成采集结果. 每种数据类型都对应一个采集字段. 我们可以右键单击该字段以进行相关设置,包括“修改字段名称”,“增加或减少字段”,“过程数据”等.
单击此处以了解如何配置采集字段.
在列表页面上,我们需要添加产品名称,产品标题,产品价格,产品图片等信息. 字段设置如下:
2. 使用深入的采集功能提取详细信息页面数据
关于慧聪网家用空气净化器的大多数信息都显示在列表页面上,但是如果我们要采集获取卖方的具体信息和总供应量,则需要右键单击“产品”链接”并使用深入的采集功能,跳至采集的详细信息页面.
点击此处了解有关采集列表+详细页面类型页面的更多信息.
在详细信息页面上,我们可以看到诸如卖方信息和产品总供应量之类的信息. 我们可以单击“添加字段”来添加采集字段. 字段设置效果如下:
第4步: 设置并启动采集任务
1,设置采集任务
完成采集数据添加后,我们可以启动采集任务. 开始之前,我们需要对采集任务进行一些设置,以提高采集的稳定性和成功率.
单击“设置”按钮,然后在弹出的运行设置页面中设置运行设置和防阻塞设置. 在这里,我们选中“跳过以继续采集”,设置为“ 2”秒请求等待时间,然后选中“不加载网页图片”,防阻塞设置将遵循系统默认设置,然后单击“保存”.
单击此处以了解有关如何配置采集任务的更多信息.
2,启动采集任务
单击“保存并开始”按钮以在弹出页面中执行一些高级设置,包括定时开始,自动存储和下载图片. 在此示例中,不使用定时采集和自动存储功能. 选中将图片下载到本地的功能后,单击“开始”以运行采集器工具.
单击此处以了解有关计时采集的更多信息.
单击此处以了解有关自动存储的更多信息.
单击此处以了解有关如何下载图片的更多信息.
[温馨提示]免费版可以使用非定期定时采集功能,并且图片下载功能是免费的. 个人专业版及更高版本可以使用高级计时功能和自动存储功能.
3. 运行任务以提取数据
启动任务后自动开始采集数据. 我们可以从界面直观地看到程序的运行过程和采集的结果,并且采集结束后会有提醒.
第5步: 导出和查看数据
数据采集完成后,我们可以查看和导出数据. 优采云 采集器支持多种导出方法(手动导出到本地,手动导出到数据库,自动发布到数据库,自动发布到网站)以及导出文件的格式(EXCEL,CSV,HTML和TXT),我们选择所需的方法和文件类型,然后单击“确认导出”.
单击此处以了解有关如何查看和清除采集数据的更多信息.
单击此处以了解有关如何导出采集结果的更多信息.
[提醒]: 所有手动导出功能都是免费的. Personal Professional Edition及更高版本可以使用“发布到网站”功能.
作者: 技术Peter Pan
链接: