最新采集器(【常见问题】如何采集58二手房房源信息数据?步骤介绍)
优采云 发布时间: 2021-12-28 01:16最新采集器(【常见问题】如何采集58二手房房源信息数据?步骤介绍)
优采云
采集器是一款专业实用的网络数据采集器。这个采集
器不需要开发,任何人都可以使用,并且可以将数据导出到本地文件,发布到网站和数据库等。
【特征】
可视化点击,一键采集网络数据
全程拖拽点击,无需开发或了解技术
任何人都可以使用的网络数据采集
器
所有平台,Win/Mac/Linux 均可用
与其他采集
器不同,优采云
支持所有操作系统
版本更新和功能升级同步所有平台
采集
导出全部免费,放心无限使用
全免费采集软件,无限导出数据
数据可以导出到本地文件,发布到网站和数据库等。
可后台运行,实时速度显示
可切换软件后台运行,不打扰您其他前台工作
浮动窗口实时查看采集速度和采集数据
【手动的】
1、可视化自定义采集流程
全程问答指导、可视化操作、自定义采集流程。
自动记录和模拟网页操作顺序
高级设置满足更多采集
需求
2、点击提取网页数据
鼠标点击选择要抓取的网页内容,操作简单。
您可以选择提取文本、链接、属性、html 标签等。
3、运行批量数据采集
软件根据采集流程和提取规则自动批量采集
快速稳定,实时显示采集速度和进程,可切换软件后台运行,不打扰前台工作。
4、导出和发布采集
的数据
采集
的数据会自动制成表格,并且可以自由配置字段。
支持数据导出到Excel等本地文件,支持一键发布到CMS网站/数据库/微信公众号等媒体。
【常见问题】
如何采集
58份二手房信息数据?
第 1 步:创建采集
任务
1)打开优采云
采集
器,进入主界面,点击创建任务按钮,创建“精灵采集
任务”
2)输入58二手房网址,包括三种方式
1、 手动输入:直接在输入框中输入网址,多个网址需要用换行符分割
2、 点击读取文件:用户选择一个文件来存储 URL。文件中可以有多个URL地址,地址之间需要用换行符分隔。
3、 批量添加方式:通过添加和调整地址参数生成多个常规地址
第 2 步:自定义获取过程
1) 点击创建自动打开第一个网址进入向导设置,点击下一步进入列表页面
2)在列表块中选择要采集的元素所在的块,在块中点击要提取的元素
3) 点击列表中的另一块,可以自动选择整个列表,点击下一步
4)选择下一页按钮,选择选择下一页的选项,然后点击页面上的下一页按钮填写第一个输入框,第二个数据框可以调整点击任务下一页按钮同时任务运行频率。理论上,次数越多,采集
的数据结果就越多。点击下一步
5) 在焦点框中单击以选择要采集
的字段。采集到的结果会显示在下方,并且可以为每个字段的结果设置提取方法。双击要编辑的字段。点击下一步。
6)选择是否进入详情页,进入详情页需要点击焦点框点击元素进入详情页,在输入框中会获取到该元素的xpath,点击下一步
7) 在详情页,可以继续点击添加字段。在这里可以添加二手房价格、*房*康*厅、房屋面积、楼层数、小区位置,点击保存或保存运行
第 3 步:数据采集
和导出
1)采集任务正在运行
2)采集完成后,选择“导出数据”将所有数据导出到本地文件
3)选择“导出方式”导出采集的数据,这里可以选择excel作为导出格式
4) 采集到的数据可以导出到Excel