解决方案:优采云采集器 3.5.1 官方版
优采云 发布时间: 2020-11-03 12:01优采云采集器3.5.1正式版
优采云采集器是一款功能强大的网络抓取软件,通过该软件,您可以独立保存网页上的内容,从而可以在完成浏览后复制其他人的内容网站文件夹非常方便共享网络资源,复制Web内容等; 优采云采集器操作更加灵活,您可以捕获单个网页或选择多个HTML页面进行捕获,也可以手动选择字段,从而可以更快地锁定所捕获的内容。同时,该软件提供了图像过滤,广告过滤等功能,可以阻止您不需要抓取的内容!
软件功能
1、可视化自定义采集过程:完整的问答指南,可视化操作,自定义采集过程,自动记录和模拟网页操作序列,高级设置以满足更多采集需求
2、单击以提取网页数据:用鼠标单击以选择要爬网的网页内容,操作很简单,您可以选择提取文本,链接,属性,html标记等。
3、运行批处理采集数据:软件根据采集流程和提取规则自动批处理采集,快速且稳定,实时显示采集速度和流程,可切换软件运行在后台,而不会打扰前台工作
4、具有强大的功能和快速的迭代:智能识别Web数据,各种导出数据的方式,定期进行软件更新以及不断添加新功能
软件功能
1、可视化自定义采集流程
完整的问答指南,可视化操作,自定义采集过程
自动记录和模拟网页操作顺序
高级设置可以满足更多采集需求
2、点击提取网页数据
鼠标单击以选择要爬网的Web内容,操作简单
您可以选择提取文本,链接,属性,html标记等。
3、运行批处理采集数据
该软件会根据采集流程和提取规则自动对采集进行批处理。
快速,稳定,实时显示采集速度和过程
可以将软件切换为在后台运行,而不会影响前台工作
4、导出并发布采集的数据
采集的数据会自动制成表格,其中收录可自由配置的字段
支持将数据导出到Excel等本地文件
一键发布到媒体cms网站 /数据库/微信官方帐户
安装方法
1、下载该软件,单击此处启动houyicaiji-Setup-2.0.3.exe,它将提示您输入协议内容,单击以接受
2、设置软件的安装地址,可以选择C:\ Program Files(x86)优采云采集 houyicaiji
3、提示安装进度,请等待
4、 优采云采集器成功,请检查运行并单击以完成
使用方法
1、找到您在桌面上安装的“ 优采云采集器”,找到它后单击以启动。
2、在此处输入软件的登录帐户,单击其旁边的注册功能以申请帐户
3、提示软件项目创建方法,您可以在此处单击以创建新的爬网项目
4、您可以在此处复制网页的地址,也可以选择从文本中读取多个地址
5、复制地址后,单击“创建任务”。
6、如图所示,软件自动打开网页。这里有三个选项。您可以选择列表页面和内容页面。点击下一步
7、在上方的浏览区域中选择要抓取的网页的字段,然后用鼠标单击该字段
8、提示保存,找到捕获的内容后,单击下面的蓝色保存按钮
9、这次采集已经完成,请点击导出数据以保存网页的数据输出
10、提示保存,您可以选择Excel,CSV或HTML
1 1、这是保存界面。编辑者选择保存HTML,该HTML会自动保存在网页名称下
1 2、保存后提示,您可以选择打开捕获的内容进行查看,单击以打开文件夹
1 3、 优采云采集器抓取的内容在下面,这是抓取的HTML文件的内容