【优采云采集攻略】提取数据怎么设置自定义抓取方法
优采云 发布时间: 2020-08-27 17:36【优采云采集攻略】提取数据怎么设置自定义抓取形式
的属性值。演示如下:
优采云提取数据-自定义抓取形式
图
6
优采云提取数据-自定义抓取形式 图7
2、从浏览器提取数据
优采云提取数据-自定义抓取形式图8
(1)页面网址:同添加其他特殊数组中的抓取当前页面的网址疗效
(2)页面标题:同添加其他特殊数组中的抓取当前页面的标题疗效
(3)从页面源码里抓取:可直接用正则表达式提取网页源码里匹配到的数据3、生成数据
优采云提取数据-自定义抓取形式图9
(1)生成固定的值:同添加其他特殊数组中的生成固定值疗效,常用于发布到网站时设置发布的用户名,发布到的版块等固定数组
(2)使用当前时间:同添加其他特殊数组中的使用当前时间疗效,用于记录采集时间,此设置有可能会造成优采云采集器去重功能检查失效
相关采集教程:
美团店家信息采集
1688热门商品采集
搜狗陌陌文章采集
优采云——70万用户选择的网页数据采集器。
1、操作简单,任何人都可以用:无需技术背景,会上网才能采集。完全可视化流程,点击滑鼠完成操作,2分钟即可快速入门。
2、功能强悍,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。
3、云采集,关机也可以。配置好采集任务后可死机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用害怕IP被封,网络中断。
4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足低端付费企业用户的须要。