常用的方法:常用数据采集方式介绍
优采云 发布时间: 2020-09-01 12:11常用数据介绍采集方法
在线数据采集
1. 前端掩埋点: 通过在客户端上部署点,当用户在客户端上进行交互时,相应的信息将被记录并传输到日志服务器. 前端掩埋点有三种类型:
根据要求,记录指定的行为数据
优点: 定制的埋入点,灵活性强,采集丰富的数据信息,基本上适用于各种复杂场景;
缺点: 埋点工作量大,维护成本高;
根据需要,以视觉方式掩埋点并记录指定的行为数据
优点: 定制的埋入点,很好地解决了代码埋入点的工作量和维护成本
缺点: 某些页面控件行为无法实现;数据无法追踪;只能记录行为发生的次数
尽可能采集所有行为数据
优点: 解决了代码埋入点的工作量和维护成本,并且可以跟踪数据
缺点: 某些页面控件行为无法实现. 由于存在大量冗余数据,因此数据存储和传输的成本很高;只能记录行为发生的次数
2. 服务器端掩埋点: 通过在系统服务器端部署相应的数据采集模块,可以处理和分析采集数据.
比较前端掩埋点的优缺点
优点: 前端埋入点只能采集将数据信息保留在前端,而服务器端埋入点可以采集将数据记录在后端,这也可以减少客户的复杂性
缺点: 某些行为数据不一定会发出访问服务器的请求,并且服务器无法采集这部分数据
离线数据采集
脱机行为数据主要是通过硬件采集进行的,例如
第三方数据采集
第三方数据采集通常是一种程序或脚本,可以根据既定规则通过网络爬网程序自动对Internet信息进行爬网,并且通常用于网站的自动化测试和行为模拟.
Google,搜狗,百度等提供的Internet信息检索功能基于内部自建的Web采集器. 在遵守相关协议的条件下,他们将不断在Internet上抓取新鲜的网页信息,并在处理完内容后提供相应的检索服务