基于网页版的数据采集解决方案——基于请求式样采集

优采云 发布时间: 2021-03-23 00:06

  基于网页版的数据采集解决方案——基于请求式样采集

  1.什么是采集

  2.为什么需要采集

  3.场景分析

  4.解决方案:

  --------------------------------------------------- -------------------------------------------------- -------------

  1.什么是采集

  在通用的分层业务系统中,数据采集是非常重要的部分:它主要负责数据输入。

  2.为什么需要采集

  在传统的管理系统中,一般的业务系统是采集,存储,显示,报告,这是传统的分层模型架构下的业务功能;让我们关注数据采集部分;

  3.场景分析

  1.第一种数据类型采集基于请求样式采集,这意味着请求为采集。常见的情况是HTTP请求,大量请求作为数据源存储在数据库中。

  2.第二种类型是基于Web的数据采集。前端在一段时间后使用点技术来完成数据采集并将其存储在DB中。

  3.最后一种方法是从中间表到DB的数据钻取,查询和存储

  4基于ETL 采集导入的方法数据。

  5.基于消息队列的数据采集,

  4.解决方案:

  第一种方案是通用程序采集。实现是实体类的映射并存储在数据库中,主要是实现Bear的映射和格式转换。分析自定义数据结构,例如xml,对象,配置文件等。

  数组分析,配置文件读取,xml分析,对象分析,JSON分析以及其他基本数据类型和复杂数据类型分析。

  xml的实现技术:Jaxb2

  该配置文件可实现jdk属性,地图映射

  xml解析:dom4j,JDOM,

  对象:对象之间的映射,一对多,多对一等,通常在Herbernate,Mybatis等中使用。

  JSON:Gson实现,fastjson等

  第二种方案:它基于网页采集,常用的分压技术等。

  第三种方案:比较常见的一种方案是启动计划任务到采集,我们可以转到中间库采集,查询中间库的数据,并定期采集进行业务桌子。

  第四个解决方案:在DB之前使用迁移工具,例如Oracle导入泵,RMAN工具等。

  第五种方案:基于消息队列,例如Kafka监视并使用它并将其存储在DB中。

  开源解决方案处理数据的方式采集:

  使用最新的解决方案:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线