自动采集系统(自动采集系统如何从服务器下载数据的操作步骤?)

优采云 发布时间: 2022-04-20 00:07

  自动采集系统(自动采集系统如何从服务器下载数据的操作步骤?)

  自动采集系统怎么用,对于刚入门的自动采集系统的开发同学来说,不知道自动采集系统的实现细节,不能清楚了解自动采集系统的原理。

  一、自动采集系统的组成自动采集系统中包含,采集,过滤,抓取,下载,管理,etl等组件,这里主要介绍的是采集功能的实现.

  二、采集功能在自动采集系统中,最基本的,直接操作采集数据,包括有添加采集规则,选择采集方法,提取过滤信息,添加到etl(extractandtransform)工具等,下面简单介绍,自动采集系统如何从服务器下载数据的操作步骤.

  1、在服务器上搭建hadoopmapreduce集群.

  2、下载采集工具vncsdk

  3、安装相关的java工具

  4、编写采集程序,使用vncserver与自己网站交互,提取数据并下载

  5、把数据下载完毕的命令工具打开.

  三、自动采集系统的参数设置自动采集系统的运行参数,主要有采集软件,网站,数据库服务器,数据上传软件。采集软件:主要解决采集效率问题,可选择海量采集。简单易用。网站:主要解决网站性能问题,可进行高并发集群,采集速度更快。数据库服务器:主要解决数据的高可用问题,如果采集数据少,那么下发速度就要慢,每个机器要配服务器,也为数据库增加负担。

  数据下载软件:主要是从数据库服务器下载相关数据,如果从vnc下载,在传输过程中会产生网络请求,这会产生费用。

  四、自动采集系统的实现原理相信大家都知道,虽然自动采集系统是基于自动化的原理设计的,但实际工作中,还需要做一些针对性的修改,如业务逻辑,模块抽象,ui定制等.以便应对一些特殊的需求.下面对采集系统中的模块详细介绍.

  1、采集规则与控制器这里面主要是针对采集规则的设置,比如有的城市的域名,需要进行获取。域名是写abc@yy。com,下一个是。abc@ca@yy。com等。针对采集规则的设置可以多写一些规则,比如从某城市开始,有的采集规则可以从/开始,有的可以从/。com开始,写成多种形式。比如是否设置被采集数据的类型(列表),是否设置截取天数等等。

  2、vncserver这里面主要是针对vnc服务器的配置.

  1)vncserver上对应用的license.dat文件.设置权限.

  2)vncserver把上述给的username(用户名)和密码告诉自己的客户端(称为服务端).要写一个逻辑,允许服务端对这个vncserver上的采集规则进行传递.不允许服务端对这个vncserver上的采集规则进行传递.

  3)添加到etl工具的一个config.cfg文件.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线