采集自动组合( 适配器管理用来展示元数据系统支持的所有适配器列表(组图))
优采云 发布时间: 2022-04-19 14:12采集自动组合(
适配器管理用来展示元数据系统支持的所有适配器列表(组图))
1.适配器管理
适配器管理用于显示元数据系统支持的所有适配器的列表。点击查看各个适配器的详细信息,不可添加、编辑、删除。
适配器分为国内数据库、大型数据库、关系数据库、报表工具、建模工具、数据处理工具等7类。
单击适配器名称,可以查看适配器的基本信息和配置信息。例如,JDBC 驱动程序采集 适配器。在配置信息中,列出了需要为适配器设置的参数。
点击
进入新的 采集 向导以快速创建新的数据源和 采集 任务。
2.数据源管理
在数据源管理界面,列出系统当前所有的数据源
点击新建添加新数据源,并配置相关参数采集将数据库中的元数据信息到指定目录
数据源名称:设置数据源的名称;
· 审核:如果这里选择“是”,则所有采集数据都需要审核入库;
Adapter:为此数据源选择适用的适配器;
工具版本:选择适配器的版本;
·采集模式:根据选择的适配器默认生成;
·数据源挂载路径:选择数据源的挂载点。
描述:描述数据源
以上基本信息设置好后,点击下一步。下面以JDBC驱动采集适配器为例介绍参数配置
• 需要 采集 的架构:您可以指定需要 采集 的架构
• 是否将表/字段注释作为表/字段名称:可以设置是否将表/字段作为元数据名称
上图中,在下拉框中选择数据库类型为DB2,在参数列表的参数值中设置各个参数值,点击连接测试。测试通过后,点击保存,保存数据源。
注意:(1)同一驱动、url、用户名、挂载点只能添加一个数据源
(2)JDBC采集支持driverFiles参数指定驱动路径
(3)JDBC采集支持otherParams参数配置扩展属性
(4)库表采集适配器”或“JDBC驱动程序采集适配器”采集
(5)元数据数据源信息数据库密码密文显示
点击编辑修改数据源
修改数据源参数配置
如果采集适配器为“Library Table采集Adapter”或“JDBKC Driver采集Adapter”,参数配置完成后,点击左下角的【下一步】按钮,然后单击过滤元数据采集。
从左侧页面选择需要过滤的元数据类型,然后勾选右侧的【收录】或【排除】,在对应的文本框中输入数据
笔记:
【勾选选项】左侧选择的元数据类型需要为采集可以勾选此项,文本框中输入的表名、字段名等正则表达式为指定要存储的数据。
【排除】左侧选择的元数据类型不需要采集,可以勾选此项,在文本框中输入不需要采集的表名、字段名等正则表达式, 采集 根据模糊匹配结果过滤后,数据入库
3.采集任务配置
定义好数据源后,需要新建一个采集任务,周期性地将采集数据发送到业务系统。在采集任务配置界面,可以添加和删除采集任务,分组采集任务,禁用和启用采集任务。
点击New弹出新建采集任务向导
在任务计划向导中,选择需要采集数据的数据源,是否自动发布,存储策略。当自动发布选择“是”时,最新的元数据可以作为最终元数据自动发布。存储策略分为全量、增量、保守更新和激进更新。不同的是,数据源中的所有数据都存储在数据库中,增量数据是新增或修改的。保守更新是基于增量更新保留最新元数据的现有名称和属性值,点击下一步,
详细说明:
全量:比较这个采集的元数据和挂载点下的数据,删除挂载点下的冗余数据,更新不一致的数据,添加缺失的数据;
增量:保留挂载点下的现有数据。当采集元数据的代码和路径与已有元数据相同且名称和属性值不完全相同时,采集元数据会更新挂载下对应的元数据观点;
保守更新:保留挂载点下已有的数据。当采集元数据的代码和路径与现有元数据相同且名称和属性值不相同时,如果采集元数据与现有元数据具有相同的代码和路径metadata 当名称和属性值不为空时,将元数据不为空的采集的值更新为已有的元数据。采集如果元数据属性值为空,则对应的属性值不会改变。
激进更新:比较挂载点和采集源中的元数据,删除挂载点下多余的元数据,添加缺失的元数据,增量更新最新元数据的现有名称和属性值。
设置相应的调度执行时间。设置任务的执行时间,请根据具体情况和需要来决定。需要注意的是,名称必须是唯一的。
点击采集任务名称,查看对应的采集任务日志
将挂载点与采集源中的元数据进行比较,删除挂载点下多余的元数据,添加缺失的元数据,增量更新最新元数据的现有名称和属性值。
4.采集日志
在采集日志界面可以查看采集任务的执行情况,或者点击导出按钮导出采集日志
5.入站审核
如果在创建新数据源时选择需要审核,则需要审核的采集任务将在此页面列出。
入库审核分为待审核、已审核、退货3个标签页。
单击详细信息以查看数据更改及其依赖关系。
在要审核的数据中,选择更改类型为“添加”、“修改”或“删除”。更改类型中显示了每种类型的总数,您可以查看每个更改的状态。
对于待审核的数据,您可以选择通过、返回或检查部分通过和部分返回的元数据,其余数据将保留在待审核页面上。
对于修改后的数据,可以查看审计跟踪。
在操作中单击“待审核详情”,可以查看该数据源的待审核数据和待审核关系。
单击操作中的已审核审核流程以查看此数据源的审核结果。
注意:左侧导航树不显示已传递或返回的元数据。传递和返回导航树的逻辑如下。
·根据组合关系,在新增的情况下
通过逻辑:检查元数据和上级元数据都通过
返回逻辑:选中的元数据和从属元数据都返回
· 根据组合关系修改情况
传递逻辑:检查哪些元数据要传递哪些元数据
返回同上:检查哪些元数据通过了哪些元数据
· 根据组合关系,删除案例
传递逻辑:通过检查的元数据和从属元数据
返回同上:勾选的元数据和低级元数据都通过
以上步骤完成后,采集对元数据的工作就完成了,接下来就是分析元数据了。
6.采集模板配置
元数据管理平台可以使用手动方式采集数据,但是手动采集时,不同的元数据类型,数据格式会有所不同,用户很难准确知道格式,导致在手动 采集 模板中很难。系统可以通过数据源生成标准文件,用户可以根据文件填写元数据信息,通过采集任务直接将元数据采集传给系统。
手动采集有两种应用场景,直接通过excel输入数据或者补充其他数据源的数据。如果数据是通过excel输入的,那么新建数据源时,需要选择Excel采集适配器;如果是补充数据,则在新建数据源时,选择Excel补充条目采集适配器。
在采集模板配置中,点击新建按钮,在采集模板管理中,输入模板名称,选择需要手动采集数据的数据源,勾选需要采集元数据类型,点击下一步,
确认每个excel文件的sheet页面后,点击OK生成采集模板
选择采集模板后,可以将基于采集模板对应的excel文件导出为采集模板。
注意:新创建的采集模板的状态默认显示为有效。重新发布模板对应的元模型时,模板状态显示为无效。重新编辑保存后,模板状态变为有效。