解决方案:使用Excel补录适配器采集元数据
优采云 发布时间: 2022-12-05 18:26解决方案:使用Excel补录适配器采集元数据
1. 概述
Excel转录适配器一般用于补充已有采集,如元数据属性批量补充、缺失元数据批量补充、数据库中未采集依赖的批量补充等,支持跨库依赖的补充。
在上一章中,我们使用 MySQL 采集 适配器来采集
一个 MySQL 数据库,假设有一批数据库表和字段元数据无法自动采集,在这种情况下我们可以在 Excel 中手动输入这些缺失的元数据和依赖关系,然后使用 Excel 补编适配器将 Excel 数据采集到平台。让我们用这个例子来解释 Excel 适配器的使用。
2. 步骤 2.1 创建采集数据源
首先,创建采集数据源。
在元数据-元数据采集-数据源管理模块中,单击新建。
在弹出的对话框中,完成数据源的基本信息设置,如下图所示
其中,
1)适配器:在“其他”下选择“Excel补充适配器”。
2) 采集模式
:分为“文件上传(手动采集)”和“服务器文件(计划采集)”两种模式。文件上传(手动采集),属于手动执行采集,执行过程中需要上传Excel数据;服务器文件(定时采集)是定时自动执行采集,执行时会在服务器的指定位置获取Excel数据,下一步会设置指定位置。根据需要选择,在这种情况下,我们将其设置为“文件上传(手动采集)”。
3) 数据源挂载路径:记录到的元数据挂载点。
4)审核:选择“是”,那么采集需要在仓库审核后,审核通过后的元数据采集会输入最新的元数据。选择“否”进行采集,然后直接转到最新的元数据,无需入站审核。根据需要选择,在这种情况下,我们选择“否”。
保存以完成采集数据源的创建。
2.2 创建采集任务
接下来,创建采集任务。
在 [元数据] - [
元数据采集]-[采集任务配置]界面,点击【新建】。
在弹出的定时任务向导页面,选择上面创建的数据源“Excel补充”,自动发布选择否,如下图所示。
注意:自动发布为“否”,表示存储采集后仅输入最新的元数据;自动发布为“是”表示在存储采集后输入最新的元数据,并自动发布为最终元数据。
【下一步】,命名采集任务,如下图所示,点击【完成】完成采集任务的创建。
技巧:
您也可以通过 [适配器管理] 模块的采集任务创建门户一次性创建采集数据源和采集任务。
2.3 准备Excel数据
接下来,准备 Excel 数据。Excel模板在【元数据】-【元数据采集】-【采集模板配置】模块中获取,具体操作如下:
在“采集模板配置”模块中,单击“新建”。
输入模板名称“数据源”以选择
上面新创建的采集数据源,然后根据需要选择要补充的元数据类型,这里我们检查“表”和“字段”。
接下来,选择要输入到表和字段元数据中的属性。 【确定】完成模板创建。
单击模板列表中的导出以导出模板。
在导出的 Excel 模板中输入缺少的表、字段和依赖项。如下图所示,输入了一个数据库表cs_excel,其中收录两个字段ID_和NAME_;此外,还有一个依赖关系,表cs_excel依赖于同一挂载点下的表dim_gzdd。
技巧:
1)在Excel中输入依赖项时,只需输入直接依赖项即可。
2)元数据路径必须根据模板提示正确填写,否则会影响元数据的存储。
3) 如果使用 Excel 补充适配器来补充现有元数据
属性,您可以批量导出现有元数据,在导出的 Excel 中完成属性值补充,然后使用 Excel 补充适配器采集 Excel 的数据。元数据导出条目如下所示:
2.4 执行采集任务
最后,执行采集任务,将 Excel 数据采集到平台的最新元数据中。
采集如果没有,请点击 [刷新] 刷新任务列表以找到刚刚创建采集采集任务,然后在操作中单击 [立即执行]
如下
在出现的对话框中,单击此处
选择要上传的本地Excel数据文件(第一步中准备的Excel文件),然后单击[立即执行]开始采集。
采集完成后,您可以在最新的元数据模块中查看添加的元数据和依赖项。
虚假社区论坛关键词网址采集工具、关键词网址采集,
海量自动解决方案,搜索引擎可以自行挑选,键入关键词采集URL,支持
。
假冒社区论坛关键词URL采集工具,关键词URL采集,*敏*感*词*自动解决,搜索引擎可以自行选择,键入关键词来采集URL,支持全自动考虑重复内容,功能齐全。这次PC版的关键词 采集URL生成工具PC版免费下载,站长有网站采集要求,何不试试呢!
关键词 URL 采集工具指示:
它可以特定于搜索引擎,重复数据删除,导出等
功能齐全的关键词URL采集工具,可根据关键词使用
采集 网站搜索引擎内容查找结果的地址内容。
支持全自动重复重复的内容
存储方式支持本地TXT
还有其他参数配置可以自动配备
关键词与该工具相关的 URL 采集:
阳离子/X冲击波闪光“/>