具体分析:浅析影响百度排名浮动的几方面因素
优采云 发布时间: 2022-12-12 09:40具体分析:浅析影响百度排名浮动的几方面因素
很多百度优化从业者认为,百度优化排名波动大,排名不稳定,而谷歌关键词排名稳定。今天我就来分析一下造成这种情况的原因,因为两个搜索引擎的算法是不一样的。侧重点不同。互联网上已经有很多文章。大多说百度更看重内容,谷歌更看重外链。其实这确实是有原因的,但这还不是最重要的。今天给大家分享一个经验总结。
很多百度优化从业者为了百度好排名,伪原创转了很多,结果发现效果很差,百度收录很少,就算收录两天也会被删,开始花费大量时间编写 原创,陷入恶性循环。其实作者觉得原创30%,伪原创30%,转发40%就够了。百度认了,不过转贴也是有技巧的。不要转旧的东西,几年前的东西当然百度不会收录,转载热门实时的东西,百度还是会收录,并且会给予更高的权重,信息转播而分享百度还是比较受青睐的。
百度在优化过程中排名不稳定的原因之一就是内容的不稳定。上面说了,如果你转的很多,百度会先收录删掉。如果你转贴过时的信息,百度要么不收录,要么收录以后迅速删除,这不像谷歌,谁都知道谷歌收录比百度多很多。因为谷歌收录以后一般不会删除,这也是百度不稳定谷歌稳定的原因之一,内容收录不稳定,内容的质量和数量由网站加权对于影响力比较大的,百度有一个新的收录 文章 给予更高的权重,以便曝光新内容,让更多人知道。一般来说,
百度优化排名不稳定的另一个主要原因是外链不稳定。和前面的情况类似,谷歌的收录外链更注重质量,一般不会收录,而收录长期稳定,百度正好相反,大量的收录外链,经过一段时间后,大量低质量外链和重复外链会被删除,导致关键词排名波动。我们可以发现,百度的外链波动很大,而谷歌的外链非常稳定。所以,在做百度优化的时候,一定要注意外链的稳定性。论坛的外部链接普遍不稳定。百度更新时会删除大量论坛外链。博客和分类信息的外部链接相对稳定。保证外部链接的稳定性是解决百度优化问题的关键。需要不断维护外部链接,增加新的外部链接。
当然,还有百度更新的原因。百度每月有两次大更新,每周有一次小更新。更新频率比较高,伴随着算法调整。但这不是主要原因。网站优化时不要作弊。关键词推广速度较慢,但推广比较稳定。作弊来得快去得也快。这方面的例子太多了。脚踏实地的做网站是网站优化的基础。
汇总:《DAMA-DMBOK2》读书笔记-第12章 元数据管理
应用程序内元数据存储库。
指存储元数据的物理表,通常内置于建模工具、BI 工具和其他应用程序中。
商业术语表。
业务词汇表(Business Glossary)的作用是记录和存储组织的业务概念、术语、定义以及这些术语之间的关系。
满足以下三类人: 1)企业用户。2) 数据管理专家。3) 技术用户。
不建议打印词汇表,因为它的内容不是静态的。
商业智能工具。
BI工具生成与BI设计相关的各种类型的元数据,包括概览信息、类、对象、派生信息和计算项、过滤器、报表、报表字段、报表呈现、报表用户、报表发布频率和报表发布渠道。
配置管理工具。
配置管理工具或数据库 (CMDB) 提供管理和维护与 IT 资产相关的元数据、它们之间的关系以及资产的合同细节的功能。
数据字典。
数据字典定义数据集的结构和内容,通常用于单个数据库、应用程序或数据仓库。数据字典可用于管理数据模型中每个元素的名称、描述、结构、特征、存储要求、默认值、关系、唯一性和其他属性。
数据集成工具。
这些工具能够从各种来源加载数据,通过分组、更正、重新格式化、连接、过滤或其他操作来处理加载的数据,然后生成输出数据。
数据集成工具提供应用程序编程接口 (API),允许外部元数据存储库提取沿袭信息和临时文件元数据。
数据库管理和系统目录。
数据库目录是描述数据库内容、信息大小、软件版本、部署状态、网络正常运行时间、基础设施正常运行时间、可用性和许多其他操作元数据属性的元数据的重要来源。
数据映射管理工具。
映射管理工具用于项目的分析和设计阶段,将需求转化为映射规范,然后由数据集成工具直接使用或供开发人员使用以生成数据集成代码。
它通常也存储在整个企业的 Excel 文档中。
数据质量工具。
数据质量工具通过验证规则评估数据质量,这些工具中的大多数都提供与其他元数据存储库交换质量分数和质量配置文件的能力,使元数据存储库能够将质量分数附加到相关的物理资产上。
字典和目录。
数据字典和词汇表收录有关术语、表格和字段的详细信息,而字典或目录收录有关组织内数据的系统、来源和位置的信息。
事件消息传递工具。
事件消息传递工具在不同系统之间移动数据,需要大量元数据,并生成描述此移动的元数据。
建模工具和存储库。
数据建模工具用于构建各种类型的数据模型:概念模型、逻辑模型和物理模型。这些工具生成与应用程序或系统模型设计相关的元数据,例如主题域、逻辑实体、逻辑属性、实体和属性关系、超类型和子类型、表、字段、索引、主键和外键、完整性约束以及其他类型的模型中的属性。
参考数据库。
引用数据记录了系统中上下文中使用的各种类型的枚举数据(值字段)的业务价值和描述。
服务注册。
服务注册中心是从面向服务架构(SOA)的角度来管理和存储服务和服务终端的技术信息,如定义、接口、操作、输入输出参数、系统、版本、示例使用场景等。
额外的元数据存储。
特定于格式的清单,例如事件注册表、源列表或接口、代码集、字典、时空模式、空间参考、数字地理数据集分布存储库和业务规则的存储库。
业务词汇表应收录业务术语属性,例如:1) 术语名称、定义、缩写或缩写,以及任何同义词。2) 负责管理术语相关数据的业务部门和/或应用程序。3) 维护该术语的人的姓名和更新日期。4)术语的分类或分类之间的关联关系(业务功能关联)。5) 要解决的冲突的定义、问题的性质、行动的时间表。6)常见的误解。7) 支持自定义算法。8) 血缘关系。9) 支持该术语的官方或权威数据来源。
2.6 元数据模式的类型
与其他形式的数据一样,元数据也有生命周期。从概念上讲,所有元数据管理解决方案都收录与元数据生命周期相对应的架构层。
元数据生命周期:创建和 采集。贮存。融合的。递送。利用。控制和管理。
元数据模式的类型:
集中式元数据架构。集中式元数据架构由单个元数据存储库组成,其中收录来自不同来源的元数据副本。P330 见下图12-3
分布式元数据架构。在完全分布式架构中维护单个接入点。元数据检索引擎通过实时从源系统检索数据来响应用户请求;分布式元数据架构没有持久存储库。P331 见下图12-4
混合元数据架构。元数据仍然直接从源系统移动到集中存储库,但存储库设计仅考虑用户添加的元数据、重要的标准化元数据和从手动源添加的元数据。单向。
双向元数据模式。允许在模式的任何部分(源、数据集成、用户界面)中更改元数据,然后将更改从存储库(代理)同步到其原创源以获得反馈。
集中存储库的优势:P330
1)高可用,因为它独立于源系统。2) 快速元数据检索,因为存储库和查询功能在一起。3)解决数据库结构问题,使其不受第三方或商业系统的独特属性影响。4) 在提取元数据时,可以转换、定制或补充来自其他源系统的元数据,提高元数据的质量。
集中式存储库的缺点:P330
1)必须使用一个复杂的过程来确保元数据源的变化能够快速同步到存储库中。2) 维护集中存储库的成本可能很高。3)元数据的提取可能需要自定义模块或中间件。4) 验证和维护自定义代码增加了对内部 IT 人员和软件供应商的要求。
分布式元数据架构的优势:P331
1) 元数据总是尽可能最新和有效,因为它是直接从其数据源检索的。2)查询是分布式的,可以提高响应和处理的效率。3) 来自专有系统的元数据请求仅限于查询处理,不需要专有数据结构的详细知识,从而最大限度地减少了实施和维护所需的工作量。4) 自动化元数据查询处理的开发可能更简单,几乎不需要人工干预。5) 减少批处理,没有元数据复制或同步过程。
分布式元数据架构的缺点:P331
1) 无法支持用户定义或手动插入的元数据项,因为没有可以放置这些添加项的存储库。2)来自不同系统的元数据需要以统一和标准化的方式呈现。3) 查询功能以源系统可用性为准。4) 元数据的质量完全取决于源系统。
混合元数据模式:P332
结合集中式和分布式架构的特点,将元数据直接从源系统转移到集中式存储库,但存储库设计只考虑用户添加的元数据、重要的标准化元数据和手动源添加的元数据。数据。
该架构受益于在源头对元数据进行近乎实时的检索和扩充,以便在需要时最有效地满足用户需求。
双向元数据模式:P332
它允许在模式的任何部分(源、数据集成、用户界面)更改元数据,然后将更改从存储库(代理)同步到其原创源以获得反馈。强制更新源。
这种方法显然存在各种挑战。该设计强制元数据存储库收录最新版本的元数据源并对源实施变更管理。必须系统地捕获变化,然后加以解决;必须构建和维护一系列额外的处理接口,以将存储库的内容转换为写回元数据源。
3 上下文图 3.1 定义
元数据元数据:定义和描述其他数据的数据。(GB/T18391.1-2009信息技术元数据注册系统MDR第1部分:框架)
元数据。元数据可以帮助组织了解他们自己的数据、系统和流程,并帮助用户评估数据质量。它对于数据库和其他应用程序的管理是必不可少的。它有助于处理、维护、集成、保护和管理其他数据。
元数据可以确保组织识别私有或敏感数据,能够出于自身利益管理数据生命周期,满足合规性要求,并降低风险敞口。
如果没有可靠的元数据,组织就不知道它拥有什么数据、它代表什么、它来自哪里、它如何在系统中移动、谁有权访问它,或者数据保持高质量意味着什么。没有元数据,组织就无法将其数据作为资产进行管理。事实上,如果没有元数据,组织可能根本无法管理他们的数据。
技术元数据已成为数据迁移和集成方法的组成部分。
没有人知道关于数据的一切。P320
在GB/T 18391中,元数据是定义和描述其他数据的数据。这意味着元数据就是数据,当以这种方式使用数据时,它就变成了元数据。只有在特定的环境中,出于特定的目的或从特定的角度来看,数据才成为元数据。P320
将数据用作元数据的一组上下文、目的或观点称为上下文。因此,在某种语境下,元数据是关于数据的数据。因为元数据也是数据,所以元数据可以存储在数据库中并按模型组织。有些型号仅适用于特定应用,有些则更通用。
描述元数据的模型通常称为元模型。从这个意义上说,GB/T 18391.3引入的概念模型是元模型。
元数据:包括技术和业务流程、数据规则和约束,以及逻辑和物理数据结构。它描述了数据本身(如数据库、数据元素、数据模型)、数据表示的概念(如业务流程、应用系统、软件代码、技术基础设施),以及数据与概念之间的联系(关系)
如果没有可靠的元数据,组织将不知道他们拥有什么数据、代表什么、来自何处、如何在系统中移动以及谁有权访问这些数据。
3.2 目标
目标包括:P322
指导原则:P323
3.3 业务驱动因素
数据管理需要元数据,元数据本身也需要管理。可靠且管理良好的元数据可以提供帮助:P322
元数据管理不善很容易导致以下问题:P322
3.4 输入 3.5 活动
活动: 1. 定义元数据策略。2. 了解元数据要求。(一)业务人员需求。(二)技术人才需求。3. 定义元数据模式。(1) 创建元模型。(2) 应用元数据标准。(3) 管理元数据存储。4. 创建和维护元数据。(1) 整合元数据。(2) 分发和传送元数据。5.查询、报告和分析元数据。
[活动 1] 定义元数据策略。
元数据策略描述了组织应该如何管理自己的元数据,以及元数据从当前状态到未来状态的实现路径。P333
元数据战略包括定义组织的元数据架构蓝图和与战略目标一致的实施步骤。P333
步骤包括:P333
启动元数据战略计划。目的是确保团队可以定义短期和长期目标。主要利益相关者应参与计划制定。组织与主要利益相关者的访谈。通过与业务人员和技术人员的访谈,可以获得元数据策略的基本知识。评估现有的元数据资源和信息架构。评估确定解决元数据和系统问题的难度,在访谈和文件审查期间识别这些问题。在此阶段,将与关键 IT 人员进行进一步的访谈,并审查系统架构和数据模型等文件。开发未来的元数据模式。优化并确认未来愿景,开发能够满足管理当前元数据环境的长期目标的元数据架构。此阶段必须考虑战略组成部分,例如组织架构、与数据治理所需的管理人员保持一致、受治理的元数据架构、元数据交付架构、技术架构和安全架构。制定阶段性实施计划。验证、整合访谈和数据分析的结果并确定其优先级,发布元数据策略,并定义可从当前状态转移到未来受控元数据环境的分阶段实施方法。[活动 2] 了解元数据要求 元数据架构、元数据交付架构、技术架构和安全架构。制定阶段性实施计划。验证、整合访谈和数据分析的结果并确定其优先级,发布元数据策略,并定义可从当前状态转移到未来受控元数据环境的分阶段实施方法。[活动 2] 了解元数据要求 元数据架构、元数据交付架构、技术架构和安全架构。制定阶段性实施计划。验证、整合访谈和数据分析的结果并确定其优先级,发布元数据策略,并定义可从当前状态转移到未来受控元数据环境的分阶段实施方法。[活动 2] 了解元数据要求
元数据要求的具体内容是:需要什么样的元数据,需要什么样的详细程度。== 例如,采集 表和字段的物理和逻辑名称是必需的。== P333
全面的元数据解决方案收录以下功能要求: P333
更新频率。元数据属性和属性集的更新频率。同步情况。数据源改变后的更新时间。历史信息。是否保留元数据的历史版本。访问权限。通过特定的用户界面功能,谁可以访问元数据以及如何访问。存储结构。如何通过建模存储元数据。集成要求。来自不同数据源的元数据的集成程度,以及集成规则。操作和维护要求。更新元数据(记录日志和提交申请)的流程和规则。管理要求。管理元数据的角色和职责。质量要求。元数据质量要求。安全要求。某些元数据不应公开,因为它会泄露有关某些高度机密数据的信息。[活动 3] 定义元数据模式
元数据管理系统必须具有采集来自不同数据源的元数据的能力。在设计架构时,应确保可以扫描不同的元数据源,并定期更新元数据存储库。系统必须支持手动更新元数据、请求元数据数据、查询元数据并被不同的用户组查询。P334
内容:
创建元模型。P335
创建元数据存储库的数据模型(也称为元模型)是定义元数据策略和了解业务需求后的第一个设计步骤。可根据需求开发不同层次的元模型;高层概念模型描述系统之间的关系,低层元模型细化各个属性,描述模型的组成元素和处理过程。
应用元数据标准。P335
数据治理活动应监控对元数据标准的遵守情况。
管理元数据存储。P335
实施控制活动来管理元数据环境。存储库控制活动是由元数据专家执行的元数据迁移和存储库更新的控制。
这些活动的本质是可管理的、可监控的、可报告的、预警的和作业日志的,可以解决各种实施的元数据存储环境的各种问题。
元数据存储库的控制活动:P335
1)作业调度和监控。2) 负荷统计分析。3) 备份、恢复、归档和清除。4) 配置修改。5)性能调优。6)查询统计分析。7) 查询和报告生成。8)安全管理。
元数据质量控制活动:P336
1)质量保证,质量控制。2) 数据更新频率——与时间表相匹配。3) 缺少元数据报告。4) 元数据报告未更新。
元数据管理活动:P336
1) 加载、探测、导入和标记数据资产。2)记录与源的映射迁移关系。3) 记录版本。4) 用户界面管理。5) 连接数据集的元数据维护——提供对NOSQL的支持。6) 建立数据与内部数据之间的连接 采集——自定义连接和作业元数据。7) 外部数据源和提要的许可。8) 数据增强元数据,如关联GIS。
元数据培训活动:P336
1) 教育和培训用户和数据管理员。2) 生成和分析管理指标。3) 对控制活动、查询和报告进行培训。
[活动 4] 创建和维护元数据
好的元数据不是偶然产生的,而是精心规划的结果。
元数据管理的几个一般原则描述了管理元数据质量的方法:P336
问责制。认识到元数据通常是通过现有流程(数据建模、SDLC、业务流程定义)生成的,因此流程的执行者对元数据的质量负责。标准。制定、实施和审核元数据标准,以简化集成和应用。改进。建立反馈机制,以便用户可以将不准确或过时的元数据通知元数据管理团队。
整合元数据 P337
采集和整合来自整个企业的元数据,包括来自企业外部的元数据。存储库应将提取的技术元数据与相关业务、流程和管理元数据集成在一起。
扫描元数据存储库的方式:
专用接口。使用单步方法,扫描器通过调用特定于格式的加载程序将源系统中的 采集 元数据直接加载到元数据存储中。半私有接口。使用两步方法,扫描器 采集 来自源系统的元数据并将其输出到特定格式的数据文件中。架构更加开放。
扫描仪生成并使用多种类型的文件:
控制文件。收录数据模型的数据源结构信息。重复使用文件。收录管理加载过程的重用规则信息。日志文件。在流程的每个阶段、每次扫描或提取操作中生成的日志。临时文件和备份文件。流程中使用的文档或用于执行可追溯性流程的文档。
分发和交付元数据 P337
元数据可以传递给数据消费者和需要处理元数据的应用程序或工具。
交付机制包括:
内部元数据网站,提供浏览、搜索、查询、报告和分析功能。报告、词汇表和其他文档。数据仓库、数据集市和 BI(商业智能)工具。建模和软件开发工具。消息和交易。Web 服务和应用程序编程接口 (API)。外部组织接口解决方案(如供应链解决方案)。【活动五】元数据查询、上报、分析
元数据存储库应具有前端应用程序,并支持查询、采集功能,以满足上述各种数据资产管理的需要。提供给业务用户的应用程序接口和功能不同于提供给技术用户和开发人员的应用程序接口和功能,其中可能包括有助于开发新功能(例如变更影响分析)或帮助解决数据仓库和数据定义问题的能力,例如商业智能项目中的数据沿袭报告。P338
3.6 可交付成果 3.7 技术驱动因素 3.8 方法 [方法 1] 数据沿袭和影响分析
发现和记录有关数据资产的元数据的一个重要方面是它提供有关数据如何在系统之间传输的信息。基于程序代码的当前版本的沿袭称为“As Implemented Lineage”。相比之下,映射规范文档中描述的谱系称为“As Designed Lineage”P340
数据沿袭创建的限制是元数据管理系统的覆盖范围。P340
元数据管理系统通过能够提供数据沿袭细节的工具导入“实现的沿袭”,从无法自动提取的“设计沿袭”文件中获取实现细节进行补充。连接数据沿袭的各个部分的过程称为“拼接”,“拼接”的结果是表示数据从其原创位置(数据源或记录系统)到其最终位置的传输的全景图。P340
为成功实现业务目标,需要规划和设计用于发现元数据并将采集元数据放入元数据存储库的策略。要成功发现数据亲缘关系,必须平衡业务重点和技术重点。P340
业务重点:根据业务优先级寻找数据元素的血缘关系。从目标位置追溯至特定数据的来源系统。
技术重点:从源系统开始识别直接相关的数据用户,依次识别间接数据用户,直到识别所有系统。
==数据元素血缘关系示例,业务数据元素“所有延期订单金额”物理实现下的字段“zz合计”依赖于其他三个数据元素:字段“yy单位成本”和“字段” “Tax”的“yy tax”和“Deferred Order Data Sheet”的字段“yy qty”。==见下图12-6
【方法二】应用于大数据的元数据采集
数据湖中成功的数据管理取决于管理元数据。P340
应将元数据标记应用于 采集 中的数据,然后元数据可用于识别可访问数据湖中的数据内容。采集engine采集的大部分数据都是在数据分析后分析的。数据分析可以识别数据字段、数据关系和数据质量问题,并进行标注。当采集数据时,当识别出敏感或隐私(如个人身份信息,PPI)数据时,应添加元数据标签。== 例如,数据科学家会添加关于置信度、文本标识符和集群行为的代码。==
3.9 工具
管理元数据的主要工具是元数据存储库。元数据存储库包括一个集成层和一个用于手动更新的接口。处理和使用元数据的工具被集成到元数据存储库中作为元数据的来源。P339
元数据管理工具提供了在集中位置(存储库)管理元数据的能力。元数据可以手动输入或通过专门的连接器从各种其他来源提取。元数据存储库还提供与其他系统交换元数据的功能。P339
3.10 度量元数据存储库完整性。理想覆盖率与实际覆盖率。元数据管理成熟度。能力成熟度模型 (CMM-DMM) 评估。专业的人员配备。评价承诺。元数据的使用。业务术语活动。使用、更新、定义分辨率、覆盖范围。主数据服务数据合规性。元数据文档质量。手动+自动。元数据存储库可用性。正常运行时间、处理时间(批处理和查询)。P3434 实施指南
使用增量步骤构建和实施受控元数据管理环境可降低组织风险并促进用户接受。使用开源关系数据库平台实现元数据存储可以处理在实现存储库项目之初可能无法预见的各种控制和接口问题。P341
存储库的内容在设计上应该是通用的,而不仅仅是反映源系统的数据库设计。P341
准备评估/风险评估。P341
有一个坚定的元数据策略。每个人都应该意识到不管理元数据的风险。对元数据相关活动的当前状态进行正式的成熟度评估。
元数据策略是整体数据治理策略的一部分,是实现有效数据治理的第一步。元数据评估应通过对现有元数据的客观检查进行,包括与主要利益相关者的访谈。风险评估的可交付成果包括元数据战略和实施路线图。P341
评估丢失高质量元数据的可能影响:P341
由于不正确、不完整和不合理的假设或对数据内容的了解不足而导致的误判。暴露敏感数据,使客户或员工面临风险,影响商业声誉并引发法律纠纷。如果了解数据的领域专家离开,他们所知道的知识也会随之消失。(隐性知识没有显性化)。
组织准备评估解决方案:P341
组织文件更改。P341
5 元数据管理治理 1 过程控制
数据管理团队应负责定义标准和管理元数据状态变化(通常使用工作流或协作软件),并可负责组织内的质量改进活动、培训计划或实际培训活动。P342
有必要将元数据策略融入到软件开发的生命周期中,以确保及时采集更改的元数据,以确保元数据保持最新。P342
2 元数据解决方案文档
元数据的主目录包括当前范围内的源和目标。P342
元数据资源面向技术和业务用户,可以发布到用户社区,可以作为“元数据在哪里”的指南,告知用户可以满足以下需求:P342
元数据管理实施情况。源和目标元数据存储。元数据更新的计划信息。保留和持久化版本。内容。质量声明或警告(如缺失值)。记录系统和其他数据源状态(如数据内容历史加载、删除或更新标志)。相关的工具、结构和人员。敏感信息和数据源的去除或脱敏策略。3 元数据标准和指南
为了支持共享信息的优化使用,需要共享通用元数据,这已经在许多专业领域产生了标准。P342
指南包括模板、相关示例、有关预期输入和更新的培训,以及规则和完整性声明,例如“不要使用术语来定义术语”。为不同类型的元数据开发了不同的模板,部分由所选的元数据解决方案驱动。持续监控指南的有效性并在必要时更新它们是一项治理责任。P342
6键架构图
图 12-1 元数据管理上下文图
图 12-1 元数据管理上下文图
表 12-2 三种元数据的示例
表 12-2 三种元数据的示例
图 12-3 集中元数据架构
图 12-3 集中元数据架构
图 12-4 分布式元数据架构
图 12-4 分布式元数据架构
图 12-5 混合元数据架构
图 12-5 混合元数据架构
图12-6 数据元素血缘关系流程图示例
图12-6 数据元素血缘关系流程图示例